その他

PsyToolkitで２腕バンディット課題を作る

簡単にブラウザ上でオンライン実験課題を作ることができるPsyToolkitを用いて２腕バンディット課題を作る方法を解説します。はじめに，最低限の処理だけを含めたプログラムを作成する方法を解説し，それから4段階にわけて，それを拡張する方法を解説します。

PsyToolkitで基本的な２腕バンディット課題を作る : ベースとなる最も基本的な’experiment’, exp_2armed_banditを作成します。これを’survey’の中に埋め込んでブラウザから実験に参加できるようにする方法も解説します。
- 拡張1: 画面遷移を入れる，選択肢の位置のランダマイズ
- 拡張2: 試行ごとの報酬の有無をテーブルで指定する
- 拡張3: 選択肢に画像ファイルを使う，簡単なアニメーションを使う
- 拡張4: 入力デバイスをマウスではなくキーボードにする，教示文を呈示する

Tips

最適化関数による最尤推定，MAP推定の途中で出るエラーを回避する

optim,solnpを用いた最適化の途中でエラーが出ることがあります。一つの原因は，選択確率pAが推定の途中でちょうど1.0や0.0などの極端な値になってしまうことによるものです。pA[t] = 1.0となったのに，その試行tではそれと異なる選択肢Bが選ばれた，というデータが入ると，log(0)を計算することになり，対数尤度はマイナス無限大 (-Inf) となって，その後の処理でエラーになります。以下のようにしてpA[t]を計算した後に，その値を0.001から0.999などの範囲に強制的に制限するとこの問題は回避できます。

        pA[t] <- 1/(1+exp(-beta * (Q[1,t] - Q[2,t])))
        
        # pA[t]を0.001から0.999の範囲におさめる
        if (pA[t] < 0.001) pA[t] <- 0.001
        if (pA[t] > 0.999) pA[t] <- 0.999
        
        ll <- ll + (c[t] == 1) * log(pA[t]) + (c[t] == 2) * log(1-pA[t])

上の二つのif文は，以下のようにも書けます。

        pA[t] <- max( min(pA[t], 0.999), 0.001)

このようなことをしたら推定結果に影響してしまうのではないかと心配される方もいるかもしれませんが，本来の選択確率がちょうど1または0になるということはあまりありません。そのように極端な値をとるのは大抵は最適化の途中のプロセスにおいてのみであり，最終的な推定結果に影響することはあまりないと思います (少なくとも，対数尤度がマイナス無限大となるような推定値は最尤推定値やMAP推定値とはいえません)。

パラメータの値を制限する

学習率αは本来0から1の間の範囲の値をとるべきものですが，最尤推定とはそれがマイナスになったり，1以上になったりすることがあります。学習率のように定義域が決まっているパラメータについては，探索範囲を制限するとよいと思います。 Rの最適化関数optimであればmethodを“L-BFGS-B”とすることで，lower, upperというオプションで指定できます。solnpであれば，LB, UBというオプションで指定できます。例えば，パラメータが学習率と逆温度の二つであり，それぞれ値の範囲を[0,1], [0,20]に制限したければ，以下のようにします。

    res <- optim(initparam, func_minimize,
                  method = "L-BFGS-B", 
                  lower = c(0,0), upper = c(1,20), 
                  hessian = FALSE, choice=c, reward=r)

solnpならLB = c(0,0), UB = c(1,20) を引数に追加します。 Matlabの場合は標準関数であるfminserchでは探索範囲の指定ができませんが，Optimization toolboxにあるfminconであればそれが可能です。詳細は各関数のマニュアルをご覧ください。

その他

PsyToolkitで２腕バンディット課題を作る

データ分析

Tips

最適化関数による最尤推定，MAP推定の途中で出るエラーを回避する

パラメータの値を制限する