しふみんの日記

しふみんの日記です。

探索と活用1 1回試してから考える

探索(exploration)活用(exploitation)はずっと書きたかったテーマなのでこれから何回か書くと思う。が、もしかしたら1回で終わるかもしれない(いつもの前置き)

1人の時の外食は、そもそも1人の時は2ヶ月に1回くらいしか外食しないが、コスパを考えると自ずと行く場所は決まるので行く場所に悩むことはほとんどない。問題は自分を含めた複数人で初めて行く場所*1で外食する場合だ。ビルのレストランフロアなど複数のレストランがあるかつあまり行ったことがない場所に複数人で行くと、どこで食べるかがすんなり決まることは少ない。人間だからね。それぞれの好き・嫌いを考慮していくと3,4つくらいまでは候補を絞り込めるけど、決め手に欠けるためそこからが決まらない。

こういった場合、僕は自分の第一希望?を譲ることが多い。他の候補が致命的に自分が好まないものである場合以外は、自分の希望を譲ってでもさっさと店を決めた方がいいと考えている。なぜなら、決め手に欠けるほどの情報がないから。情報がないからベストの選択を行おうにもそもそもできないし、結局適当にサイコロを投げて決めるのと期待値は変わらないはず。

もし、「そのレストランは、自分が世界で一番好きな、100点満点が約束されたレストランである」という情報を得ていたら、そのレストランに入るのが唯一無二の正解になるなろう。しかし、そういった情報がなく、特に入店候補のどこにも入ったことがないような場合は、選択の手がかりが店の雰囲気というあやふやな情報だけだから、店を選ぶのに無駄に時間をかけるよりはその回は適当に入って、実際の料理という確かな手がかりのもと「A店は70点」という情報を得て次回以降に役立てる。次回はその「A店は70点」という情報を活用して70点を得るか、あるいは70点以上の店であることを期待して他の店を探索する。その方が効率がいい。

ここらの「探索と活用のトレードオフ」の問題は効率厨として本当に興味があるので近いうちに学んで行こうと思っている。雑にググってみるとキーワードとして「バンディットアルゴリズム」や「ベイズ最適化」あたりが出てきたのでそこをとっかかりに何か学べたらいいな。

*1:あるいは、行った回数が少ない場所