Weekly Machine Learning #141

All change is not growth, as all movement is not forward. Ellen Glasgow

News: PyTorchオフィシャルで、ベイズ最適化を行うライブラリが登場しました。個人的にはベイズ型の逆強化学習とかやりやすくなるなと感じました。MultiFCはファクトチェックを行うためのデータセットです。こうしたデータセットが作れるリソースがあるというのがまずうらやましいと感じました(日本でファクトチェックを行っているところって聞いたことがあまりないので・・・)。LinkedInの判例は今後が気になる事例です。これがデファクトになるなら、ログインなしで公開されている情報は取得OKになるかも?(あくまで米国においてですが)
Articles: nlpaper.challengeがあったため自然言語処理の論文が多めです。CTRLはコントロール可能な事前学習モデルで、応用の幅がいろいろありそうです。こんなことができるなら既存のタスクは全部言語モデルである程度解けちゃうんじゃないの?という気がしないでもないです。Misspelling Oblivious Word Embeddingsは、ミススペルの分散表現を得るために愚直にミススペルの辞書(教師データ)を使ったという研究です。単にミススペルだけでなく、他の用途にも使えそうです(何らかの辞書データで分散表現を強化するという面で)。Using a Logarithmic Mapping~は強化学習における割引率の謎に迫った論文で、個人的にはよく出してくれた!と言いたくなる一本です。
Resources: Evolution Strategiesの解説はとても分かりやすいです。Lilさんはこれまでも素晴らしいまとめ記事をたくさん書かれているので、ブログ自体をチェックしておいた方がいいと思います。sumgramはとても興味深い手法です。教師なしでざっくり固有表現を得るには便利な手法ではないかなと思います。実際いちいち固有表現認識モデルを学習するのも大変ですしね。ゲームにおける強化学習の事例はとても面白いです。いろんな日本語タイトルが出てくるので、このゲームで使ってたんだという発見があります。

