News:
doccano 1.5.0で関係や位置が重複した固有表現のアノテーションができるようになりました。既存の
bratはセットアップが困難ではじめるまでに2日は固かったですが(経験談)、doccanoはDocker、またAWS/GCPにも1clickでデプロイ可能で数分で開始可能です。医療や特許など、関係や固有表現が重要なドメインでぜひ役立て頂ければと思います!物理シミュレーターはMuJoCoのOSS化で荒れ模様です。
Articles:
事前学習済みモデルを転移する選択肢が広がっています。代表的な手法は
prompt learningですが、今回紹介しているストレートに転移学習を改善する手法も研究されています。個人的には事前学習済みモデルに手を入れないprompt learningに類する手法が筋が良いと考えています。事前学習済みモデルを手を入れたくないモノリシックなシステムと見た時、
ドメイン駆動の腐敗防止層が有効なためです。DNNのパラメーターを学習せず予測する手法は、特にモジュール化が進んだ昨今のDNNでは有効に働く気がします。
Resources:
Shopiryのノウハウから、定量的な指標で機械学習にチャレンジするタイミングを監視するのが有効ではないかと感じました。機械学習の導入は効果が明確でなく、まだバズワードに類することから、トレンドになびいた思い付きとみられる向きもあると思います。同じカテゴリのアイテム数が一定数を超えたら、該当カテゴリに推薦モデルの導入を検討する、と決めるのは合理的に思えます。事前にチーム内で判断指標を合意しておくことで、スムーズかつ迅速に意思決定できると思います。PoC開始のクライテリアとしても機能すると思います。サービスが著作権法違反にならないかは要チェックです。著作権ありのコンテンツを学習に使えることは割と知られていますが、かといって著作権有コンテンツを提供することがOKにはならないので注意です。