View profile

Weekly Machine Learning #226

Weekly Machine Learning #226
By piqcy • Issue #227 • View online
News:
StandordのHAIから、自然言語処理を医療・チャットボットの応対に活用している事例が公開されました。患者の病状にあった処置を提案するために、カルテに記載されたテキストを活用しています。本当にシンプルな単語ベースの手法(Bag of Words)を使用しており、基本的な手法でも十分検証に活用できることが伺えます。チャットボットの応対は、技術向上というより人間と機械とのコミュニケーションをどうデザインするかというコンセプトの問題が大きい印象です。
Articles:
機械学習で生成した翻訳の品質問題は度々話題となるトピックです。今回掲載している研究では、翻訳の品質とは何か、を体系立てて整理するためにMQMというフレームワークを使用しています。これは欧州委員会が設立した翻訳品質評価の研究ワーキンググループで策定されたようです。考え方は翻訳だけでなく、人の作成したテキスト評価全般に使えそうな印象です。Pompt Learningは、新しい事前学習済みモデルの活用方法として発展しそうです。事前学習済みモデルが大きくなるにつれて、タスク固有に転移させるのも難しくなってきます。そのため、事前学習済みモデルの外側でタスクに対応する方法が注目を集めていくと思います。
Resource:
Transformerの資料は、興味がある方は一読をお勧めします。これだけでTransformer博士になれるかも。多言語のTwitterを事前学習したモデルはSNS上の感情評価などに使えそうです。対象としている時間範囲もそれなりにあるので、話題の移り変わりなどをとらえることもできるのではないかと思います。
Listeners:
自然言語処理のベンチマークについてお便りをいただきました!ので回答しています。
Twitterハッシュタグ: #weeklyml

News
Using Clinical Text to Combat Selection Bias in Medical Research
How to Create Better Chatbot Conversations
Articles
Resources
Transformer メタサーベイ
spaCyで文字単位のNERアノテーションを単語単位に変換する - radiology-nlp’s blog
GitHub - cardiffnlp/xlm-t: Repository for XLM-T, a framework for evaluating multilingual language models on Twitter data
Listeners
しょうゆさんから質問をいただきました。
いつもわくわく半分、ハテナ半分で拝読しております。英語圏ですと自然言語処理のベンチマークは数多く出ていますが、日本語でのベンチマークは最近はあるのでしょうか。
私が知る範囲では、日本語でベンチマークとして認知されているデータセットやタスクはありません。自然言語処理のタスクをまとめたNLP-Progressでは各国独自のベンチマークも掲載されていますが、ここにJapaneseはありません。さらにいえば、テキスト分類や固有表現認識といった基本タスクのデータセットも豊富にあるとは言えない状態です(固有表現認識はUD_Japanese-GSDが1年ぐらい前に使えるようになりました)。
日本語でもGLUE Benchmarkのような指標があるといいですね。研究の発展状況がわかりやすくなると思います。個人的にはぜひ作りたいですし活動があるなら協力したいと考えています。ベンチマーク作成したい・する予定がある、という方がいましたら是非連絡を取らせていただきたいです。
先週のアクセスランキングは以下の通りでした。200越えはデータを見始めてから初めてです。Transformerはやはり注目の技術ですね。
  1. 全日本CV勉強会発表資料 Learning Transformer in 40 Minutes(206click)
  2. ディープラーニング専門講座 (166 click)
  3. Language Interpretability Tool (LIT) の紹介 (77 click)
Did you enjoy this issue?
Become a member for $5 per month
Don’t miss out on the other issues by piqcy
piqcy
By piqcy

make machine learning engineer and researcher more cheerful

You can manage your subscription here.
If you were forwarded this newsletter and you like it, you can subscribe here.
Powered by Revue