View profile

Weekly Machine Learning #97

Revue
 
News: GoogleがBERTの多言語版モデルを公開しました。言語個別ではないのですが、日本語もサポートされているため日本語のデータセットへの適用も可能になりました。東ロボのデータセットも公開された
 

piqcy

November 9 · Issue #97 · View online
All change is not growth, as all movement is not forward. Ellen Glasgow

News: GoogleがBERTの多言語版モデルを公開しました。言語個別ではないのですが、日本語もサポートされているため日本語のデータセットへの適用も可能になりました。東ロボのデータセットも公開されたため、 誰か合格にチャレンジしてくれないかなと思います(ただ、国語の問題がないですが・・・)。Sutton先生の強化学習本は、強化学習研究者は要チェックです。最後に、アノテーションツールを公開したため自然言語に関わる方はフィードバックをいただければ幸いです。
Articles: WaveGlowは既存の手法をうまくまとめた印象で、興味深い研究です。これはPlan Online, Learn Offline~についても同様で、いずれも組み合わせ方がうまいと思います。Efficient Metropolitan~はGraph Neural Networkの活用ですが、それ以上に問題をグラフにする着眼点がとてもよいと思います。Are Deep Policy Gradient~は、実装したことがある方なら直感に即した結果で、今後の強化学習アルゴリズムの構築方法に一石を投じそうです。
Resources: 機械学習のパイプラインを自動構築してくれるtpotは、よくできたツールと思います。テストカバレッジがきちんと表示されているのもポイントが高いです。vscode-ipeは通常のPythonコードについてJupyter的に部分部分の実行結果を表示できるプラグインで、かなり便利そうです。実用化のための~は機械学習を実務に適用する際の評価尺度に関わる話で、プロジェクトを始める前に目を通しておきたい資料です。
Series: Graph Attention Networkについて、実際のデータに適用した結果を書いています。Part1ではAttentionがうまく働いていませんでしたが、実際のデータでは効果があるのかどうか?

News
bert/multilingual.md at master · google-research/bert · GitHub
TIS、自然言語処理・機械学習向けデータ作成ツール「doccano」をOSSで公開 | ニュースリリース | 2018年度 | ニュース | TIS株式会社
Sorry I didn’t get that! — How to understand what your users want
Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning)
Spinning Up in Deep RL
MLflow - A platform for the machine learning lifecycle | MLflow
Articles
[1811.00002v1] WaveGlow: A Flow-based Generative Network for Speech Synthesis
[1811.00740] Efficient Metropolitan Traffic Prediction Based on Graph Recurrent Neural Network
[1811.02549] Language GANs Falling Short
[DL輪読会]Graph Convolutional Policy Network for Goal-Directed Molecular…
[1808.10568] Multi-Hop Knowledge Graph Reasoning with Reward Shaping
[1811.01848] Plan Online, Learn Offline: Efficient Learning and Exploration via Model-Based Control
[1811.02553] Are Deep Policy Gradient Algorithms Truly Policy Gradient Algorithms?
GitHub - clic-lab/nlvr
MMD: Towards Building Large Scale Multimodal Domain-Aware Conversation Systems
google-research/simple_probabilistic_programming at master · google-research/google-research · GitHub
Resources
GitHub - EpistasisLab/tpot: A Python Automated Machine Learning tool that optimizes machine learning pipelines using genetic programming.
GitHub - neuron-team/vscode-ipe: Interactive programming experience for data scientists: Visual Studio Code extension
GitHub - googlecreativelab/teachable-machine-boilerplate: Boilerplate code for Teachable Machine
ロボットは東大に入れるか。Todai Robot Project
EMNLP 2018 Highlights: Inductive bias, cross-lingual learning, and more - AYLIEN
MAMEToolkit/README.md at master · M-J-Murray/MAMEToolkit · GitHub
ESIM
実用化のための 機械学習の評価尺度の色々
Learning with Latent Linguistic Structure
How to Train Your ResNet | myrtle.ai
Series
Graph Attention Network Layerを実装する Part2 – programming-soda – Medium
Did you enjoy this issue?
 
Become a member for $5 per month
Don’t miss out on the other issues by piqcy
You can manage your subscription here
If you were forwarded this newsletter and you like it, you can subscribe here.
Powered by Revue