View profile

Weekly Machine Learning #116

News: Biduが、新しいセサミストリートファミリーであるERNIEを発表しました。文字ベースのモデルとなっているので、日本語についてもこちらの方が優位性があるかもしれません。いつまでファミリー更新


March 22 · Issue #117 · View online
All change is not growth, as all movement is not forward. Ellen Glasgow

News: Biduが、新しいセサミストリートファミリーであるERNIEを発表しました。文字ベースのモデルとなっているので、日本語についてもこちらの方が優位性があるかもしれません。いつまでファミリー更新が続くのか興味深いところです。DeepXから公開されたmachinaは、実用を意識した強化学習フレームワークとなっています。ここからどんどん応用が進むとよいなと思っております!
Articles: Semantic Image Synthesis~は割合シンプルな手法で、条件付きの画像生成を改善する手法です。デモが話題となり、Twitterなどで見かけた人も多いかもしれません。Efficient Off-Policy~は戦略側ではなく環境認識側でメタラーニングを行った手法です。最近の動向をみると、強化学習の転移はやはり表現学習のルートから進むのかなという印象です。Algorithms for Verifying~は、深層学習の実適用が進む中で重要な技術と感じます。実装も公開されているので、ちょっと見ておきたいたいです。
Resources: XGBoostとJupyterlabの記事はお勧めです。Jupyterlabはまだ使ったことがなかったのですが、単にpip installをjupyterからjupyterlabにするだけで使えるようなので一回使ってみようかなと思います。創薬コンペティションについての記事は、結構ニッチな分野の記事なのでとても参考になります。
Series: 今週は強化学習本の修正を行っており、それに関する記事となっています。Policy Gradientについて、結構まちがえやすいところをまとめているので参考になれば幸いです。

Baidu released knowledge integration language representation model ERNIE which outperforms Google’s BERT in certain Chinese NLP tasks
machina | A Library for Real‑World Deep Reinforcement Learning
Pruning Models with NVIDIA Transfer Learning Toolkit | NVIDIA Developer Blog
Conda 4.6 Release - Anaconda
Honoring J.S. Bach with our first AI-powered Doodle
Semantic Image Synthesis with Spatially-Adaptive Normalization
Human Pose Estimation – VITA
Implicit Generation and Generalization Methods for Energy-Based Models
[1903.08254] Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables
[1903.06758] Algorithms for Verifying Deep Neural Networks
[1901.09491] Stiffness: A New Perspective on Generalization in Neural Networks
[1903.08114] Exact Gaussian Processes on a Million Data Points
Dive into XGBoost - Speaker Deck
木星を継ぐもの 〜JupyterLab よこんにちは〜 | Research Blog
Deep Learning等の精度評価において、F値(Dice)とIoU(Jaccard)のどちらを選択するべきか? - OPTiM TECH BLOG
Text classification using TensorFlow.js: An example of detecting offensive language in browser
ML Kit事例紹介 機械学習を活用したプロトタイプアプリの開発 - Speaker Deck
Deep Learning for Robotics
コンペティションから見るAI創薬/AI drug discovery in the view of competitions - Speaker Deck
Replay BufferがPolicy Gradientで使えない理由 – programming-soda – Medium
AdvantageでActor-Criticを学習する際の注意点 – programming-soda – Medium
Did you enjoy this issue?
Become a member for $5 per month
Don’t miss out on the other issues by piqcy
You can manage your subscription here
If you were forwarded this newsletter and you like it, you can subscribe here.
Powered by Revue