View profile

Weekly Machine Learning #150

Revue
 
News: IEEEがarXivに次いで論文のプレプリントサービスを公開しました。1プラットフォームへの依存はあまり健全とは言えないので、これは良い流れだと思います。Machine learning i
 

piqcy

November 15 · Issue #151 · View online
All change is not growth, as all movement is not forward. Ellen Glasgow

News:
IEEEがarXivに次いで論文のプレプリントサービスを公開しました。1プラットフォームへの依存はあまり健全とは言えないので、これは良い流れだと思います。Machine learning in UK financial servicesは、イギリスの金融サービスでどのように機械学習が使われているのかを調べた資料です。Googleが銀行口座サービスを開始するという報道がありましたが、銀行をはじめとする基幹金融サービスにまで機械学習活用の流れが進んでいくかもしれません。くずし文字、同義語辞書など日本でもリソースの公開が進んできたのは喜ばしいことです。
Articles:
疑似ラベルを使用した学習は、最近トレンドになっているなと感じます(こちらなど)。ベンチマークとして、ラベルなしを含んだデータセットも公開されていったりするかもしれません。RadialGANも、データを増やすという点では似ていると思います。自然言語では、多言語の分散表現(LASER)がトレンドの一つと感じます。Emuはシンプルながら精度向上の幅も大きく(一部上がっていないところもありますが)、興味深い手法と思います。シンプルといえばContrastive Representation Distillationもで、蒸留する機会があれば試してみたいです(スコアがかなり上がっている)。
Resources:
Federated Learningは、個人的にはとても面白いなと感じています。機械学習モデルのパーソナライズがどんな価値をもたらすかイメージできないところはありますが(モーション認識とかはいいかも?)、問題設定として夢がある感じです。The Batchの記事は、機械学習にまつわる怪談がまとめられた資料です。笑ってしまうようなものも中にはありますが、バイアスなどちゃんと意識しないといけないなと感じる問題もあります(コメントがすごい勉強になる・・・)。Docker入門の記事はとてもわかりやすいのでお勧めです!
Series:
今年前半にかけて作っていたデータセットを公開しました!自然言語処理で企業分析を行うためのデータセットです。ぜひ使っていただければと。

News
TechRxiv: IEEE Launches New Preprint Server | IEEE Xplore Subscription Options
Machine learning in UK financial services
日本古典籍くずし字データセット | ROIS-DS人文学オープンデータ共同利用センター
SudachiDict/synonyms.md at develop · WorksApplications/SudachiDict · GitHub
Google AI Blog: Introducing the Next Generation of On-Device Vision Models: MobileNetV3 and MobileNetEdgeTPU
NVIDIA Makes 3D Deep Learning Research Easy with Kaolin PyTorch Library – NVIDIA Developer News Center
[D] Colab has P100 GPUs : MachineLearning
Articles
[1911.04252] Self-training with Noisy Student improves ImageNet classification
[1802.06403] RadialGAN: Leveraging multiple datasets to improve target-specific predictive models using Generative Adversarial Networks
Margin-based Parallel Corpus Mining with Multilingual Sentence Embeddings - ACL Anthology
[1909.06731] Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization
[1910.10699] Contrastive Representation Distillation
Resources
Federated Learning: Challenges, Methods, and Future Directions – Blog | Machine Learning | Carnegie Mellon University
Leaf
The Batch: Daemon Spawn, AGI Takeover, Deepfake Deluge, Bias Crisis - How Scared Should You Be?
なぜ疑似ラベルが効果的か調べてみた - 機械学習 Memo φ(・ω・ )
GitHub - Kensuke-Mitsuzawa/JapaneseTokenizers: aim to use JapaneseTokenizer as easy as possible
ndl-lab · GitHub
Self-Supervised Representation Learning
Metrics
さわって理解するDocker入門 第4回 | オブジェクトの広場
Series
TIS、自然言語処理で企業分析を行うためのデータセット「CoARiJ」を無償公開 | ニュースリリース | 2019年度 | ニュース | TIS株式会社
Did you enjoy this issue?
 
Become a member for $5 per month
Don’t miss out on the other issues by piqcy
You can manage your subscription here
If you were forwarded this newsletter and you like it, you can subscribe here.
Powered by Revue