View profile

Weekly Machine Learning #143

Revue
 
News: ImageNet内の人物画像に人種の偏りや差別的なカテゴリがあったため、画像/カテゴリの修正が行われることになりました。ImageNetが特別差別的な作成方法を取ったわけではないので、今後他
 

piqcy

September 27 · Issue #144 · View online
All change is not growth, as all movement is not forward. Ellen Glasgow

News:
ImageNet内の人物画像に人種の偏りや差別的なカテゴリがあったため、画像/カテゴリの修正が行われることになりました。ImageNetが特別差別的な作成方法を取ったわけではないので、今後他のデータセットでも同様の修正が行われるかもしれません(自然言語処理のデータセットでも)。StanfordのCS 330はマルチタスク/メタラーニングに特化したコースです。比較的最近発達してきた手法ですが、それがすぐ講義になるのは驚きです。講義の充実では頭1つどころか3つ4つ抜けている印象があります。PyTorchはPython2対応を来年頭からDropするので、移行していない方はお早めに(いまだ使っている人はいない・・・ですよね?)。
Articles:
Making the Invisible Visible~は、驚きを感じることが少なくなった画像系論文の中で久々にインパクトがある研究でした。可視/不可視の情報を組み合わせるという点はかなりアツいと思います。 A Critical Analysis~は、構造を学習する(とされる)手法の評価が本当に妥当か問いかけています。Tree系の手法に端を発する研究ですが、この分野は手法の複雑化とリセットを繰り返している印象です。MixoutはDropoutにヒントを得た転移学習の手法です。確率的にモデルパラメーターをMixする手法なのですが、理論的な解析もあり丁寧に書かれている印象です。事前学習済みモデル+Headではない新しいスタンダードになるかも?しれません。
Resources:
Kaggle Coursesは短時間でデータサイエンスを学ぶのによいコースだと思います。Goodhart’s Law~は学術的な成果を測る難しさを感じさせられます。評価が大学の在り方すらゆがめてしまうというのは、考えさせられるものがありました。workshop-p5-introはアートのためのコーディング資料で、個人的に参考にしたいです。Why we switched from Spacy to Flair~は、固有表現認識に関するかなり実践的な記事です。これを国のプロジェクトで出しているのか・・・と思うと(フランスのデジタル省的な機関と最高裁判所の共同プロジェクトです)、情報技術活用の差を感じさせられます。OSSを活用して機械学習して、使うだけでなくPRを出しつつ検証過程をMediumに投稿するって、日本では何年後か・・・と。
Series:
久々の連載更新です。Airflowで始まった連載の最後がAirflowからの脱却で終わるとは・・・という感じです。強化学習本は改訂2版が発売したのでよろしくです!

News
ImageNetのデータ改善についてのアナウンス。Personのカテゴリについて、人種によるデータのばらつき、攻撃的・差別的なカテゴリ、画像から判断不可能なカテゴリ(博愛主義者など)が修正されるとのこと。
CS 330: Deep Multi-Task and Meta Learning Fall 2019, Class: Mon, Wed 1:30-2:50pm, Bishop Auditorium Description:
Dropping Python 2 support on January 1st, 2020 - PyTorch Forums
第55回 コンピュータビジョン勉強会@関東 (2019/10/19 14:30〜)
Introducing the CodeSearchNet challenge - The GitHub Blog
MIMII Dataset: Sound Dataset for Malfunctioning Industrial Machine Investigation and Inspection | Zenodo
Google AI Blog: Contributing Data to Deepfake Detection Research
Building AI to inform people's fashion choices with Fashion++
Articles
[1909.09300] Making the Invisible Visible: Action Recognition Through Walls and Occlusions
[1710.05381] A systematic study of the class imbalance problem in convolutional neural networks
[1909.09428] A Critical Analysis of Biased Parsers in Unsupervised Parsing
ALBERT: A Lite BERT for Self-supervised Learning of Language Representations | OpenReview
[1909.11299] Mixout: Effective Regularization to Finetune Large-scale Pretrained Language Models
[1909.09157] Rapid Learning or Feature Reuse? Towards Understanding the Effectiveness of MAML
[1908.00261] Optimality and Approximation with Policy Gradient Methods in Markov Decision Processes
Resources
Kaggle Courses - Faster Data Science Education
Goodhart’s Law: Are Academic Metrics Being Gamed?
【開催報告】ML@Loft #5 (NLP) | Amazon Web Services
コンピュータビジョンの最新論文調査 Single Image Super-Resolution 前編 - Technology of DeNA
GitHub - mattdesl/workshop-p5-intro: Intro to Creative Coding workshop with p5.js and Tone.js
GitHub - stepjam/RLBench
Why we switched from Spacy to Flair to anonymize French case law
Series
Apache Airflowでエンドユーザーのための機械学習パイプラインを構築する Part5 (End)
GitHub - icoxfog417/baby-steps-of-rl-ja: Pythonで学ぶ強化学習 -入門から実践まで- サンプルコード
Did you enjoy this issue?
 
Become a member for $5 per month
Don’t miss out on the other issues by piqcy
You can manage your subscription here
If you were forwarded this newsletter and you like it, you can subscribe here.
Powered by Revue