ギークなエンジニアを目指す男

機械学習系の知識を蓄えようとするブログ

第35回 Machine Learning 15minutes! に参加してきました

f:id:taxa_program:20190428165541p:plain
 

こんにちは。takapy(@takapy0210)です。

待ちに待った(?)GWです。今年は10連休&元号が変わるということで、若干のお祭りモードを感じます。

5月6日に「10連休何やってたんだっけ・・・」とならないように、適度に勉強もしていきたいな!と思っていたりします。

本エントリは27日に参加してきた第35回 Machine Learning 15minutes!の雑多メモです。 あまり有用なことは書いておりませんのでご承知ください。

はじめに

ハイプ・サイクル調査ではAIは幻滅期に入ったと言われているようです。
一方でAI技術を活用するハードルは下がっており、アルゴリズムや学習済みモデルがオープンソースとして流通しているのも事実です。

そんな中で、他社さんは事業に対してどのようにAI(機械学習)を取り入れているのか、そんな知見を得られれば良いな〜という気持ちで参加してきました。

以下、簡単ではありますが印象的だった部分をつらつらと書いてみます。(発表者の皆様、私の認識に誤りがありましたら、すみません)

LT内容

牛久 祥孝さん【OSX & Ridge-i】 - オムロンサイニックエックス株式会社 / 株式会社Ridge-i

大量の動画の中から、言葉で特定の動画を検索することができる話

  • 例:「上裸でスノボやってる人」など
  • YouTubeと一緒?かと思ったら全然違った。動画の説明文から検索するのではなく、動画を学習して、その動画にどんなオブジェクトが映っているか判定しているらしい。すごい。

ゴミステーションの話

  • 焼却炉の火加減をコントロールするのに機械学習を用いている
    • 火が弱いと水分の多いゴミによって消えてしまう。一度消えると再点火が大変(再点火は札束を投燃やすようなもの、というぐらいコストが膨らむらしい)
    • 逆に火が強すぎると、焼却炉の施設へのダメージが多いらしい。
  • ピクセル単位でどこ場所にどのようなゴミがあるか認識して、火力をコントロールしている。

PVCR2019の話

  • ラベルがノイズ混じりでも大丈夫なGAN

    • 現実世界ではラベルにノイズが混ざっていることが多い。
      • ノイズの影響を受けて、GANが間違えてしまう。
  • シュミレーターで画像を生成して、それから学習させたりしている。

    • シュミレーターなので、どこに何があるか計算できている→学習データの精度は良い
    • しかし、これを現実世界で推論させるとなかなか難しい
  • 現実世界の画像(写真)から学習させたモデルで、イラスト等の物体検知できたりもする

    • 人、鳥、ボトル、バイク、猫・・・など

所感

  • 全体的に自分には少し難しい内容であった。勉強が必要。
  • 現実世界の写真から学習させて、イラストの物体検知などできるのはすごそう感が強かった。
  • ゴミステーションなどでも機械学習が使われていることを初めて知った。聞いている限りだとかなりコストカットできているようなので、幸せな気持ちになった。地球に優しい。

佐藤 一憲さん【TensorFlow Lite and Edge TPU】 - グーグル株式会社

TensorFlow Liteの話

  • Edgeで推論するためサービス
  • TensorFlowで作ったモデルをConverterで簡単に整形できる
  • Android NN APIというものがあり、その上で動く(AppleだったらCore ML)
  • 速度、容量ともに優しい

FIrebaseにあるML Kitの話

  • ネイティブエンジニアのためのML
  • エッジ推論とクラウド推論と選択できる
  • ある程度のプリサンプルAPIがある。もちろんカスタマイズすることもできる。
    • FPSが60くらい出ている
    • ショッピングカートにラズパイとカメラつけて、メニューのレコメンド
    • クラウド推論だと2sかかっていたが、エッジ推論だと5ms
  • AutoML vision
    • クラウドに画像をあげて、ポチッとボタン押すと24時間で最良のモデル選択・作成してくれるサービス。
    • 24時間で500ドルぐらい
    • エッジ端末用の「AutoML vision Edge」もある

所感

  • エッジ端末だけで学習 & 推論する流れが来るのかな?という印象。ネットワークレイテンシ考えると、エッジ推論の方が1/4ぐらいのスピードがでるみたい。
  • ショッピングカートにラズパイとカメラつけて、メニューのレコメンドしてくれるやつとか、家の冷蔵庫とデータ共有できればとても便利になりそう。

佐藤 直生さん【Microsoft AI Updates】 - 日本マイクロソフト株式会社

AzureでMLの話

  • ある程度MSで学習させてあるモデルが使える
  • Anomaly Detector
    • データを渡せば異常値を検出してくれる
  • Azure VScode、Azure jupyterなどもある
  • frameworkはONNX
  • MSさんもPytorchの開発に関わっていくみたい
  • Azure ML
    • 開発、トレーニング、推論のサイクルを支援するサービス
    • 実行履歴管理、パラメータチューニングの自動化などが可能
  • Azure Databricks
    • Sparkのサービス
    • ビックデータのトランスフォーム

AI for Good Idea Challengeというものを開催しているみたい

www.ailab.microsoft.com

所感

  • やっぱりエッジ端末でMLやっていく流れをひしひしと感じたLTであった。
  • どのパブリッククライド(GCP, Azure, AWS)もML系のサービスに力を入れている雰囲気を感じた。

鮫島 正樹さん【Reinforcement Learning on Cloud】 - アマゾン ウェブ サービス ジャパン株式会社

クラウドで強化学習する話

  • 強化学習とは
    試行錯誤の結果を学習データとする手法

    • レーシングゲームの例
      • ひたすら走らせる
      • 早く走れたら報酬を与える
      • 報酬によってエージェントが賢くなっていく
  • 強化学習における課題

    • 強化学習のアルゴリズムだけでなく、シミュレーションの計算量が多い
    • 並列分散シミュレーションのアルゴリズムがいくつかある
      • A3C
      • PPO
      • Ape-X
  • 実装面での課題

    • シミュレーション環境の構築が大変
      • 構築知識が必要
      • 構築自体も構築、評価のイテレーションの繰り返し
      • 環境構築のためのライブラリ知識が必要

SageMakerでエージェント、シミュレーション環境を構築できるみたい

所感

  • 強化学習の知識はほとんどないが、まだまだ実社会での実例が少ないみたい。その原因の一つとして様々な課題があるんだなぁという印象を受けた。SageMakerでそこを解決できるみたい。

佐々木 邦暢さん【Automatic Mixed Precision で学習を高速化】 - エヌビディア合同会社

FP32とFP16の話

  • FP16(半精度)で結構いける

    • 計算のスループットは8倍になる
    • 混合精度行列ユニット
      • TeslaV100だと、tensorコアが入っているのでFP16でも良い成果がでる
      • バッチサイズも大きくできる(メモリ消費が少ないので)
  • GCPはインスタンスとGPUがフレキシブルに選択できるらしい。

所感

  • 正直自分には知識がなさすぎてあまり理解できなかった・・・
  • 最新のGPU使うと、FP16でもいろいろいけそう感があることは伝わりました。

武田 秀樹さん【リーガルテックにおける機械学習の最先端】 - 株式会社FRONTEO

幻滅期に向けてのポイント

  • ROI
  • 運用
  • ドメインの深掘り
    →今日はこのドメインの深掘りの話

今後のAIベンダーの話

  • 一連の機械学習PJフローを回せることが大事
  • ドメイン知識をつけることも大事

リーガルテックにおけるAIの話

  • 訴訟におけるディスカバリー

    • 公開した情報を収集、調査する必要がある
    • この調査は弁護士や法律の知識のある人がやる必要がある
      →ここで自然言語処理を使って、証拠となりうるものが発見できる
  • 調査領域で機械学習による生産性向上

    • 多種多様なドキュメントに対して、経験の異なるレビュアーが多様な観点で内容をチェックしなければならないのが課題だった
  • ドキュメントの量によって課金するモデルとしている

    • AIを使うことによって実現可能な課金モデル
    • 機械学習を使わない場合は人月に対して課金するビジネスモデルだった
  • 説明性の担保

    • 弁護士の方に説明しなければならない
    • ここが結構難しいみたい

所感

  • リーガルテックの話は普段聞けないので面白かった。
  • 証拠となる文書かどうかの判断ってどう学習させているのか気になった。
  • どの業界にも課題はまだまだたくさんあって、中でもITの技術を使って解決できる課題は多そう。

中林 紀彦さん【ML Opsの実装例 - 学習済みモデルをWebサービスに組み込む】 - SOMPOホールディングス

ML Opsは流行らせていこうよ!という話

  • ML Opsを流行らせたい
  • Flaskエンジニアを増やしたい
  • 結果的にGDPあげたい
  • 経団連もAI Ready化として応援している
  • ビジネスの経験とMLOpsの経験が重要

所感

  • ML Opsという言葉は最近良く耳にするようになってきたので、流行らせていきたい & 社内でも実践していきたい。

小澤 健祐さん【AIニュースサイト「AINOW」掲載記事でAIトレンド分析 ~ 4月 ~ 】 - dip AI. Lab

まずはAIをAIと言わないようにすることが必要とのこと。面白い。

t.co

スクエニのVRゲームの話

  • 壊れた宇宙船を、宇宙人?のようなキャラに指示を出しながら修復するゲーム
  • VRゲームだが、音声で操作する
  • 指をさしながら「これ」を「あの白い部分につけて」という指示でも宇宙人は理解して動くらしい。
    • 言葉を概念として認識することで、「あれをそこにつけて」ということを学習している

終わりに

本当に備忘録みたいな記事になってしまいましたが、機械学習界隈の新鮮な話が聞けてよかったです!

ということでGW初日は優勝でした!

発表者の皆様、会場提供いただいたディップ株式会社様、ありがとうございました!