Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SSII2025[PT2]AI研究の未来を拓くチームビルディング

 SSII2025[PT2]AI研究の未来を拓くチームビルディング

More Decks by 画像センシングシンポジウム

Transcript

  1. 1/77 自己紹介 名前:小塚 和紀(こづか かずき) 博士(工学), MBA 所属:パナソニックホールディングス株式会社 DX・CPS本部 デジタル・AI技術センター

    AIソリューション部 1課 スタンフォード大学 人工知能研究所 客員研究員 (2016.4-2019.3) Supervisor:FeiFei Li(世界最大の画像データセットImageNetの開発者) 専門分野:人工知能/コンピュータビジョン/パターン認識 世界最大の行動認識向けマルチモーダルデータセット Home Action Genome, オープンボキャブラリなマルチモーダル基盤モデル HIPIE, 国内最大規模の日本語LLM Panasonic-LLM-100b, 対話型マルチモーダル基盤モデル SegLLM等を開発 マルチモーダルデータセット Home Action Genome マルチモーダル基盤モデル HIPIE 日本語LLM Panasonic-LLM-100b
  2. 9/77 AI研究におけるチームビルディングの考え方 AIは競争が激化する中で「技術」だけでは戦いにくい時代に突入 → 仮説:ダイナミック・ケイパビリティの考え方を導入するとよい? ダイナミック・ケイパビリティ:企業が環境の変化に適応し、事業や組織を変革する能力 → 不確定要素が多いAI研究に「外部連携を活用したチームビルディング」を導入 感知 (Sensing)

    捕捉 (Seizing) 変容 (Transforming) 環境変化(機会や脅威)を機敏に感知する能力 → 情報源の多様化でリスク回避 社内外の資源の結合や再活用を行う能力 → 内部では補えないリソースを補完可能 資源や組織を再編成し、 持続的な競争力を維持する能力 → 新たなノウハウ・組織文化の獲得
  3. 10/77 今回の講演 AI研究の最前線における外部連携を活用したチームビルディングの事例について紹介 大学との連携事例: 1.スタンフォード人工知能研究所との連携 → 大規模データセット構築、国際ワークショップ主催に関する事例 2.UC Berkeleyとの連携 →

    バーチャルラボ体制の構築と基盤モデル開発の事例 スタートアップとの連携事例: 3.ストックマーク株式会社との協業による大規模言語モデルの開発 4.FastLabel株式会社との協業によるデータアノテーション効率化 → AIの社会実装に向けた外部連携の事例
  4. 13/77 パナソニックのAIに対する考え方 Cyber Physical AI 安定品質のものづくりで、 実世界に価値を送り続ける 産業に破壊的な価値をもたらす ソフトウェア技術 “REAL”

    IoT Company 実世界のデータをサイバー空間で分析し くらしを豊かにし社会課題の解決を行う Cyber-Physical 実世界のデータをサイバー空間で分析する Cyber Physicalに注力 → クラウド上だけではなく,実空間に近い領域でのAI活用がパナソニックの優位性
  5. 21/77 スタンフォード大の戦い方(特にFeiFei Li) ImageNet Large Scale Visual Recognition Challenge (ILSVRC)

    Deep Learningが出現した2012年から数年で性能が99%に到達 (2017年でアカデミアによるコンペティションを終了する宣言) → 新たな認識タスクを作る&その分野を流行らせるをセットにしている 引用:Large Scale Visual Recognition Challenge (ILSVRC) 2017
  6. 29/77 Home Action Genome マルチモーダルデータ カメラだけでなく,家庭内に設置可能なセンサにより ユーザ行動を認識 ※パナソニックが保有する実験ハウス(US)で計測を 実施 行動ラベル(アノテーション情報)

    家庭内で発生する行動を網羅 家庭内の行動(Activity): 70種類 行動内の詳細動作(Atomic Action): 453種類 住空間における多くのユーザ行動を検出可能になる 日常行動3,500シーンを収録
  7. 31/77 CAMP workshop ImageNet Large Scale Visual Recognition Challenge (ILSVRC)

    と同様の認識コンペティションを開催して,AI研究者と行動認識モデルを共創 International Challenge on Compositional and Multimodal Perception(CAMP) をAIのトップカンファレンス(CVPR,ICCV,ECCV)で主催
  8. 33/77 SAILとの連携を通じての気付き① 採掘者 大量のデータ利用者 (過当競争) AIモデル GPU 供給 トップ研究者は,技術だけでなく 優位なポジションを得られるような活動を仕掛けてくる

    (例:投資をかけられるのであれば,データ,コンペが有効に働く場合がある) → 技術の優劣だけでなく,分野の構造上やどんな優位性が潜んでいるかを再確認 データセット=鉱山 (制御可能)
  9. 34/77 SAILとの連携を通じての気付き② 採掘者 大量のデータ利用者 (過当競争) AIモデル GPU 供給 自分の活動範囲だけで研究を閉じることなく 制御できる場所を発見・周辺のプレーヤーを巻き込むことで

    世界的な活躍をできる可能性がある → この図では鉱山と採掘者に着目,実はつるはしやジーンズをうまく使う手があるのでは? データセット=鉱山 (制御可能)
  10. 37/77 産学連携プログラム BAIR Commons パナソニックHDはUC Berkeleyの産学連携プログラム BAIRオープンリサーチコモンズ(BAIR Commons)に参画 → BAIR参画企業で開発した資産を参画企業でシェアする仕組み

    (BMW, Bosch, Electronic Arts, Google, Meta, Panasonic, Picsart, Samsung, Sony, …) 自社以外の企業の開発資産にもアクセス可能(AIの使い方が他の参画企業と異なるパナソニックにとっては有利な仕組み)
  11. 39/77 チームビルディングの工夫:バーチャルラボ体制の構築 海外研究部門 パナソニックホールディングス 事業会社 Company A Company B ・・・

    Engineering Solution1 Engineering Solution2 Engineering Solution3 トップ大学に入り込んで先端技術の原理獲得 社外連携による重要技術の見極め ソリューション構築・事業適用 海外トップ大学 Cutting-edge Technology1 Cutting-edge Technology2 Cutting-edge Technology3 大学の技術を短期間で事業までつなげるために現地の海外研究部門を入り込ませる 事業課題を反映させるために事業会社を含めたチーム体制を構築 → 相反する研究と事業の板挟みになるが、この両立が研究の差別化につながる
  12. 41/77 PanasonicのAI活用における特徴と課題:データ構築・チューニング 現場ごとに「データ収集・アノテーション」を行って「AIをチューニング」しなければならない → 幅広い事業への現場適用リソースがボトルネックに … アノテーション チューニング アノテーション チューニング

    アノテーション チューニング アノテーション チューニング 現場①向けAI 現場① 現場②向けAI 現場② 現場③向けAI 現場③ 現場N向けAI 現場N 画像 ラベル データ収集 データ収集 データ収集 データ収集 … … … AI
  13. 43/77 解決に向けた注力技術:基盤モデル 少数データ学習 基盤モデル マルチモーダルデータ … 僅かなデータで、多様な現場の お客様それぞれに最適なAIをお届け 基盤モデルにより 様々なくらし・現場に適応

    パナソニックグループの幅広い事業を カバーするデータ (例:大規模行動認識データ Home Action Genome) 基盤モデル x 少数データ学習で,AIをあらゆるくらし・現場へ → スケーラブルなAIでこれまでAIを導入できなかったくらし・現場へのAI実装を加速
  14. 44/77 解決に向けた注力技術:基盤モデル 少数データ学習 基盤モデル マルチモーダルデータ … 僅かなデータで、多様な現場の お客様それぞれに最適なAIをお届け 基盤モデルにより 様々なくらし・現場に適応

    パナソニックグループの幅広い事業を カバーするデータ (例:大規模行動認識データ Home Action Genome) 基盤モデル x 少数データ学習で,AIをあらゆるくらし・現場へ → スケーラブルなAIでこれまでAIを導入できなかったくらし・現場へのAI実装を加速
  15. 50/77 HIPIEはどんなことに使える? ①現場で取り扱う物品,新商品による認識対象の変化に対して テキストプロンプトを追加するだけで認識可能になる ②物体名ではない曖昧な対象に対してもテキストプロンプトで認識対象にすることが可能 基盤モデル 環境が変化 ・新たな工場 ・部品の更新 “equipment,

    tool, … , conveyor” テキスト・プロンプト(見分けたい対象) 基盤モデル 黄色い 服装の人を カウントしたい “equipment, tool, … , person wearing yellow jacket” テキスト・プロンプト(見分けたい対象) → 新たな環境で見分けたいものを再学習なしで追加 → データ構築時にはクラスを定義しにくい詳細な対象
  16. 51/77 従来のAIの構成 画像AI 物体検出 セグメンテーション 物体検出 デコーダ 画像 画像AI セグメンテーション

    画像 エンデコーダ ①入力画像を特徴量に変換するエンコーダ ②特徴量を認識結果に変換するデコーダ 出力 入力 特徴量
  17. 52/77 基盤モデル HIPIEの構造 特徴量 画像AI 言語AI 物体検出 セグメンテーション HIPIE ①言語AI/画像AIのエンコーダ

    ②複数の認識タスクに対応したデコーダ 物体検出 セグメンテーション エンコーダ デコーダ テキスト プロンプト 画像 ・・・ equipment tool ・・・ person
  18. 54/77 HIPIEの仕組み①:未知の対象の認識 特徴量 言語AI “tool” “equipment” “conveyor” テキストプロンプト 言語データを事前学習したBERT等の大規模言語モデルが大幅に性能向上 →

    HIPIEでは汎用性の高い「言語AI」を画像AIの機能拡張に活用 大規模言語モデル 大量の単語・複雑な テキストプロンプトでも 特徴空間へのマッピングが可能 大規模化
  19. 56/77 言語AIでマッピングされた位置を参照することにより 未知の画像であっても再学習せずに認識可能 HIPIEの仕組み①:未知の対象の認識 画像AI 言語AI HIPIEの実行フェーズ 未知の画像 特徴量 HIPIE

    “person” “tool” “equipment” “person” 言語AIー画像AI 特徴量のマッチング テキストプロンプト (見分けたい対象) equipment tool ・・・ person
  20. 59/77 HIPIEの効果・性能 基盤モデルの効能:一つのモデルで多数のタスクに適用可能 → 全てのセグメンテーションタスクに対応可能できるのはHIPIEのみ Instance Segmentation Semantic Segmentation Panoptic

    Segmentation Part Segmentation Reference Segmentation 数えられる対象物 (前景クラス)で構成 数えられない自然対象 (背景クラス)で構成 前景,背景 両方に対応 動物・ヒトの個体毎に 体の各部位をマスク 指示文で 特定個体のみをマスク
  21. 65/77 ストックマーク株式会社との協業 ①モデルの強さに加えて、整理されたデータの強みを重視(ハルシネーション抑制) ②モデル提供形態の柔軟性の高さ(セキュリティ → 小型化・オンプレ活用) パナソニックにおける LLMの課題整理 ・ハルシネーション ・セキュリティ

    ・開発コスト 協業先のピックアップ ・各社の強みの分析 ・公開モデルの性能評価 ・GENIAC採択状況 連携交渉 ・モデル提供の柔軟性 ・開発スピード Panasonic-LLM開発 ・担当の明確化 ・精緻化モデルの提供 ・学習ノウハウの提供 情報収集 市場分析 社内情報検索 エンタープライズサーチ Know-Who 組織開発 ビジネスニュース,論文・特許,社内文書を 推薦・検索・要約が可能な ビジネス特化AIサービスを提供 A news向けに創業時から蓄積した 日本語×ビジネスデータに強み GENIAC採択
  22. 66/77 Panasonic-LLM-100bのコンセプト Stockmark-LLM-100b Panasonic-LLM-100b Closed data ①ハルシネーション&日本語に強く,パナソニックの業務内容に回答可能 ②現場に合わせたモデルのカスタマイズが可能 グループ内情報 (製品・技術情報)

    公開モデルに追加学習を実施 より精緻化させたモデルを提供 追加学習/信頼性・AI倫理強化 適用領域 業界ごとの業務効率化 製品・サービス 学習ノウハウ モデル 回答精度 Stockmark-LLM-100b 0.90 GPT-4-turbo 0.64 GPT-3.5-turbo 0.44 Stockmark Business Questions 質問回答精度・評価結果 2024.7 プレスリリース時の性能比較
  23. 69/77 社内情報に対する回答例 Q.パナソニック ハウジングソリューションズ株式会社が開発した植物油脂由来の塗料とリサイクル木材 を基材に使った床材は何ですか Panasonic-LLM-100b パナソニック ハウジングソリューションズ株式会社が開発 した、植物油脂由来の塗料とリサイクル木材を基材に使 用した床材は「サステナブルフロア―TM」です。

    GPT-4o パナソニック ハウジングソリューションズ株式会社が開発 した、植物油脂由来の塗料とリサイクル木材を基材に使 用した床材は「エコシステムフローリング」と呼ばれていま す。この製品は環境に配慮し、持続可能な素材を使用 している点が特徴です。エコシステムフローリングは、自然 素材を活用しながらも高い耐久性と美しい仕上がりを実 現しています。 ※プレスリリース情報を参考情報として提示
  24. 71/77 AI開発プロセスにおける課題:アノテーション … アノテーション チューニング アノテーション チューニング アノテーション チューニング アノテーション

    チューニング 製品・現場①向けAI 製品・現場① 製品・現場②向けAI 製品・現場② 製品・現場③向けAI 製品・現場③ 製品・現場N向けAI 製品・現場N 画像 ラベル データ収集 データ収集 データ収集 データ収集 … … … AI 幅広い事業に対する製品・現場毎のデータ構築がAI展開のボトルネックに AI開発プロセス
  25. 72/77 AI開発プロセスとは? 企画設計から現場にAIを適用するまでの一連のプロセス AIの性能は、教師データ構築とアルゴリズムで決まる アルゴリズム 開発 学習・評価 推論 企画 設計

    教師データ 構築 何を実現したいか? 何を認識したいか? どうやって認識するか? 教師データのパターンを学習 教師データ 画像とラベル(何が、どこにあるか?)のペア 例)30万枚の画像を利用(MSCOCOデータセット) COCO - Common Objects in Context 画像から 位置を予測する アルゴリズム 画像から 領域を予測する アルゴリズム 教師データを再現する ようなパラメータを学習 領域認識 物体検出
  26. 75/77 FastLabel株式会社との連携:AI開発効率向上に向けた協業 基盤モデル HIPIEとData-centric AIプラットフォームの連携により AI開発効率を向上してパナソニックグループのAI開発を加速 モデルの学習をせずに プロンプトの入力でアノテーション自動化が可能な 基盤モデル HIPIE

    企業内AIモデル開発プロジェクトの 一連にわたる支援が可能な Data-centric AIプラットフォーム AI開発プロセスのボトルネックとなるデータアノテーションの手間を大幅に削減 × HIPIE テキスト・プロンプト (データ構築したい対象) 画像認識 banana
  27. 77/77 さいごに AI研究の最前線における外部連携を活用したチームビルディングの事例について紹介 大学との連携事例: 1.スタンフォード人工知能研究所との連携 2.UC Berkeleyとの連携 → ポイント:連携により何を制御したいかを明確化(単純に技術の強化ではない) ・データセットを押さえることにより研究領域の方向性を制御

    ・柔軟性の高い組織との連携により、チーム規模を制御 スタートアップとの連携事例: 3.ストックマーク株式会社との協業による大規模言語モデルの開発 4.FastLabel株式会社との協業によるデータアノテーション効率化 → ポイント:自身のコアコンピタンスの明確化 社会実装までのパスを繋ぐことができるパートナーとの連携により 実用化までの期間を大幅に短縮できる