Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

SLMをエッジAIとして検証してみて分かったこと

 SLMをエッジAIとして検証してみて分かったこと

AIxIoTビジネス共創ラボ

November 26, 2024
Tweet

More Decks by AIxIoTビジネス共創ラボ

Other Decks in Technology

Transcript

  1. Copyright © Tokyo Electron Device LTD. All Rights Reserved. SLMをエッジAIとして検証してみて分かったこと

    クラウドIoTカンパニー エッジクラウドソリューション部 ストラテジックプランニンググループ 辻野三郎 2024年11月26日
  2. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 2

    東京エレクトロンデバイス 会社概要 会 社 名 東京エレクトロン デバイス株式会社 設立年月日 1986年3月3日 代 表 者 代表取締役社長 徳重 敦之 上場証券取引所 東証プライム市場(コード番号:2760) 資 本 金 24億9千5百万円 (2024年3月31日現在) 売 上 高 2,428億88百万円(2024年3月期) 従業員数 連結: 1,357名(2024年3月31日現在) 本社所在地 東京都渋谷区桜丘町1番1号渋谷サクラステージ SHIBUYAタワー 主な事業内容 マイクロソフトとのパートナーシップ Microsoft Japan Partner of the Year Internet of Things (IoT) Award Windows Embeddedライセンスの 販売パートナーとして 30年以上の実績 Cloud Solution Provider Since 2016
  3. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 3

    製造業(OEM)向け TED クラウドIoTカンパニーのビジネス 半導体/エッジデバイス クラウド AI セキュリティ 製造業の製品づくりを支援するため、半導体などのエッジから、AI、IoT、クラウド、セキュリティまでのソリューションを提供 組み込みOS IoT 組込IoTボード・ゲートウェイ PC・サーバ・周辺機器 産業用CPUボード・PC 組込みCPUモジュール Bluetoothルーターサービス 産業用フラッシュストレージ 組込みWindows OS 組込みLinux OS クラウドソリューション 組込み・クラウド向けセキュリティ 産業向け次世代IPS OTセキュリティリスク可視化 製品サポート業務のDX ローコード・ノーコード開発 生成AI評価支援 データ活用基盤導入支援 赤枠は、 マイクロソフトベース のソリューション OPC UA導入支援 クラウドHPC導入支援 Try it! Azure OpenAI Service EXPRESS Azure HPC エッジAI開発支援 Microsoft Olive Phi-3 Microsoft Defender for IoT 導入支援サービス ソフトウェア開発 生産性向上 GitHub Copilot
  4. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 4

    エッジでの生成AI SLMとは 産業用PC/組み込みデバイス アプリケーション 特定用途 AI 生成AI (SLM) エッジAIを 内蔵あるいは連携した インテリジェント製品 エッジAIの特徴 • オフライン利用 • プライバシーデータのローカル処理 • 低遅延 • 帯域幅の節約 エッジAIを活用することで、これまでよりもインテリジェントな製品を開発することが可能です。 生成AIにより、創造性や柔軟性を持った多様な処理能力を活用できる時代に入りました。 Microsoft Azure 生成AI (LLM) Microsoft Olive クラウドで SLMのファインチューニング 生成AIは、処理特性により、エッジでのSLMと クラウドでのLLMを使い分けることも有効 ファインチューニングにより 業務に最適化された SLMを配置 RAGによる 自社データ 活用 SLM(小規模言語モデル) LLM(大規模言語モデル) SLM は、より小さいデータセットを使ってトレーニングされます。 パラメーターの数は LLM よりも少なくなります。 LLM は、広い範囲の一般的な膨大な量のテキストでトレー ニングされます。トレーニング時、LLM には数十億 (または数 兆もの) パラメーターがあります。 SLM のサイズが小さいほど、デバイスやオンプレミス コンピュー ターへのローカル展開など、展開のオプションが増える。 サイズが大きいため、パフォーマンスに影響し、デバイスやコン ピューターにローカルに展開することは困難で、クラウドでの実 行が一般的。 エッジでの特定用途AI・生成AIを組み合わせた アプリケーションで付加価値提供
  5. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 5

    エッジでの特定用途AI・生成AIを組み合わせたアプリケーションで付加価値提供 産業用PC/組み込みデバイス アプリケーション 特定用途 AI 生成AI (SLM) 特定用途AIと生成AIにはそれぞれの特性があり、組み合わせて活用することも可能です。 生成AIは急速に進化し、対応領域を広めています。 特定用途AI 生成AI(SLM) 主な用途 物体検出、予測、分類など テキスト生成、会話、要約など メリット 高精度、低遅延 柔軟性、創造性 デメリット 汎用性が低い、タスク限定 計算資源の制約、業務に応じたファインチューニングが必要 応答速度 高速 処理内容、HWスペックにより応答速度は異なり特性理解が必要 ユースケース例 製造業の品質管理・故障予知、医療画像診断 コンテンツ生成、ナレッジ支援、音声ガイド スマートファクトリー、医療アシスタント、接客ロボット
  6. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 6

    独自データを含めた生成AIシステムを構築する手法 エッジでの独自データを含めた生成システムでは、エッジでのリソース制約から、ファインチューニングは有力な手段となります。 エッジにおいても小規模なRAGは活用出来ます。 また、プロンプトの工夫(プロンプトエンジニアリング)は重要な要素となります。 ユーザーからの問い合わせをベクトル化 企業内データを ベクトル化しておく。 企業内データで 関係する情報を渡す。 一般的な情報を踏まえ ながら、回答を生成する。 プロンプトを入力する。 (問い合わせをする。) RAG Microsoft Build (2024/5/23) Integrating Azure AI and Microsoft Fabric for next-gen AI solutions 資料に加筆 プロンプトとは プロンプト は、言語モデルにタスク を実行するよう指示する自然言 語命令です。適切なプロンプトを 入力しないと、生成AIは、期待さ れる回答を返すことが出来ません。 RAGとは (Retrieval Augmented Generation:取得拡張生成) RAG は、独自データを提供する 情報取得システムを追加すること で、言語モデルの機能を拡張す るアーキテクチャです。 ファインチューニングとは 専門データセットで生成AIを追 加的にトレーニングすることで、よ り正確で関連性の高い応答を導 くアーキテクチャーです。大規模な 計算リソースが必要。 追加 学習 ファインチューニング
  7. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 7

    ファインチューニングしたSLMのエッジ展開の最適環境 ファインチューニングから展開まで、マイクロソフトのフレームワーク(Microsoft Olive)に基づいて運用が可能 Microsoft OliveをSLMのファインチューニングを行い、エッジプラットフォームの種類に応じて、モデルの最適化を行います。 Phi-3CookBook/md/04.Fine-tuning/FineTuning_MicrosoftOlive.md at main · microsoft/Phi-3CookBook · GitHub
  8. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 8

    生成AIを使ったエッジAIの想定ユースケース:産業機器 射出成形機における生成AIを使ったエッジAI デモ 射出成形機に付属したアプリケーションでは、 従来より、機械の制御や基本的な統計データの確認 は行える仕組みが提供されていることを想定。 エッジAIとして生成AI(SLM)を活用し、新たな付加 価値提供する。 生成AI(SLM)が以下の対応を行います。 デモシナリオ1:柔軟性に富んだ保全レポート作成 デモシナリオ2:保全作業の支援 共同検証
  9. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 9

    エッジAIとしての生成AIに関する構成について 2030年度には、国内法人PC市場の72%がAI PCに マイクロソフトが提供するWindows + Phiシリーズ(Phi Shilica)が、最も使われるエッジでの生成AI構成に 2024年07月01日 今後5年間で法人市場にAIパソコンが普及 ≪ プレスリリース | 株式会社MM総研
  10. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 10

    デモで使用したミニPC エッジPC NUC 14 Pro+ NUC14RVSU7(ASUS) AI 対応: インテル® Core Ultra 9 プロセッサーの能力を活用して、 生成的な AI ワークロードをローカルで実行します。 Phi 3 mini on Windows 11 IoT Enterprise
  11. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 11

    デモシナリオ1動画:柔軟性に富んだ保全レポート作成 自然言語に対応したレポート作成 ※デモ動画は待ち時間を短縮して再生
  12. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 12

    Machine Learning for Quality Prediction in Plastic Injection Molding • エッジデバイス内に本アプリとは別に存在する、射出成型機の保 全アプリが取得するデータを想定 • 保全アプリがこのデータから、さらに保全集計データ(センサー/稼 働率、日毎/時間毎)を出力することを想定 • オリジナル:日付、時刻、射出成型のセンサーデータ値、サイク ルタイム、品質ラベルの列がある • カスタマイズ:修理時間、総生産時間、稼働率の列を追加 使用データ 概要 • エッジデバイス内のIoT Edgeモジュールで実行されるアプリ • 産業機器の保全レポートを生成する • 保全作業者がエッジデバイスでオフライン実行する • モジュール内のSLM(Phi3-mini)を利用 • チャットGUI上でユーザーの自然言語でのあいまいな指示でも、 SLMが日付とレポート項目を読み取る • 生成AIがグラフ出力コードを生成し、そのコードで出力されたグ ラフがレポート内容に加わる • モジュールの開発/管理/デプロイはAzure上で完結 保全作業者 デモシナリオ1動画:柔軟性に富んだ保全レポート作成 自然言語に対応したレポート作成
  13. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 13

    デモシナリオ1動画:柔軟性に富んだ保全レポート作成 自然言語に対応したレポート作成 アーキテクチャー図 Windows 11 IoT ( NUC 14 Pro+ Intel® Core Ultra 9 ) 保全レポート生成 Module SLM(phi3-mini)を 利用したレポートの生成 Azure VM(開発用) Container Registry 管理者 集計データのロード 射出成型機保全アプリ 保全データの集計 Runtime Module (システムモジュール) Edge Agent Edge Hub Azure IoT Edge Runtime IoT Edge モジュールのデ プロイ 収集データをRuntimeに転 送 (WindowsホストとAzure IoT Edge Runtimeでフォル ダ共有可能) デバイス管理 IoT Hub IoT Edgeモジュール (コンテナ)の開発 IoT Edgeモジュールのデ プロイ定義 IoT EdgeモジュールのPush Edge IoTモジュールの参照 保全データの取得 IoT Edge モジュールの死活 監視 保全作業者 localhostにアクセス Blob Storage SLMを Blobに登 録 SLMをダ ウンロード SLM登録 レポート確認
  14. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 14

    デモシナリオ2動画:保全作業の支援 ファインチューニングの効果 ※デモ動画は待ち時間を短縮して再生
  15. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 15

    産業機器のトラブルシューティングガイドより学習データを作成 アラームNo.、エラーメッセージ、原因、対処方法の列がある このドキュメントから.json形式に変換する(自動変換可能) トラブルシューティングガイド(.pdf) 使用データ 概要 • エッジデバイス内のIoT Edgeモジュールで実行されるアプリ • 産業機器に関するマニュアルのQAチャットボット • 保全作業者がエッジデバイスでオフライン実行する • モジュール内の学習済みのSLM(Phi3-mini)を利用 • 学習により、SLMが生産現場のドメイン知識を元に回答を生 成 • SLM学習、モジュールの開発/管理/デプロイはAzure上で 完結 デモシナリオ2動画:保全作業の支援 ファインチューニングの効果
  16. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 16

    デモシナリオ2動画:保全作業の支援 ファインチューニングの効果 アーキテクチャー図 Windows 11 IoT ( NUC 14 Pro+ Intel® Core Ultra 9 ) QAチャット Module 学習済みSLM(phi3-mini)を 利用した回答の生成 Azure VM(開発用) Container Registry 管理者 Runtime Module (システムモジュール) Edge Agent Edge Hub Azure IoT Edge Runtime IoT Edge モジュールのデ プロイ デバイス管理 IoT Hub IoT Edgeモジュール (コンテナ)の開発 IoT Edgeモジュールのデ プロイ定義 IoT EdgeモジュールのPush Edge IoTモジュールの参照 IoT Edge モジュールの死活 監視 保全作業者 localhostにアクセス Blob Storage SLMをダ ウンロード データ生成用 ドキュメント登録 &学習済みSLM登録 QAチャット実施 VM(SLM学習用 A100 GPU搭載) with Olive 学習済みSLMをBlobに登録 SLMダウンロード &データ作成 &学習実施 ドキュメント ダウンロード
  17. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 17

    SLMをエッジAIとして検証してみて分かったこと • Intel、QualcommなどもエッジAIに最適化されたプロセッサの提供を準備しています。 • SLMのニーズの高まりとともに、周辺環境も整備が進んでゆきます。 • 評価検証すれば、SLMの特性の理解が進み、ノウハウは必ず蓄積されます。 全て時間が解決します。 • 快適なパフォーマンスを得るには高価なHWが必要になる場合が多い。 • 特にVisionを使う場合は、SLM利用だと高性能なGPU利用が必要。Vision特化のAI活用も検討すべき。 • SLMのモデルと、利用できるフレームワークや量子化モデルの組み合わせが限定されている場合がある。 • 特に、最新のSLMモデルに最適化フレームワークが即座に対応しているわけでないので、制限が発生する。 • 生成AIに知見も持っていても、LLMに比べて、ノウハウの蓄積が浅い。 • SLMへの精度やパフォーマンスの期待値と実測に乖離が発生することも多く、改善手法発見に時間が掛かる。 生成AIをエッジで活用環境は整備途上 SLMは、エッジアプリケーションに柔軟性と創造性をもたらし、数年後に一般的な体験となる。
  18. Copyright © Tokyo Electron Device LTD. All Rights Reserved. 18

    TEDとしてのエッジAIとしての生成AIの今後の取り組み エッジAIとしての生成AI活用促進を目的として、 製造業の製品開発部門 パートナー企業 その他のお客様 に対して、今回の検証プロジェクトを元にした「エッジAIとしてのSLM展開・運用ガイドライン」を公開いたします。 是非、一緒にSLMの分野も開拓してゆきましょう。 X <関連ウェビナー> 12/13(金)11-12時 エッジデバイスでの生成AI活用による製造業の新たな付加価値創出とサービス提供の可能性とは? - 申し込み | ITmedia イベント