Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Google Opalで使える生成AIの能力と役割
Search
MIKIO KUBO
October 12, 2025
Business
0
6
Google Opalで使える生成AIの能力と役割
MIKIO KUBO
October 12, 2025
Tweet
Share
More Decks by MIKIO KUBO
See All by MIKIO KUBO
Google Opal解体新書
mickey_kubo
2
25
Google Opalで使える37のライブラリ
mickey_kubo
1
18
Opal 例題解説
mickey_kubo
0
20
エージェントAI フレームワーク 2025 年版
mickey_kubo
0
12
AIを使って最新研究 について調べて発表しよ う!
mickey_kubo
4
29
モダンWeb認証入門
mickey_kubo
1
18
Google Gemini (Gem) の育成方法
mickey_kubo
2
130
最適化ソリューション開発を加速する 数理最適化モデリングツール AMPL 活用セミナー
mickey_kubo
2
23
AMPLとその他のPythonモデラーの違いと優越性
mickey_kubo
3
68
Other Decks in Business
See All in Business
新規投資家向け資料
digitalgrid
0
1.1k
業務紹介@第3回セキュリティ若手の会 〜セキュリティ+そのためのお仕事〜 / Introducing my work at the 3rd sec_wakate event
nttcom
0
110
ele&company_companydeck
eleand
0
480
提案レベルを上げてみたら、私の『提案』が『進捗』になっていた件
natty_natty254
26
16k
東山自動車学校 採用ピッチ
higashiyamads
0
610
FY2025.6 Impact Report JP
mercari_inc
0
100k
We are Wunderbar, Culture Deck Full
wunderbar
0
1.4k
Team Topologies Second Edition - launch events - 25 September 2025
matthewskelton
PRO
0
520
株式会社デイトラ FACT BOOK 2025
daytra
0
390
Leveraging Guest Podcasting to Boost SEO & Build Your Brand
brandonleibowitz
1
180
会社説明資料/株式会社PLAY
play_inc
0
20k
Corporate Story (GA technologies Co., Ltd.)
gatechnologies
0
240
Featured
See All Featured
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.6k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.2k
Bash Introduction
62gerente
615
210k
Site-Speed That Sticks
csswizardry
11
890
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.6k
Speed Design
sergeychernyshev
32
1.1k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Six Lessons from altMBA
skipperchong
28
4k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
9
590
Transcript
Google AI モデル群 解体新書 Opal で使えるAI の能力と役割 1
はじめに:タスクに応じたAI の使い分け Opalなどのプラットフォームでは、様々な得意分野を持つAIモデルを利用できま す。 これらのモデルを 適材適所で組み合わせることで、シンプルなお手伝いから複雑な アプリケーションまで、あらゆるアイデアを実現できます。 本日は、主要なモデルを2つのカテゴリに分けて解説します。 1. テキスト・マルチモーダル系モデル
2. メディア生成系モデル 2
1. テキスト・マルチモーダル系モデル 言葉やデータを理解し、思考するAI 中心的な役割 テキストの理解、要約、生成、分析 マルチモーダルとは? テキストだけでなく、画像、音声、動画など、複数の種類の情報を同時に 扱える能力 主な用途 文章作成、データ分析、計画立案、対話など
3
Gemini 2.5 Flash 日常タスクを高速処理する、軽快なモデル 役割: 日常的なタスクや 高速な応答が得意なバランス型。 機能: 大量のタスクを低遅延で効率的に処理することに最適化。 最適な用途:
リアルタイム性が求められるチャットボット 文章の要約や分類 画像や動画のキャプション生成 4
Gemini 2.5 Pro 複雑なタスクをこなす、高性能な頭脳 役割: 複雑で高度な思考を必要とするタスクを実行。 機能: Flash より高度な推論、コーディング、マルチモーダル理解能力。 テキスト、コード、画像、音声、動画など、多様な入力を深く理解。
最適な用途: 専門的なレポートや記事の作成 複雑なデータ分析と洞察の抽出 アプリ開発のコーディング補助 5
Plan and Execute with Gemini 2.5 計画し、実行する「AI エージェント」 役割: 複雑なタスクを
自律的に計画し、実行する。 機能: 曖昧な指示を具体的なステップに分解。 必要なツール(他のAI、Web検索など)を自動で呼び出してタスクを遂 行。 例: 「競合他社の最新動向を調査してレポートを作成して」という指示だけ で、計画から実行までを自動化。 6
Deep Research with Gemini 2.5 特定分野を深掘りする「AI リサーチャー」 役割: 特定トピックに関する 詳細な調査とレポート生成。
機能: AIが自ら調査計画を立て、Webから信頼性の高い情報を収集・分析。 最終的に 出典リンク付きで、構造化された詳細なレポートを生成。 強み: 情報の信頼性が高く、ファクトチェックの手間を削減。 7
2. メディア生成系モデル テキストから、新たな創造物を生み出すAI 中心的な役割 画像、音声、動画、音楽といったメディアをゼロから生成 仕組み プロンプト(テキストによる指示)を解釈し、対応するメディアコンテン ツを生成 主な用途 アート制作、デザイン、BGM作成、動画コンテンツ制作など
8
Imagen 4 テキストから高品質な画像を生成 役割: プロンプトから フォトリアルな画像を生成。 機能: 非常にリアルで高解像度な画像を生成。 特に、 人物の骨格や手の描写、
画像内のテキスト表現の正確性に優れる。 最適な用途: 広告ビジュアルの作成 ブログやプレゼン資料の挿絵 アート作品の制作 9
Gemini 2.5 Flash Image 画像を生成し、さらに対話で「編集」する 役割: テキストと画像を基に、 画像の生成と編集を行う。 機能: Imagen
4 の生成能力に加え、 既存画像の編集が得意。 「この人物を消して」「背景を森に変えて」といった自然言語での対話的 な指示で画像を修正。 最適な用途: 写真のレタッチや修正 既存の画像をベースにしたコラージュ作成 10
AudioLM テキストから人間のようなスピーチを生成 役割: テキストを 自然な音声に変換。 機能: 入力されたテキストを、人間らしいイントネーションや感情で読み上げ る。 短い音声の「続き」を違和感なく生成することも可能。 最適な用途:
オーディオブックのナレーション 動画の吹き替え ポッドキャスト制作 11
Veo テキストや画像から高品質な動画を生成 役割: 指示に基づいて リアルな動画を生成。 機能: 物理法則や光の表現に優れた、シネマティックな動画を生成。 最新版では、動画の内容に合った 音声も同時に生成可能。 最適な用途:
製品のプロモーションビデオ コンセプトの可視化 ショート動画コンテンツの制作 12
Lyria 2 テキストからプロ品質の音楽を生成 役割: **楽器演奏の音楽(インストゥルメンタル)**を生成。 機能: 「壮大なオーケストラ」「落ち着いたジャズピアノ」といった指示だけで 音楽を生成。 プロ品質で、商用利用も可能なレベル。 最適な用途:
動画コンテンツのBGM作成 作曲や編曲のアイデア出し アプリやゲームの背景音楽 13
まとめ 適材適所のAI を組み合わせて、アイデアを形に 思考するAI: Gemini Flash, Pro, Plan/Execute, Deep Research
創造するAI: Imagen, Flash Image, AudioLM, Veo, Lyria これらのモデルの特性を理解し、組み合わせることで、 あなたのアイデアはより強力なアプリケーションへと進化します。 14