Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Google Opalで使える生成AIの能力と役割
Search
MIKIO KUBO
October 12, 2025
Business
0
73
Google Opalで使える生成AIの能力と役割
MIKIO KUBO
October 12, 2025
Tweet
Share
More Decks by MIKIO KUBO
See All by MIKIO KUBO
ポストSaaS時代:コンポーザブル、エージェント 型、成果指向ソフトウェアへの移行を読み解く
mickey_kubo
1
28
AIの二元論 -ビジネスリーダーのための水平型AIと垂直型AIに関する戦略的ガイド-
mickey_kubo
1
35
AIの二元論(詳細版)
mickey_kubo
0
6
TransformerからMCPまで(現代AIを理解するための羅針盤)
mickey_kubo
7
5.7k
Agentic AI フレームワーク戦略白書 (2025年度版)
mickey_kubo
1
69
Agentic AIを用いたサプライチェーン最適化
mickey_kubo
1
120
Google Opal解体新書
mickey_kubo
3
98
Google Opalで使える37のライブラリ
mickey_kubo
3
170
Opal 例題解説
mickey_kubo
1
83
Other Decks in Business
See All in Business
サスメド株式会社 Culture Deck
susmed
0
47k
at FOREST_recruit_pitch deck202510
atforest
0
310
ソニックガーデン経営組織論(2025/10版)
kuranuki
1
3.1k
VISASQ: ABOUT DEV TEAM
eikohashiba
5
37k
20251012_社内でのMCT活動
ponponmikankan
1
860
CLT OF THE YEAR 2025応募要領
kobari
0
120
FABRIC TOKYO会社紹介資料 / We are hiring(2025年10月07日更新)
yuichirom
36
350k
第3回DifyStudio_まつにぃ浸透し_継続するDifyとは.pdf
yukaikunimatsu
3
1.6k
採用ピッチ資料
awesome22
0
420
We are Wunderbar, Culture Deck Full
wunderbar
0
1.4k
ビジネス職中途採用向け会社説明資料_2025.2.pdf
zozobusiness
0
990
信和興業 事例紹介
tsubasam
0
1.9k
Featured
See All Featured
Docker and Python
trallard
46
3.6k
We Have a Design System, Now What?
morganepeng
53
7.9k
KATA
mclloyd
PRO
32
15k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
For a Future-Friendly Web
brad_frost
180
10k
Writing Fast Ruby
sferik
630
62k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
Transcript
Google AI モデル群 解体新書 Opal で使えるAI の能力と役割 1
はじめに:タスクに応じたAI の使い分け Opalなどのプラットフォームでは、様々な得意分野を持つAIモデルを利用できま す。 これらのモデルを 適材適所で組み合わせることで、シンプルなお手伝いから複雑な アプリケーションまで、あらゆるアイデアを実現できます。 本日は、主要なモデルを2つのカテゴリに分けて解説します。 1. テキスト・マルチモーダル系モデル
2. メディア生成系モデル 2
1. テキスト・マルチモーダル系モデル 言葉やデータを理解し、思考するAI 中心的な役割 テキストの理解、要約、生成、分析 マルチモーダルとは? テキストだけでなく、画像、音声、動画など、複数の種類の情報を同時に 扱える能力 主な用途 文章作成、データ分析、計画立案、対話など
3
Gemini 2.5 Flash 日常タスクを高速処理する、軽快なモデル 役割: 日常的なタスクや 高速な応答が得意なバランス型。 機能: 大量のタスクを低遅延で効率的に処理することに最適化。 最適な用途:
リアルタイム性が求められるチャットボット 文章の要約や分類 画像や動画のキャプション生成 4
Gemini 2.5 Pro 複雑なタスクをこなす、高性能な頭脳 役割: 複雑で高度な思考を必要とするタスクを実行。 機能: Flash より高度な推論、コーディング、マルチモーダル理解能力。 テキスト、コード、画像、音声、動画など、多様な入力を深く理解。
最適な用途: 専門的なレポートや記事の作成 複雑なデータ分析と洞察の抽出 アプリ開発のコーディング補助 5
Plan and Execute with Gemini 2.5 計画し、実行する「AI エージェント」 役割: 複雑なタスクを
自律的に計画し、実行する。 機能: 曖昧な指示を具体的なステップに分解。 必要なツール(他のAI、Web検索など)を自動で呼び出してタスクを遂 行。 例: 「競合他社の最新動向を調査してレポートを作成して」という指示だけ で、計画から実行までを自動化。 6
Deep Research with Gemini 2.5 特定分野を深掘りする「AI リサーチャー」 役割: 特定トピックに関する 詳細な調査とレポート生成。
機能: AIが自ら調査計画を立て、Webから信頼性の高い情報を収集・分析。 最終的に 出典リンク付きで、構造化された詳細なレポートを生成。 強み: 情報の信頼性が高く、ファクトチェックの手間を削減。 7
2. メディア生成系モデル テキストから、新たな創造物を生み出すAI 中心的な役割 画像、音声、動画、音楽といったメディアをゼロから生成 仕組み プロンプト(テキストによる指示)を解釈し、対応するメディアコンテン ツを生成 主な用途 アート制作、デザイン、BGM作成、動画コンテンツ制作など
8
Imagen 4 テキストから高品質な画像を生成 役割: プロンプトから フォトリアルな画像を生成。 機能: 非常にリアルで高解像度な画像を生成。 特に、 人物の骨格や手の描写、
画像内のテキスト表現の正確性に優れる。 最適な用途: 広告ビジュアルの作成 ブログやプレゼン資料の挿絵 アート作品の制作 9
Gemini 2.5 Flash Image 画像を生成し、さらに対話で「編集」する 役割: テキストと画像を基に、 画像の生成と編集を行う。 機能: Imagen
4 の生成能力に加え、 既存画像の編集が得意。 「この人物を消して」「背景を森に変えて」といった自然言語での対話的 な指示で画像を修正。 最適な用途: 写真のレタッチや修正 既存の画像をベースにしたコラージュ作成 10
AudioLM テキストから人間のようなスピーチを生成 役割: テキストを 自然な音声に変換。 機能: 入力されたテキストを、人間らしいイントネーションや感情で読み上げ る。 短い音声の「続き」を違和感なく生成することも可能。 最適な用途:
オーディオブックのナレーション 動画の吹き替え ポッドキャスト制作 11
Veo テキストや画像から高品質な動画を生成 役割: 指示に基づいて リアルな動画を生成。 機能: 物理法則や光の表現に優れた、シネマティックな動画を生成。 最新版では、動画の内容に合った 音声も同時に生成可能。 最適な用途:
製品のプロモーションビデオ コンセプトの可視化 ショート動画コンテンツの制作 12
Lyria 2 テキストからプロ品質の音楽を生成 役割: **楽器演奏の音楽(インストゥルメンタル)**を生成。 機能: 「壮大なオーケストラ」「落ち着いたジャズピアノ」といった指示だけで 音楽を生成。 プロ品質で、商用利用も可能なレベル。 最適な用途:
動画コンテンツのBGM作成 作曲や編曲のアイデア出し アプリやゲームの背景音楽 13
まとめ 適材適所のAI を組み合わせて、アイデアを形に 思考するAI: Gemini Flash, Pro, Plan/Execute, Deep Research
創造するAI: Imagen, Flash Image, AudioLM, Veo, Lyria これらのモデルの特性を理解し、組み合わせることで、 あなたのアイデアはより強力なアプリケーションへと進化します。 14