Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
Search
you(@youtoy)
PRO
March 16, 2025
Technology
0
61
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
you(@youtoy)
PRO
March 16, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
ヒーローズ・リーグの応募作品で使ったデバイス・アイテム・ライブラリなど / #ヒーローズリーグ 2025 開発素材LT
you
PRO
0
9
最近発売された端末+UIFlow 2.0の組み合わせ(+1.0の話)をUSB接続で / ビジュアルプログラミングIoTLT vol.21
you
PRO
0
1
AIエージェント開発用SDKとローカルLLMをLINE Botと組み合わせてみた / LINEを使ったLT大会 #14
you
PRO
0
130
ブラウザで CircuitPython の開発:公式の「CircuitPython Code Editor」を試した / 【屋形船開催】IoT縛りの勉強会! IoTLT vol.126 @東京湾
you
PRO
0
120
公開初日に個人環境で試した Gemini CLI 体験記など / Gemini CLI実験レポート
you
PRO
3
2.7k
Webの技術とガジェットで那須の子ども達にワクワクを! / IoTLT_20250720
you
PRO
0
140
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you
PRO
0
2.5k
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
170
総額200円の入力インターフェースで年齢問わず楽しめる体験型展示 / エンジニアの自由研究発表会vol.10
you
PRO
0
310
Other Decks in Technology
See All in Technology
共有と分離 - Compose Multiplatform "本番導入" の設計指針
error96num
2
1.2k
これでもう迷わない!Jetpack Composeの書き方実践ガイド
zozotech
PRO
0
1.1k
DroidKaigi 2025 Androidエンジニアとしてのキャリア
mhidaka
2
380
未経験者・初心者に贈る!40分でわかるAndroidアプリ開発の今と大事なポイント
operando
5
750
実践!カスタムインストラクション&スラッシュコマンド
puku0x
0
540
OCI Oracle Database Services新機能アップデート(2025/06-2025/08)
oracle4engineer
PRO
0
180
LLMを搭載したプロダクトの品質保証の模索と学び
qa
0
1.1k
Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」
shisyu_gaku
0
330
ブロックテーマ時代における、テーマの CSS について考える Toro_Unit / 2025.09.13 @ Shinshu WordPress Meetup
torounit
0
130
Codeful Serverless / 一人運用でもやり抜く力
_kensh
7
450
AWSを利用する上で知っておきたい名前解決のはなし(10分版)
nagisa53
10
3.2k
いま注目のAIエージェントを作ってみよう
supermarimobros
0
350
Featured
See All Featured
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.7k
Code Review Best Practice
trishagee
71
19k
Raft: Consensus for Rubyists
vanstee
140
7.1k
Designing for humans not robots
tammielis
253
25k
Into the Great Unknown - MozCon
thekraken
40
2k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
GraphQLとの向き合い方2022年版
quramy
49
14k
Optimizing for Happiness
mojombo
379
70k
Facilitating Awesome Meetings
lara
55
6.5k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6k
Transcript
2025年3月16日 (日) @横須賀市産業交流プラザ 豊田陽介( ) @youtoy 横須賀プログラミング“夢”アカデミー 〜デモをまじえつつの生成AIの話題〜
自己紹介 ・ IT系イベント主催、登壇や運営なども ・ 技術書の出版や技術記事執筆も ・ モノづくり活動(作品作り、展示) ・ 子ども向けの活動いろいろ プライベートでの活動
・ ガジェット大好き ・ 学生の時の専門分野は情報科学 その他 豊田陽介( ) @youtoy イトナブ ガジェット エバンジェリスト
ガジェットを使ったモノづくり・展示 ブラウザで動作するアプリ ・描画(シェーダー) ・太鼓の利用(Gamepad API) ・空気ポンプの利用(p5.sound)
生成AI関連のリリースが 多すぎる 笑 (3/10週のごく一部だけを見ても)
3/13: Google 特定機能の全ユーザーへの展 開やその他: ・無料版ユーザーでも Deep Research を利用可能に
3/11: OpenAI 新しいAPI のリリースなど: ・Responses API ・Agents SDK
3/12: Google(その2) 新しいオープンなモデル: ・Gemma 3
3/14: OpenAI(その2) ChatGPT のデータ解析(Advanced Data Analysis)でのモデル追加: ・推論モデル(o1・o3-mini) が 利用可能に
他にも色々な情報が 出ていました
今日はいくつかの 生成AI関連の話をピックアップ (紹介できないものも多数)
デモをまじえつつ 生成AIの話題を紹介 (※ デモは分かりやすそうなものを)
今日デモをする生成AIでできること ・どんどん性能が上がっている 生成AIのモデル ・生成AIと他のものを連携させる仕組み ・情報の調査・まとめ ・Adobeの生成AIの一例
▪ 続々と登場している 生成AIのモデル
▪ 新しめの生成AIのモデル (特定の企業のもののみ抜粋)
OpenAI・Anthropic・Google リスト ・OpenAI: o3-mini、GPT-4.5 ・Anthropic: Claude 3.7 Sonnet ・Google: Gemini
2.0系 (※ 他企業も色々出してるけど省略) 推論モデルや深い思考なしのモデル、拡 張思考モード・標準思考モードが共存す るハイブリッド推論モデルなど
【デモ】 Anthropic: Claude 3.7 Sonnet (Webで話題になってた事例で)
Claude 3.7 Sonnet で ビジュアル表現を工夫した HTML の出力
【デモ】 Google: Gemini 2.0 Flash Experimental (Webで話題になってた事例で)
Gemini 2.0 Flash Experimental によるアニメーション用フレーム の生成・写真の視点変更
▪ 生成AIと別のものを つなぐ仕組み
▪ MCP:LLMに外部連携の 仕組みを足せたりなど
Anthropic:Model Context Protocol(MCP) デスクトップ版Claudeからローカルの ファイルやアプリを扱えたり、外部連携 の処理を色々扱えたりなど 例えばデスクトップ版Claudeなどと 組み合わせて使う形
【MCP関連の動画紹介】 デスクトップ版Claudeで Blenderを利用
BlenderMCP
紹介のみ
▪ ビジュアルプログラミング で LLM を扱う
Dify
デモをまじえつつ
▪ 情報の調査・まとめを推論を しながら進める生成AI
▪ 検索と推論を組み合わせて 詳細な調査を行なう仕組み
OpenAI: ChatGPT の deep research 同じ系統のもの ・Google: Gemini の Deep
Research ・Perplexity の Deep Research ・xAI: Grok の DeepSearch ・。。。(Genspark とか他...) ※ こちらの中には無料枠があるものも 現状は有償のプランでのみ利用可能 (Plusプランや Proプランなど)
【デモ】 OpenAI: ChatGPT の deep research
【デモ】 Google: Gemini の Deep Research
▪ Adobe Firefly
最近も新しい機能が公開されている
【デモ】 Adobe Firefly で シーンから画像生成
Adobe Firefly で シーンから画像生成 (Beta)
▪ 開発用のエディタ上で 直接開発を助けてくれる
【デモ】 VS Code上で GitHub Copilot (チャット、編集)
紹介のみ
▪ ローカルの処理で LLMを利用
モデルは種類が多数(多すぎ...) モデルを扱いやすくしてくれるもの ・Ollama ・LM Studio ・MLX LM、MLX-VLM(Apple Silicon向け) ※ 他もあるけど省略
Hugging Face で公開されているモデル を使うパターンが多い
▪ 自動操作関連
OpenAI: Operator(ブラウザの自動操作) PC自動操作も含む同系統(?)のもの ・Browser Use(OSS) ・Anthropic: Computer use ・OpenAI: Computer
use ※ 他もあるけど省略 現状は一部の有償プランでのみ利用可能 (Proプラン)
【デモ】 OpenAI の Operator
今日は扱わなかった 内容の一部を紹介
1)自律的に開発を進める仕組みのもの 人に確認しつつ進めるものだったり、 ガンガン進めていくものだったり ・Cursor、Windsurf など(IDE提供型) ・Cline、Roo Code など(IDE用拡張機能型) ・Devin ・GitHub
Copilot エージェントモード ・。。。
2)各社のモデル 話題になったものだと 例えば DeepSeek のモデル
3)Web開発関連 有名どころで例えば Vercel の v0、 StackBlitz の Bolt.new
4)大手クラウドの生成AI関連 AWS関連、Azure関連、 Google Cloud関連など
5)生成AI関連のAPI 冒頭で紹介したような 新しいAPI の公開も
6)様々な生成を行うもの 音、動画、3Dモデル、 などを生成するもの
7)自分が用意したデータをもとに回答を得る 自分がアップロードしたデータを もとにした回答をしてもらうもの、 自分が用意したデータを生成AIが 検索できるようにする仕組み
これでも掲載しきれてない ものが大量に
自分がやってみたい分野 での生成AIの活用の話は 見ておくと良いかも