Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
Search
you(@youtoy)
PRO
March 16, 2025
Technology
0
54
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
you(@youtoy)
PRO
March 16, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
公開初日に個人環境で試した Gemini CLI 体験記など / Gemini CLI実験レポート
you
PRO
3
310
Webの技術とガジェットで那須の子ども達にワクワクを! / IoTLT_20250720
you
PRO
0
120
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you
PRO
0
1.8k
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
150
総額200円の入力インターフェースで年齢問わず楽しめる体験型展示 / エンジニアの自由研究発表会vol.10
you
PRO
0
63
Node−RED で Ollama を使ったローカルLLM(node-red-contrib-ollamaを利用) / ビジュアルプログラミングIoTLT vol.20
you
PRO
0
190
AIエージェント開発や最新の生成AIのAPI利用などJavaScriptで色々やってみる / IoTLT vol.123
you
PRO
0
120
ChatGPT からモックサーバー宛(Beeceptor宛)の HTTPリクエストを試す / IoTLT 202504
you
PRO
0
110
もくはりでのモノ作りと自身のモノ作り活動 / もくはり文化祭2024 オープン記念イベント
you
PRO
0
59
Other Decks in Technology
See All in Technology
Bliki (ja), and the Cathedral, and the Bazaar
koic
8
1.3k
スプリントレビューを効果的にするために
miholovesq
9
1.6k
QAを早期に巻き込む”って どうやるの? モヤモヤから抜け出す実践知
moritamasami
2
170
SAE J1939シミュレーション環境構築
daikiokazaki
0
130
BEYOND THE RAG🚀 ~とりあえずRAG?を超えていけ! 本当に使えるAIエージェント&生成AIプロダクトを目指して~ / BEYOND-THE-RAG-Toward Practical-GenerativeAI-Products-AOAI-DevDay-2025
jnymyk
4
230
Shadow DOM & Security - Exploring the boundary between light and shadow
masatokinugawa
0
660
増え続ける脆弱性に立ち向かう: 事前対策と優先度づけによる 持続可能な脆弱性管理 / Confronting the Rise of Vulnerabilities: Sustainable Management Through Proactive Measures and Prioritization
nttcom
0
120
PHPからはじめるコンピュータアーキテクチャ / From Scripts to Silicon: A Journey Through the Layers of Computing
tomzoh
2
380
DATA+AI SummitとSnowflake Summit: ユーザから見た共通点と相違点 / DATA+AI Summit and Snowflake Summit
nttcom
0
210
Building GoReleaser - from shell script to paid product
caarlos0
0
270
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
13k
室長の逆襲 :データ活用の陣地を増やすためのヒント
masatoshi0205
0
180
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Raft: Consensus for Rubyists
vanstee
140
7k
BBQ
matthewcrist
89
9.7k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.7k
Unsuck your backbone
ammeep
671
58k
Facilitating Awesome Meetings
lara
54
6.5k
Testing 201, or: Great Expectations
jmmastey
43
7.6k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Transcript
2025年3月16日 (日) @横須賀市産業交流プラザ 豊田陽介( ) @youtoy 横須賀プログラミング“夢”アカデミー 〜デモをまじえつつの生成AIの話題〜
自己紹介 ・ IT系イベント主催、登壇や運営なども ・ 技術書の出版や技術記事執筆も ・ モノづくり活動(作品作り、展示) ・ 子ども向けの活動いろいろ プライベートでの活動
・ ガジェット大好き ・ 学生の時の専門分野は情報科学 その他 豊田陽介( ) @youtoy イトナブ ガジェット エバンジェリスト
ガジェットを使ったモノづくり・展示 ブラウザで動作するアプリ ・描画(シェーダー) ・太鼓の利用(Gamepad API) ・空気ポンプの利用(p5.sound)
生成AI関連のリリースが 多すぎる 笑 (3/10週のごく一部だけを見ても)
3/13: Google 特定機能の全ユーザーへの展 開やその他: ・無料版ユーザーでも Deep Research を利用可能に
3/11: OpenAI 新しいAPI のリリースなど: ・Responses API ・Agents SDK
3/12: Google(その2) 新しいオープンなモデル: ・Gemma 3
3/14: OpenAI(その2) ChatGPT のデータ解析(Advanced Data Analysis)でのモデル追加: ・推論モデル(o1・o3-mini) が 利用可能に
他にも色々な情報が 出ていました
今日はいくつかの 生成AI関連の話をピックアップ (紹介できないものも多数)
デモをまじえつつ 生成AIの話題を紹介 (※ デモは分かりやすそうなものを)
今日デモをする生成AIでできること ・どんどん性能が上がっている 生成AIのモデル ・生成AIと他のものを連携させる仕組み ・情報の調査・まとめ ・Adobeの生成AIの一例
▪ 続々と登場している 生成AIのモデル
▪ 新しめの生成AIのモデル (特定の企業のもののみ抜粋)
OpenAI・Anthropic・Google リスト ・OpenAI: o3-mini、GPT-4.5 ・Anthropic: Claude 3.7 Sonnet ・Google: Gemini
2.0系 (※ 他企業も色々出してるけど省略) 推論モデルや深い思考なしのモデル、拡 張思考モード・標準思考モードが共存す るハイブリッド推論モデルなど
【デモ】 Anthropic: Claude 3.7 Sonnet (Webで話題になってた事例で)
Claude 3.7 Sonnet で ビジュアル表現を工夫した HTML の出力
【デモ】 Google: Gemini 2.0 Flash Experimental (Webで話題になってた事例で)
Gemini 2.0 Flash Experimental によるアニメーション用フレーム の生成・写真の視点変更
▪ 生成AIと別のものを つなぐ仕組み
▪ MCP:LLMに外部連携の 仕組みを足せたりなど
Anthropic:Model Context Protocol(MCP) デスクトップ版Claudeからローカルの ファイルやアプリを扱えたり、外部連携 の処理を色々扱えたりなど 例えばデスクトップ版Claudeなどと 組み合わせて使う形
【MCP関連の動画紹介】 デスクトップ版Claudeで Blenderを利用
BlenderMCP
紹介のみ
▪ ビジュアルプログラミング で LLM を扱う
Dify
デモをまじえつつ
▪ 情報の調査・まとめを推論を しながら進める生成AI
▪ 検索と推論を組み合わせて 詳細な調査を行なう仕組み
OpenAI: ChatGPT の deep research 同じ系統のもの ・Google: Gemini の Deep
Research ・Perplexity の Deep Research ・xAI: Grok の DeepSearch ・。。。(Genspark とか他...) ※ こちらの中には無料枠があるものも 現状は有償のプランでのみ利用可能 (Plusプランや Proプランなど)
【デモ】 OpenAI: ChatGPT の deep research
【デモ】 Google: Gemini の Deep Research
▪ Adobe Firefly
最近も新しい機能が公開されている
【デモ】 Adobe Firefly で シーンから画像生成
Adobe Firefly で シーンから画像生成 (Beta)
▪ 開発用のエディタ上で 直接開発を助けてくれる
【デモ】 VS Code上で GitHub Copilot (チャット、編集)
紹介のみ
▪ ローカルの処理で LLMを利用
モデルは種類が多数(多すぎ...) モデルを扱いやすくしてくれるもの ・Ollama ・LM Studio ・MLX LM、MLX-VLM(Apple Silicon向け) ※ 他もあるけど省略
Hugging Face で公開されているモデル を使うパターンが多い
▪ 自動操作関連
OpenAI: Operator(ブラウザの自動操作) PC自動操作も含む同系統(?)のもの ・Browser Use(OSS) ・Anthropic: Computer use ・OpenAI: Computer
use ※ 他もあるけど省略 現状は一部の有償プランでのみ利用可能 (Proプラン)
【デモ】 OpenAI の Operator
今日は扱わなかった 内容の一部を紹介
1)自律的に開発を進める仕組みのもの 人に確認しつつ進めるものだったり、 ガンガン進めていくものだったり ・Cursor、Windsurf など(IDE提供型) ・Cline、Roo Code など(IDE用拡張機能型) ・Devin ・GitHub
Copilot エージェントモード ・。。。
2)各社のモデル 話題になったものだと 例えば DeepSeek のモデル
3)Web開発関連 有名どころで例えば Vercel の v0、 StackBlitz の Bolt.new
4)大手クラウドの生成AI関連 AWS関連、Azure関連、 Google Cloud関連など
5)生成AI関連のAPI 冒頭で紹介したような 新しいAPI の公開も
6)様々な生成を行うもの 音、動画、3Dモデル、 などを生成するもの
7)自分が用意したデータをもとに回答を得る 自分がアップロードしたデータを もとにした回答をしてもらうもの、 自分が用意したデータを生成AIが 検索できるようにする仕組み
これでも掲載しきれてない ものが大量に
自分がやってみたい分野 での生成AIの活用の話は 見ておくと良いかも