Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
Search
you(@youtoy)
PRO
March 16, 2025
Technology
0
46
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
you(@youtoy)
PRO
March 16, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
Node−RED で Ollama を使ったローカルLLM(node-red-contrib-ollamaを利用) / ビジュアルプログラミングIoTLT vol.20
you
PRO
0
130
AIエージェント開発や最新の生成AIのAPI利用などJavaScriptで色々やってみる / IoTLT vol.123
you
PRO
0
93
ChatGPT からモックサーバー宛(Beeceptor宛)の HTTPリクエストを試す / IoTLT 202504
you
PRO
0
91
もくはりでのモノ作りと自身のモノ作り活動 / もくはり文化祭2024 オープン記念イベント
you
PRO
0
46
"かわいい" がテーマのハッカソンでWebの技術を使って魔法の世界を作った話など / HTML5 10th Anniversary
you
PRO
0
100
ブラウザで AI・機械学習が扱える TensorFlow.js が使われているライブラリなどの話 / #さくらのAI Meetup vol.4「ブラウザ」
you
PRO
0
220
Blynk と Raspberry Pi Pico W で IoT 〜 MQTT・HTTPリクエストの組み合わせも 〜 / IoTLT vol.114
you
PRO
0
2.5k
AIを活用したWebアプリのプロトタイプを作ってコンテストや展示に出してみた話 / 大阪工業大学 ネットワークデザイン学科 LT大会 2024v2
you
PRO
0
120
Babylon.jsと色々なものを組み合わせる:ブラウザのAPIやガジェットや2D描画ライブラリなど / Babylon.js 勉強会 vol.3
you
PRO
0
690
Other Decks in Technology
See All in Technology
超簡単!RAGアプリケーション構築術
oracle4engineer
PRO
0
110
ソフトウェアは捨てやすく作ろう/Let's make software easy to discard
sanogemaru
10
5.5k
“新卒らしさ”を脱ぎ捨てて 〜1年を経て学んだこと〜
rebase_engineering
0
120
Oracle Database オプティマイザ・ヒントの活用
oracle4engineer
PRO
1
130
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
3
1.5k
新卒から4年間、20年もののWebサービスと向き合って学んだソフトウェア考古学 - PHPカンファレンス新潟2025 / new graduate 4year software archeology
oguri
2
330
mnt_data_とは?ChatGPTコード実行環境を深堀りしてみた
icck
0
180
MCP で繋ぐ Figma とデザインシステム〜LLM を使った UI 実装のリアル〜
kimuson
1
1.1k
カンファレンスのつくりかた / The Conference Code: What Makes It All Work
tomzoh
7
870
金融システムをモダナイズするためのAmazon Elastic Kubernetes Service(EKS)ノウハウ大全
daitak
0
120
継続戦闘能⼒
sansantech
PRO
0
200
CSS polyfill とその未来
ken7253
0
130
Featured
See All Featured
Raft: Consensus for Rubyists
vanstee
137
7k
Music & Morning Musume
bryan
47
6.5k
Why You Should Never Use an ORM
jnunemaker
PRO
56
9.4k
Agile that works and the tools we love
rasmusluckow
329
21k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
Balancing Empowerment & Direction
lara
1
81
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
137
34k
Code Reviewing Like a Champion
maltzj
523
40k
Building Applications with DynamoDB
mza
95
6.4k
GitHub's CSS Performance
jonrohan
1031
460k
Transcript
2025年3月16日 (日) @横須賀市産業交流プラザ 豊田陽介( ) @youtoy 横須賀プログラミング“夢”アカデミー 〜デモをまじえつつの生成AIの話題〜
自己紹介 ・ IT系イベント主催、登壇や運営なども ・ 技術書の出版や技術記事執筆も ・ モノづくり活動(作品作り、展示) ・ 子ども向けの活動いろいろ プライベートでの活動
・ ガジェット大好き ・ 学生の時の専門分野は情報科学 その他 豊田陽介( ) @youtoy イトナブ ガジェット エバンジェリスト
ガジェットを使ったモノづくり・展示 ブラウザで動作するアプリ ・描画(シェーダー) ・太鼓の利用(Gamepad API) ・空気ポンプの利用(p5.sound)
生成AI関連のリリースが 多すぎる 笑 (3/10週のごく一部だけを見ても)
3/13: Google 特定機能の全ユーザーへの展 開やその他: ・無料版ユーザーでも Deep Research を利用可能に
3/11: OpenAI 新しいAPI のリリースなど: ・Responses API ・Agents SDK
3/12: Google(その2) 新しいオープンなモデル: ・Gemma 3
3/14: OpenAI(その2) ChatGPT のデータ解析(Advanced Data Analysis)でのモデル追加: ・推論モデル(o1・o3-mini) が 利用可能に
他にも色々な情報が 出ていました
今日はいくつかの 生成AI関連の話をピックアップ (紹介できないものも多数)
デモをまじえつつ 生成AIの話題を紹介 (※ デモは分かりやすそうなものを)
今日デモをする生成AIでできること ・どんどん性能が上がっている 生成AIのモデル ・生成AIと他のものを連携させる仕組み ・情報の調査・まとめ ・Adobeの生成AIの一例
▪ 続々と登場している 生成AIのモデル
▪ 新しめの生成AIのモデル (特定の企業のもののみ抜粋)
OpenAI・Anthropic・Google リスト ・OpenAI: o3-mini、GPT-4.5 ・Anthropic: Claude 3.7 Sonnet ・Google: Gemini
2.0系 (※ 他企業も色々出してるけど省略) 推論モデルや深い思考なしのモデル、拡 張思考モード・標準思考モードが共存す るハイブリッド推論モデルなど
【デモ】 Anthropic: Claude 3.7 Sonnet (Webで話題になってた事例で)
Claude 3.7 Sonnet で ビジュアル表現を工夫した HTML の出力
【デモ】 Google: Gemini 2.0 Flash Experimental (Webで話題になってた事例で)
Gemini 2.0 Flash Experimental によるアニメーション用フレーム の生成・写真の視点変更
▪ 生成AIと別のものを つなぐ仕組み
▪ MCP:LLMに外部連携の 仕組みを足せたりなど
Anthropic:Model Context Protocol(MCP) デスクトップ版Claudeからローカルの ファイルやアプリを扱えたり、外部連携 の処理を色々扱えたりなど 例えばデスクトップ版Claudeなどと 組み合わせて使う形
【MCP関連の動画紹介】 デスクトップ版Claudeで Blenderを利用
BlenderMCP
紹介のみ
▪ ビジュアルプログラミング で LLM を扱う
Dify
デモをまじえつつ
▪ 情報の調査・まとめを推論を しながら進める生成AI
▪ 検索と推論を組み合わせて 詳細な調査を行なう仕組み
OpenAI: ChatGPT の deep research 同じ系統のもの ・Google: Gemini の Deep
Research ・Perplexity の Deep Research ・xAI: Grok の DeepSearch ・。。。(Genspark とか他...) ※ こちらの中には無料枠があるものも 現状は有償のプランでのみ利用可能 (Plusプランや Proプランなど)
【デモ】 OpenAI: ChatGPT の deep research
【デモ】 Google: Gemini の Deep Research
▪ Adobe Firefly
最近も新しい機能が公開されている
【デモ】 Adobe Firefly で シーンから画像生成
Adobe Firefly で シーンから画像生成 (Beta)
▪ 開発用のエディタ上で 直接開発を助けてくれる
【デモ】 VS Code上で GitHub Copilot (チャット、編集)
紹介のみ
▪ ローカルの処理で LLMを利用
モデルは種類が多数(多すぎ...) モデルを扱いやすくしてくれるもの ・Ollama ・LM Studio ・MLX LM、MLX-VLM(Apple Silicon向け) ※ 他もあるけど省略
Hugging Face で公開されているモデル を使うパターンが多い
▪ 自動操作関連
OpenAI: Operator(ブラウザの自動操作) PC自動操作も含む同系統(?)のもの ・Browser Use(OSS) ・Anthropic: Computer use ・OpenAI: Computer
use ※ 他もあるけど省略 現状は一部の有償プランでのみ利用可能 (Proプラン)
【デモ】 OpenAI の Operator
今日は扱わなかった 内容の一部を紹介
1)自律的に開発を進める仕組みのもの 人に確認しつつ進めるものだったり、 ガンガン進めていくものだったり ・Cursor、Windsurf など(IDE提供型) ・Cline、Roo Code など(IDE用拡張機能型) ・Devin ・GitHub
Copilot エージェントモード ・。。。
2)各社のモデル 話題になったものだと 例えば DeepSeek のモデル
3)Web開発関連 有名どころで例えば Vercel の v0、 StackBlitz の Bolt.new
4)大手クラウドの生成AI関連 AWS関連、Azure関連、 Google Cloud関連など
5)生成AI関連のAPI 冒頭で紹介したような 新しいAPI の公開も
6)様々な生成を行うもの 音、動画、3Dモデル、 などを生成するもの
7)自分が用意したデータをもとに回答を得る 自分がアップロードしたデータを もとにした回答をしてもらうもの、 自分が用意したデータを生成AIが 検索できるようにする仕組み
これでも掲載しきれてない ものが大量に
自分がやってみたい分野 での生成AIの活用の話は 見ておくと良いかも