Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / G...
Search
you(@youtoy)
PRO
July 13, 2025
Technology
0
2.7k
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you(@youtoy)
PRO
July 13, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
ブラウザのAPIで Nintendo Switch用の特殊なゲーム用コントローラーを体験型コンテンツに / IoTLT @ストラタシス・ジャパン
you
PRO
0
130
ローカルLLMとLINE Botの組み合わせ その2(EVO-X2でgpt-oss-120bを利用) / LINE DC Generative AI Meetup #7
you
PRO
1
160
生成AIとM5Stack / M5 Japan Tour 2025 Autumn 東京
you
PRO
0
280
子ども向けの活動や自身のモノづくり活動などでやったこと / micro:bit ファンの集い
you
PRO
0
13
ブラウザのAPIで色々なデバイスをあれこれ扱ってみた話(主にWeb HID API) / IoTLT @JLCPCB オープンハードカンファレンス
you
PRO
0
130
ヒーローズ・リーグの応募作品で使ったデバイス・アイテム・ライブラリなど / #ヒーローズリーグ 2025 開発素材LT
you
PRO
0
40
最近発売された端末+UIFlow 2.0の組み合わせ(+1.0の話)をUSB接続で / ビジュアルプログラミングIoTLT vol.21
you
PRO
0
100
AIエージェント開発用SDKとローカルLLMをLINE Botと組み合わせてみた / LINEを使ったLT大会 #14
you
PRO
0
220
ブラウザで CircuitPython の開発:公式の「CircuitPython Code Editor」を試した / 【屋形船開催】IoT縛りの勉強会! IoTLT vol.126 @東京湾
you
PRO
0
140
Other Decks in Technology
See All in Technology
[2025年10月版] Databricks Data + AI Boot Camp
databricksjapan
1
260
SCONE - 動画配信の帯域を最適化する新プロトコル
kazuho
1
380
だいたい分かった気になる 『SREの知識地図』 / introduction-to-sre-knowledge-map-book
katsuhisa91
PRO
3
1.4k
デザインとエンジニアリングの架け橋を目指す OPTiMのデザインシステム「nucleus」の軌跡と広げ方
optim
0
120
MCP ✖️ Apps SDKを触ってみた
hisuzuya
0
360
CREが作る自己解決サイクルSlackワークフローに組み込んだAIによる社内ヘルプデスク改革 #cre_meetup
bengo4com
0
330
serverless team topology
_kensh
3
230
dbtとAIエージェントを組み合わせて見えたデータ調査の新しい形
10xinc
0
150
現場の壁を乗り越えて、 「計装注入」が拓く オブザーバビリティ / Beyond the Field Barriers: Instrumentation Injection and the Future of Observability
aoto
PRO
1
590
FinOps について (ちょっと) 本気出して考えてみた
skmkzyk
0
210
「タコピーの原罪」から学ぶ間違った”支援” / the bad support of Takopii
piyonakajima
0
140
NLPコロキウム20251022_超効率化への挑戦: LLM 1bit量子化のロードマップ
yumaichikawa
3
470
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
34
2.3k
The Illustrated Children's Guide to Kubernetes
chrisshort
49
51k
The Cost Of JavaScript in 2023
addyosmani
55
9.1k
Bash Introduction
62gerente
615
210k
Large-scale JavaScript Application Architecture
addyosmani
514
110k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.7k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
Gamification - CAS2011
davidbonilla
81
5.5k
How to train your dragon (web standard)
notwaldorf
97
6.3k
Transcript
2025年7月13日 (日) Gemini CLI 初学者勉強会(#AI道場) @オンライン 豊田陽介( ) @youtoy 公開初日に
Gemini CLI を試した話や FFmpeg と組み合わせてみた話など
自己紹介 豊田陽介( ) @youtoy ▶ IT系イベント主催(2013年〜)、 登壇や運営なども ▶ 機械学習・IoT関連の
技術書の出版 ▶ メーカーフェア出展など モノづくり関連の活動も ▶ 子ども向けのIT関連活動、他 プライベートでの活動 ▶ ガジェット ▶ 描画系/IoT/AI・機械学習系 ▶ JavaScript、ビジュアルプログラミング 好きな技術など
今日の話①:公開当日に試したGemini CLIの話など 記事投稿が 2025年6月25日
日本時間夜のGemini CLI公開から記事公開まで 23:23 試用中 23時ごろからお試し + 実況ポスト + 記事を書く 23:36
記事をポスト 22:42 リポジトリの 情報などを少し確認
今日の話②:FFmpeg と組み合わせてみた話 Gemini CLI でまずは 試して結果を確認 ついでに Claude Code +
FFmpeg と Google AI Studio での動画入力 も試してみた
どちらも詳細はQiitaの記事に
Gemini CLI を公開日に試して 個人的に便利だった点
すぐに無料枠を使って試せた ※ 無料枠で使った入力データの扱われ方は気にする必要があるけど Gemini API の無料枠やアカウントを紐付けて 使う形での利用 アカウントを紐付けるほうは「Gemini 2.5 Pro」
の利用も可能に (Gemini API の無償版では使えないモデル)
Claude Code初登場時はウェイトリスト・従量課金 (詳細はQiitaの記事に) Claude Code初登場時(リサーチプレビュー での提供時)はウェイトリスト登録が必須 (日中に登録したら深夜には使えるように なった、というくらいではあったものの) +
当時はアカウントを紐付ける定額になる使い方 がなく、無料枠のない API での従量課金が必須
Claude Code が昨日対応した Windows での WSLなしでの利用も 当初からできていた (3日前のアップデートまでは入力まわりなど Windows版のバグが複数あったものの) ※
自分が当初試したのは Mac で、その後に Windows でも試した
FFmpeg との 組み合わせの話
【※追記】 アカウントを連携させる使い方で 動画を直接よんでもらうことができず FFmpeg を組み合わせた流れでした (有償版の API を使う方法では試せてはいないです)
FFmpegについて コマンドラインで「動画・音声・動画コンテナ等」 を幅広く扱えて豊富なコーデックに対応したツール (OSS で Windows/macOS/Linux に対応) 形式変換・加工・再エンコードなどの様々な処理が 行える昔からある老舗のツール (自分が初めて触ったのが
20年くらい前というレベル感)
選定についてなど ・コマンドラインのツールなので相性が良さそう + 老舗で OSS のツールなので、十分学習されている 試した動画は使っても問題ない 37秒くらいの適当なもので (最近、試作してたものの1つで リングコン・Joy-Con
の情報 ブラウザの API で取得して 描画に反映させる体験型の コンテンツ)
プロンプトや構成の補足 【試したプロンプト】 「fileフォルダ内の動画をffmpegコマンドで 10秒ごとに画像にして、その画像を読み取って 内容を解説して」 【補足】 Gemini CLI が扱えるフォルダの直下に、「file」 という名前のフォルダを作成して、その中に動画
ファイルを置いた形
抽出された画像と得られた結果① 1枚目の画像です。 左上には、男性がリングコンのようなものを両手で持って いる映像が表示されています。右側には、黒い背景に、 黄色い同心円状のグラフィックと、その周りにカラフルな 光の粒子のようなものが表示されています。左下には、 コードのようなものが表示されていますが、内容は一部しか 見えません。 2枚目の画像です。 1枚目との違いは、右側のグラフィックです。同心円の色が
黄色から水色に変化し、カラフルな光の粒子の位置も 変わっています。男性の映像やコードの部分に大きな変化は 見られません。
抽出された画像と得られた結果② 3枚目の画像です。 右側のグラフィックの同心円の色が、さらに緑色に変化して います。光の粒子の位置も、前の画像から変わっています。 男性の映像やコードの部分に大きな変化は見られません。 4枚目の画像です。 右側のグラフィックの同心円が消え、代わりにピンク色の円が 表示されています。カラフルな光の粒子は、その円の周りを 漂うように表示されています。 この動画は、男性がリングコンのようなものを操作することで、右側のグラフィックが変化
する、という内容のようです。リングコンの動きに合わせて、同心円の色や光の粒子の動き がインタラクティブに変化している様子がうかがえます。左下のコードは、このインタラク ションを制御しているプログラムの一部であると考えられます。
FFmpeg での他の処理や 動画・音声の特徴を抽出できる他の コマンドラインツールも試してみたい!
終わり!