Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / G...
Search
you(@youtoy)
PRO
July 13, 2025
Technology
0
2.1k
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you(@youtoy)
PRO
July 13, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
公開初日に個人環境で試した Gemini CLI 体験記など / Gemini CLI実験レポート
you
PRO
3
1.6k
Webの技術とガジェットで那須の子ども達にワクワクを! / IoTLT_20250720
you
PRO
0
130
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
150
総額200円の入力インターフェースで年齢問わず楽しめる体験型展示 / エンジニアの自由研究発表会vol.10
you
PRO
0
68
Node−RED で Ollama を使ったローカルLLM(node-red-contrib-ollamaを利用) / ビジュアルプログラミングIoTLT vol.20
you
PRO
0
210
AIエージェント開発や最新の生成AIのAPI利用などJavaScriptで色々やってみる / IoTLT vol.123
you
PRO
0
120
ChatGPT からモックサーバー宛(Beeceptor宛)の HTTPリクエストを試す / IoTLT 202504
you
PRO
0
110
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
you
PRO
0
57
もくはりでのモノ作りと自身のモノ作り活動 / もくはり文化祭2024 オープン記念イベント
you
PRO
0
63
Other Decks in Technology
See All in Technology
20250807_Kiroと私の反省会
riz3f7
0
160
隙間時間で爆速開発! Claude Code × Vibe Coding で作るマニュアル自動生成サービス
akitomonam
3
250
VLMサービスを用いた請求書データ化検証 / SaaSxML_Session_1
sansan_randd
0
220
大規模イベントに向けた ABEMA アーキテクチャの遍歴 ~ Platform Strategy 詳細解説 ~
nagapad
0
190
Amazon Q と『音楽』-ゲーム音楽もAmazonQで作成してみた感想-
senseofunity129
0
100
o11yツールを乗り換えた話
tak0x00
1
240
AIのグローバルトレンド 2025 / ai global trend 2025
kyonmm
PRO
1
120
家族の思い出を形にする 〜 1秒動画の生成を支えるインフラアーキテクチャ
ojima_h
1
450
2025新卒研修・HTML/CSS #弁護士ドットコム
bengo4com
3
13k
Lambda management with ecspresso and Terraform
ijin
2
140
LTに影響を受けてテンプレリポジトリを作った話
hol1kgmg
0
290
生成AI導入の効果を最大化する データ活用戦略
ham0215
0
110
Featured
See All Featured
BBQ
matthewcrist
89
9.8k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Visualization
eitanlees
146
16k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Balancing Empowerment & Direction
lara
1
530
Java REST API Framework Comparison - PWX 2021
mraible
32
8.8k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
We Have a Design System, Now What?
morganepeng
53
7.7k
How to Think Like a Performance Engineer
csswizardry
25
1.8k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.9k
Transcript
2025年7月13日 (日) Gemini CLI 初学者勉強会(#AI道場) @オンライン 豊田陽介( ) @youtoy 公開初日に
Gemini CLI を試した話や FFmpeg と組み合わせてみた話など
自己紹介 豊田陽介( ) @youtoy ▶ IT系イベント主催(2013年〜)、 登壇や運営なども ▶ 機械学習・IoT関連の
技術書の出版 ▶ メーカーフェア出展など モノづくり関連の活動も ▶ 子ども向けのIT関連活動、他 プライベートでの活動 ▶ ガジェット ▶ 描画系/IoT/AI・機械学習系 ▶ JavaScript、ビジュアルプログラミング 好きな技術など
今日の話①:公開当日に試したGemini CLIの話など 記事投稿が 2025年6月25日
日本時間夜のGemini CLI公開から記事公開まで 23:23 試用中 23時ごろからお試し + 実況ポスト + 記事を書く 23:36
記事をポスト 22:42 リポジトリの 情報などを少し確認
今日の話②:FFmpeg と組み合わせてみた話 Gemini CLI でまずは 試して結果を確認 ついでに Claude Code +
FFmpeg と Google AI Studio での動画入力 も試してみた
どちらも詳細はQiitaの記事に
Gemini CLI を公開日に試して 個人的に便利だった点
すぐに無料枠を使って試せた ※ 無料枠で使った入力データの扱われ方は気にする必要があるけど Gemini API の無料枠やアカウントを紐付けて 使う形での利用 アカウントを紐付けるほうは「Gemini 2.5 Pro」
の利用も可能に (Gemini API の無償版では使えないモデル)
Claude Code初登場時はウェイトリスト・従量課金 (詳細はQiitaの記事に) Claude Code初登場時(リサーチプレビュー での提供時)はウェイトリスト登録が必須 (日中に登録したら深夜には使えるように なった、というくらいではあったものの) +
当時はアカウントを紐付ける定額になる使い方 がなく、無料枠のない API での従量課金が必須
Claude Code が昨日対応した Windows での WSLなしでの利用も 当初からできていた (3日前のアップデートまでは入力まわりなど Windows版のバグが複数あったものの) ※
自分が当初試したのは Mac で、その後に Windows でも試した
FFmpeg との 組み合わせの話
【※追記】 アカウントを連携させる使い方で 動画を直接よんでもらうことができず FFmpeg を組み合わせた流れでした (有償版の API を使う方法では試せてはいないです)
FFmpegについて コマンドラインで「動画・音声・動画コンテナ等」 を幅広く扱えて豊富なコーデックに対応したツール (OSS で Windows/macOS/Linux に対応) 形式変換・加工・再エンコードなどの様々な処理が 行える昔からある老舗のツール (自分が初めて触ったのが
20年くらい前というレベル感)
選定についてなど ・コマンドラインのツールなので相性が良さそう + 老舗で OSS のツールなので、十分学習されている 試した動画は使っても問題ない 37秒くらいの適当なもので (最近、試作してたものの1つで リングコン・Joy-Con
の情報 ブラウザの API で取得して 描画に反映させる体験型の コンテンツ)
プロンプトや構成の補足 【試したプロンプト】 「fileフォルダ内の動画をffmpegコマンドで 10秒ごとに画像にして、その画像を読み取って 内容を解説して」 【補足】 Gemini CLI が扱えるフォルダの直下に、「file」 という名前のフォルダを作成して、その中に動画
ファイルを置いた形
抽出された画像と得られた結果① 1枚目の画像です。 左上には、男性がリングコンのようなものを両手で持って いる映像が表示されています。右側には、黒い背景に、 黄色い同心円状のグラフィックと、その周りにカラフルな 光の粒子のようなものが表示されています。左下には、 コードのようなものが表示されていますが、内容は一部しか 見えません。 2枚目の画像です。 1枚目との違いは、右側のグラフィックです。同心円の色が
黄色から水色に変化し、カラフルな光の粒子の位置も 変わっています。男性の映像やコードの部分に大きな変化は 見られません。
抽出された画像と得られた結果② 3枚目の画像です。 右側のグラフィックの同心円の色が、さらに緑色に変化して います。光の粒子の位置も、前の画像から変わっています。 男性の映像やコードの部分に大きな変化は見られません。 4枚目の画像です。 右側のグラフィックの同心円が消え、代わりにピンク色の円が 表示されています。カラフルな光の粒子は、その円の周りを 漂うように表示されています。 この動画は、男性がリングコンのようなものを操作することで、右側のグラフィックが変化
する、という内容のようです。リングコンの動きに合わせて、同心円の色や光の粒子の動き がインタラクティブに変化している様子がうかがえます。左下のコードは、このインタラク ションを制御しているプログラムの一部であると考えられます。
FFmpeg での他の処理や 動画・音声の特徴を抽出できる他の コマンドラインツールも試してみたい!
終わり!