Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Kazuki Miura
PRO
February 07, 2026
Technology
4
320
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
一周年おめでとうございます!
#jawsug_tochigi #jawsug
https://jawsug-tochigi.connpass.com/event/381536/
Kazuki Miura
PRO
February 07, 2026
Tweet
Share
More Decks by Kazuki Miura
See All by Kazuki Miura
これだけはやっておいた方がよさそう?awsにおけるランサムウェア対策
miu_crescent
PRO
1
94
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
310
エンタメ方向のTを広げよう!Werner先生の クロージングキーノートを 深掘りするための小ネタ10
miu_crescent
PRO
1
160
Amazon Bedrockを活用した 報道向け文字起こしシステムの開発
miu_crescent
PRO
0
120
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
0
42
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
3
1.1k
完全未経験からAWSと共に セキュリティに立ち向かった半生
miu_crescent
PRO
1
150
Stripe Terminal を触ってみた!!
miu_crescent
PRO
0
90
アクシズを探せ! 各勢力の位置関係についての考察
miu_crescent
PRO
1
110
Other Decks in Technology
See All in Technology
Interop Tokyo 2025 ShowNet Team Memberで学んだSRv6を基礎から丁寧に
miyukichi_ospf
0
200
失敗できる意思決定とソフトウェアとの正しい歩き方_-_変化と向き合う選択肢/ Designing for Reversible Decisions
soudai
PRO
7
860
AI活用を"目的"にしたら、データの本質が見えてきた - Snowflake Intelligence実験記 / chasing-ai-finding-data
pei0804
0
670
Agent Ready になるためにデータ基盤チームが今年やること / How We're Making Our Data Platform Agent-Ready
zaimy
0
170
「OSアップデート:年に一度の「大仕事」を乗り切るQA戦略」_Mobile Tech Flex 〜4社合同!私たちのモバイル開発自慢大会〜
gu3
0
240
20260222ねこIoTLT ねこIoTLTをふりかえる
poropinai1966
0
220
Getting started with Google Antigravity
meteatamel
0
370
作るべきものと向き合う - ecspresso 8年間の開発史から学ぶ技術選定 / 技術選定con findy 2026
fujiwara3
5
1.1k
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
4k
Snowflake Night #2 LT
taromatsui_cccmkhd
0
160
三菱UFJ銀行におけるエンタープライズAI駆動開発のリアル / Enterprise AI_Driven Development at MUFG Bank: The Real Story
muit
10
19k
論文検索を日本語でできるアプリを作ってみた
sailen2
0
120
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.8k
A better future with KSS
kneath
240
18k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.4k
The Curious Case for Waylosing
cassininazir
0
260
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
130
The SEO identity crisis: Don't let AI make you average
varn
0
400
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
460
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
130
What's in a price? How to price your products and services
michaelherold
247
13k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
2
64
Transcript
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
1周年おめでとうございます! 1周年おめでとうございます!
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 三浦 一樹 クラウドアーキテクト 自己紹介 自己紹介
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 初 AWS Builder Center 初 AWS Builder Center ほんとだロゴ出てるw 本日無事、更新の連絡が来ました
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 自己紹介 自己紹介 札幌からきました
新千歳の床で寝ました 新千歳の床で寝ました こないだ こないだ 気になる人は懇親会で... 気になる人は懇親会で...
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
放送局向け 音声文字起こし 要件違いで 2つ作った 放送局向け 音声文字起こし 要件違いで 2つ作った システム A
システム A システム B システム B
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい システム A システム A
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい システム B
システム B
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock
Amazon Transcribe 今日の主役 Amazon Bedrock ありがとう ぼくの ベッドロック
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
話者識別
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe チャンネル分け:なし 話者数:なし
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe "speaker_label":"spk_0" "speaker_label":"spk_1"
有効にすると、speaker_label が付与される
ちょっと何言って るかわからない ちょっと何言って るかわからない
人が読める形に + speaker_label に人の名前を 付与する 人が読める形に + speaker_label に人の名前を 付与する
Amazon Transcribe Amazon Bedrock 社長:とりあえず、ビール 常務:ハイボールで 会長:レモンサワー! 各登場人物の最初の発言は以下です Bedrock 側に発言順と最初の一言を渡し て、テキスト整形してもらう
これでとても綺麗 に議事録ができま した これでとても綺麗 に議事録ができま した 社長:お忙しいところありがとう ございます。 常務:皆様、こんにちは 会長:よろしくおねがいします
用途 通称番組審議会用 の議事録 用途 通称番組審議会用 の議事録 2 審議機関は、放送事業者の諮問に応じ、放送番組の適正を図るため必要な事項を審 議するほか、これに関し、放送事業者に対して意見を述べることができる。 3 放送事業者は、番組基準及び放送番組の編集に関する基本計画を定め、又はこれを 変更しようとするときは、審議機関に諮問しなければならない。
4 放送事業者は、審議機関が第二項の規定により諮問に応じて答申し、又は意見を述 べた事項があるときは、これを尊重して必要な措置をしなければならない。 5 放送事業者は、総務省令で定めるところにより、次の各号に掲げる事項を審議機関 に報告しなければならない。 一 前項の規定により講じた措置の内容 二 第九条第一項の規定による訂正又は取消しの放送の実施状況 三 放送番組に関して申出のあつた苦情その他の意見の概要 6 放送事業者は、審議機関からの答申又は意見を放送番組に反映させるようにするた め審議機関の機能の活用に努めるとともに、総務省令で定めるところにより、次の各号 に掲げる事項を公表しなければならない。 一 審議機関が放送事業者の諮問に応じてした答申又は放送事業者に対して述べた意見 の内容その他審議機関の議事の概要 二 第四項の規定により講じた措置の内容 放送法 第六条 放送事業者は、放送番組の適正を図る ため、放送番組審議機関(以下「審議 機関」という。 )を置くものとする。
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock VTT ファイルいけんじゃね?
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ブラウザが読める 動画とかで使ってる zoom とかの字幕も シークバーサムネとか もここで定義
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ただのテキストファイル
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock Transcribe はVTT が出せる 人に優しくないので Bedrock に頑張ってもらう
用途 選挙報道のため 用途 選挙報道のため 候補者の発言はとても大切 https://news.ntv.co.jp/n/rab/category/politics/ra0da837093f974868bafd8ba7d4b27569
Amazon Transcribe Amazon Bedrock 時間は1分くらいでまとめて1行ずつ CSV に出力してください 「あー」 「うー」などは削除 カスタム語彙
+ フィラーの除去 カスタム語彙 + フィラーの除去 プロンプト(だいたい) カスタム語彙 ・政党名 ・候補者名 ・地名 陸奥とむつ
操作画面 操作画面
今日の オープニング 今日の オープニング WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、
2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッションの中で、ちょっと地域 支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単に振り返りたいと思い ます。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中から入っていただい て、今三人で運営しています。
今日の オープニング 今日の オープニング
0:00:00 - 0:00:19 ちゃんとお話させていただいた、 やらせていただいてるんですけど、この後ですね、トークセッションの中 で、ちょっと地域支部の活性化だったりとか、活動報告、 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、 2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッション の中で、ちょっと地域支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
編集や テロップ作成 にも使える フィラーが消えて るの大きい 編集や テロップ作成 にも使える フィラーが消えて るの大きい
ツイートするまで次いきません! ツイートするまで次いきません!
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock 生成AI に入力するデータを
工夫すると 考えることを減らせる! 間に色々噛ませるのがAWS のいいところ
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 便利な p a r s e r として 便利な p a r s e r として
ありがとうございました! ありがとうございました! # j a w s u g _
t o c h i g i # j a w s u g _ t o c h i g i