Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Kazuki Miura
PRO
February 07, 2026
Technology
1
59
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
一周年おめでとうございます!
#jawsug_tochigi #jawsug
https://jawsug-tochigi.connpass.com/event/381536/
Kazuki Miura
PRO
February 07, 2026
Tweet
Share
More Decks by Kazuki Miura
See All by Kazuki Miura
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
280
エンタメ方向のTを広げよう!Werner先生の クロージングキーノートを 深掘りするための小ネタ10
miu_crescent
PRO
1
150
Amazon Bedrockを活用した 報道向け文字起こしシステムの開発
miu_crescent
PRO
0
120
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
0
30
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
3
1.1k
完全未経験からAWSと共に セキュリティに立ち向かった半生
miu_crescent
PRO
1
150
Stripe Terminal を触ってみた!!
miu_crescent
PRO
0
78
アクシズを探せ! 各勢力の位置関係についての考察
miu_crescent
PRO
1
81
地方だからできた! 東北でのAWS事例を一挙紹介!#地方だからできる
miu_crescent
PRO
0
47
Other Decks in Technology
See All in Technology
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
660
セキュリティについて学ぶ会 / 2026 01 25 Takamatsu WordPress Meetup
rocketmartue
1
290
AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦
0gm
0
750
学生・新卒・ジュニアから目指すSRE
hiroyaonoe
2
550
Azure Durable Functions で作った NL2SQL Agent の精度向上に取り組んだ話/jat08
thara0402
0
140
2026年、サーバーレスの現在地 -「制約と戦う技術」から「当たり前の実行基盤」へ- /serverless2026
slsops
2
210
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
1
190
toCプロダクトにおけるAI機能開発のしくじりと学び / ai-product-failures-and-learnings
rince
6
5.5k
Databricks Free Edition講座 データサイエンス編
taka_aki
0
290
SREが向き合う大規模リアーキテクチャ 〜信頼性とアジリティの両立〜
zepprix
0
400
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
42k
2人で作ったAIダッシュボードが、開発組織の次の一手を照らした話― Cursor × SpecKit × 可視化の実践 ― Qiita AI Summit
noalisaai
1
370
Featured
See All Featured
Navigating Weather and Climate Data
rabernat
0
100
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
290
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
770
WCS-LA-2024
lcolladotor
0
440
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Rails Girls Zürich Keynote
gr2m
96
14k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
62
Leo the Paperboy
mayatellez
4
1.4k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Transcript
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
1周年おめでとうございます! 1周年おめでとうございます!
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 三浦 一樹 クラウドアーキテクト 自己紹介 自己紹介
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 初 AWS Builder Center 初 AWS Builder Center ほんとだロゴ出てるw 本日無事、更新の連絡が来ました
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 自己紹介 自己紹介 札幌からきました
新千歳の床で寝ました 新千歳の床で寝ました こないだ こないだ 気になる人は懇親会で... 気になる人は懇親会で...
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
放送局向け 音声文字起こし 要件違いで 2つ作った 放送局向け 音声文字起こし 要件違いで 2つ作った システム A
システム A システム B システム B
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい システム A システム A
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい システム B
システム B
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock
Amazon Transcribe 今日の主役 Amazon Bedrock ありがとう ぼくの ベッドロック
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
話者識別
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe チャンネル分け:なし 話者数:なし
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe "speaker_label":"spk_0" "speaker_label":"spk_1"
有効にすると、speaker_label が付与される
ちょっと何言って るかわからない ちょっと何言って るかわからない
人が読める形に + speaker_label に人の名前を 付与する 人が読める形に + speaker_label に人の名前を 付与する
Amazon Transcribe Amazon Bedrock 社長:とりあえず、ビール 常務:ハイボールで 会長:レモンサワー! 各登場人物の最初の発言は以下です Bedrock 側に発言順と最初の一言を渡し て、テキスト整形してもらう
これでとても綺麗 に議事録ができま した これでとても綺麗 に議事録ができま した 社長:お忙しいところありがとう ございます。 常務:皆様、こんにちは 会長:よろしくおねがいします
用途 通称番組審議会用 の議事録 用途 通称番組審議会用 の議事録 2 審議機関は、放送事業者の諮問に応じ、放送番組の適正を図るため必要な事項を審 議するほか、これに関し、放送事業者に対して意見を述べることができる。 3 放送事業者は、番組基準及び放送番組の編集に関する基本計画を定め、又はこれを 変更しようとするときは、審議機関に諮問しなければならない。
4 放送事業者は、審議機関が第二項の規定により諮問に応じて答申し、又は意見を述 べた事項があるときは、これを尊重して必要な措置をしなければならない。 5 放送事業者は、総務省令で定めるところにより、次の各号に掲げる事項を審議機関 に報告しなければならない。 一 前項の規定により講じた措置の内容 二 第九条第一項の規定による訂正又は取消しの放送の実施状況 三 放送番組に関して申出のあつた苦情その他の意見の概要 6 放送事業者は、審議機関からの答申又は意見を放送番組に反映させるようにするた め審議機関の機能の活用に努めるとともに、総務省令で定めるところにより、次の各号 に掲げる事項を公表しなければならない。 一 審議機関が放送事業者の諮問に応じてした答申又は放送事業者に対して述べた意見 の内容その他審議機関の議事の概要 二 第四項の規定により講じた措置の内容 放送法 第六条 放送事業者は、放送番組の適正を図る ため、放送番組審議機関(以下「審議 機関」という。 )を置くものとする。
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock VTT ファイルいけんじゃね?
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ブラウザが読める 動画とかで使ってる zoom とかの字幕も シークバーサムネとか もここで定義
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ただのテキストファイル
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock Transcribe はVTT が出せる 人に優しくないので Bedrock に頑張ってもらう
用途 選挙報道のため 用途 選挙報道のため 候補者の発言はとても大切 https://news.ntv.co.jp/n/rab/category/politics/ra0da837093f974868bafd8ba7d4b27569
Amazon Transcribe Amazon Bedrock 時間は1分くらいでまとめて1行ずつ CSV に出力してください 「あー」 「うー」などは削除 カスタム語彙
+ フィラーの除去 カスタム語彙 + フィラーの除去 プロンプト(だいたい) カスタム語彙 ・政党名 ・候補者名 ・地名 陸奥とむつ
操作画面 操作画面
今日の オープニング 今日の オープニング WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、
2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッションの中で、ちょっと地域 支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単に振り返りたいと思い ます。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中から入っていただい て、今三人で運営しています。
今日の オープニング 今日の オープニング
0:00:00 - 0:00:19 ちゃんとお話させていただいた、 やらせていただいてるんですけど、この後ですね、トークセッションの中 で、ちょっと地域支部の活性化だったりとか、活動報告、 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、 2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッション の中で、ちょっと地域支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
編集や テロップ作成 にも使える フィラーが消えて るの大きい 編集や テロップ作成 にも使える フィラーが消えて るの大きい
ツイートするまで次いきません! ツイートするまで次いきません!
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock 生成AI に入力するデータを
工夫すると 考えることを減らせる! 間に色々噛ませるのがAWS のいいところ
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 便利な p a r s e r として 便利な p a r s e r として
ありがとうございました! ありがとうございました! # j a w s u g _
t o c h i g i # j a w s u g _ t o c h i g i