Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Kazuki Miura
PRO
February 07, 2026
Technology
4
340
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
一周年おめでとうございます!
#jawsug_tochigi #jawsug
https://jawsug-tochigi.connpass.com/event/381536/
Kazuki Miura
PRO
February 07, 2026
Tweet
Share
More Decks by Kazuki Miura
See All by Kazuki Miura
us-east-1 に障害が起きた時に、 ap-northeast-1 にどんな影響があるか 説明できるようになろう!
miu_crescent
PRO
13
4.2k
これだけはやっておいた方がよさそう?awsにおけるランサムウェア対策
miu_crescent
PRO
1
120
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
330
エンタメ方向のTを広げよう!Werner先生の クロージングキーノートを 深掘りするための小ネタ10
miu_crescent
PRO
1
170
Amazon Bedrockを活用した 報道向け文字起こしシステムの開発
miu_crescent
PRO
0
130
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
0
57
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
3
1.1k
完全未経験からAWSと共に セキュリティに立ち向かった半生
miu_crescent
PRO
1
150
Stripe Terminal を触ってみた!!
miu_crescent
PRO
0
98
Other Decks in Technology
See All in Technology
OCI Security サービス 概要
oracle4engineer
PRO
2
13k
トップマネジメントとコンピテンシーから考えるエンジニアリングマネジメント
zigorou
4
840
Google系サービスで文字起こしから勝手にカレンダーを埋めるエージェントを作った話
risatube
0
140
生成AIの利用とセキュリティ /gen-ai-and-security
mizutani
1
1.6k
SRE NEXT 2026 CfP レビュアーが語る聞きたくなるプロポーザルとは?
yutakawasaki0911
1
240
マルチロールEMが実践する「組織のレジリエンス」を高めるための組織構造と人材配置戦略
coconala_engineer
3
710
タスク管理も1on1も、もう「管理」じゃない ― KiroとBedrock AgentCoreで変わった"判断の仕事"
yusukeshimizu
5
2.6k
EMからVPoEを経てCTOへ:マネジメントキャリアパスにおける葛藤と成長
kakehashi
PRO
9
1.7k
決済サービスを支えるElastic Cloud - Elastic Cloudの導入と推進、決済サービスのObservability
suzukij
2
600
白金鉱業Meetup_Vol.22_Orbital Senseを支える衛星画像のマルチモーダルエンベディングと地理空間のあいまい検索技術
brainpadpr
2
290
ナレッジワーク IT情報系キャリア研究セッション資料(情報処理学会 第88回全国大会 )
kworkdev
PRO
0
160
Go標準パッケージのI/O処理をながめる
matumoto
0
130
Featured
See All Featured
Agile that works and the tools we love
rasmusluckow
331
21k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
How GitHub (no longer) Works
holman
316
140k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.6k
Side Projects
sachag
455
43k
Fireside Chat
paigeccino
42
3.8k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
190
Writing Fast Ruby
sferik
630
63k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
130
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Transcript
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
1周年おめでとうございます! 1周年おめでとうございます!
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 三浦 一樹 クラウドアーキテクト 自己紹介 自己紹介
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 初 AWS Builder Center 初 AWS Builder Center ほんとだロゴ出てるw 本日無事、更新の連絡が来ました
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 自己紹介 自己紹介 札幌からきました
新千歳の床で寝ました 新千歳の床で寝ました こないだ こないだ 気になる人は懇親会で... 気になる人は懇親会で...
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
放送局向け 音声文字起こし 要件違いで 2つ作った 放送局向け 音声文字起こし 要件違いで 2つ作った システム A
システム A システム B システム B
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい システム A システム A
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい システム B
システム B
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock
Amazon Transcribe 今日の主役 Amazon Bedrock ありがとう ぼくの ベッドロック
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
話者識別
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe チャンネル分け:なし 話者数:なし
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe "speaker_label":"spk_0" "speaker_label":"spk_1"
有効にすると、speaker_label が付与される
ちょっと何言って るかわからない ちょっと何言って るかわからない
人が読める形に + speaker_label に人の名前を 付与する 人が読める形に + speaker_label に人の名前を 付与する
Amazon Transcribe Amazon Bedrock 社長:とりあえず、ビール 常務:ハイボールで 会長:レモンサワー! 各登場人物の最初の発言は以下です Bedrock 側に発言順と最初の一言を渡し て、テキスト整形してもらう
これでとても綺麗 に議事録ができま した これでとても綺麗 に議事録ができま した 社長:お忙しいところありがとう ございます。 常務:皆様、こんにちは 会長:よろしくおねがいします
用途 通称番組審議会用 の議事録 用途 通称番組審議会用 の議事録 2 審議機関は、放送事業者の諮問に応じ、放送番組の適正を図るため必要な事項を審 議するほか、これに関し、放送事業者に対して意見を述べることができる。 3 放送事業者は、番組基準及び放送番組の編集に関する基本計画を定め、又はこれを 変更しようとするときは、審議機関に諮問しなければならない。
4 放送事業者は、審議機関が第二項の規定により諮問に応じて答申し、又は意見を述 べた事項があるときは、これを尊重して必要な措置をしなければならない。 5 放送事業者は、総務省令で定めるところにより、次の各号に掲げる事項を審議機関 に報告しなければならない。 一 前項の規定により講じた措置の内容 二 第九条第一項の規定による訂正又は取消しの放送の実施状況 三 放送番組に関して申出のあつた苦情その他の意見の概要 6 放送事業者は、審議機関からの答申又は意見を放送番組に反映させるようにするた め審議機関の機能の活用に努めるとともに、総務省令で定めるところにより、次の各号 に掲げる事項を公表しなければならない。 一 審議機関が放送事業者の諮問に応じてした答申又は放送事業者に対して述べた意見 の内容その他審議機関の議事の概要 二 第四項の規定により講じた措置の内容 放送法 第六条 放送事業者は、放送番組の適正を図る ため、放送番組審議機関(以下「審議 機関」という。 )を置くものとする。
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock VTT ファイルいけんじゃね?
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ブラウザが読める 動画とかで使ってる zoom とかの字幕も シークバーサムネとか もここで定義
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ただのテキストファイル
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock Transcribe はVTT が出せる 人に優しくないので Bedrock に頑張ってもらう
用途 選挙報道のため 用途 選挙報道のため 候補者の発言はとても大切 https://news.ntv.co.jp/n/rab/category/politics/ra0da837093f974868bafd8ba7d4b27569
Amazon Transcribe Amazon Bedrock 時間は1分くらいでまとめて1行ずつ CSV に出力してください 「あー」 「うー」などは削除 カスタム語彙
+ フィラーの除去 カスタム語彙 + フィラーの除去 プロンプト(だいたい) カスタム語彙 ・政党名 ・候補者名 ・地名 陸奥とむつ
操作画面 操作画面
今日の オープニング 今日の オープニング WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、
2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッションの中で、ちょっと地域 支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単に振り返りたいと思い ます。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中から入っていただい て、今三人で運営しています。
今日の オープニング 今日の オープニング
0:00:00 - 0:00:19 ちゃんとお話させていただいた、 やらせていただいてるんですけど、この後ですね、トークセッションの中 で、ちょっと地域支部の活性化だったりとか、活動報告、 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、 2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッション の中で、ちょっと地域支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
編集や テロップ作成 にも使える フィラーが消えて るの大きい 編集や テロップ作成 にも使える フィラーが消えて るの大きい
ツイートするまで次いきません! ツイートするまで次いきません!
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock 生成AI に入力するデータを
工夫すると 考えることを減らせる! 間に色々噛ませるのがAWS のいいところ
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 便利な p a r s e r として 便利な p a r s e r として
ありがとうございました! ありがとうございました! # j a w s u g _
t o c h i g i # j a w s u g _ t o c h i g i