Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrockを活用した 報道向け文字起こしシステムの開発
Search
Kazuki Miura
PRO
November 21, 2025
Technology
170
1
Share
Amazon Bedrockを活用した 報道向け文字起こしシステムの開発
#mediajaws
https://media-jaws.connpass.com/event/369833/
Kazuki Miura
PRO
November 21, 2025
More Decks by Kazuki Miura
See All by Kazuki Miura
地域のCCoEの拡大を目指す 企業間コミュニティ 「re:light local」について
miu_crescent
PRO
0
40
us-east-1 に障害が起きた時に、 ap-northeast-1 にどんな影響があるか 説明できるようになろう!
miu_crescent
PRO
13
5k
これだけはやっておいた方がよさそう?awsにおけるランサムウェア対策
miu_crescent
PRO
1
140
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
4
400
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
390
エンタメ方向のTを広げよう!Werner先生の クロージングキーノートを 深掘りするための小ネタ10
miu_crescent
PRO
1
190
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
0
76
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
3
1.1k
完全未経験からAWSと共に セキュリティに立ち向かった半生
miu_crescent
PRO
1
160
Other Decks in Technology
See All in Technology
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.6k
【新卒研修】ライブデモ + compose.yaml読解_講義資料
dip_tech
PRO
0
130
LookerとADKで作る社内AIエージェント
chanyou0311
0
290
GitHub Copilot CLI の Rubber Duck 機能を使ってコーディングの品質をあげよう #techbaton_findy
stefafafan
1
330
AIコーディングエージェントの活用で、コードは静かに肥大化した
yosukeshinoda
1
140
ワールドカフェ再び、そしてゴール・ルール・ロール・ツール / World Café Revisited, and the Goals-Rules-Roles-Tools
ks91
PRO
0
190
【禁断】Obsidianの第二の脳に「知の巨人」と呼ばれた師匠の脳をロードしてみた
nagatsu
0
2.7k
Fラン学生が考える、AI時代のデザインに執着した突破口
husengs7
1
240
責任あるソフトウェアエンジニアリングの紹介4章・5章 / RSE_Ch4-5
ido_kara_deru
0
220
AIAgentと取り組むKaggle
508shuto
2
480
Copilot CLI・IDE・Web・スマホで途切れない開発フローを目指して / One Copilot flow - CLI IDE Web Mobile
aeonpeople
0
260
Redmine次期バージョン7.0の注目新機能解説 — UI/UX強化と連携強化を中心に
vividtone
2
230
Featured
See All Featured
WCS-LA-2024
lcolladotor
0
600
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Deep Space Network (abreviated)
tonyrice
0
150
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
290
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
570
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.3k
How to make the Groovebox
asonas
2
2.2k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.9k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
220
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Transcript
Amazon Bedrock を活用した 報道向け文字起こしシステムの開発 RAB 青森放送 ヘプタゴン 2025年11月21日(金) Media-JAWS #20
内山 匠 三浦 一樹
内山 匠 報道部 デジタル報道班 三浦 一樹 クラウドアーキテクト
Content 目次 開発の背景(RAB内山) 開発と構成について(HEP三浦) 実際使ってみて(RAB内山)
開発の背景 01
「dahande」は 津軽弁の“だはんで(だから) ”に由来し “hand(手助け) ”や“handy(便利) ”の意味も込めた造語 人の手間を減らし、使う人の味方になる文字起こしツール ―「だはんで、便利なんだ」って言いたくなる存在! dahande 自動文字起こしシステム
(ダハンデ)
地域性に特化した 『育てる』自動字起こしシステムです。 ・音声ファイルをクラウド上の生成AIで高速処理 ・タスク完了をメールやslackで通知 ・使い易く区切ったタイムコード付で出力 ・誤字や方言などを学習させてカスタマイズ
・ログインユーザーごとに出力フォルダを作成 →管理者以外は他のフォルダを見れないため グループ内でも厳しい情報管理に ・音声ファイルをドラッグ&ドロップの簡易操作 (対応:amr,flac,m4a,mp3,ogg,webm,wav) ・PC,スマホ対応(ボイスメモアプリなど) ・指定ドメインのみアカウント作成・管理で ファイルの機密を保持
Ex) 長さ7 分の音声を3 分ほどでテキスト出力できます。 ・適度な長さの文節を自動で判断 ・タイムコードのIN点とOUT点を出力 ・出力したcsvはコピペで原稿端末へ ・誤字や独自の読み方、固有名詞などを AWS上で追加していくことで エンジンが進化し,エリアに合わせた
出力が可能になる. (将来的には方言データベース連携も)
開発支援をおこないました
開発と構成について 02
AWS Amplify Amazon Cognito AWS Step Functions Amazon S3 Amazon
Transcribe Amazon SES Amazon CloudFront Amazon Bedrock Amazon S3 Authenticated user AWS Cloud AWS Lambda AWS Lambda AWS Lambda AWS Lambda Email 音声ファイル VTT ファイル 音声ファイル 構成図
None
生成AIさんが Step FunctionsのSDKを ちゃんと理解してくれない、、
AWS Amplify Amazon Cognito Amazon CloudFront AWS Lambda AWS Lambda
AWS Lambda AWS Lambda AWS Step Functions Amazon S3 Amazon Transcribe Amazon SES Amazon Bedrock Amazon S3 Authenticated user AWS Cloud Email 音声ファイル VTT ファイル 音声ファイル
アップロードするところ iOS の「ボイスメモ」 から 簡単にアップロード
メール S3 署名付き URL ログインのアドレスに送信
Amazon Transcribe Amazon Bedrock 音声ファイル VTT ファイル CSV ファイル Amazon
S3 Amazon S3 大事なところ
Amazon Transcribe VTT ファイル 大事なところ 動画で時間に紐づいた情報 を出すためのファイル 字幕とか シークバーのサムネとか
大事なところ 人手で修正する前提で ある程度のまとまりで みやすいように 「あー」とか「うー」とか フィラーも削除 Amazon Bedrock CSV ファイル
実際に使ってみて 03
参院選の期間中なのに早く帰れた 第一声の記事を出せた 誤変換はどうしてもある 「むつ」と「陸奥」と「六つ」 辞書登録で対応 10分で50円くらい タイムコードでコミュニケーションコストも低減 アップロード簡単 変換もはやい はやい
コスト 育てる 選挙の話
計画と展望 04
今後にむけて 長時間ファイルの対応 辞書登録の拡大 カスタム語彙のサイズ は 制限50 KB Lambda のタイムアウト と
トークン数制限 他部門での活用 番組審議会など 他部署から 青森ならでは 青森ならではの 方言対応など
細かいお話が気になる方はこちら 長時間ファイルの対応 辞書登録の拡大 https://heptagon.co.jp/showcases/rab-dahande/
Thank you ご清聴ありがとうございました。 RAB 青森放送 ヘプタゴン 内山 匠 三浦 一樹