Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メディア業界の AI活用
Search
NAXA, Inc.
June 21, 2024
Technology
0
62
メディア業界の AI活用
Media-JAWS 【第15回】
https://media-jaws.connpass.com/event/316706/
NAXA, Inc.
June 21, 2024
Tweet
Share
More Decks by NAXA, Inc.
See All by NAXA, Inc.
Interop Tokyo 2024 テレビ業界を解き放つAI×放送DXの未来
naxa
1
130
Other Decks in Technology
See All in Technology
SwiftSyntaxでUIKitとSwiftUIの使用率を完璧に計測できちゃう件について
ldf_tech
0
160
AWS Step Functionsのタスク入出力に秩序を与えよう
y_kotani
0
180
いまからでも遅くない!コンテナでWebアプリを動かしてみよう入門(2-2)WebAPIハンズオン
nomu
0
150
What's in a Postgres major release? An analysis of contributions in the v17 timeframe | Claire Giordano | PGConf EU 2024
clairegiordano
1
660
WINTICKETアプリで実現した高可用性と高速リリースを支えるエコシステム / winticket-eco-system
cyberagentdevelopers
PRO
1
130
TinyMLの技術動向
kyotomon
2
230
オニオンアーキテクチャで実現した 本質課題を解決する インフラ移行の実例
hryushm
11
2.3k
30万人が利用するチャットをFirebase Realtime DatabaseからActionCableへ移行する方法
ryosk7
2
240
失敗しないOpenJDKの非互換調査
tabatad
0
200
LLMOps : ΔMLOps
shuntaito
14
2.9k
研究の再現性を高める 仕組みをGoでつくる / Creating a system to improve the reproducibility of research using go
linyows
1
100
6年の歴史×ペタバイト級のデータ基盤のチームを一体化する開発スタイル
plaidtech
PRO
4
110
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
66
9.9k
Imperfection Machines: The Place of Print at Facebook
scottboms
264
13k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
167
49k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
246
1.3M
Dealing with People You Can't Stand - Big Design 2015
cassininazir
364
22k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.1k
Optimizing for Happiness
mojombo
376
69k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
3
360
Producing Creativity
orderedlist
PRO
341
39k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.8k
The Art of Programming - Codeland 2020
erikaheidi
51
13k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9k
Transcript
メディア業界の AI活用 NAXA株式会社 山上駿也
自己紹介 2 山上駿也 NAXA株式会社 AIエンジニア 学生時代はAIエンジニアとしてフリーランス活動 CVPR/BMVC/MIRUに画像認識AIの論文投稿 画像処理/音声処理/自然言語処理 アプリ開発
NAXA株式会社 3 ▪ NAXA株式会社 ビジョン メディア、エンタメの未来を創る 放送局向けソフトウェア開発 クライドプレイアウト、インカムアプリ、音効処理 等 AI技術を活用した新事業
自動字幕生成AI、音源分離AI、デジタルプレイスメント 取り組み 放送技術×AI
本日のテーマ 4 メディア業界における AI活用
Copyright NAXA, Inc. All rights reserved. Index 5 1. 字幕生成AI
2. メタデータ生成AI 3. 音源分離AI 4. AWS Summit 展示紹介
字幕生成AI 6 ▪独自の音声認識エンジン 日本語特化で高精度 ▪編集エディタの提供 モダンで直感的な操作 ▪テレビ局の規約に対応 ARIB字幕 テロップ避け 話者認識
etc.. 放送技術×AI
字幕生成AI 7 字幕制作業務の 90%以上効率化を目指す
メタデータ生成AI 8 膨大な番組データ 検索が非常に大変 → NAXAの音声認識エンジンを用いてメタデータを自動生成 要約、セクション分割、キーワード抽出 等 番組 DB
NAXA 音声認識 エンジン 検索 要約 セクション分割 キーワード抽出
音源分離 9 Voice SE Music ▪楽曲の権利処理 ▪マイク収録時の雑音 →音源分離AIによりセリフと効果音を残しながらBGMの除去を行う. Cross Attention
音源分離AI Waveform Spectrogram
AWS Summit 展示紹介 11 カメラでユーザの状態を観測し、店舗試着からECサイトへの誘導、おすすめ 商品の提案等を行うバーチャルコンシェルジュ。 WebRTCで低遅延接続を確立し、動画/音声/生成AIをリアルタイムで動かす。
NAXA株式会社 東京都文京区本郷3丁目39-9 山本ビル 2階 https://www.naxa.co.jp/