Introduction to works of Data Scientist in LY Corporation

© LY Corporation Introduction to works of Date Scientist in
LY Corporation DS統括本部 4本部宗像北斗 / Munakata Hokuto 1

© LY Corporation 宗像北斗 (Munakata Hokuto) ~2023 : 大阪大学
工学研究科駒谷研究室 - 音源分離の研究 2023~ : LINE株式会社 ASPチーム - 音楽情報処理の研究開発 2023/10~ : LINEヤフー株式会社 4本部 - 動画解析 / 音楽情報処理の研究開発普段京都オフィスにいます趣味：・ギター，ライブ鑑賞 (ロック，パンク，メタル，シューゲイザー…) ・飲み会 (あんまり飲めない）・良い紅茶 2 自己紹介 DCASE 2024(品川)にて

© LY Corporation 所属チームでの仕事音楽情報処理 / 動画解析にまつわる研究開発音楽情報処理：LINE MUSICなどの楽曲を扱うコンテンツのUX改善・歌唱者ダイアライゼーション
・動画を入力とした楽曲推薦・楽曲タギング動画解析：スポーツナビなどの動画コンテンツの検索システムや動画広告の審査自動化・テキストクエリを用いたオーディオクリップ検索・テキストクエリを用いたオーディオの区間検索・マルチモーダル (Text, Image, Video, Audio) 基盤モデル研究・開発どちらもやってます！国際会議/論文誌投稿，OSSライブラリ開発，サービス向けツール開発

© LY Corporation 歌唱者ダイアライゼーション複数人歌唱楽曲でどのタイミングで誰が歌っているか予測応用先：LINE MUSICのUX向上 (歌詞表示，カラオケ機能) 従来：ボーカル抽出技術と話者(=対話音声)ダイアライゼーション技術の組み合わせ課題：歌唱者ダイアライゼーションの学習データのアノテーションは高コスト
提案：大規模な楽曲データと音声変換モデルを組み合わせた合成データ生成法を提案！ ☺ 企業ならではの大規模データ，音声合成チームとの連携結果：大幅な性能改善 (ダイアライゼーション誤り率: 38.2% → 23.4%)，国際会議採択！ Diarization model Vocal extraction Singer labels Singer B A Time ♡~~~~~ ♧~~~~~

© LY Corporation テキストクエリを用いたオーディオの区間検索長いオーディオから特定のイベントが含まれる区間を検索したい応用先：スポーツ動画の自動ハイライト集生成，広告の自動審査従来：事前に短く分割されたオーディオクリップの検索システムしかない提案：コンピュータビジョンで扱われる動画に対する区間検索を応用，タスク整備 ☺ CVをバックグラウンドに持つメンバーと協力して新データセット，モデル提案
結果：単純なベースラインに比べて性能改善 (avg.mAP: 57.0→67.8)，国際会議投稿中！ Input long audio Input text query Freq.[kHz] 0 16 0 10 20 30 50 40 60 Time [second] 44s 16s Output audio moment Audio moment retrieval ”Spectators watch sports and cheer.” [16s, 44s]

© LY Corporation マルチモーダル基盤モデルの開発日本語版Text-Image基盤モデルの拡張目標：現状の基盤モデルに新たなモーダル(Video/Audioなど)を追加 (https://techblog.lycorp.co.jp/ja/20240514bにてText-image基盤モデルの詳細公開中！) 応用先：動画クリップに対する検索，自動タギング現在進行中！・日本語版の学習
/ 評価データ収集中・大規模学習に向けた環境構築マルチモーダルなユーザクエリマルチモーダルな出力 Audio Video Text Audio Video Text

© LY Corporation 1日の流れケース1 10:00-11:00 ミーティング研究の進捗報告，アイデア出し 11:00-14:00 論文読み/資料作成/雑務
合間にお昼ご飯 14:00-15:00 全体定例事業部との連携や全社的な動きについて周知 15:00-18:45 論文読み/実験・実装/資料作成日によってさまざまミーティングが少ない夕方の方がコーディングに集中できるケース2 10:00-15:00 論文執筆締切前はとにかく書く 15:00-16:00 研究について1on1 行き詰まったらメンバーに相談 16:00-20:00 実験論文を補強するための実験集中モード

Introduction to works of Data Scientist in LY C...

Introduction to works of Data Scientist in LY Corporation

LINEヤフー株式会社採用情報

More Decks by LINEヤフー株式会社採用情報

Other Decks in Technology

Featured

Transcript

© LY Corporation Introduction to works of Date Scientist in

© LY Corporation 宗像北斗 (Munakata Hokuto) ~2023 : 大阪大学

© LY Corporation 所属チームでの仕事音楽情報処理 / 動画解析にまつわる研究開発音楽情報処理：LINE MUSICなどの楽曲を扱うコンテンツのUX改善・歌唱者ダイアライゼーション

© LY Corporation 1日の流れケース1 10:00-11:00 ミーティング研究の進捗報告，アイデア出し 11:00-14:00 論文読み/資料作成/雑務

© LY Corporation

Introduction to works of Data Scientist in LY C...

Introduction to works of Data Scientist in LY Corporation

More Decks by LINEヤフー株式会社 採用情報

Other Decks in Technology

Featured

Transcript

More Decks by LINEヤフー株式会社採用情報