Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Music×Analytics Meetup Vol.12LT2: 大規模言語モデルでアド...
Search
triwave33
August 06, 2024
Technology
170
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Music×Analytics Meetup Vol.12 LT2: 大規模言語モデルでアドリブさせてみた(時のこぼれ話)
https://muana.connpass.com/event/321761/
triwave33
August 06, 2024
More Decks by triwave33
See All by triwave33
LLMの効率化を支えるアルゴリズム
taturabe
19
7.9k
Other Decks in Technology
See All in Technology
Docker Desktop不要の時代が来る? WSL標準の「wslc」で Linuxコンテナを動かしてみた.
ueponx
0
130
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
4
800
40代で“やっとエンジニアになれた”――閉じた学びを開き、空の青さを知る / 20260628 Naoki Takahashi
shift_evolve
PRO
4
1.1k
AIに障害切り分けを全部やってもらった。 。 。 。
estie
0
260
AIは、人間らしい仕事の夢を見るか?─ AI時代のtoB/toEプロダクトを再設計する
techtekt
PRO
0
160
5分でわかる Amazon Connect_20260608
hwangbyeonghun
0
130
AI 不只幫你寫 Code: 當專案從 300 暴增到 1500, 我們如何撐住 DevOps
appleboy
0
280
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
11k
AWS Summit 2026で見えたSIerにとっての Amazon Quickの位置づけ
maf_0521
0
110
Deep Data Security 機能解説
oracle4engineer
PRO
2
230
Fabricをフル活用する AI Agent Hub -製造業特化AIエージェントの設計
iotcomjpadmin
0
150
AI時代のコスト管理を考えよう〜明日から使える実践AWSノウハウ~
yoshimi0227
0
950
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Raft: Consensus for Rubyists
vanstee
141
7.6k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
400
What's in a price? How to price your products and services
michaelherold
247
13k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.2k
Code Reviewing Like a Champion
maltzj
528
40k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
400
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
Navigating Weather and Climate Data
rabernat
0
240
The #1 spot is gone: here's how to win anyway
tamaranovitovic
3
1.1k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
750
Transcript
Music×Analytics Meetup Vol.12 LT2: ⼤規模⾔語モデルでアドリブさせてみた(時のこぼれ話) @triwave33
⾃⼰紹介(お前誰よ︕︖) • おばけ👻 (triwave33@) • クラウドベンダ勤務(4年⽬) • 機械学習、⽣成AIのプリセールスエンジニア(ソリューションアーキテクト) • もとは化学屋。有毒ガスのセンサデバイスを開発など
• 楽器は主にギターを弾きます。無⼈島に3枚 (アーティスト) 持ってくなら?→Led Zeppelin, Donny Hathaway, 桂枝雀 • MuAna vol.7 (2022年2⽉)でもロングトークさせてもらいました (多謝!) 参考: Deep Learning で⾳楽を作成するにはどうしたらいいの - AWS
今⽇話すこと ⼤規模⾔語モデル (is 何?) でアドリブさせてみた (時のこぼれ話) (Photo of Charlie Parker
from Wikipedia) https://qiita.com/triwave33/items/b36f85f95db44d252e32
⼤規模⾔語モデル (LLM) が実際にやっていること 桃太郎がお供に連れていたのは、⽝、猿、 ⼤規模⾔語モデル キジ 99% ハト 0.1% ネズミ
0.1% 弟 0.1% 与えられたテキストの次に来る単語の確率を算出して最も⾼いものを出⼒する … 4 ︖ 演奏データをテキスト形式に起こせ れば、次のフレーズを⽣成できる
音楽の記号化とデータフォーマット 音声信号 (Audio Signal) MIDI ピアノロール X: 1 T: Majide
Koi Suru 5 Byoumae C: Mariya Takeuchi M: 4/4 K: C L:1/16 A3 F G2 A2 B2 B4 A2 | G4 E2 D2 C4 z4| ABC MusicXML (抜粋) 演奏データを文字列 (ABC) にしてしまえばLLMで扱える!!
None
やろうとしたこと • とりあえず、過去の偉⼤なミュージシャンと演奏データをMIDI → MusicXML → ABCに変換して学習データにする • データを元にLLMをカスタム (pre-train,
fine tuning)。フレーズを⽣成する モデルを作成 • 作成したフレーズを伴奏データに乗せて吟味 (飲みながら楽しむ) • 経緯と結果はブログ参照 • https://qiita.com/triwave33/items/b36f85f95db44d252e32
プロンプト実例 やることを指⽰ 実例 詳細 (ABCの解説と制約条件の提⽰) ⼊⼒データの引き渡し (その後にフレーズを出⼒させる)
⽣成結果 入力 (提示)シーケンス 出力 (生成) シーケンス
感じたこと、苦労したこと • それらしいフレーズが⽣成されて興奮した • (諸理由で)会えない⼈と⾳楽による対話ができる︕︖ • 今回やりたかったことは曲の⽣成ではなく、フレーズの⽣成と対話 • 絵画でいうと 絵が欲しいのではなく筆が欲しかった。
• pre-trainよりfine tuningの⽅が良い結果だった (周辺の演奏情報を埋め込めたので) • ⽣成したフレーズが制約条件(ex. 4拍⼦1⼩節)を満たすことに苦労した • あくまでテキストで返ってくる。LLMはそれらしいことをいう緩い道具 • プロンプトエンジニアリングは⾳楽⽣成においても有効(概念の説明、制約条件の提⽰) • 機械学習の”過学習” (ex. 過去のフレーズの組み合わせの再演)はフレーズ⽣成に悪か︕︖ • 個⼈的にはNo(過学習上等)。かっこいいフレーズかどうかが全て。 • そもそも本番で新規フレーズを錬成する⼈いる︖(B.B.Kingは既存のフレーズ以外は弾かない) • みなさまの楽しい⾳楽 (分析) ライフの⼀助となれば幸いです︕︕