Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIに私たちの人格を憑依させパラレルワールドを生きる
Search
Masahiro Nishimi
July 05, 2023
Programming
0
370
AIに私たちの人格を憑依させパラレルワールドを生きる
LLM Meetup Tokyo #3 LT
Masahiro Nishimi
July 05, 2023
Tweet
Share
More Decks by Masahiro Nishimi
See All by Masahiro Nishimi
AIエージェントが変えるソフトウェアのパラダイム
masahiro_nishimi
0
370
AIエージェントとLangChain
masahiro_nishimi
3
3.3k
LangChainキャッチアップ - LangChain Expression Languageを完全に理解する
masahiro_nishimi
11
8.2k
LangChainもくもく会ガイダンス
masahiro_nishimi
1
440
ChatGPTによるデータ変換がもたらすインパクト
masahiro_nishimi
4
6.9k
プログラマとしての良心に従い続けるためにはどうすれば良いのか? / Agile Tech Expo #2
masahiro_nishimi
1
1k
Vue.jsで作るシングルページアプリケーション〜Vue.js, Nuxt.js, Vuetify〜
masahiro_nishimi
1
2.4k
Other Decks in Programming
See All in Programming
R言語の環境構築と基礎 Tokyo.R 112
bob3bob3
0
270
Fragment Composition of GraphQL
quramy
7
1.1k
Goのエラースタックトレースの歴史と今後
sonatard
9
1.6k
雑に思考を整理する技術と効能
konifar
60
29k
大規模UIKitベースアプリへのTCAの段階的導入/gradual-adoption-of-tca-in-a-large-scale-uikit-based-app
takehilo
1
190
Node.js v22 で変わること
yosuke_furukawa
PRO
10
3.6k
#phpcon_odawara オープン・クローズドなテストフィクスチャを求めて / open closed test fixtures
77web
3
230
DMMプラットフォームがTiDB Cloudを採用した背景
pospome
9
4.1k
スキーマ駆動開発による品質とスピードの両立 - 私達は何故、スキーマを書くのか
kentaroutakeda
0
170
CDKコントリビュートの最初の壁を越えよう! -簡単issueの見つけ方-
badmintoncryer
2
130
TCAとKMPを用いた新規動画配信アプリ 「ABEMA Live」の設計
tomu28
1
120
Polars入門
daikikatsuragawa
1
110
Featured
See All Featured
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
228
16k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
126
32k
Gamification - CAS2011
davidbonilla
76
4.6k
Facilitating Awesome Meetings
lara
43
5.6k
What’s in a name? Adding method to the madness
productmarketing
PRO
17
2.7k
The Cult of Friendly URLs
andyhume
74
5.7k
Happy Clients
brianwarren
92
6.4k
The Invisible Customer
myddelton
114
12k
How to Ace a Technical Interview
jacobian
273
22k
Faster Mobile Websites
deanohume
300
30k
How To Stay Up To Date on Web Technology
chriscoyier
782
250k
BBQ
matthewcrist
80
8.8k
Transcript
AIに私たちの人格を憑依させ パラレルワールドを生きる LLM Meetup Tokyo #3 2023.7.5
「コミュニケーションを圧縮したい」
人同士の会話はシリアル通信である
シリアル通信である以上、時間短縮には限界がある パラレル通信は できない
本当にコミュニケーションを圧縮する方法はないのか? 高度な高速通信 プロトコルを発明する パラレルワールドを MapReduceする
AIであれば可能かも知れない 高度な高速通信 プロトコルを発明する パラレルワールドを MapReduceする
「高度な高速通信プロトコル」案 • transformerモデル同士であれば埋め込みベクトルやニューロン活性を利用す ることによってコミュニケーションを取り合うことが可能かも知れない? ◦ OpenAIが「言語モデルに言語モデルを説明」させるデモンストレーションツールを公開 • とりあえずデータを突っ込んでも良いが、それをどう理解して何を返してい るかは外部から観察が困難。手を動かして検証するにはちょっとSFすぎる。
「パラレルワールドをMapReduce」案 • ちょっと前にtwitterのアーカイブデータからgpt-neoxやOpenCALMをファイ ンチューニング(LoRA)してみる試みが流行っていた。 • それなりにそれっぽくなるらしく、このチューニング済みモデルをパラレル ワールドに分散配置してみたらどうなるか? • シリアル通信の高速化が難しいのであれば、パラレル通信を実現することで コミュニケーションの圧縮に寄与するのではなかろうか?
パラレルワールドを開発する
AI人格を用意する • ベースモデルにはrinna/japanese-gpt-neox-3.6b-instruction-ppoを使用 • 8名の方にtwitterアーカイブを提供頂き、データ加工の上でファインチューン ◦ 試験的パラレルワールドでは100個のお題についてランダムにつぶやいてもらう設計なので、 各twitterのつぶやきがどのお題に近いか類似検索し、inputがお題、outputがtwitterつぶやきと なるようにデータ加工した。 •
LoRA作成にあたってはPEFTを利用 ◦ learning_rate: 3e-5 ◦ epoch: 3 ◦ これでA6000で5〜6時間程度
ランダムに誰かのつぶやきに反応する • 候補を与えて自己選択させたかったが、生rinnaには難しいタスクだった ◦ このタスク向けにもチューニングする必要あり • よってランダムに抽出されたつぶやきに反応するメカニズムを加える
できたもの(デモ)
ふりかえり • かなりデータをクレンジングしたのに出力が荒れてしまう問題 ◦ もうちょいlossを抑えないとダメだろうか(現在でもA6000で5時間ぐらいかかっているんだけ ど・・・) • スペシャルトークンの残骸のようなものが出てしまう問題 ◦ 今回はppo版をファインチューニングしたが、インストラクションチューニングされていない
モデルをファインチューニングした方が良かった? 分からん・・・ • 次は会話を発生させていきたい ◦ 会話スレッドはかなり面白そう • 男子ばかりなので女子のデータも欲しい ◦ 誰か・・・