Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIに私たちの人格を憑依させパラレルワールドを生きる
Search
Masahiro Nishimi
July 05, 2023
Programming
0
690
AIに私たちの人格を憑依させパラレルワールドを生きる
LLM Meetup Tokyo #3 LT
Masahiro Nishimi
July 05, 2023
Tweet
Share
More Decks by Masahiro Nishimi
See All by Masahiro Nishimi
AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門
masahiro_nishimi
7
1.4k
DSPy Meetup Tokyo #1 - はじめてのDSPy
masahiro_nishimi
1
370
はじめてのDSPy - 言語モデルを『プロンプト』ではなく『プログラミング』するための仕組み
masahiro_nishimi
4
24k
Devinで実践する!AIエージェントと協働する開発組織の作り方
masahiro_nishimi
6
4.2k
【AIエージェント開発】LLMアプリ開発の1stステップと論文キャッチアップ - 論文を活用したAIエージェント開発の始め方
masahiro_nishimi
6
1k
日経電子版 x AIエージェントの可能性とAgentic RAGによって提案書生成を行う技術
masahiro_nishimi
2
1.5k
Azure OpenAI Service Dev Day / LLMでできる!使える!生成AIエージェント
masahiro_nishimi
4
3.6k
AIエージェントを現場に導入する目線とは
masahiro_nishimi
3
5.6k
AIエージェントが変えるソフトウェアのパラダイム
masahiro_nishimi
2
1.8k
Other Decks in Programming
See All in Programming
maplibre-gl-layers - 地図に移動体たくさん表示したい
kekyo
PRO
0
260
AIに任せる範囲を安全に広げるためにやっていること
fukucheee
0
130
CSC307 Lecture 13
javiergs
PRO
0
320
encoding/json/v2のUnmarshalはこう変わった:内部実装で見る設計改善
kurakura0916
0
410
エンジニアの「手元の自動化」を加速するn8n 2026.02.27
symy2co
0
150
エージェント開発初心者の僕がエージェントを作った話と今後やりたいこと
thasu0123
0
240
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
490
Claude Code Skill入門
mayahoney
0
320
Understanding Apache Lucene - More than just full-text search
spinscale
0
110
PostgreSQL を使った快適な go test 環境を求めて
otakakot
0
540
コーディングルールの鮮度を保ちたい / keep-fresh-go-internal-conventions
handlename
0
200
grapheme_strrev関数が採択されました(あと雑感)
youkidearitai
PRO
1
210
Featured
See All Featured
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
300
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
150
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
640
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
How GitHub (no longer) Works
holman
316
140k
The Invisible Side of Design
smashingmag
302
51k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
340
Chasing Engaging Ingredients in Design
codingconduct
0
140
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
190
Paper Plane
katiecoart
PRO
0
48k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
150
Transcript
AIに私たちの人格を憑依させ パラレルワールドを生きる LLM Meetup Tokyo #3 2023.7.5
「コミュニケーションを圧縮したい」
人同士の会話はシリアル通信である
シリアル通信である以上、時間短縮には限界がある パラレル通信は できない
本当にコミュニケーションを圧縮する方法はないのか? 高度な高速通信 プロトコルを発明する パラレルワールドを MapReduceする
AIであれば可能かも知れない 高度な高速通信 プロトコルを発明する パラレルワールドを MapReduceする
「高度な高速通信プロトコル」案 • transformerモデル同士であれば埋め込みベクトルやニューロン活性を利用す ることによってコミュニケーションを取り合うことが可能かも知れない? ◦ OpenAIが「言語モデルに言語モデルを説明」させるデモンストレーションツールを公開 • とりあえずデータを突っ込んでも良いが、それをどう理解して何を返してい るかは外部から観察が困難。手を動かして検証するにはちょっとSFすぎる。
「パラレルワールドをMapReduce」案 • ちょっと前にtwitterのアーカイブデータからgpt-neoxやOpenCALMをファイ ンチューニング(LoRA)してみる試みが流行っていた。 • それなりにそれっぽくなるらしく、このチューニング済みモデルをパラレル ワールドに分散配置してみたらどうなるか? • シリアル通信の高速化が難しいのであれば、パラレル通信を実現することで コミュニケーションの圧縮に寄与するのではなかろうか?
パラレルワールドを開発する
AI人格を用意する • ベースモデルにはrinna/japanese-gpt-neox-3.6b-instruction-ppoを使用 • 8名の方にtwitterアーカイブを提供頂き、データ加工の上でファインチューン ◦ 試験的パラレルワールドでは100個のお題についてランダムにつぶやいてもらう設計なので、 各twitterのつぶやきがどのお題に近いか類似検索し、inputがお題、outputがtwitterつぶやきと なるようにデータ加工した。 •
LoRA作成にあたってはPEFTを利用 ◦ learning_rate: 3e-5 ◦ epoch: 3 ◦ これでA6000で5〜6時間程度
ランダムに誰かのつぶやきに反応する • 候補を与えて自己選択させたかったが、生rinnaには難しいタスクだった ◦ このタスク向けにもチューニングする必要あり • よってランダムに抽出されたつぶやきに反応するメカニズムを加える
できたもの(デモ)
ふりかえり • かなりデータをクレンジングしたのに出力が荒れてしまう問題 ◦ もうちょいlossを抑えないとダメだろうか(現在でもA6000で5時間ぐらいかかっているんだけ ど・・・) • スペシャルトークンの残骸のようなものが出てしまう問題 ◦ 今回はppo版をファインチューニングしたが、インストラクションチューニングされていない
モデルをファインチューニングした方が良かった? 分からん・・・ • 次は会話を発生させていきたい ◦ 会話スレッドはかなり面白そう • 男子ばかりなので女子のデータも欲しい ◦ 誰か・・・