https://llm-app.connpass.com/event/296674/
上記イベントの登壇資料です。
Context Window のお話もしトークン数を気にせず LLM が使えたら?林 祐太 / ぬこぬこ @schroneko※このページは削除して構いませんUSE TEMPLATEClick1
View Slide
- 林 祐太 / ぬこぬこ- 12 月から LLM 無職→転職- 専門は核融合(核融合はいいぞ!)自己紹介2
LLM において入力できるトークン数のことContext Window とは?3https://arxiv.org/abs/2212.10947
ChatGPT を使っていてこんな表示を見かけたら、どんな気持ちになりますか?4
😑5
Claude を使ったことはありますか?✋6
- 性能評価で GPT-4 と僅差- 100k Tokens まで入力可- GPT-4 の RLHF 味がない😆😆😆うれしい😆😆😆ただ、日本で使えるようになるのはもう少し...!Claude のここがすごい!https://chat.lmsys.org/?arena 7※ VPN 接続での利用はやめましょう!
100k トークン?イメージ沸かない?8
9だいたい75,000 字
なるほどわかった💡で、なにに使えるの?10
論文めちゃ読める💡Context Windowまわりの論文を紹介11
- 7月17日の論文- Transformer を使わず、Context Window を増やしても推論コストの増大を低減https://arxiv.org/abs/2307.08621https://github.com/microsoft/unilm/tree/master/retnet論文紹介 Retentive Network: A Successor to Transformer for Large Language Models12
- 8月31日の論文- Context Window の拡張手法- Llama 2 7B / 13 B を 4k → 128k(16~32倍)- 性能劣化はほぼなし(0.49%)https://arxiv.org/abs/2309.00071https://github.com/jquesnelle/yarn論文紹介 YaRN: Efficient Context Window Extension of Large Language Models13
- 9月20日の論文- Vision Transformer に RetNet を適用- 計算コストが下がるだけでなく性能向上https://arxiv.org/abs/2309.11523論文紹介 RMT: Retentive Networks Meet Vision Transformers14
- 9月21日の論文- Context Window の拡張手法- Llama 2 7B / 13 B / 70B を 4k から100k / 6k / 32 k に拡張https://arxiv.org/abs/2309.12307https://github.com/dvlab-research/LongLoRA論文紹介 LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models15
要素技術は出揃ってきた16
Context Window を気にしない未来ってもしかすると近い?17
- Embedding はもしかすると不要?- Hallucinations がかなり軽減?- そもそも大量の情報を人間が解釈する必要性って?- etc…18もしトークン数を気にせず LLM が使えたら?
もし日常使いの LLM のContext Windowに上限がなくなったら?🤔19
20
もし時間があまったら21
22実演Claude くんを普段どう使っているか?
23で、でもお高いんでしょう?https://www-files.anthropic.com/production/images/model_pricing_july2023.pdf
長文 Prompt テクニック真ん中があんまり抽出できない?→https://arxiv.org/abs/2307.03172一昨日の Anthropic の公式記事によると1. 引用の指示2. 指示を最後に置くhttps://www.anthropic.com/index/prompting-long-context24
最近作ったもの論文要約後日 webui化予定https://gist.github.com/schroneko/210881cb680322ea455baee21abddf2925
Claude 使いたいんだけど?💢26残念ながら、本日時点で US / UK のみあと数ヶ月で一般公開とありました。首を長くして待ちましょう!
API 使いたいんだけど?💢27https://www.anthropic.com/earlyaccessこちらからどうぞ!