Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語による シェルコマンドラインチャー wanna の紹介
Search
hirokidaichi
April 05, 2023
Technology
0
2.3k
自然言語による シェルコマンドラインチャー wanna の紹介
hirokidaichi
April 05, 2023
Tweet
Share
More Decks by hirokidaichi
See All by hirokidaichi
大規模言語モデル時代の開発生産性
hirokidaichi
21
12k
内製化のコツとワナ
hirokidaichi
2
1.7k
心理的安全性とソフトウェア化する社会/ Psychological Safety and Software-based Society
hirokidaichi
40
12k
Power Theory of Software Architecture
hirokidaichi
21
7.3k
Cultural Capital Theory in Software Engineering
hirokidaichi
48
15k
エンジニアリング組織論への招待:第1章(プレゼン)
hirokidaichi
6
2.5k
エンジニアリング組織論への招待:第2章(プレゼン)
hirokidaichi
3
1.1k
2つのDXと技術的負債-YAPC Tokyo 2019
hirokidaichi
54
25k
Other Decks in Technology
See All in Technology
eBPFのこれまでとこれから
yutarohayakawa
5
380
Google CloudのLLM活用の選択肢を広げるVertex AIのパートナーモデル
nayuts
0
110
「認証認可」という体験をデザインする ~Nekko Cloud認証認可基盤計画
logica0419
2
250
サーバレスでモバイルアプリ開発! NTTコム「ビジネスdアプリ」のアーキテクチャ / The architecture of business d app
nttcom
12
230
エンジニア視点で見る、 組織で運用されるデザインシステムにするには
shunya078
1
300
Segment Anything Model 2
tenten0727
3
620
プログラム検証入門
riru
5
760
エンジニア向け会社紹介資料
caddi_eng
15
250k
The XZ Backdoor Story
fr0gger
0
3.5k
スーパーマリオRPGのリメイク版の変更点からみるUX
nishiharatsubasa
1
330
技術ブログや登壇資料を秒で作るコツ伝授します
minorun365
PRO
23
5.5k
2024年のナビゲーション・フォーカス対応:Composeでキーボード・ナビゲーションをサポートしよう
tahia910
0
100
Featured
See All Featured
Clear Off the Table
cherdarchuk
91
320k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
25
3.9k
No one is an island. Learnings from fostering a developers community.
thoeni
18
2.9k
Debugging Ruby Performance
tmm1
72
12k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
24
600
The Art of Programming - Codeland 2020
erikaheidi
48
13k
Fashionably flexible responsive web design (full day workshop)
malarkey
401
65k
Art, The Web, and Tiny UX
lynnandtonic
294
20k
Building Better People: How to give real-time feedback that sticks.
wjessup
359
18k
Fantastic passwords and where to find them - at NoRuKo
philnash
48
2.8k
How To Stay Up To Date on Web Technology
chriscoyier
786
250k
Building an army of robots
kneath
302
42k
Transcript
自然言語による シェルコマンドラインチャー wanna の紹介 株式会社レクター 広木大地
広木 大地 1983年生まれ。筑波大学大学院を卒業後、2008年に新卒第1期として株式会社ミクシィに 入社。同社のアーキテクトとして、技術戦略から組織構築などに携わる。 同社メディア開発部長、開発部部長、サービス本部長執行役員を務めた後、2015年退社。 現在は、株式会社レクターを創業し、技術と経営をつなぐ技術組織のアドバイザリーとして、 多数の会社の経営支援を行っている。 著書『エンジニアリング組織論への招待~不確実性に向き合う思考と組織のリファクタング』 が第6回ブクログ大賞・ビジネス書部門大賞、翔泳社ITエンジニアに読んでほしい技術書大 賞2019・技術書大賞受賞。一般社団法人日本CTO協会理事。内閣官房、経産省、IPA、デ
ジタル庁などでDX/リスキリングに関する委員を歴任。 2022年9月、株式会社朝日新聞社社外CTO就任 2022年11月、株式会社グッドパッチ社外取締役就任 自己紹介
None
まずはデモをご覧ください。
None
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
複数のNLPタスクを組み合わせたUX GPTの凄さはNLPの圧倒的な民主化。これまで使わなかったところにもふんだんに使う設計 ①ソースコード生成 ③実行結果の評価と デバッグ ②スクリプト名の 提案 ④概要文の生成 ⑤ユーザー言語の 推定
GPTのすごさはNLPの民主化 (こんなところにも使うの?がUXになる。)
スクリプトの生成プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
実行結果から反省とデバッグ bashの出力をteeして、実行結果を systemプロンプトに抜粋して入力 もし、問題があればコードの修正をサジェスト。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
これまでの指示をまとめて概要文を作成
ユーザー言語を推定して、その言語で対話 プロンプトの能力は、英語の方が日本語よりやや高い。 また、論文やライブラリなど例が豊富。 一方、ユーザーへの応答は入力言語から自然と対応してほし い。(ときどき、英語で話し出すのを防ぐ )
Prompt Engineeringも 普通のエンジニアリング。 (既知のパターンの組み合わせと試行錯誤)
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
LLMソフトウェア =組織プロセス設計
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
メンバーが提案し、マネージャが決める AIと人間の関係は、メンバーとマネジメントの組織設計に似ている。 メンバーの仕事:実装したり提案する マネージャの仕事:目的の提供と意思決定
すべての人が AIをマネジメントする マネージャになる。