Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語による シェルコマンドラインチャー wanna の紹介
Search
hirokidaichi
April 05, 2023
Technology
0
2.3k
自然言語による シェルコマンドラインチャー wanna の紹介
hirokidaichi
April 05, 2023
Tweet
Share
More Decks by hirokidaichi
See All by hirokidaichi
大規模言語モデル時代の開発生産性
hirokidaichi
21
12k
内製化のコツとワナ
hirokidaichi
2
1.8k
心理的安全性とソフトウェア化する社会/ Psychological Safety and Software-based Society
hirokidaichi
40
12k
Power Theory of Software Architecture
hirokidaichi
21
7.4k
Cultural Capital Theory in Software Engineering
hirokidaichi
48
15k
エンジニアリング組織論への招待:第1章(プレゼン)
hirokidaichi
6
2.7k
エンジニアリング組織論への招待:第2章(プレゼン)
hirokidaichi
3
1.1k
2つのDXと技術的負債-YAPC Tokyo 2019
hirokidaichi
55
25k
Other Decks in Technology
See All in Technology
Platform Engineering for Software Developers and Architects
syntasso
1
520
マルチプロダクトな開発組織で 「開発生産性」に向き合うために試みたこと / Improving Multi-Product Dev Productivity
sugamasao
1
310
インフラとバックエンドとフロントエンドをくまなく調べて遅いアプリを早くした件
tubone24
1
430
OCI Network Firewall 概要
oracle4engineer
PRO
0
4.1k
Security-JAWS【第35回】勉強会クラウドにおけるマルウェアやコンテンツ改ざんへの対策
4su_para
0
180
Terraform CI/CD パイプラインにおける AWS CodeCommit の代替手段
hiyanger
1
240
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
120
生成AIが変えるデータ分析の全体像
ishikawa_satoru
0
130
誰も全体を知らない ~ ロールの垣根を超えて引き上げる開発生産性 / Boosting Development Productivity Across Roles
kakehashi
1
230
Incident Response Practices: Waroom's Features and Future Challenges
rrreeeyyy
0
160
これまでの計測・開発・デプロイ方法全部見せます! / Findy ISUCON 2024-11-14
tohutohu
3
370
EventHub Startup CTO of the year 2024 ピッチ資料
eventhub
0
120
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
265
13k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
109
49k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
720
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
28
2k
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
Agile that works and the tools we love
rasmusluckow
327
21k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Code Review Best Practice
trishagee
64
17k
Art, The Web, and Tiny UX
lynnandtonic
297
20k
Raft: Consensus for Rubyists
vanstee
136
6.6k
Transcript
自然言語による シェルコマンドラインチャー wanna の紹介 株式会社レクター 広木大地
広木 大地 1983年生まれ。筑波大学大学院を卒業後、2008年に新卒第1期として株式会社ミクシィに 入社。同社のアーキテクトとして、技術戦略から組織構築などに携わる。 同社メディア開発部長、開発部部長、サービス本部長執行役員を務めた後、2015年退社。 現在は、株式会社レクターを創業し、技術と経営をつなぐ技術組織のアドバイザリーとして、 多数の会社の経営支援を行っている。 著書『エンジニアリング組織論への招待~不確実性に向き合う思考と組織のリファクタング』 が第6回ブクログ大賞・ビジネス書部門大賞、翔泳社ITエンジニアに読んでほしい技術書大 賞2019・技術書大賞受賞。一般社団法人日本CTO協会理事。内閣官房、経産省、IPA、デ
ジタル庁などでDX/リスキリングに関する委員を歴任。 2022年9月、株式会社朝日新聞社社外CTO就任 2022年11月、株式会社グッドパッチ社外取締役就任 自己紹介
None
まずはデモをご覧ください。
None
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
複数のNLPタスクを組み合わせたUX GPTの凄さはNLPの圧倒的な民主化。これまで使わなかったところにもふんだんに使う設計 ①ソースコード生成 ③実行結果の評価と デバッグ ②スクリプト名の 提案 ④概要文の生成 ⑤ユーザー言語の 推定
GPTのすごさはNLPの民主化 (こんなところにも使うの?がUXになる。)
スクリプトの生成プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
実行結果から反省とデバッグ bashの出力をteeして、実行結果を systemプロンプトに抜粋して入力 もし、問題があればコードの修正をサジェスト。
スクリプト名の提案プロンプト CoT:Chain of Thoughtを効かせるためにまず説明を求める。 CoT One Shot Example ユーザーの言語を入力から推定して、出力を縛る。 JSONの配列として出力を求めて、
parseし失敗したらretry。
これまでの指示をまとめて概要文を作成
ユーザー言語を推定して、その言語で対話 プロンプトの能力は、英語の方が日本語よりやや高い。 また、論文やライブラリなど例が豊富。 一方、ユーザーへの応答は入力言語から自然と対応してほし い。(ときどき、英語で話し出すのを防ぐ )
Prompt Engineeringも 普通のエンジニアリング。 (既知のパターンの組み合わせと試行錯誤)
wanna think / コマンドを考えるコマンド ソフトウェア開発のプロセス設計し、 AIと人間の役割を決めてステートマシンとして実装 生成 名前提案 概要生成と保存 反省とデバッグ
指示出し 実行 保存 追加指示 指示リセット 名前選択 これまでの 指示をまとめる レビュー 保存フェーズ 終了 Exit 問題があれば修正 LLM の仕事 人間の仕事
LLMソフトウェア =組織プロセス設計
AIが提案し、人間が決める 自然言語を入力するのは意外とめんどくさい。だからできる限り ”意思決定”だけさせる。 LLM の仕事:実装したり提案したり 人間の仕事:目的の提供と意思決定
メンバーが提案し、マネージャが決める AIと人間の関係は、メンバーとマネジメントの組織設計に似ている。 メンバーの仕事:実装したり提案する マネージャの仕事:目的の提供と意思決定
すべての人が AIをマネジメントする マネージャになる。