Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI駆動開発 〜 生成AIが導く未来の開発手法
Search
Ikko Eltociear Ashimine
August 22, 2024
Technology
0
87
AI駆動開発 〜 生成AIが導く未来の開発手法
第11回 GenAI 勉強会での登壇資料です
(
https://gais.jp/gais11/
)
Ikko Eltociear Ashimine
August 22, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
OSS活動はいいぞ
eltociear
0
57
初めての管理職での大失敗談
eltociear
0
92
上半期でやったこと
eltociear
0
73
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
68
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
27
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
24
外国語文献購読 (Purification and properties of phenolic acid decarboxylase from Candida guilliermondii)
eltociear
0
18
Boost The Performance with Codon
eltociear
0
120
Copilot Workspaceで“管制官”になろう!
eltociear
1
800
Other Decks in Technology
See All in Technology
透過型SMTPプロキシによる送信メールの可観測性向上: Update Edition / Improved observability of outgoing emails with transparent smtp proxy: Update edition
linyows
2
210
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.8k
データプロダクトの定義からはじめる、データコントラクト駆動なデータ基盤
chanyou0311
2
310
隣接領域をBeyondするFinatextのエンジニア組織設計 / beyond-engineering-areas
stajima
1
270
Lexical Analysis
shigashiyama
1
150
10XにおけるData Contractの導入について: Data Contract事例共有会
10xinc
6
620
いざ、BSC討伐の旅
nikinusu
2
780
エンジニア人生の拡張性を高める 「探索型キャリア設計」の提案
tenshoku_draft
1
120
Security-JAWS【第35回】勉強会クラウドにおけるマルウェアやコンテンツ改ざんへの対策
4su_para
0
180
第1回 国土交通省 データコンペ参加者向け勉強会③- Snowflake x estie編 -
estie
0
130
Amplify Gen2 Deep Dive / バックエンドの型をいかにしてフロントエンドへ伝えるか #TSKaigi #TSKaigiKansai #AWSAmplifyJP
tacck
PRO
0
380
AWS Lambdaと歩んだ“サーバーレス”と今後 #lambda_10years
yoshidashingo
1
170
Featured
See All Featured
Speed Design
sergeychernyshev
25
620
Building Better People: How to give real-time feedback that sticks.
wjessup
364
19k
Faster Mobile Websites
deanohume
305
30k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
1.9k
How STYLIGHT went responsive
nonsquared
95
5.2k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
26
2.1k
VelocityConf: Rendering Performance Case Studies
addyosmani
325
24k
The Cost Of JavaScript in 2023
addyosmani
45
6.7k
Building an army of robots
kneath
302
43k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.1k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
329
21k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
Transcript
AI駆動開発 〜 生成AIが導く未来の開発手法 Ikko Eltociear Ashimine GitHub: @eltociear X: @eltociear
2024/8/21 第11回 GenAI 勉強会
1. 自己紹介 2. AI駆動開発とは 3. 開発に於いて AIが担える範囲 4. AI駆動開発ツールの一例 5.
GitHub Copilot Workspace 6. AI駆動開発勉強会について Agenda
Ikko Ashimine / 一功 安次嶺 AI駆動開発勉強会 LLM-jp 勉強会 株式会社I-Tecnology 取締役
株式会社Oshibloom GitHub: @eltociear Facebook: IkkoEltociearAshimine LinkedIn: ikko-ashimine X: @eltociear
My business card
AI駆動開発とは
AI駆動開発とは AI-Driven Development(AI 駆動開発)は従来のソフトウェ ア開発を大きくかえる開発手法・開発思想です。 プロダクト企画、要件定義、ソフトウェア設計、 コーディング、テスト、リリースのすべてのフェーズにおいて、 生成AI・LLMを主導的に利用することで、 プロダクトの企画からリリースまでのサイクルを統合し、開発 スピードの向上と、品質の統一、プロダクトのリリースタイム
の高速化を行います。 refs: https://www.ai-driven.dev/
開発に於いて AIが担える範囲
開発に於いて AIが担える範囲( 1) 企画 要件定義 設計 実装 テスト リリース 保守運用
Claude ChatGPT
開発に於いて AIが担える範囲( 2) 企画 要件定義 設計 実装 テスト リリース 保守運用
CodeRabbit GitHub Copilot Autify Genesis Amazon Q Developer
開発に於いて AIが担える範囲( 3) 企画 要件定義 設計 実装 テスト リリース 保守運用
Devin Merlinn
開発に於いて AIが担える範囲( まとめ) 企画 要件定義 設計 実装 テスト リリース 保守運用
AI駆動開発ツールの一例
SWE-bench (ベンチマーク)で 新たな最先端技術を確立 値は13.86% 世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-bench とは refs: https://arxiv.org/abs/2310.06770 GitHub Issue をどれほど解決 できるか見る評価指標
1. OpenHands (旧OpenDevin ) https://github.com/All-Hands-AI/OpenHand s ・2024/3/13 GitHub 公開 ・ベンチマークは未測定
・GPT-4 、Claude 3 、Llama 等をサポート ・商用利用可能 ・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロン トエンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 GitHub 公開 ・ベンチマークは未測定 ・Claude 3 、GPT-4
、GPT-3.5 、そして Ollama 経由のローカル LLMをサポート ・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
3. Devon https://github.com/entropy-research/Devon ・2024/3/15 GitHub 公開 ・ベンチマークは未測定 ・Claude 3.5 、GPT-4o
そしてOllama 経由の ローカルLLMをサポート ・コードベースの調査、バグ修正、テストコード 記述等が可能
4. SWE-agent https://github.com/princeton-nlp/SWE-agen t ・2024/4/2 GitHub 公開 ・ベンチマークが 12.29% でDevin
に肉薄 ・G itHub リポジトリのバグや issue を修正する エンジニアリングエージェントに変更 ・GPT-4 、Claude3 、ローカル推論の Ollama 等をサポート ・プルリクエストを自動作成
5. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 GitHub 公開 ・ベンチマークで約 15.95% ・実際にDjango(Python のWeb
FW) のIssue を解決した実績あり ・テストケースがある場合、それを読み込むこ とでさらに高精度に修正可能
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
8/21現在のSWE-bench リーダーボード refs: https://www.swebench.com/
AI駆動開発の OSSを集めています( 62 projects ) refs: https://github.com/eltociear/awesome-AI-driven-development
GitHub Copilot Workspace
Copilot Workspace のTPが開始されてます refs: https://githubnext.com/projects/copilot-workspace
Copilot の機能の所感 ・GitHub Copilot →一緒にコーディングしてくれるペアプログラマー 自分のコーディング量が 30-40% ぐらい減った感触 ・GitHub Copilot
Chat →コードの解説 /修正をしてくれるメンター ・Copilot Workspace →指示をもとに上流から下流工程までやってくれる SE 自分のコーディング量が 70-80% ぐらい減らせるかも?
一行のプロンプトでも簡単なものを作ってくれる refs: https://github.com/eltociear/copilot-workspace-web/issues/3
動かない場合は別途、 Session で修正依頼
出来上がっているものにも Session で改善依頼
枚数の多い資料作成にも使える
仕事にも・・・?
デモ
現在のモデルは GPT-4 Turbo refs: Copilot Workspace は GPT-4 Turbo を搭載しています。私たちは常に新しいモ
デルを評価して、ニーズに最適なものを使用していることを確認していますが、現 時点では GPT-4 Turbo が使用されているモデルです。
ということは refs: https://x.com/tradernewsai/status/1793095855442129039 NOW THEN
refs: https://qiita.com/tags/copilotworkspace
AI駆動開発勉強会について
AI駆動開発とは refs: https://www.facebook.com/groups/700738895539654/
AI駆動開発 勉強会とは refs: https://aid.connpass.com/ 第1回 2024/2/2 第2回 2024/5/29
AI駆動開発 勉強会 #3は9/11(水)開催です refs: https://aid.connpass.com/event/327682/
Thank you for your attention 🐈