Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI駆動開発 〜 生成AIが導く未来の開発手法
Search
Ikko Eltociear Ashimine
August 22, 2024
Technology
0
310
AI駆動開発 〜 生成AIが導く未来の開発手法
第11回 GenAI 勉強会での登壇資料です
(
https://gais.jp/gais11/
)
Ikko Eltociear Ashimine
August 22, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
OSS活動はいいぞ
eltociear
0
94
初めての管理職での大失敗談
eltociear
0
310
上半期でやったこと
eltociear
0
110
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
93
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
68
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
59
外国語文献購読 (Purification and properties of phenolic acid decarboxylase from Candida guilliermondii)
eltociear
0
54
Boost The Performance with Codon
eltociear
0
190
Copilot Workspaceで“管制官”になろう!
eltociear
1
1k
Other Decks in Technology
See All in Technology
20 Years of Domain-Driven Design: What I’ve Learned About DDD
ewolff
1
310
GraphQLを活用したリアーキテクチャに対応するSLI/Oの再設計
coconala_engineer
0
210
Previewでもここまで追える! Azure AI Foundryで始めるLLMトレース
tomodo_ysys
2
630
AI 코딩 에이전트 더 똑똑하게 쓰기
nacyot
0
540
genspark_presentation.pdf
haruki_uiru
1
240
クラウドネイティブ環境の脅威モデリング
kyohmizu
2
400
社会人力と研究力ー博士号をキャリアの武器にするー
kentaro
2
110
Serverlessだからこそコードと設計にはこだわろう
kenichirokimura
2
950
Terraform にコントリビュートしていたら Azure のコストをやらかした話 / How I Messed Up Azure Costs While Contributing to Terraform
nnstt1
1
450
グループ ポリシー再確認 (2)
murachiakira
0
230
Coding Agentに値札を付けろ
watany
3
410
MySQL Indexes and Histograms – How they really speed up your queries
lefred
0
160
Featured
See All Featured
How to Ace a Technical Interview
jacobian
276
23k
Product Roadmaps are Hard
iamctodd
PRO
53
11k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
19
1.2k
Designing for Performance
lara
608
69k
Making the Leap to Tech Lead
cromwellryan
133
9.3k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
700
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
5
600
GraphQLの誤解/rethinking-graphql
sonatard
71
10k
Writing Fast Ruby
sferik
628
61k
GitHub's CSS Performance
jonrohan
1031
460k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Transcript
AI駆動開発 〜 生成AIが導く未来の開発手法 Ikko Eltociear Ashimine GitHub: @eltociear X: @eltociear
2024/8/21 第11回 GenAI 勉強会
1. 自己紹介 2. AI駆動開発とは 3. 開発に於いて AIが担える範囲 4. AI駆動開発ツールの一例 5.
GitHub Copilot Workspace 6. AI駆動開発勉強会について Agenda
Ikko Ashimine / 一功 安次嶺 AI駆動開発勉強会 LLM-jp 勉強会 株式会社I-Tecnology 取締役
株式会社Oshibloom GitHub: @eltociear Facebook: IkkoEltociearAshimine LinkedIn: ikko-ashimine X: @eltociear
My business card
AI駆動開発とは
AI駆動開発とは AI-Driven Development(AI 駆動開発)は従来のソフトウェ ア開発を大きくかえる開発手法・開発思想です。 プロダクト企画、要件定義、ソフトウェア設計、 コーディング、テスト、リリースのすべてのフェーズにおいて、 生成AI・LLMを主導的に利用することで、 プロダクトの企画からリリースまでのサイクルを統合し、開発 スピードの向上と、品質の統一、プロダクトのリリースタイム
の高速化を行います。 refs: https://www.ai-driven.dev/
開発に於いて AIが担える範囲
開発に於いて AIが担える範囲( 1) 企画 要件定義 設計 実装 テスト リリース 保守運用
Claude ChatGPT
開発に於いて AIが担える範囲( 2) 企画 要件定義 設計 実装 テスト リリース 保守運用
CodeRabbit GitHub Copilot Autify Genesis Amazon Q Developer
開発に於いて AIが担える範囲( 3) 企画 要件定義 設計 実装 テスト リリース 保守運用
Devin Merlinn
開発に於いて AIが担える範囲( まとめ) 企画 要件定義 設計 実装 テスト リリース 保守運用
AI駆動開発ツールの一例
SWE-bench (ベンチマーク)で 新たな最先端技術を確立 値は13.86% 世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-bench とは refs: https://arxiv.org/abs/2310.06770 GitHub Issue をどれほど解決 できるか見る評価指標
1. OpenHands (旧OpenDevin ) https://github.com/All-Hands-AI/OpenHand s ・2024/3/13 GitHub 公開 ・ベンチマークは未測定
・GPT-4 、Claude 3 、Llama 等をサポート ・商用利用可能 ・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロン トエンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 GitHub 公開 ・ベンチマークは未測定 ・Claude 3 、GPT-4
、GPT-3.5 、そして Ollama 経由のローカル LLMをサポート ・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
3. Devon https://github.com/entropy-research/Devon ・2024/3/15 GitHub 公開 ・ベンチマークは未測定 ・Claude 3.5 、GPT-4o
そしてOllama 経由の ローカルLLMをサポート ・コードベースの調査、バグ修正、テストコード 記述等が可能
4. SWE-agent https://github.com/princeton-nlp/SWE-agen t ・2024/4/2 GitHub 公開 ・ベンチマークが 12.29% でDevin
に肉薄 ・G itHub リポジトリのバグや issue を修正する エンジニアリングエージェントに変更 ・GPT-4 、Claude3 、ローカル推論の Ollama 等をサポート ・プルリクエストを自動作成
5. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 GitHub 公開 ・ベンチマークで約 15.95% ・実際にDjango(Python のWeb
FW) のIssue を解決した実績あり ・テストケースがある場合、それを読み込むこ とでさらに高精度に修正可能
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
8/21現在のSWE-bench リーダーボード refs: https://www.swebench.com/
AI駆動開発の OSSを集めています( 62 projects ) refs: https://github.com/eltociear/awesome-AI-driven-development
GitHub Copilot Workspace
Copilot Workspace のTPが開始されてます refs: https://githubnext.com/projects/copilot-workspace
Copilot の機能の所感 ・GitHub Copilot →一緒にコーディングしてくれるペアプログラマー 自分のコーディング量が 30-40% ぐらい減った感触 ・GitHub Copilot
Chat →コードの解説 /修正をしてくれるメンター ・Copilot Workspace →指示をもとに上流から下流工程までやってくれる SE 自分のコーディング量が 70-80% ぐらい減らせるかも?
一行のプロンプトでも簡単なものを作ってくれる refs: https://github.com/eltociear/copilot-workspace-web/issues/3
動かない場合は別途、 Session で修正依頼
出来上がっているものにも Session で改善依頼
枚数の多い資料作成にも使える
仕事にも・・・?
デモ
現在のモデルは GPT-4 Turbo refs: Copilot Workspace は GPT-4 Turbo を搭載しています。私たちは常に新しいモ
デルを評価して、ニーズに最適なものを使用していることを確認していますが、現 時点では GPT-4 Turbo が使用されているモデルです。
ということは refs: https://x.com/tradernewsai/status/1793095855442129039 NOW THEN
refs: https://qiita.com/tags/copilotworkspace
AI駆動開発勉強会について
AI駆動開発とは refs: https://www.facebook.com/groups/700738895539654/
AI駆動開発 勉強会とは refs: https://aid.connpass.com/ 第1回 2024/2/2 第2回 2024/5/29
AI駆動開発 勉強会 #3は9/11(水)開催です refs: https://aid.connpass.com/event/327682/
Thank you for your attention 🐈