Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI駆動開発 〜 生成AIが導く未来の開発手法
Search
Ikko Eltociear Ashimine
August 22, 2024
Technology
0
66
AI駆動開発 〜 生成AIが導く未来の開発手法
第11回 GenAI 勉強会での登壇資料です
(
https://gais.jp/gais11/
)
Ikko Eltociear Ashimine
August 22, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
OSS活動はいいぞ
eltociear
0
47
初めての管理職での大失敗談
eltociear
0
70
上半期でやったこと
eltociear
0
63
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
61
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
25
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
22
外国語文献購読 (Purification and properties of phenolic acid decarboxylase from Candida guilliermondii)
eltociear
0
14
Boost The Performance with Codon
eltociear
0
110
Copilot Workspaceで“管制官”になろう!
eltociear
0
750
Other Decks in Technology
See All in Technology
LINEヤフー新卒採用 コーディングテスト解説 アルゴリズム問題編
lycorp_recruit_jp
0
13k
Rubyはなぜ「たのしい」のか? / Why is Ruby a programmers' best friend? #tqrk15
expajp
4
1.8k
Azure Verified Moduleを触って分かった注目ポイント/azure-verified-module-begin
mhrtech
1
380
Low Latency Join Method for Distributed DBMS
yugabytejapan
0
180
見えづらい活動の成果の伝え方は日頃からめちゃくちゃ悩んでるけど、実際こんな取り組みをしな がら温度感を合わせにいってるよ / Conveying Hard-to-See Results
kakehashi
4
1.8k
Oracle Database 23ai 新機能#4 Rolling Maintenance
oracle4engineer
PRO
0
130
LeSSはスクラムではない!?LeSSにおけるスクラムマスターの振る舞い方とは / Scrum Master Behavior in LeSS
toma_sm
0
200
【shownet.conf_】トポロジ図の歩き方
shownet
PRO
0
510
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
2
230
Efficient zero-copy networking using io_uring
ennael
PRO
0
350
Databricks Appのご紹介
databricksjapan
0
180
【swonet.conf_】NOCメンバーが語るSTMの実態!! ~ShowNetから若者への贈り物~
shownet
PRO
0
310
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Design by the Numbers
sachag
278
19k
Navigating Team Friction
lara
183
14k
YesSQL, Process and Tooling at Scale
rocio
167
14k
What's in a price? How to price your products and services
michaelherold
243
11k
Six Lessons from altMBA
skipperchong
26
3.4k
VelocityConf: Rendering Performance Case Studies
addyosmani
325
23k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
3
230
Product Roadmaps are Hard
iamctodd
PRO
48
10k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
7
580
The Invisible Side of Design
smashingmag
297
50k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
504
140k
Transcript
AI駆動開発 〜 生成AIが導く未来の開発手法 Ikko Eltociear Ashimine GitHub: @eltociear X: @eltociear
2024/8/21 第11回 GenAI 勉強会
1. 自己紹介 2. AI駆動開発とは 3. 開発に於いて AIが担える範囲 4. AI駆動開発ツールの一例 5.
GitHub Copilot Workspace 6. AI駆動開発勉強会について Agenda
Ikko Ashimine / 一功 安次嶺 AI駆動開発勉強会 LLM-jp 勉強会 株式会社I-Tecnology 取締役
株式会社Oshibloom GitHub: @eltociear Facebook: IkkoEltociearAshimine LinkedIn: ikko-ashimine X: @eltociear
My business card
AI駆動開発とは
AI駆動開発とは AI-Driven Development(AI 駆動開発)は従来のソフトウェ ア開発を大きくかえる開発手法・開発思想です。 プロダクト企画、要件定義、ソフトウェア設計、 コーディング、テスト、リリースのすべてのフェーズにおいて、 生成AI・LLMを主導的に利用することで、 プロダクトの企画からリリースまでのサイクルを統合し、開発 スピードの向上と、品質の統一、プロダクトのリリースタイム
の高速化を行います。 refs: https://www.ai-driven.dev/
開発に於いて AIが担える範囲
開発に於いて AIが担える範囲( 1) 企画 要件定義 設計 実装 テスト リリース 保守運用
Claude ChatGPT
開発に於いて AIが担える範囲( 2) 企画 要件定義 設計 実装 テスト リリース 保守運用
CodeRabbit GitHub Copilot Autify Genesis Amazon Q Developer
開発に於いて AIが担える範囲( 3) 企画 要件定義 設計 実装 テスト リリース 保守運用
Devin Merlinn
開発に於いて AIが担える範囲( まとめ) 企画 要件定義 設計 実装 テスト リリース 保守運用
AI駆動開発ツールの一例
SWE-bench (ベンチマーク)で 新たな最先端技術を確立 値は13.86% 世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-bench とは refs: https://arxiv.org/abs/2310.06770 GitHub Issue をどれほど解決 できるか見る評価指標
1. OpenHands (旧OpenDevin ) https://github.com/All-Hands-AI/OpenHand s ・2024/3/13 GitHub 公開 ・ベンチマークは未測定
・GPT-4 、Claude 3 、Llama 等をサポート ・商用利用可能 ・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロン トエンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 GitHub 公開 ・ベンチマークは未測定 ・Claude 3 、GPT-4
、GPT-3.5 、そして Ollama 経由のローカル LLMをサポート ・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
3. Devon https://github.com/entropy-research/Devon ・2024/3/15 GitHub 公開 ・ベンチマークは未測定 ・Claude 3.5 、GPT-4o
そしてOllama 経由の ローカルLLMをサポート ・コードベースの調査、バグ修正、テストコード 記述等が可能
4. SWE-agent https://github.com/princeton-nlp/SWE-agen t ・2024/4/2 GitHub 公開 ・ベンチマークが 12.29% でDevin
に肉薄 ・G itHub リポジトリのバグや issue を修正する エンジニアリングエージェントに変更 ・GPT-4 、Claude3 、ローカル推論の Ollama 等をサポート ・プルリクエストを自動作成
5. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 GitHub 公開 ・ベンチマークで約 15.95% ・実際にDjango(Python のWeb
FW) のIssue を解決した実績あり ・テストケースがある場合、それを読み込むこ とでさらに高精度に修正可能
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
8/21現在のSWE-bench リーダーボード refs: https://www.swebench.com/
AI駆動開発の OSSを集めています( 62 projects ) refs: https://github.com/eltociear/awesome-AI-driven-development
GitHub Copilot Workspace
Copilot Workspace のTPが開始されてます refs: https://githubnext.com/projects/copilot-workspace
Copilot の機能の所感 ・GitHub Copilot →一緒にコーディングしてくれるペアプログラマー 自分のコーディング量が 30-40% ぐらい減った感触 ・GitHub Copilot
Chat →コードの解説 /修正をしてくれるメンター ・Copilot Workspace →指示をもとに上流から下流工程までやってくれる SE 自分のコーディング量が 70-80% ぐらい減らせるかも?
一行のプロンプトでも簡単なものを作ってくれる refs: https://github.com/eltociear/copilot-workspace-web/issues/3
動かない場合は別途、 Session で修正依頼
出来上がっているものにも Session で改善依頼
枚数の多い資料作成にも使える
仕事にも・・・?
デモ
現在のモデルは GPT-4 Turbo refs: Copilot Workspace は GPT-4 Turbo を搭載しています。私たちは常に新しいモ
デルを評価して、ニーズに最適なものを使用していることを確認していますが、現 時点では GPT-4 Turbo が使用されているモデルです。
ということは refs: https://x.com/tradernewsai/status/1793095855442129039 NOW THEN
refs: https://qiita.com/tags/copilotworkspace
AI駆動開発勉強会について
AI駆動開発とは refs: https://www.facebook.com/groups/700738895539654/
AI駆動開発 勉強会とは refs: https://aid.connpass.com/ 第1回 2024/2/2 第2回 2024/5/29
AI駆動開発 勉強会 #3は9/11(水)開催です refs: https://aid.connpass.com/event/327682/
Thank you for your attention 🐈