Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI駆動開発 〜 生成AIが導く未来の開発手法
Search
Ikko Eltociear Ashimine
August 22, 2024
Technology
0
290
AI駆動開発 〜 生成AIが導く未来の開発手法
第11回 GenAI 勉強会での登壇資料です
(
https://gais.jp/gais11/
)
Ikko Eltociear Ashimine
August 22, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
OSS活動はいいぞ
eltociear
0
89
初めての管理職での大失敗談
eltociear
0
300
上半期でやったこと
eltociear
0
100
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
88
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
65
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
55
外国語文献購読 (Purification and properties of phenolic acid decarboxylase from Candida guilliermondii)
eltociear
0
50
Boost The Performance with Codon
eltociear
0
180
Copilot Workspaceで“管制官”になろう!
eltociear
1
1k
Other Decks in Technology
See All in Technology
プロダクト開発におけるAI時代の開発生産性
shnjtk
2
230
システムとの会話から生まれる先手のDevOps
kakehashi
PRO
0
270
Les nouveautés d'OKDP - Open Kubernetes Data Platform
bluehats
0
110
Linuxのパッケージ管理とアップデート基礎知識
go_nishimoto
0
100
開発視点でAWS Signerを考えてみよう!! ~コード署名のその先へ~
masakiokuda
3
160
От ручной разметки к LLM: как мы создавали облако тегов в Lamoda. Анастасия Ангелова, Data Scientist, Lamoda Tech
lamodatech
0
710
20250411_HCCJP_AdaptiveCloudUpdates.pdf
sdosamut
1
110
LangfuseでAIエージェントの 可観測性を高めよう!/Enhancing AI Agent Observability with Langfuse!
jnymyk
1
220
Recap of Next - Google Cloud で実践する クラウドネイティブ最前線 / The Frontlines of Cloud-Native with Insights from Google Cloud
aoto
PRO
1
100
OSSコントリビュートをphp-srcメンテナの立場から語る / OSS Contribute
sakitakamachi
0
1.4k
AWSLambdaMCPServerを使ってツールとMCPサーバを分離する
tkikuchi
1
3k
Goの組織でバックエンドTypeScriptを採用してどうだったか / How was adopting backend TypeScript in a Golang company
kaminashi
6
5.1k
Featured
See All Featured
Build The Right Thing And Hit Your Dates
maggiecrowley
35
2.6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
34
2.2k
The Invisible Side of Design
smashingmag
299
50k
Gamification - CAS2011
davidbonilla
81
5.2k
GraphQLの誤解/rethinking-graphql
sonatard
71
10k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
2.9k
Bash Introduction
62gerente
611
210k
Unsuck your backbone
ammeep
670
57k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.4k
KATA
mclloyd
29
14k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.1k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.5k
Transcript
AI駆動開発 〜 生成AIが導く未来の開発手法 Ikko Eltociear Ashimine GitHub: @eltociear X: @eltociear
2024/8/21 第11回 GenAI 勉強会
1. 自己紹介 2. AI駆動開発とは 3. 開発に於いて AIが担える範囲 4. AI駆動開発ツールの一例 5.
GitHub Copilot Workspace 6. AI駆動開発勉強会について Agenda
Ikko Ashimine / 一功 安次嶺 AI駆動開発勉強会 LLM-jp 勉強会 株式会社I-Tecnology 取締役
株式会社Oshibloom GitHub: @eltociear Facebook: IkkoEltociearAshimine LinkedIn: ikko-ashimine X: @eltociear
My business card
AI駆動開発とは
AI駆動開発とは AI-Driven Development(AI 駆動開発)は従来のソフトウェ ア開発を大きくかえる開発手法・開発思想です。 プロダクト企画、要件定義、ソフトウェア設計、 コーディング、テスト、リリースのすべてのフェーズにおいて、 生成AI・LLMを主導的に利用することで、 プロダクトの企画からリリースまでのサイクルを統合し、開発 スピードの向上と、品質の統一、プロダクトのリリースタイム
の高速化を行います。 refs: https://www.ai-driven.dev/
開発に於いて AIが担える範囲
開発に於いて AIが担える範囲( 1) 企画 要件定義 設計 実装 テスト リリース 保守運用
Claude ChatGPT
開発に於いて AIが担える範囲( 2) 企画 要件定義 設計 実装 テスト リリース 保守運用
CodeRabbit GitHub Copilot Autify Genesis Amazon Q Developer
開発に於いて AIが担える範囲( 3) 企画 要件定義 設計 実装 テスト リリース 保守運用
Devin Merlinn
開発に於いて AIが担える範囲( まとめ) 企画 要件定義 設計 実装 テスト リリース 保守運用
AI駆動開発ツールの一例
SWE-bench (ベンチマーク)で 新たな最先端技術を確立 値は13.86% 世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-bench とは refs: https://arxiv.org/abs/2310.06770 GitHub Issue をどれほど解決 できるか見る評価指標
1. OpenHands (旧OpenDevin ) https://github.com/All-Hands-AI/OpenHand s ・2024/3/13 GitHub 公開 ・ベンチマークは未測定
・GPT-4 、Claude 3 、Llama 等をサポート ・商用利用可能 ・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロン トエンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 GitHub 公開 ・ベンチマークは未測定 ・Claude 3 、GPT-4
、GPT-3.5 、そして Ollama 経由のローカル LLMをサポート ・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
3. Devon https://github.com/entropy-research/Devon ・2024/3/15 GitHub 公開 ・ベンチマークは未測定 ・Claude 3.5 、GPT-4o
そしてOllama 経由の ローカルLLMをサポート ・コードベースの調査、バグ修正、テストコード 記述等が可能
4. SWE-agent https://github.com/princeton-nlp/SWE-agen t ・2024/4/2 GitHub 公開 ・ベンチマークが 12.29% でDevin
に肉薄 ・G itHub リポジトリのバグや issue を修正する エンジニアリングエージェントに変更 ・GPT-4 、Claude3 、ローカル推論の Ollama 等をサポート ・プルリクエストを自動作成
5. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 GitHub 公開 ・ベンチマークで約 15.95% ・実際にDjango(Python のWeb
FW) のIssue を解決した実績あり ・テストケースがある場合、それを読み込むこ とでさらに高精度に修正可能
世界初のAIソフトウェアエンジニア「 Devin 」 refs: https://www.cognition-labs.com/post/swe-bench-technical-report
8/21現在のSWE-bench リーダーボード refs: https://www.swebench.com/
AI駆動開発の OSSを集めています( 62 projects ) refs: https://github.com/eltociear/awesome-AI-driven-development
GitHub Copilot Workspace
Copilot Workspace のTPが開始されてます refs: https://githubnext.com/projects/copilot-workspace
Copilot の機能の所感 ・GitHub Copilot →一緒にコーディングしてくれるペアプログラマー 自分のコーディング量が 30-40% ぐらい減った感触 ・GitHub Copilot
Chat →コードの解説 /修正をしてくれるメンター ・Copilot Workspace →指示をもとに上流から下流工程までやってくれる SE 自分のコーディング量が 70-80% ぐらい減らせるかも?
一行のプロンプトでも簡単なものを作ってくれる refs: https://github.com/eltociear/copilot-workspace-web/issues/3
動かない場合は別途、 Session で修正依頼
出来上がっているものにも Session で改善依頼
枚数の多い資料作成にも使える
仕事にも・・・?
デモ
現在のモデルは GPT-4 Turbo refs: Copilot Workspace は GPT-4 Turbo を搭載しています。私たちは常に新しいモ
デルを評価して、ニーズに最適なものを使用していることを確認していますが、現 時点では GPT-4 Turbo が使用されているモデルです。
ということは refs: https://x.com/tradernewsai/status/1793095855442129039 NOW THEN
refs: https://qiita.com/tags/copilotworkspace
AI駆動開発勉強会について
AI駆動開発とは refs: https://www.facebook.com/groups/700738895539654/
AI駆動開発 勉強会とは refs: https://aid.connpass.com/ 第1回 2024/2/2 第2回 2024/5/29
AI駆動開発 勉強会 #3は9/11(水)開催です refs: https://aid.connpass.com/event/327682/
Thank you for your attention 🐈