Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
Search
Ikko Eltociear Ashimine
April 16, 2024
Technology
0
270
🧑🤝🧑→🤖と移りゆくアプリ開発 - 1.5
【4/16(火)19:00~】春のクリエイター大交流会の登壇資料です
(
https://creator-square.connpass.com/event/314073/
)
Ikko Eltociear Ashimine
April 16, 2024
Tweet
Share
More Decks by Ikko Eltociear Ashimine
See All by Ikko Eltociear Ashimine
pre-AI全盛時代で君たちはどう生きるか
eltociear
0
77
AI駆動開発、 猫からシーサーへ進化中。 現場での実践と未来
eltociear
0
480
OSS活動はいいぞ
eltociear
0
120
AI駆動開発 〜 生成AIが導く未来の開発手法
eltociear
0
360
初めての管理職での大失敗談
eltociear
0
340
上半期でやったこと
eltociear
0
120
呼ばれたのでカンファレンスに登壇してみた結果…
eltociear
0
110
深海微生物の結晶セルロース分解酵素に関する研究
eltociear
0
90
伊豆赤沢海洋深層水から分離された微生物が生産するアラビノキシラン分解酵素に関する研究
eltociear
0
71
Other Decks in Technology
See All in Technology
PFEM Online Feature Flag @ newmo
shinyaishitobi
1
150
✨敗北解法コレクション✨〜Expertだった頃に足りなかった知識と技術〜
nanachi
1
780
マルチプロダクト×マルチテナントを支えるモジュラモノリスを中心としたアソビューのアーキテクチャ
disc99
1
660
Observability for LLM Application lifecycle
ivry_presentationmaterials
0
110
オブザーバビリティ文化を組織に浸透させるには / install observability culture
mackerelio
0
340
僕たちが「開発しやすさ」を求め 模索し続けたアーキテクチャ #アーキテクチャ勉強会_findy
bengo4com
0
2.6k
Kiro と Q Dev で 同じゲームを作らせてみた
r3_yamauchi
PRO
1
120
Rethinking Incident Response: Context-Aware AI in Practice - Incident Buddy Edition -
rrreeeyyy
0
120
意志の力が9割。アニメから学ぶAI時代のこれから。
endohizumi
1
110
キャリアを支え組織力を高める「多層型ふりかえり」 / 20250821 Kazuki Mori
shift_evolve
PRO
2
120
React Server ComponentsでAPI不要の開発体験
polidog
PRO
0
340
Amazon S3 Vectorsは大規模ベクトル検索を低コスト化するサーバーレスなベクトルデータベースだ #jawsugsaga / S3 Vectors As A Serverless Vector Database
quiver
2
990
Featured
See All Featured
Mobile First: as difficult as doing things right
swwweet
223
9.9k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.5k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.6k
A designer walks into a library…
pauljervisheath
207
24k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
A Tale of Four Properties
chriscoyier
160
23k
The Language of Interfaces
destraynor
159
25k
Raft: Consensus for Rubyists
vanstee
140
7.1k
Transcript
→🤖と移りゆく アプリ開発 - 1.5 Ikko Eltociear Ashimine GitHub: @eltociear X:
@eltociear 2024/4/16 【4/16(火)19:00~】春のクリエイター大交流会
Ikko Ashimine / 一功 安次嶺 株式会社I-Tecnology 取締役 #AI #Web3.0 #OSS #ネコ #生物学 #ゲーム #登山 #筋トレ #散歩 #海 #山 #外国料理 #カレー #酒 #投資
GitHub: @eltociear Connpass: @eltociear X: @eltociear YouTube: @eltociear
IKKOです
My business card
参考URL: https://speakerdeck.com/eltociear/toyi-riyukuapurikai-fa
「◦◦までに××作って」 「はい!(まじかよ、、、)」 「◦◦までに××作って」 「オケマル」 偉い人 私 偉くなった私 かしこなAI(※イメージ)
直近のアプリ開発AI
SWE-bench(ベンチマーク)で新 たな最先端技術を確立 その値、驚愕の13.86% 世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/introducing-devin
世界初のAIソフトウェアエンジニア「Devin」 参考URL: https://www.cognition-labs.com/post/swe-bench-technical-report
SWE-benchって何? 参考URL: https://arxiv.org/abs/2310.06770 GitHub Issueをどれだけ解決 できるか見る評価指標
とは言えさ Devinはまだ非公開 (WL申請のみ)
直近のアプリ開発AI (OSS)
1. OpenDevin https://github.com/OpenDevin/OpenDevin ・2024/3/13 (1ヶ月前) GitHub公開 ・ベンチマークは未測定(準備中と報告) ・GPT-4、Claude 3、Llama等をサポート ・商用利用可能
・サンドボックス環境でコード実行 ・シェル、エディタ、ブラウザを統合したフロント エンドIF
2. Devika https://github.com/stitionai/devika ・2024/3/21 (3週間前) GitHub公開 ・ベンチマークは未測定 ・Claude 3、GPT-4、GPT-3.5、そしてOllama 経由のローカルLLMをサポート
・シームレスなウェブ閲覧と情報収集 ・チャットインターフェイスを介した自然言語対 話 ・プロジェクトベースの組織と管理
2. Devika 参考URL: https://github.com/stitionai/devika?tab=readme-ov-file#demos
3. SWE-agent https://github.com/princeton-nlp/SWE-agent ・2024/4/2 (2週間前) GitHub公開 ・ベンチマークが12.29%でDevinに肉薄 ・G itHubリポジトリのバグやissueを修正するエ ンジニアリングエージェントに変更
・GPT-4、Claude3、ローカル推論のOllama等 をサポート ・プルリクエストを自動作成
3. SWE-agent 参考URL: https://github.com/princeton-nlp/SWE-agent
4. AutoCodeRover https://github.com/nus-apr/auto-code-rover ・2024/4/8 (1週間前) GitHub公開 ・ベンチマークで約15.95% ・実際にDjango(PythonのFW)のIssueを解決 した実績あり ・テストケースがある場合、それを読み込むこと
でさらに高精度に修正可能
参考URL: https://github.com/nus-apr/auto-code-rover 4. AutoCodeRover
まとめ 現状、解決率は十数% かなりの速さで人間に追いつきつ つある
Thank you for your attention🐈