Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon BedrockでClaude 3.5 Sonnet v2のComputer u...
Search
Champ
October 29, 2024
Technology
0
79
Amazon BedrockでClaude 3.5 Sonnet v2のComputer useを試す
Champ
October 29, 2024
Tweet
Share
More Decks by Champ
See All by Champ
【re:Invent 2024 アプデ】 Prompt Routing の紹介
champ
1
440
【Bedrock×Athena】生成系AIでSlackデータの分析に挑戦
champ
0
140
Amazon Qの全体像を掴んでみよう!
champ
0
53
神アプデ?Amazon Comprehendで 生成系AIの毒性検出に挑戦!
champ
0
310
Bedrockで挑戦! 生成系AIで Slackコミュニケーションの活性化!
champ
0
420
Other Decks in Technology
See All in Technology
Javaアプリケーションの配布とパッケージング / Distribution and packaging of Java applications
hogelog
2
520
うちの会社の評判は?SNSの投稿分析にAIを使ってみた
doumae
0
610
GitHub Copilot Use Cases at ZOZO
horie1024
1
350
Java 30周年記念! Javaの30年をふりかえる
skrb
4
2.7k
Test Smarter, Not Harder: Achieving Confidence in Complex Distributed Systems
eliasnogueira
1
120
libsyncrpcってなに?
uhyo
0
240
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
12k
Text-to-SQLの評価データセットを作って最新LLMモデルの性能評価をしてみた
gotalab555
3
440
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
38k
組織とセキュリティ文化と、自分の一歩
maimyyym
3
1.4k
Eight Engineering Unit 紹介資料
sansan33
PRO
0
3.4k
おれのAI活用の現状とこれから
tsukasagr
0
120
Featured
See All Featured
The Invisible Side of Design
smashingmag
299
50k
Side Projects
sachag
454
42k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
Music & Morning Musume
bryan
47
6.6k
The Cult of Friendly URLs
andyhume
78
6.4k
Docker and Python
trallard
44
3.4k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
For a Future-Friendly Web
brad_frost
178
9.8k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
25
2.8k
GraphQLとの向き合い方2022年版
quramy
46
14k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Transcript
Amazon Bedrock で Claude 3.5 Sonnet v2 の Computer use
を試す
自己紹介
1. Computer Use API とは Claude 3.5 Sonnet V2 の新機能(ベータ版)
生成系 AI が画面のスクショを見て、マウスカーソルの移動、クリック、キーボー ド入力などの操作を実行可能 以下から利用可能: Anthropic API Amazon Bedrock 主な特徴: スクリーンショットベース操作 マウス・キーボード制御 ブラウザ操作
2. Computer Use Demo について Anthropic が提供する公式サンプルコード: GitHub: anthropics/anthropic-quickstarts Computer
Use API を簡単に試せる環境を提供 デモ環境の特徴: Docker コンテナで起動 Streamlit による Web UI が用意されており、Computer Use API を利用した画面操作 の様子が見れる
3. デモ <別画面で動画を開く>
3. デモ すごい!うごいた! でも、どうやっているの?
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 ユーザーからの指示(プロンプト) 画面のスクリーンショット
Anthropic が定義したツール Computer Tool(マウス・キーボード操作) Text Editor Tool(テキスト編集) Bash Tool(コマンド実行) 2. Claude の処理 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 スクリーンショットの解析 ユーザーからの指示を理解 適切なツールの選択 アクションのシミュレーションし実行すべき操 作を生成 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 3. 実行 Claude から実行すべきコマンド・操作を受信 アプリケーション側で実際の操作を実装・実行 結果を新しいスクリーンショットとして取得
5. まとめ 1. Computer Use Demo を使うことで簡単に Computer Use API
を試せる 2. Claude がやってくれるのはコマンドやアクションの生成まで 3. コマンドやアクションを実行するには自分たちが実装する必要があるが、サンプ ルコードが充実しているのでそこまで難しくない