$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon BedrockでClaude 3.5 Sonnet v2のComputer u...
Search
Champ
October 29, 2024
Technology
0
97
Amazon BedrockでClaude 3.5 Sonnet v2のComputer useを試す
Champ
October 29, 2024
Tweet
Share
More Decks by Champ
See All by Champ
【re:Invent 2024 アプデ】 Prompt Routing の紹介
champ
1
500
【Bedrock×Athena】生成系AIでSlackデータの分析に挑戦
champ
0
200
Amazon Qの全体像を掴んでみよう!
champ
0
69
神アプデ?Amazon Comprehendで 生成系AIの毒性検出に挑戦!
champ
0
350
Bedrockで挑戦! 生成系AIで Slackコミュニケーションの活性化!
champ
0
440
Other Decks in Technology
See All in Technology
Modern Data Stack大好きマンが語るSnowflakeの魅力
sagara
0
250
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
46k
LangChain v1.0にトライ~ AIエージェントアプリの移行(v0.3 → v1.0) ~
happysamurai294
0
160
AI開発の定着を推進するために揃えるべき前提
suguruooki
1
470
MS Ignite 2025で発表されたFoundry IQをRecap
satodayo
3
220
あなたの知らないDateのひみつ / The Secret of "Date" You Haven't known #tqrk16
expajp
0
110
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
16k
オープンデータの内製化から分かったGISデータを巡る行政の課題
naokim84
2
1.3k
MAP-7thplaceSolution
yukichi0403
2
230
AI駆動開発によるDDDの実践
dip_tech
PRO
0
230
Capture Checking / Separation Checking 入門
tanishiking
0
110
タグ付きユニオン型を便利に使うテクニックとその注意点
uhyo
2
410
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
49
14k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Docker and Python
trallard
46
3.7k
Embracing the Ebb and Flow
colly
88
4.9k
Navigating Team Friction
lara
191
16k
Context Engineering - Making Every Token Count
addyosmani
9
450
How GitHub (no longer) Works
holman
316
140k
Why Our Code Smells
bkeepers
PRO
340
57k
Done Done
chrislema
186
16k
Documentation Writing (for coders)
carmenintech
76
5.2k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Transcript
Amazon Bedrock で Claude 3.5 Sonnet v2 の Computer use
を試す
自己紹介
1. Computer Use API とは Claude 3.5 Sonnet V2 の新機能(ベータ版)
生成系 AI が画面のスクショを見て、マウスカーソルの移動、クリック、キーボー ド入力などの操作を実行可能 以下から利用可能: Anthropic API Amazon Bedrock 主な特徴: スクリーンショットベース操作 マウス・キーボード制御 ブラウザ操作
2. Computer Use Demo について Anthropic が提供する公式サンプルコード: GitHub: anthropics/anthropic-quickstarts Computer
Use API を簡単に試せる環境を提供 デモ環境の特徴: Docker コンテナで起動 Streamlit による Web UI が用意されており、Computer Use API を利用した画面操作 の様子が見れる
3. デモ <別画面で動画を開く>
3. デモ すごい!うごいた! でも、どうやっているの?
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 ユーザーからの指示(プロンプト) 画面のスクリーンショット
Anthropic が定義したツール Computer Tool(マウス・キーボード操作) Text Editor Tool(テキスト編集) Bash Tool(コマンド実行) 2. Claude の処理 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 スクリーンショットの解析 ユーザーからの指示を理解 適切なツールの選択 アクションのシミュレーションし実行すべき操 作を生成 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 3. 実行 Claude から実行すべきコマンド・操作を受信 アプリケーション側で実際の操作を実装・実行 結果を新しいスクリーンショットとして取得
5. まとめ 1. Computer Use Demo を使うことで簡単に Computer Use API
を試せる 2. Claude がやってくれるのはコマンドやアクションの生成まで 3. コマンドやアクションを実行するには自分たちが実装する必要があるが、サンプ ルコードが充実しているのでそこまで難しくない