Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
re:Invent 2023 機械学習、アナリティクス系 "推し" アップデート紹介
Search
nakamura.shogo
December 08, 2023
Programming
0
3k
re:Invent 2023 機械学習、アナリティクス系 "推し" アップデート紹介
nakamura.shogo
December 08, 2023
Tweet
Share
More Decks by nakamura.shogo
See All by nakamura.shogo
AIF勉強会
cmnakamurashogo
2
3.5k
生成AI時代に必要な検索とレコメンドをざっくり抑える
cmnakamurashogo
0
810
実践AI/ML ~よくあるユースケースとレコメンデーションの効果的な活用戦略~
cmnakamurashogo
0
460
脱ブラックボックス化!LLMと一緒に使われるLangChainやLlamaIndexを徹底解説
cmnakamurashogo
10
15k
Amazon Lookout for Visionで 筆跡鑑定してみた
cmnakamurashogo
0
14k
Other Decks in Programming
See All in Programming
SymfonyCon Vienna 2025: Twig, still relevant in 2025?
fabpot
3
1.2k
17年周年のWebアプリケーションにTanStack Queryを導入する / Implementing TanStack Query in a 17th Anniversary Web Application
saitolume
0
250
Effective Signals in Angular 19+: Rules and Helpers @ngbe2024
manfredsteyer
PRO
0
140
KubeCon + CloudNativeCon NA 2024 Overviewat Kubernetes Meetup Tokyo #68 / amsy810_k8sjp68
masayaaoyama
0
250
StarlingMonkeyを触ってみた話 - 2024冬
syumai
3
270
Webエンジニア主体のモバイルチームの 生産性を高く保つためにやったこと
igreenwood
0
330
わたしの星のままで一番星になる ~ 出産を機にSIerからEC事業会社に転職した話 ~
kimura_m_29
0
180
今年のアップデートで振り返るCDKセキュリティのシフトレフト/2024-cdk-security-shift-left
tomoki10
0
200
Haze - Real time background blurring
chrisbanes
1
510
Mermaid x AST x 生成AI = コードとドキュメントの完全同期への道
shibuyamizuho
0
160
useSyncExternalStoreを使いまくる
ssssota
6
1k
数十万行のプロジェクトを Scala 2から3に完全移行した
xuwei_k
0
270
Featured
See All Featured
A Tale of Four Properties
chriscoyier
157
23k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
It's Worth the Effort
3n
183
28k
4 Signs Your Business is Dying
shpigford
181
21k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.1k
Six Lessons from altMBA
skipperchong
27
3.5k
Thoughts on Productivity
jonyablonski
67
4.4k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
RailsConf 2023
tenderlove
29
940
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.3k
The Cost Of JavaScript in 2023
addyosmani
45
7k
Transcript
機械学習、アナリティクス系 "推し"アップデート紹介 1
中村祥吾 データアナリティクス事業本部 インテグレーション部 機械学習チーム ・普段は機械学習メイン ・re:Invent2023 現地未参加勢 ・キーノートは夜更かし参加 ・今朝HHKB Studioを購入したところ
2 NO IMAGE 自己紹介
3 ブログ Amazon Q (New!!) https://dev.classmethod.jp/articles/update-reinvent2023- amazon-q-summary/ Amazon Bedrock (Update!!)
https://dev.classmethod.jp/articles/update-reinvent2023- bedrock-summary/ Amazon SageMaker (Update!!) https://dev.classmethod.jp/articles/update-reinvent2023- sagemaker-summary/ re:Invent2023のAIMLまとめ、書いてます。
AI / ML アップデート
5 Generative AI Stack
6 Amazon Q(概要) AWS製の生成AI搭載アシスタントがプレビューとして発表 3種類に大別できる ・Amazon Q (For AWS Builder
Use) マネコンの, トラブルシューティング, IDE連携, Javaアップグレード, etc ・Amazon Q (For Business Use) 独自データでアシスタントをカスタムしたりする場合はコチラ ・Amazon Q in {他のサービス} in Connect, in QuickSight, その他, Builder Useに含まれるものも
7 Q in {他のサービス}を集めてみた Amazon Q(推しアプデ) Q in Reachability Analyzer
VPC Reachability Analyzerと連携することでネットワークに関する問題のトラブルシューティングができます。 Q in Amazon CodeCatalyst CodeCatalyst上での開発を加速するためのサービスとなっており、コメントやREADMEの追加、issue作成、小規模なクラスや単体 テストの作成、CodeCatalyst自体のワークフローの更新といった、開発上のタスクを加速する機能です。 Q in Connect コンタクトセンターのエージェントが顧客の問題を迅速かつ正確に解決できるよう、推奨される対応やアクションを通話中にリアルタ イムで提供する機能です。 Q in QuickSight 自然言語で実現したい分析を伝えることで、ダッシュボードや分析を自動で作成できる機能です。 これに加えて、ダッシュボー ドの要約、データの質問に答えるためのミニダッシュボードの生成、データを説明するストーリーの構築なども機能もあります。 Q in Supply Chain (Coming Soon) サプライチェーンで何が起きているのか、なぜ起きているのか、どのような行動を取るべきかについて質問し、インテリジェントな回答 を得ることができる機能です。 Q in AWS Chatbot AWS ChatbotとTeamsやSlackチャンネルを紐づけることで、TeamsやSlackからAmazon Qを使用することができる機能で す。 Q data integration in AWS Glue (Comming Soon) 自然言語を使ってAWS Glueによるデータパイプラインを作成することができる機能となっており、またチャットを通したト ラブルシューティングも可能となる機能のようです。 Q gererative SQL in Amazon Redshift Redshift クエリエディタから処理したいことを自然言語で問い合わせることで、Amazon RedshiftへのSQL文を生成する 機能となっています。
8 大規模言語モデル, 画像生成などの基盤モデルを AWSでフルマネージドで扱えるサービス ・Knowledge BasesとAgentsがGA ・基盤モデルが追加・更新 ・Titan Text Lite,
Text Express, Image Generator, Multimodal Embeddings ・Claude 2.1, Llama 2 70B ・チューニング方式のアップデート ・Fine Tuningモデルが拡大、Continued pre-trainingが追加 Amazon Bedrock(概要)
9 チューニング方式のアップデート ・Fine-Tuning対応の拡大 ・日本語対応のテキスト生成はTitan Expressのみ(Claudeはこれから) ・Titanの他のシリーズについてもFine-tuning対応 ・Continued pre-training方式 (Preview)の追加 Amazon
Bedrock(推しアプデ1) 入力プロンプト 出力テキスト 再学習 ... 入力プロンプト ... Fine-tuning Continued pre-training
10 Titan Multimodal Embeddings ・「テキスト」、「画像」、「テキスト+画像」の3種類の入力に対応 これらを1024次元の埋め込みベクトルに変換 ・ベクトルをベクターストアなどに格納することで、「テキスト」、「画像」、「テキスト+ 画像」の3種類を相互にクエリして結果を得ることが可能 ・注意点 ・入力できるトークン数は128
tokensと少なめ ・Titan Embeddingsと異なり日本語には対応していない Amazon Bedrock(推しアプデ2)
11 AWS上で機械学習基盤を構築するサービス MLOpsを実現するPipelineやMonitoringの仕組みも提供 Bedrockより広範なモデルを扱え、独自モデルも使用可能 ・HyperPodがGA, Code Editor(VSCodeなIDE)がGA ・SageMaker Studio自体が大幅リニューアル ・旧StudioはStudio
Classicという扱いに Amazon SageMaker(概要)
12 SageMaker Studioが大きく変わった Amazon SageMaker(推しアプデ1) Studioコンソール起動に 時間が掛かる⌛ 軽量なコンソールの起動が一瞬!! (インスタンスはまだ立ち上がらない) ノートブックでの開発が
つらくなってきた💦 VSCodeなIDE, JupyterLabから アプリケーションを選択可能!! 独自のEFSが持ってこれない😖 アプリケーションは個別にEBSを持ち、 EFSがマウントできる! マネコンとStudioコンソールを 両方見る必要がある🙄 コンソールで管理が統一!
13 SageMaker Studioが"アーキも"大きく変わった Amazon SageMaker(推しアプデ2) Studio Domain EFS(共通) JupyterServer (コンソール)
JupyterServer (コンソール Job空間 TrainingJob TrainingJob ProcessingJob ProcessingJob Studio Domain Webコンソール Webコンソール CodeEditor JupyterLab EBS EBS CodeEditor EBS Job空間 TrainingJob TrainingJob ProcessingJob ProcessingJob EFS (mount) + INSTANCE STORAGE
Analytics, Database アップデート
主に3つの観点で個人的に整理 ・Zero-ETL対応の拡大 ・VectorStore対応の拡大 ・Analytics + AIML 15 Analytics, Databaseのアップデート概観
16 Zero-ETLとはETL処理なしに分析エンジンから データベースやストレージにアクセスできる仕組み Zero-ETL対応の拡大 Aurora (PostgreSQL) DynamoDB RDS (MySQL) Aurora
(MySQL) GA済み Preview Redshift クエリ DynamoDB S3 Preview GA CloudTrail Lake GA Preview Preview OpenSearch クエリ Athena クエリ
17 たとえばDynamoDBとOpenSearch ・PITR(ポイントインタイムリカバリ)とDynamoDBストリームは、あらかじめ有効にしておく ・OpenSearchのIngestion Pipelineを作る ・この時にyamlを書くがOSSのOpenSearchの機能の中ではData Prepperと呼ばれる 機能で様々なデータソースからOpenSearchへとデータを統合する機能として存在 Zero-ETL対応の拡大 DynamoDB
GA OpenSearch クエリ
18 生成AIに活用されることの多いVectorStoreの適用が拡大 ・OpenSearch ServerlessでVector engineがGA 元々プレビューで、今回発表されたBedrockのKnowledge Basesでも使用 ・DocumentDBおよびDynamoDBのベクトルサーチ機能がGA DynamoDBはOpenSearchへのzero-ETLを介して実現する様子 ・MemoryDB
for Redisでベクトル検索機能がプレビュー VectorStore対応の拡大
19 AIMLなどとの組み合わせでより高度な分析 Analytics + AIML Redshift Serverless with AI- driven
scaling and optimizationを 発表 Redshift Serverlessでワークロード特性をAIが学習し、それに合わせてプロアクティブにリソース量を調 整・最適化 Redshift MLがSageMaker JumpStartのLLM用のエンドポイントで推 論実行が可能に SageMaker JumpStart で LLM 用のエンドポイントを作成することで、Redshift のデータに対してリモ ートで推論を実行する機能 Glue Data Qualityが機械学習ベースの 異常検知に対応 Glue Data Qualityは定義したルールに従って、データの品質検査を実施できる機能 本機能は、データの変化を監視し、監視しているメトリクスが予想される値の範囲外であった場合に検知 DataZone AI recommendationsを 発表 DataZoneは、ビジネスデータカタログを提供することで、データ利活用を加速するサービス。 Amazon DataZoneで、生成系AIによる機能強化により相互利用をしやすくなる機能を発表。 本機能でプロデューサー側は、ワンクリックでデータの説明・背景情報を生成。重要なデータ列を明示し、分析 時に推奨される事項を追加。コンシューマー側はAIによるレコメンデーションにより、データを容易に発見。データ に関する説明や使用例が提示され、データ活用にスムーズに取り組める。 AWS Clean Rooms MLの発表 Clean Roomsは機密データを含むような生データを開示せずにコラボレーションするためのサービス。 Clean Rooms MLを使用することで、ユーザーはパートナーとデータを共有することなく、機密データを保護し 続けながら、MLモデルを構築・トレーニング・デプロイ・予測することが可能に。
おわり