Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
nvidia-jetson-x-deep-learning
Search
toshitanian
February 06, 2018
Technology
1.7k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
nvidia-jetson-x-deep-learning
toshitanian
February 06, 2018
More Decks by toshitanian
See All by toshitanian
エッジデバイスでディープラーニング! AWSを活用したエッジデバイスマネジメントの紹介/ aws-edge-device-deeplearning
toshitanian
1
2.3k
機械学習プラットフォーム でのDocker利用事例 / DevSumiAbeja
toshitanian
1
650
Amazon Kinesis Video Streams × Deep Learning
toshitanian
1
7.3k
急成長スタートアップのシステムの裏側 / ABEJA Innovation Meetup
toshitanian
0
1.4k
Docker入門 - Ruby on RailsアプリケーションをDockerで動かしてみる - / Introduction to Docker
toshitanian
7
3k
Other Decks in Technology
See All in Technology
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
1.2k
【Snowflake Summit 2026 Recap!!】Snowflake Summit Deep Dive: Security & Governance
civitaspo
1
240
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
170
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
Bucharest Tech Week 2026 - Guardians of the Cloud-Native Galaxy
edeandrea
PRO
0
100
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
AI時代のコスト管理を考えよう〜明日から使える実践AWSノウハウ~
yoshimi0227
0
130
AIはどのように 組織のアジリティを変えるのか?
junki
4
990
不要なレビューをAIにまかせて AIコーディングの環境改善を加速した
shoota
1
200
手塩にかけりゃいいってもんじゃない
ming_ayami
0
600
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
250
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
310
Featured
See All Featured
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
840
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
410
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
620
Embracing the Ebb and Flow
colly
88
5.1k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
170
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
370
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Accessibility Awareness
sabderemane
1
140
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Transcript
NVIDIA Jetson × Deep Learning ABEJA Cloud AI Night 2018/02/05
ABEJA, Inc Toshiya Kawasaki
河崎 敏弥 @toshitanian ABEJA, Inc. Platform Division Lead Engineer •創業1年の時にABEJAに参画
•バックエンドエンジニア •クラウド上でシステム構築 •IoTデバイスとのシステム連携 •コンテナ •エッジコンピューティング •安価なIoTカメラ上でソフトを書いたり…
社名 株式会社ABEJA 設立 2012年9月10日 住所 東京都港区虎ノ門4-1-20 田中山ビル10F 資本金 (資本準備金含む) 1,148,518,043円
企業理念 イノベーションで世界を変える 事業内容 ディープラーニングを活用した 産業構造変革
None
• エンジニア・デザイナが色々な話を書いてます • ML/DL • AWS・インフラ • IoT • デザイン
ABEJA Tech Blog 5 http://tech-blog.abeja.asia/
•Edge computing •NVIDIA Jetson •Overview •Softwares •Running deep learning application
Agenda 6
Edge computing
エッジコンピューティングとは 8 “データ・ソースの近く、ネットワークのエッジでデータ処理を実行する ことによって、クラウドコンピューティングシステムを最適化する方法” (Wikipedia調べ) 本資料ではエッジサイドでの動画・画像等へのDeep Learningの適 用を対象としています
•Latency •低レイテンシ/固定レイテンシでデータの処理をする必要がある •インターネット経由のAPIリクエストのターンアラウンドを許容できない場合がある •Connectivity •インターネットに常時接続できない環境でも処理は継続的に実行される必要がある •Security •セキュリティ上の利用でデータの事前処理してクラウドに送る必要がある •もしくは、一切のデータをクラウドに送らずにエッジ側でアクションまで行う必要がある •Data Size
•データ量が大きすぎて、ネットワーク帯域の問題でクラウドに送れない •クラウド側で集中処理するにはデータ量が多すぎる 何故エッジコンピューティングをやりたいか 9
エッジとクラウドの連携 10 引用: https://devblogs.nvidia.com/parallelforall/category/features/page/3/ クラウド: ハイパフォーマンスでスケーラブルな計算リソースを利用して学習 エッジ : 高スループット・低レイテンシな推論処理
Jetson Overview
•この資料はNVIDIA様公式の資料ではありません •情報が間違っている・古くなっている可能性があります •気になった方は公式ドキュメントを参照ください Disclaimer 12
•“クレジットカードサイズで驚異的な性能を誇るAIスーパーコンピューター” •GPU搭載 •ARM CPU NVIDIA Jetson 13 TX2 TX1 GPU
NVIDIA Pascal™, 256 CUDA cores NVIDIA Maxwell ™, 256 CUDA cores CPU HMP Dual Denver 2/2 MB L2 + Quad ARM® A57/2 MB L2 Quad ARM® A57/2 MB L2 Video 4K x 2K 60 Hz Encode (HEVC) 4K x 2K 60 Hz Decode (12-Bit Support) 4K x 2K 30 Hz Encode (HEVC) 4K x 2K 60 Hz Decode (10-Bit Support) Memory 8 GB 128 bit LPDDR4 59.7 GB/s 4 GB 64 bit LPDDR4 25.6 GB/s Display 2x DSI, 2x DP 1.2 / HDMI 2.0 / eDP 1.4 2x DSI, 1x eDP 1.4 / DP 1.2 / HDMI CSI Up to 6 Cameras (2 Lane) CSI2 D-PHY 1.2 (2.5 Gbps/Lane) Up to 6 Cameras (2 Lane) CSI2 D-PHY 1.1 (1.5 Gbps/Lane) 引用: https://www.nvidia.com/en-us/autonomous-machines/embedded-systems-dev-kits-modules/
クラウディアン様 AI Box (LTE通信機能付) 14
•OS Image (L4T 28.1) •Ubuntu16.04 / Kernel 4.4 •Libraries •CUDA
8.0 / cuDNN 6.0 •OpenCV4Tegra 2.4.13 / etc… •TensorRT 2.1 •Developer Kit •Tegra Graphics Debugger 2.4 / Tegra System Profiler 3.7 •※Jetpack 3.1時点 Jetpack SDK 15 引用: https://developer.nvidia.com/embedded/jetpack-notes
•現在はDeveloper Preview •OS Image •L4T 28.1 → L4T 28.2 •Kernel
is pre-configured to support Docker •Libraries •cuDNN 6.0 → cuDNN v7.0.5 RC •CUDA 8.0 → CUDA 9.0 •OpenCV4Tegra 2.4.13 → OpenCV 3.3.1 •TensorRT 2.1 → TensorRT 3.0 •etc… Jetpack 3.2 16 引用: https://developer.nvidia.com/embedded/jetpack-notes
Jetson Softwares
•トレーニング済みのネットワークから、ターゲットGPU向けに推論エンジンを最適化 •Jetson TX2向けの最適化 •FP32からINT8への変換も自動でしてくれる •キャリブレーションの情報、データセットを指定すると可能 •通常のフレームワーク利用と比較して高スループットを得る事が可能 TensorRT 18 引用:https://developer.nvidia.com/tensorrt
•DNNのためのメディア・ストリーム処理フレームワーク •GStreamer のプラグインとして提供 •提供されているelement (一部) •GST-nvcaffeGIE - caffeのモデルを走らせるためのelement •GST-nvtracker -
object tracking API •GST-nvosd - camera等の入力にoverlayで画面を構成する DeepStream SDK on Jetson 19 引用: https://developer.nvidia.com/deepstream-jetson
Running deep learning application on Jetson
•Deep Stream SDK on Jetson のExample App(車両認識) •30 fps Deep
learning example on Jetson (1) 21 引用: NVIDIA DeepStream SDK on Jetson Development Guideより
•Realtime object detection •SSD (Single Shot MultiBox Detector) •Based on
mxnet example •inception-v3 with 512x512 •python •mxnet-jetson-tx2 (0.12.0) •1 camera / batch size: 1 •Result: 5 fps Deep learning example on Jetson (2) 22 github incubator-mxnet/example/ssd/
•学習用データ(実環境に近いもの)の収集 •クラウドで学習したモデルのエッジデバイスへの適用 •デバイス自体のモニタリング •実環境でのモデルのモニタリング •デバイス・アクセラレータ毎の最適化 •etc… クラウドとエッジ連携での課題 23