Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【MLN】Visual Blocks for ML
Search
高橋かずひと
June 24, 2023
Technology
0
1.3k
【MLN】Visual Blocks for ML
高橋かずひと
June 24, 2023
Tweet
Share
More Decks by 高橋かずひと
See All by 高橋かずひと
【NGK2025S】動物園(PINTO_model_zoo)に遊びに行こう
kazuhitotakahashi
0
110
【Pycon mini 東海 2024】Google Colaboratoryで試すVLM
kazuhitotakahashi
2
1.5k
【Python東海#44】Pydroid3で画像処理
kazuhitotakahashi
0
1.5k
【Unagi.py 56枚目】動物園(PINTO_model_zoo)に遊びに行こう
kazuhitotakahashi
1
1.6k
【Python東海#43】Image-Processing-Node-Editor
kazuhitotakahashi
0
1k
【NGK2023S】 ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」
kazuhitotakahashi
0
1.3k
【Pythonデータ分析勉強会#33】「DearPyGuiに入門しました」の続き~Image-Processing-Node-Editor~
kazuhitotakahashi
0
1.4k
【OSC2022Nagoya】DearPyGuiに入門しました / OSC2022Nagoya Introduced to DearPyGui
kazuhitotakahashi
1
1.8k
【Pythonデータ分析勉強会#32】Raspberry Piでリアルタイムな物体検出(2022年4月やったやつ)
kazuhitotakahashi
0
2k
Other Decks in Technology
See All in Technology
Evolving Architecture
rainerhahnekamp
3
240
自社 200 記事を元に整理した読みやすいテックブログを書くための Tips 集
masakihirose
2
270
三菱電機で社内コミュニティを立ち上げた話
kurebayashi
1
320
CDKのコードレビューを楽にするパッケージcdk-mentorを作ってみた/cdk-mentor
tomoki10
0
130
Zero Data Loss Autonomous Recovery Service サービス概要
oracle4engineer
PRO
1
5k
あなたの人生も変わるかも?AWS認定2つで始まったウソみたいな話
iwamot
3
780
JAWS-UG20250116_iOSアプリエンジニアがAWSreInventに行ってきた(真面目編)
totokit4
0
120
実践! ソフトウェアエンジニアリングの価値の計測 ── Effort、Output、Outcome、Impact
nomuson
0
1.8k
Formal Development of Operating Systems in Rust
riru
1
410
知っててうれしい SQL について
greendrop
0
120
Azureの開発で辛いところ
re3turn
0
230
いま現場PMのあなたが、 経営と向き合うPMになるために 必要なこと、腹をくくること
hiro93n
3
2.1k
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Designing Experiences People Love
moore
139
23k
Statistics for Hackers
jakevdp
797
220k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
A Tale of Four Properties
chriscoyier
157
23k
BBQ
matthewcrist
85
9.4k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
560
Into the Great Unknown - MozCon
thekraken
34
1.6k
Fireside Chat
paigeccino
34
3.1k
Building Better People: How to give real-time feedback that sticks.
wjessup
366
19k
The Cult of Friendly URLs
andyhume
78
6.1k
Transcript
Visual Blocks for ML MLN 2023/06/24
Who am I ? Name Twitter:KzhtTkhs :高橋かずひと 所属 :サイバーエージェント AI事業本部
行政DX Div GovTech開発センター 仕事 :画像処理 兼 なんでも屋 その他:Axross寄稿や インディーゲーム開発の お手伝いしています
Who am I ? Name Twitter:KzhtTkhs :高橋かずひと 所属 :サイバーエージェント AI事業本部
行政DX Div GovTech開発センター 仕事 :画像処理 兼 なんでも屋 その他:Axross寄稿や インディーゲーム開発の お手伝いしています
Image-Processing-Node-Editor 特徴 ・高橋自作のノードエディタ 形式の画像処理アプリ ・ノードをドラッグ& ドロップで接続できる ・各処理を視覚化しながら 処理を試すことが出来る ・OSS(Apache-2.0 license
)
0. Overview
Visual Blocks for ML とは 特徴 ・Google製のノーコード のグラフエディター ・ノードをドラッグ& ドロップで接続できる
・MLワークフローの プロトタイプを視覚化 しながら試すことが出来る ・Web上で動作するデモと Colaboratoryで動く パッケージがある https://visualblocks.withgoogle.com/ より引用
Visual Blocks for ML とは https://visualblocks.withgoogle.com/ より引用 注意点 ・Google製ではあるが、 正式にサポートされている
Google製品ではない ・このプロダクトの関心を 測ることを目的とした 実験的なリリース ・長期的なメンテナンスの 保証はない ※現時点で既にGitHubの更新はあまり活発ではない…… 正確に言うとコア部分がパブリックに開発されていないので状況が謎
1. Input node
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
・静止画を入力 ・デフォルトで いくつかの テスト画像 ・アップロード も可能
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
・テキスト入力 が出来る ・他ノードと 組み合わせて 重畳表示や APIの入力に
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
・Webカメラを 入力画像と して利用 ・( 現時点では ) カメラの切り 替えは不可
2. Effect node
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・2つの画像を合成 ・複数の合成モード ・テキストの重畳表示
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・以下の画像処理を実行 輝度、コントラスト、 クロップ、リサイズ、 シアー、回転、ブラー ノイズ付与
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・Code editorで作成した 任意のシェーダーコード を実行
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・テキスト処理を行う - テキストの結合 - テキストの置換 - Mustacheテンプレート
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・画像と顔のランドマーク 座標を用いて、画像の オーバーレイ表示を行う
3. Model node
Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection ・Face landmark
・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・人物や(一部の)動物を 切り抜いたマスクを 取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face
detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・顔検出結果(バウンディ ングボックス、キーポイン ト)を取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face
detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・顔のランドマーク検出結 果を取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・ハンドジェスチャーを検 出する(エラー出る😇 Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・手のキーポイント検出結 果を取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・Mobilenet(v1 or v2) を用いてクラス分類結果を 取得する Visual Blocks for ML:Modelノード① ・Body
segmentation ・Face detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・物体検出結果を取得する (モデル不明。 MobileNet-SSDLite?) Visual Blocks for ML:Modelノード① ・Body segmentation ・Face
detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・PaLMチャットを実行する ※要APIキー Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・PaLMによる文章生成を 行う ※要APIキー
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・セグメンテーション+ 深度推定結果を取得する
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・姿勢推定結果を取得する
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・入力テキストが有害な テキストかクラス分類を 行う
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・TensorFlow-Hub等の TFJSモデルを実行する ※前処理・後処理はTensor 操作用ノードで実施する
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・TensorFlow-Hub等の TFLiteモデルを実行する ※前処理・後処理はTensor 操作用ノードで実施する
4. Output node
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・深度推定結果と画像から 3D画像を表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・物体検出などのバウンディ ングボックスを画像に重畳表 示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・クラス分類結果を表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・Tailwind CSSを用いた 簡易なHTMLを表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・複数画像を並べて 比較表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・画像を表示する URL指定での画像表示や 複数並べての表示も可能 ※複数表示出来ると、Image comparisonとの 差別化がイマイチ……
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・姿勢推定結果などの キーポイントと画像を 用いて可視化する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・セグメンテーションなどの マスクを用いて 切り抜いた画像を表示する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・深度推定結果を擬似カラー で表示する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・Tensorを画像に変換する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・Tensorの値を表示する
5. Tensor node
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensorの型を変換する
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensorのクロップ、 リサイズを実行する
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・画像に対し前処理を 実行してTensorへ変換する - リサイズ - 正規化
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・最小値、最大値を指定して 値の範囲をリマップする
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensor[]に対し、 インデックスを指定して Tensorを取得する
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensor型のクラス分類の 出力を「Classification viewer」で表示できる形に 変換する
6. MISC node
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・コードを記述するノード ・言語は自由 ・このノード単体では動作 せず、 Shader processing などに接続して使用
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・Web APIを実行した結果を 取得する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・指定URLの内容を iframeとして埋め込む
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・画像のサイズを取得し json形式で出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・入力されたデータを ログ出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・文字列選択リストを 生成し、選択されている 文字列を出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・文字列を範囲選択し、 選択した内容を出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・指定URLのURLパラメータ を抽出して出力する ※うまく動かない……調査中
7. Colaboratory
Visual Blocks for ML:Colaboratory ・Colaboratory 向けに visualblocks と言うパッケージが提供されている https://colab.research.google.com/github/google/visualblocks/blob/main/examples/quick_start_style_transfer.ipynb より引用
Visual Blocks for ML:Colaboratory ・Webデモとの大きな違いは、Generic関数を定義しブロックに登録できること
Visual Blocks for ML:Colaboratory
Visual Blocks for ML:Colaboratory
8. 作例
https://github.com/google/visualblocks/tree/main/pipelines/ より引用 その他にも多くの作例が掲載されている
https://github.com/google/visualblocks/tree/main/pipelines/ より引用 その他にも多くの作例が掲載されている
ご清聴ありがとうございました🙂