メタバース研究所による機械学習研究(W&Bミートアップ #15)

クラスターメタバース研究所における機械学習研究早瀬友裕 Tomohiro HAYASE, Ph.D Weights and Biases Meetup 2024/Aug./22

clusterとは? VR スマートフォン PC VRからスマホまでどこからでも遊べる　　　国内最大のメタバースプラットフォームメタバース研究所のミッションエモーションモーションボイス
独⾃のコミュニティ大量の3Dデータ「世界と⼈を計算可能に」

⼤規模3Dメタデータによる撮影スポット探索機の学習 with Sacha Braun (Ecole Polytech), 折登樹,柳川光理, 廣井裕⼀
PanoTree: Autonomous Photo-Spot Explorer in Virtual Reality Scenes https://cluster-lab.github.io/panotree/ arxiv:2405.17136

4 背景：メタバースには３D顕著性データがある 3Dシーンの顕著性/Attentionを表すもの：写真撮影単なる視線履歴ではなく、明⽰的に⼈間がカメラを向けて撮影した情報であり、顕著性としての価値が⾼い PFには、写真撮影時のメタデータ（３D座標‧回転、シーンID）が溜まっている Figure.
cluster, VRモードでのカメラUI.

5 写真撮影の例

6 研究概要 Question 未知３Dシーンにおける撮影スポットを発⾒できますか？ Answer １．顕著性の定式化＆⼤規模３Dデータで価値観数の学習＆汎化２．未知シーンにおける⾼速な強化学習探索アルゴリズムの構成性能検証は価値関数の汎化性能と探索アルゴリズムの速さで⾏う Takeaway ⾃動撮影 3Dシーンの設計,
導線管理, デザイン⼈間を⼊れる前に, 事前推測なので, ３Dシーンの設計ができる Game AIの視覚基盤

7 評価関数の定式化この画像はどちらに属していますか？ - ０：ランダムに配置されたカメラによる画像 - １：人が撮った画像からアバターを除いたもの

8 評価関数の学習

9 データセット Dataset 3Dシーン：約240シーン 3Dメタデータ：合計約８０万件ランダムデータ: 合計約８０万件学習⽤画像約160万枚 Pretraining
ImageNet-21k & ImageNet-1k Model MLP-Mixer, ViT

10 価値関数の学習＊７５⼈, 性別: 男性60名, ⼥性14名, ⾮解答１名, 年齢32.1(± 4.3) 歳
＊シーン数１０

探索アルゴリズム

12 カメラ座標のブラックボックス最適化評価値を最⼤化したいが, レンダリング（カメラパラメータから画像を出⼒する写像）は、⼀般には微分が提供されていないため, ブラックボックス最適化を⾏う. ブラックボックス関数がある程度連続であるとき, 連続補正付き⽊構造探索＆強化学習により, 最⼤値を探索する.
階層的ブラックボックス最適化(Hierachical Optimial Optimization) [“X-armed bandits”, S.Bubeck et.al., J. Machine Learning Research (2011)] 平均スコア探索バイアス項連続バイアス項訪問数 node depth node index

13 階層的ブラックボックス最適化平均スコア探索バイアス項連続バイアス項訪問数 node depth node index
繰り返し葉の展開値更新 T=3 U=0.4 T=0 U=0.7 T=2 U=0.4 T=0 U=Inf T=0 U=Inf T=0 U=0.9 T=0 U=0.7 T=1 U=0.5 T=2 U=0.4 T=3 U=0.7 T=3 U=0.4 T=1 U=0.5 T=2 U=0.4 T=0 U=Inf T=3 U=0.4 T=3 U=0.7 T=0 U=0.9 葉の選択

14 階層的ブラックボックス最適化 T=3 U=0.4 T=0 U=0.7 T=2 U=0.4 T=0 U=Inf
T=0 U=Inf T=0 U=0.9 T=0 U=0.7 T=1 U=0.5 T=2 U=0.4 T=3 U=0.7 T=3 U=0.4 T=3 U=0.7 T=3 U=0.4 T=0 U=0.9 T=1 U=0.5 T=2 U=0.4 T=0 U=Inf 平均スコア探索バイアス項連続バイアス項訪問数 node depth node index

15 従来のHOOからの変更点 … X Y Z （１）空間分割方策：xyzの順に行わず、大きな辺を優先して確率的に分割する: （２）各葉において、方向ベクトルをいくつかとり、その方向の画像の評価について最大値を葉
のスコアとする：

16 探索の様⼦

17 ⾃動撮影結果 clusterの3Dシーンで自動撮影アルゴリズムが撮ってきたスコア＞0.9の写真たち

18 局所的⽅向探索：グリッドサーチ

19 wandb usecase : Augmentation探索価値関数学習⽤ハイパラサーチ: ImageNetとﬁne-tuning⽤の画像群のドメインシフトを吸収するためdata augmentationの選択をsweepで⾏う。 program:
train_world_images.py method: grid metric: goal: maximize name: eval_top1 parameters: rand-aug-n: values: - 5 rand-aug-m: values: - 8 - 9 …

20 wandb usecase : 探索の並列化探索アルゴリズムの並列化: 強化学習⽤のシミュレーターを複数台⽤意し、sweepをそれぞれ実⾏。並列処理が可能。 program:
train_agents.py method: grid metric: goal: maximize name: cumulative_max parameters: world-id: values: - 1 - 2 - 3 - 4 - 5 …

Understanding MLP-Mixer as a Wide and Sparse MLP with Ryo
Karakida (AIST) ICML2024, arxiv:2306.01470

22 MLP-Mixer: Attentionなくても性能がでる Tolstikhin, et al., 2021

23 なぜ性能がでるのか？極めてスパースなMLPだから。ランダムにchannel/token軸いれかえてもOK。

24 wandb usecase : imagenet学習での並列化 ImageNetでバッチサイズ4096, 32インスタンスで分散学習。ただし、wandbにログを取るのは１インスタンスだけにすることにより負荷軽減
program: train_imagenet.py method: grid metric: goal: maximize name: eval_accuracy parameters: dim: values: - 64 - 128 - 256 - 512 seed: …

Future Work

26 Future Work Math x ML x VR メタバースのデータは深層学習に、深層学
習はメタバースに、相互に影響を与えることを期待 e.g. 自動撮影をサムネイル作成支援に応用, より広範な強化学習 , 自律的Agent, ….

メタバース研究所による機械学習研究(W&Bミートアップ #15)

メタバース研究所による機械学習研究(W&Bミートアップ #15)

Ryo Kanazawa

More Decks by Ryo Kanazawa

Featured

Transcript

クラスターメタバース研究所における機械学習研究早瀬友裕 Tomohiro HAYASE, Ph.D Weights and Biases Meetup 2024/Aug./22

clusterとは? VR スマートフォン PC VRからスマホまでどこからでも遊べる　　　国内最大のメタバースプラットフォームメタバース研究所のミッションエモーションモーションボイス

⼤規模3Dメタデータによる撮影スポット探索機の学習 with Sacha Braun (Ecole Polytech), 折登樹,柳川光理, 廣井裕⼀

5 写真撮影の例

7 評価関数の定式化この画像はどちらに属していますか？ - ０：ランダムに配置されたカメラによる画像 - １：人が撮った画像からアバターを除いたもの

8 評価関数の学習

9 データセット Dataset 3Dシーン：約240シーン 3Dメタデータ：合計約８０万件ランダムデータ: 合計約８０万件学習⽤画像約160万枚 Pretraining

10 価値関数の学習＊７５⼈, 性別: 男性60名, ⼥性14名, ⾮解答１名, 年齢32.1(± 4.3) 歳

探索アルゴリズム

13 階層的ブラックボックス最適化平均スコア探索バイアス項連続バイアス項訪問数 node depth node index

14 階層的ブラックボックス最適化 T=3 U=0.4 T=0 U=0.7 T=2 U=0.4 T=0 U=Inf

15 従来のHOOからの変更点 … X Y Z （１）空間分割方策：xyzの順に行わず、大きな辺を優先して確率的に分割する: （２）各葉において、方向ベクトルをいくつかとり、その方向の画像の評価について最大値を葉

16 探索の様⼦

17 ⾃動撮影結果 clusterの3Dシーンで自動撮影アルゴリズムが撮ってきたスコア＞0.9の写真たち

18 局所的⽅向探索：グリッドサーチ

19 wandb usecase : Augmentation探索価値関数学習⽤ハイパラサーチ: ImageNetとﬁne-tuning⽤の画像群のドメインシフトを吸収するためdata augmentationの選択をsweepで⾏う。 program:

20 wandb usecase : 探索の並列化探索アルゴリズムの並列化: 強化学習⽤のシミュレーターを複数台⽤意し、sweepをそれぞれ実⾏。並列処理が可能。 program:

Understanding MLP-Mixer as a Wide and Sparse MLP with Ryo

22 MLP-Mixer: Attentionなくても性能がでる Tolstikhin, et al., 2021

23 なぜ性能がでるのか？極めてスパースなMLPだから。ランダムにchannel/token軸いれかえてもOK。

24 wandb usecase : imagenet学習での並列化 ImageNetでバッチサイズ4096, 32インスタンスで分散学習。ただし、wandbにログを取るのは１インスタンスだけにすることにより負荷軽減

Future Work

26 Future Work Math x ML x VR メタバースのデータは深層学習に、深層学