Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メタバース空間で対話相⼿に向かって⾃律移動するAIアバター『ノア』の開発 / EC2025-O...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
yumulab
August 26, 2025
Research
310
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
メタバース空間で対話相⼿に向かって⾃律移動するAIアバター『ノア』の開発 / EC2025-Oyamada
2025年8月26日(火)の情報処理学会エンタテインメントコンピューティング(EC2025)シンポジウム発表ポスター
yumulab
August 26, 2025
More Decks by yumulab
See All by yumulab
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
230
Bluetooth Low Energyの海に潜る / Dive to Bluetooth Low Energy
yumulab
0
140
湯村研究室の紹介2025 / yumulab2025
yumulab
0
360
Proposal of an Information Delivery Method for Electronic Paper Signage Using Human Mobility as the Communication Medium / ICCE-Asia 2025
yumulab
0
320
研究室から社会へ 〜 情報科学でつなぐ科学技術コミュニケーション実践 / #CoSTEP20th
yumulab
0
170
A Proposal of an Information Delivery Method using Human Movement as a Communication Medium for Electronic Paper Signage / ICEC2025
yumulab
0
130
足位置の視覚的提示による電子オルガンのペダル鍵盤演奏学習支援システムの提案 / EC2025-Hokin
yumulab
0
280
電子ペーパーサイネージにおける人の移動を通信媒介とした情報配送手法の提案 / EC2025-Akiba
yumulab
0
190
フィジカルコンピューティングでアイデアをカタチに! / hiu-physcom
yumulab
0
68
Other Decks in Research
See All in Research
羽田新ルート運用6年の検証
1manken
0
160
PGDM: Physically Guided Diffusion Model for L Downscaling
satai
2
280
LLM の Attention 機構まとめ — 数式・計算量・メモリ
puwaer
8
2.2k
【Zozo Research 技術共有会】三次元領域の現在と展望
mickey_0226
3
390
老舗ものづくり企業でリサーチが変革を起こすまで - 三菱重工DXの実践
skydats
0
190
セマンティック通信勉強会 6Gに向けたデバイス間効率的な通信の技術紹介・課題・今後展望
satai
3
170
第12回人と環境にやさしい交通をめざす全国大会/熊本都市圏「車1割削減、渋滞半減、公共交通2倍」をめざして
trafficbrain
0
120
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
840
長時間動画QAにおけるマルチエージェント推論 ・SVAgent: Storyline-Guided Long Video Understanding via Cross-Modal Multi-Agent Collaboration
murakawatakuya
1
130
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
620
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
520
The mathematics of transformers
gpeyre
0
330
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
150
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
300
Why Our Code Smells
bkeepers
PRO
340
58k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
How GitHub (no longer) Works
holman
316
150k
Code Reviewing Like a Champion
maltzj
528
40k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
290
Information Architects: The Missing Link in Design Systems
soysaucechin
0
980
Thoughts on Productivity
jonyablonski
76
5.2k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
Transcript
メタバース空間で対話相手に向かって 自律移動するAIアバター『ノア』の開発 北海道情報大学 小山田 悠人 , 湯村 翼 ユースケース •
イベントの案内用アバター • バーチャルショップの店員 • 実践的なロールプレイ • 語学学習パートナー • 個人の会話相手 などが挙げられる 今後の予定 • 現在状況の表示機能 • モーション追加 • 対話ユーザーの記憶 • ユーザーの常時追従 • GUI設定機能 • BOOTHでの一般配布 概要 • VRChat上で動作するAIアバターを開発中 • 音声会話機能、ユーザー近傍への自律移動機能を持つ 課題・目的 • メタバース空間で会話可能なAI アバターの開発が進むが、アバターの動作を交えたインタラクションは困難 • ユーザーとの会話に加え、呼びかけに応じて自律移動を行うAIアバターを開発する VRChatについて • VRChat Inc.が運営しているソーシャルVRプラットフォーム • アバターでワールド内の移動や会話が可能 • アバターやワールドの制作も可能で自由度が高い 会話プログラム • 音声は文字起こしエンジン「Faster Whisper」によってテキストに変換 • テキストを対話生成モデル「ChatGPT」に送信し自然な返答文を生成 • 返答文を音声合成エンジン「VOICEVOX」によりAIアバターの音声として再生 • この一連の流れにより、人間とAIアバターとのスムーズな会話を実現 移動プログラム • ユーザーの音声を感知し、方向を推測 • その方向に居るユーザーへ回転。ユーザーの座標とAIアバターの方向は OCRで取得 • 再度そのユーザーの音声が認識された場合接近し、会話プログラムを作動させる • 終了後、元位置へ戻り再度待機 ユーザー 文字起こしライブラリ faster_whisper 音声合成関数 ユーザの 発話 AIアバターの 発話 マイク入力 音声合成関数 ChatGPT 音声合成エンジン VOICEVOX 文字起こし結果 会話返答内容 対話生成関数 スピーカー再生 ユーザー側画面 ユーザー ユーザーの発話を感知 発話したユーザーを 特定、その方向へ 回転する 発話したユーザーへ 移動、接近後 会話プログラムを作動 1 2 3 AIアバター AIアバターの方向 各ユーザーの座標