Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メタバース空間で対話相⼿に向かって⾃律移動するAIアバター『ノア』の開発 / EC2025-O...
Search
yumulab
August 26, 2025
Research
250
0
Share
メタバース空間で対話相⼿に向かって⾃律移動するAIアバター『ノア』の開発 / EC2025-Oyamada
2025年8月26日(火)の情報処理学会エンタテインメントコンピューティング(EC2025)シンポジウム発表ポスター
yumulab
August 26, 2025
More Decks by yumulab
See All by yumulab
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
140
Bluetooth Low Energyの海に潜る / Dive to Bluetooth Low Energy
yumulab
0
120
湯村研究室の紹介2025 / yumulab2025
yumulab
0
340
Proposal of an Information Delivery Method for Electronic Paper Signage Using Human Mobility as the Communication Medium / ICCE-Asia 2025
yumulab
0
270
研究室から社会へ 〜 情報科学でつなぐ科学技術コミュニケーション実践 / #CoSTEP20th
yumulab
0
130
A Proposal of an Information Delivery Method using Human Movement as a Communication Medium for Electronic Paper Signage / ICEC2025
yumulab
0
110
足位置の視覚的提示による電子オルガンのペダル鍵盤演奏学習支援システムの提案 / EC2025-Hokin
yumulab
0
230
電子ペーパーサイネージにおける人の移動を通信媒介とした情報配送手法の提案 / EC2025-Akiba
yumulab
0
150
フィジカルコンピューティングでアイデアをカタチに! / hiu-physcom
yumulab
0
59
Other Decks in Research
See All in Research
Using our influence and power for patient safety
helenbevan
0
320
第66回コンピュータビジョン勉強会@関東 Epona: Autoregressive Diffusion World Model for Autonomous Driving
kentosasaki
0
570
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
430
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
3
910
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
1k
20年前に50代だった人たちの今
hysmrk
0
180
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
190
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
220
AIを叩き台として、 「検証」から「共創」へと進化するリサーチ
mela_dayo
0
240
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
580
老舗ものづくり企業でリサーチが変革を起こすまで - 三菱重工DXの実践
skydats
0
130
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
500
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.8k
New Earth Scene 8
popppiees
3
2.1k
Fireside Chat
paigeccino
42
3.9k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
810
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.7k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
190
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2k
Paper Plane
katiecoart
PRO
1
49k
Scaling GitHub
holman
464
140k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Transcript
メタバース空間で対話相手に向かって 自律移動するAIアバター『ノア』の開発 北海道情報大学 小山田 悠人 , 湯村 翼 ユースケース •
イベントの案内用アバター • バーチャルショップの店員 • 実践的なロールプレイ • 語学学習パートナー • 個人の会話相手 などが挙げられる 今後の予定 • 現在状況の表示機能 • モーション追加 • 対話ユーザーの記憶 • ユーザーの常時追従 • GUI設定機能 • BOOTHでの一般配布 概要 • VRChat上で動作するAIアバターを開発中 • 音声会話機能、ユーザー近傍への自律移動機能を持つ 課題・目的 • メタバース空間で会話可能なAI アバターの開発が進むが、アバターの動作を交えたインタラクションは困難 • ユーザーとの会話に加え、呼びかけに応じて自律移動を行うAIアバターを開発する VRChatについて • VRChat Inc.が運営しているソーシャルVRプラットフォーム • アバターでワールド内の移動や会話が可能 • アバターやワールドの制作も可能で自由度が高い 会話プログラム • 音声は文字起こしエンジン「Faster Whisper」によってテキストに変換 • テキストを対話生成モデル「ChatGPT」に送信し自然な返答文を生成 • 返答文を音声合成エンジン「VOICEVOX」によりAIアバターの音声として再生 • この一連の流れにより、人間とAIアバターとのスムーズな会話を実現 移動プログラム • ユーザーの音声を感知し、方向を推測 • その方向に居るユーザーへ回転。ユーザーの座標とAIアバターの方向は OCRで取得 • 再度そのユーザーの音声が認識された場合接近し、会話プログラムを作動させる • 終了後、元位置へ戻り再度待機 ユーザー 文字起こしライブラリ faster_whisper 音声合成関数 ユーザの 発話 AIアバターの 発話 マイク入力 音声合成関数 ChatGPT 音声合成エンジン VOICEVOX 文字起こし結果 会話返答内容 対話生成関数 スピーカー再生 ユーザー側画面 ユーザー ユーザーの発話を感知 発話したユーザーを 特定、その方向へ 回転する 発話したユーザーへ 移動、接近後 会話プログラムを作動 1 2 3 AIアバター AIアバターの方向 各ユーザーの座標