Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NLP/CV SoTA Survey Challenge #3 - ミクシィ AI ロボット事...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
HAL
September 18, 2019
Technology
560
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
NLP/CV SoTA Survey Challenge #3 - ミクシィ AI ロボット事業部紹介
https://nlpaper-challenge.connpass.com/event/146540/
HAL
September 18, 2019
More Decks by HAL
See All by HAL
組み合わせ爆発にのまれない - 責務分割 x テスト
halhorn
1
250
テンポ感よく会話するために - Romi の応答高速化の技術 (MIXI Tech Design Conference 2024)
halhorn
0
290
会話 AI ロボット Romi の設計と技術 - MIXI Tech Conference 2023
halhorn
1
1.8k
雑談対話ロボットを Agile につくる - AgileTech 2021
halhorn
0
83
Other Decks in Technology
See All in Technology
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
860
2026TECHFRESH畢業分享會 - Lightning Talk - 打造精準高效的 MCP 設計模式與測試實務
line_developers_tw
PRO
0
870
protovalidate-es を導入してみた
bengo4com
0
170
やさしいA2A入門
minorun365
PRO
12
1.8k
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
610
機械学習を「社会実装」するということ 2026年夏版 / Social Implementation of Machine Learning June 2026 Version
moepy_stats
5
1.7k
小さく始める AI 活用推進 ― 日経電子版 Web チームの事例/nikkei-tech-talk47
nikkei_engineer_recruiting
0
230
How Timee Delivers Day 1 Production Ready LLM Features
tomoyks
0
150
自宅LLMの話
jacopen
1
460
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
4
2.2k
LLMと共に進化するプロセスを目指して
ymatsuwitter
13
4.1k
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
130
Featured
See All Featured
Balancing Empowerment & Direction
lara
6
1.2k
Designing for Timeless Needs
cassininazir
1
250
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
320
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
2k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
380
Producing Creativity
orderedlist
PRO
348
40k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
370
Music & Morning Musume
bryan
47
7.2k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
330
Navigating Weather and Climate Data
rabernat
0
220
Transcript
ミクシィ AI ロボット事業部紹介 Harumitsu Nobuta
信田 春満 (halhorn ) • 略歴 ◦ 2010〜 京大 B/M
RNN を用いた認知発達ロボティクス研究 ◦ 2013〜 mixi サーバーサイドその他諸々エンジニア ◦ 2017〜 mixi AI ロボット新規事業の最初のエンジニア ▪ 現在は開発もやるエンジニアリングマネージャ • 作って理解する Transformer / Attention • 褒める組織 • 好き ◦ ボルダリング ◦ 鳥 ◦ 写真 ◦ 心や自我、生命について考えること
AI ロボット事業部 しゃべる家庭用ロボットを作る新規事業
AI ロボット事業部 しゃべる家庭用ロボットを作る新規事業 雑談対話 to C 音声対話 ハード ≠ 研究
Only 製品出します
AI ロボット事業部 しゃべる家庭用ロボットを作る新規事業 雑談対話 雑談対話 音声対話 ハード ≠ 研究 Only
製品出します 不確定な市場 進化し続ける 技術領域 広範な 技術領域 アジャイルな開発・研究 Demo or Die
Demo or die
sandbox server (python) bot API client selector Selector Transformer Cooper
New E2E Model Reinforcement Learning module QuestionDetector Knowledge E2E Engine Transformer + RL Rule-base Engine RDS DynamoDB S3 Hubot Slack Raspberrypi which_local which_local Specific Engine EmotionDetector 量産 試作機 Weather etc...
これまでの機械学習系事例
Seq2Seq 2015/06 - Seq2Seq + 会 話 2017/01 プロジェクト始動 2017/04
2017/10 2017/07 2018/01 2018/04 2018/10 - BERT 2018/07 HRED 2016/06 - HRED 2017/06 - Transformer Alphabot Transformer + 強化学習 BERT E2E エンジンが会話の主軸へ End to End 対話システム 2019/01 Transformer XL 2019/04 2019/07 Cooper Transformer ベースの オリジナルネットワーク 2019/06 -XLNet 2019/10
各種識別系ネットワーク 基本的に RNN もしくは Transformer の Encoder (BERT)で実装 • 文章からの感情識別モデル
• 質問(?)判定モデル ◦ 某音声認識エンジンは ! や ? を出力してくれない・・ • 会話が終わりかけているかの判定モデル • etc.
ロボットの表情を作る プロポーズされた! HAPPY
ロボットの表情を作る プロポーズされた! HAPPY A: ねえねえ聞いて!何が合ったと思う? B: え、なんだろ A: プロポーズされた! B:
えー!ついに!?やったね! プロポーズされた! 会話の中で使われる顔文字 =話者の仮想的な顔 →ロボットの顔! 一般的感情に分類されない表情も
これからのターゲット&採用 • 記憶を持つ会話 ◦ 「自分のことを理解してくれる」感覚 ▪ 誰にでも同じことを言っているのではない ▪ オーナーとの会話の記憶に応じた文章生成 •
変化していく会話 ◦ 同じことしか言わないものは飽きる ◦ ロボット自身も個別に成長していく必要性 ◦ オーナーの話し方の癖や興味領域によって会話が変わっていく仕組み • 外部知識 ◦ 時事ネタや一般的知識に強くする • 音声 ◦ リアルタイム、非ターン的な会話 ◦ 音声が持つ情報(感情 etc) これらの課題解決をアジャイルな文化の中 で研究できる人を探しています! https://www.wantedly.com/projects/92981