Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スマートスピーカー(AIアシスタント)以外のVoice関連の話をしてみる / #AR_Fuku...
Search
you(@youtoy)
PRO
February 24, 2021
Technology
1
180
スマートスピーカー(AIアシスタント)以外のVoice関連の話をしてみる / #AR_Fukuoka #VUIFukuoka
you(@youtoy)
PRO
February 24, 2021
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
ブラウザで CircuitPython の開発:公式の「CircuitPython Code Editor」を試した / 【屋形船開催】IoT縛りの勉強会! IoTLT vol.126 @東京湾
you
PRO
0
88
公開初日に個人環境で試した Gemini CLI 体験記など / Gemini CLI実験レポート
you
PRO
3
2.2k
Webの技術とガジェットで那須の子ども達にワクワクを! / IoTLT_20250720
you
PRO
0
140
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you
PRO
0
2.4k
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
160
総額200円の入力インターフェースで年齢問わず楽しめる体験型展示 / エンジニアの自由研究発表会vol.10
you
PRO
0
71
Node−RED で Ollama を使ったローカルLLM(node-red-contrib-ollamaを利用) / ビジュアルプログラミングIoTLT vol.20
you
PRO
0
230
AIエージェント開発や最新の生成AIのAPI利用などJavaScriptで色々やってみる / IoTLT vol.123
you
PRO
0
130
ChatGPT からモックサーバー宛(Beeceptor宛)の HTTPリクエストを試す / IoTLT 202504
you
PRO
0
110
Other Decks in Technology
See All in Technology
新卒(ほぼ)専業Kagglerという選択肢
nocchi1
1
2k
ドキュメントはAIの味方!スタートアップのアジャイルを加速するADR
kawauso
3
320
我々は雰囲気で仕事をしている / How can we do vibe coding as well
naospon
2
220
Amazon Bedrock AgentCore でプロモーション用動画生成エージェントを開発する
nasuvitz
6
410
Evolution on AI Agent and Beyond - AGI への道のりと、シンギュラリティの3つのシナリオ
masayamoriofficial
0
160
サイボウズフロントエンドの横断活動から考える AI時代にできること
mugi_uno
4
1.4k
マイクロモビリティシェアサービスを支える プラットフォームアーキテクチャ
grimoh
1
190
自治体職員がガバクラの AWS 閉域ネットワークを理解するのにやって良かった個人検証環境
takeda_h
2
380
ECS モニタリング手法大整理
yendoooo
1
120
AIエージェントの開発に必須な「コンテキスト・エンジニアリング」とは何か──プロンプト・エンジニアリングとの違いを手がかりに考える
masayamoriofficial
0
360
OpenAPIから画面生成に挑戦した話
koinunopochi
0
150
人と組織に偏重したEMへのアンチテーゼ──なぜ、EMに設計力が必要なのか/An antithesis to the overemphasis of people and organizations in EM
dskst
5
590
Featured
See All Featured
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
283
13k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
Building Adaptive Systems
keathley
43
2.7k
The Cost Of JavaScript in 2023
addyosmani
53
8.8k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Gamification - CAS2011
davidbonilla
81
5.4k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Into the Great Unknown - MozCon
thekraken
40
2k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Transcript
2021年2月24日 (水) xTech ゆるっとLT: VUI Fukuoka and AR_Fukuoka @オンライン 豊田
陽介 ( @youtoy ) スマートスピーカー(AIアシスタント) 以外のVoice関連の話をしてみる
豊田陽介(@youtoy) 自己紹介 普段は、某通信会社の研究所勤務 話題のものをたくさん 購入している気がする IT系イベント主催・登壇・運営、多数参加 子ども向けの活動いろいろ(IT系以外も) プライベートでの活動 ガジェット好き その他
主催テーマ: ビジュアルプログラミング、IoT、 ロボットトイ、メカトロなど
VUI関連の活動など スマートスピーカー Advent Calendar 2020 で書いた記事 ⇒ IFTTT で Alexa・Google
Assistant を利用して IFTTT Pro の新機能 (クエリー・フィルター)との組み合わせも試す - Qiita ヒーローズ・リーグ(旧 Mashup Awards)のVUI部門 ⇒ オーガナイザー(2018〜2020) 今週の土曜 「VoiceLunchJP#07」 ⇒ ハンズオンっぽい感じの内容の ファシリテーター
VUI関連で作ったものの一部 ビジュアルプログラミングで Alexaスキル + toio 連携 Alexaスキル + ラズパイ +
micro:bit連携 Alexa Gadgets Toolkit の Custom Interfaces Espalexa Alexaスキル + M5StickC & micro:bit連携 Voiceflow Node.js・Python・ MakeCode C・MakeCode Node.js・V oiceflow
スマートスピーカー・ AIアシスタントの話を 出していたものの
それらが絡まない話
今日の話題 声(や音全般)+ 機械学習 1 2 ビジュアルプログラミング+ スマホの音声系機能
Teachable Machine (by Google) 1つ目のトピック
声(や音全般)+ 機械学習 Googleさん提供の「Teachable Machine」 ⇒ ブラウザ上で学習ができて推論のお試しも
声より音色がメインの 事例ですが...
Teachable Machine(音)を使った事例 https://www.youtube.com/watch?v=Ve6TyzzmXck
音のインタフェースは...
展示で年齢によらず楽しんでもらえた! 2020年10月開催の Maker Faire Tokyo 2020 にて 中高生以上の学生さん や大人の方にも!
音を対象にしたTeachable Machine 音を学習させる操作を する部分 機械学習モデルの 作成操作をする部分 音の識別を試せる 部分(モデルが できた後)
音の学習は、 サイト上でボタン押下 ⇒ マイクでの録音 という流れ
Web上で音を識別する部分を試す 作成された機械学習モデルの推論をそのままサイト上でお試し
モデルデータを独自のプログラムで動かす •Teachable Machine の FAQ より https://teachablemachine.withgoogle.com/faq 手軽なのは JavaScriptベース のもの
⇒ p5.js + p5.js の Web エディタが一番手軽かも?
手軽なお試し(p5.js Web Editorで試す) 機械学習モデルの クラウドへのアップ オンラインエディタで実行 (ソースコードの変更などもOK) モデルの URL は
書き換えを!
クラウドアップ時のURLへアクセスすると Web上でのお試しや、モデルデータのダウンロードが可能 ⇒ 学習させるデータの追加はできなそうだけど...
プロジェクトのファイルの保存/アップ 左上のメニューから、プロジェクトのダウンロード・アップが
注意点というかコツ などに関わる部分
Teachable Machineの利用での注意点 •Teachable Machine の FAQ「希望どおりに動作しないのはなぜですか?」より https://teachablemachine.withgoogle.com/faq
音の学習・モデル利用の話の一部は記事に
ビジュアルプログラミング でスマホアプリ+VUI 2つ目のトピック
デモ動画:声の機械学習利用+音声合成 https://www.youtube.com/watch?v=Ywu-fy5S16M Androidアプリ
ブロックベースのプログラミング UI を作る画面
Webサイト上での機械学習もできる 学習 推論 ⇒ 機械学習のモデルはダウンロードして Androidアプリへ
細かな話はQiitaの記事(前後編)に モデルのデータを作る部分 Androidアプリ開発の部分
将来的な話として...
Alexa連携用の機能が検討されてるっぽい App Inventor の AIプロジェクトの概要に関するプレゼンより ⇒ https://www.youtube.com/watch?v=mwE0gBH5ai0
終わり!