Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Look mom, no hands! (Web Speech API)
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuri Malheiros
February 26, 2014
Programming
120
1
Share
Look mom, no hands! (Web Speech API)
Palestra sobre Web Speech API no Paraiba.js
Yuri Malheiros
February 26, 2014
More Decks by Yuri Malheiros
See All by Yuri Malheiros
Aprendizagem de Máquina - Programando com o poder dos dados
yurimalheiros
0
78
A Method to Develop Description Logic Ontologies Iteratively Based on Competency Questions: an Implementation
yurimalheiros
0
140
Uma Ferramenta para Análise de Sentimentos em Redes Sociais Utilizando o SenticNet
yurimalheiros
7
400
Produzindo ideias
yurimalheiros
1
130
Criando comunidades bem-sucedidas
yurimalheiros
1
130
As máquinas que sentem
yurimalheiros
5
230
Other Decks in Programming
See All in Programming
AIエージェントの隔離技術の徹底比較
kawayu
0
460
作って学ぶ、 JSX (TSX) ランタイムの基本
syumai
7
1.5k
LLM本来の能力を解き放つサンドボックス技術とAI民主化への適用
yukukotani
3
2.6k
DynamoDBには集計系のクエリがないけどなんとかしたい
musan
1
130
Java × distroless で 軽量なコンテナイメージを / Java on Distroless
contour_gara
0
480
Signal Forms: Beyond the Basics @ngBaguette 2026 in Paris
manfredsteyer
PRO
0
220
net-httpのHTTP/2対応について
naruse
0
430
TSKaigi Night Talks 2026_TypeScriptでサプライチェーンの整合性を型に閉じ込める
geekplus_tech
0
250
さぁV100、メモリをお食べ・・・
nilpe
0
130
ADKを使って簡単にAIエージェントを作ってみよう
k1mu21
0
200
AI時代の仕事技芸論 — ソフトウェア開発で「遊ぶように働く」職人的熟達のすすめ
kuranuki
1
610
AutonomyとControlのあいだ:Graflowで記述するAIエージェント協調
myui
0
100
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Optimising Largest Contentful Paint
csswizardry
37
3.7k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Amusing Abliteration
ianozsvald
1
190
Fireside Chat
paigeccino
42
3.9k
Context Engineering - Making Every Token Count
addyosmani
9
940
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
Crafting Experiences
bethany
1
170
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
370
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
440
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Transcript
look mom, no hands! web speech api
yuri malheiros professor da ufpb pesquisador em inteligência artificial doutorando
no cin-ufpe
telas, mouses e teclados
as coisas evoluíram…
mas nem tanto
inovações!
inovações!
inovações!
digitar e apontar usando uma ferramenta não necessariamente é
a forma mais natural de executar uma tarefa
interações via voz e a web speech api
web speech api entrada via voz transformação de texto em
voz
web speech api server side client side
var recognition = new webkitSpeechRecognition();
recognition. continuos [true|false] interimResults [true|false] onstart [function] onresult [function] onerror
[function] onend [function]
recognition.start()
recognition.onresult = function(e) { var interimTranscript = ""; var finalTranscript
= ""; ! for (var i = e.resultIndex; i < e.results.length; i++) { if (event.results[i].isFinal) { finalTranscript += e.results[i][0].transcript; } else { interimTranscript += e.results[i][0].transcript; } } console.log(interimTranscrip); console.log(finalTranscript); };
como isso é possível?
o chrome envia o áudio para os servidores do google,
processa o sinal para reconhecer padrões e retorna a resposta para o navegador
demo (6)
web speech api é uma forma acessível e simples de
detectar voz diretamente no navegador
com o avanço da tecnologia nós podemos e devemos experimentar
novos tipos de interações entre humanos e máquinas
obrigado @yurimalheiros yurimalheiros.com