Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Look mom, no hands! (Web Speech API)
Search
Yuri Malheiros
February 26, 2014
Programming
1
110
Look mom, no hands! (Web Speech API)
Palestra sobre Web Speech API no Paraiba.js
Yuri Malheiros
February 26, 2014
Tweet
Share
More Decks by Yuri Malheiros
See All by Yuri Malheiros
Aprendizagem de Máquina - Programando com o poder dos dados
yurimalheiros
0
70
A Method to Develop Description Logic Ontologies Iteratively Based on Competency Questions: an Implementation
yurimalheiros
0
130
Uma Ferramenta para Análise de Sentimentos em Redes Sociais Utilizando o SenticNet
yurimalheiros
7
400
Produzindo ideias
yurimalheiros
1
130
Criando comunidades bem-sucedidas
yurimalheiros
1
120
As máquinas que sentem
yurimalheiros
5
230
Other Decks in Programming
See All in Programming
生成AIを活用したソフトウェア開発ライフサイクル変革の現在値
hiroyukimori
PRO
0
130
PJのドキュメントを全部Git管理にしたら、一番喜んだのはAIだった
nanaism
0
210
AI時代の認知負荷との向き合い方
optfit
0
180
izumin5210のプロポーザルのネタ探し #tskaigi_msup
izumin5210
1
420
kintone + ローカルLLM = ?
akit37
0
110
CSC307 Lecture 11
javiergs
PRO
0
580
OCaml 5でモダンな並列プログラミングを Enjoyしよう!
haochenx
0
160
浮動小数の比較について
kishikawakatsumi
0
330
CSC307 Lecture 09
javiergs
PRO
1
850
オブザーバビリティ駆動開発って実際どうなの?
yohfee
1
110
ふん…おもしれぇ Parser。RubyKaigi 行ってやるぜ
aki_pin0
0
110
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
200
Featured
See All Featured
Abbi's Birthday
coloredviolet
2
4.9k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.3k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
270
The Pragmatic Product Professional
lauravandoore
37
7.2k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.3k
The Language of Interfaces
destraynor
162
26k
Discover your Explorer Soul
emna__ayadi
2
1.1k
GraphQLとの向き合い方2022年版
quramy
50
14k
Into the Great Unknown - MozCon
thekraken
40
2.3k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
460
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
290
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.9k
Transcript
look mom, no hands! web speech api
yuri malheiros professor da ufpb pesquisador em inteligência artificial doutorando
no cin-ufpe
telas, mouses e teclados
as coisas evoluíram…
mas nem tanto
inovações!
inovações!
inovações!
digitar e apontar usando uma ferramenta não necessariamente é
a forma mais natural de executar uma tarefa
interações via voz e a web speech api
web speech api entrada via voz transformação de texto em
voz
web speech api server side client side
var recognition = new webkitSpeechRecognition();
recognition. continuos [true|false] interimResults [true|false] onstart [function] onresult [function] onerror
[function] onend [function]
recognition.start()
recognition.onresult = function(e) { var interimTranscript = ""; var finalTranscript
= ""; ! for (var i = e.resultIndex; i < e.results.length; i++) { if (event.results[i].isFinal) { finalTranscript += e.results[i][0].transcript; } else { interimTranscript += e.results[i][0].transcript; } } console.log(interimTranscrip); console.log(finalTranscript); };
como isso é possível?
o chrome envia o áudio para os servidores do google,
processa o sinal para reconhecer padrões e retorna a resposta para o navegador
demo (6)
web speech api é uma forma acessível e simples de
detectar voz diretamente no navegador
com o avanço da tecnologia nós podemos e devemos experimentar
novos tipos de interações entre humanos e máquinas
obrigado @yurimalheiros yurimalheiros.com