Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
日本語でおk?
Search
shinjism
December 10, 2016
Programming
0
230
日本語でおk?
ARコンテンツ作成勉強会 忘年会 in 2016でのLT資料。
iOS 10から採用されたSpeech Recognition APIでゴニョゴニョやったお話。
shinjism
December 10, 2016
Tweet
Share
More Decks by shinjism
See All by shinjism
OpenCVでつくろうARスタンプアプリ for iOS
shinjism
0
130
ARコンテンツ作成勉強会:VuforiaでつくるスマホAR+VRアプリ
shinjism
0
780
個人的にお気に入りのVuforia公式サンプル #AR_Fukuoka
shinjism
0
100
A-Frameでお手軽WebAR
shinjism
1
4.2k
Other Decks in Programming
See All in Programming
FormFlow - Build Stunning Multistep Forms
yceruto
1
190
Beyond Portability: Live Migration for Evolving WebAssembly Workloads
chikuwait
0
390
AIプログラマーDevinは PHPerの夢を見るか?
shinyasaita
1
120
アンドパッドの Go 勉強会「 gopher 会」とその内容の紹介
andpad
0
260
なぜ適用するか、移行して理解するClean Architecture 〜構造を超えて設計を継承する〜 / Why Apply, Migrate and Understand Clean Architecture - Inherit Design Beyond Structure
seike460
PRO
1
690
Team operations that are not burdened by SRE
kazatohiei
1
210
PHP 8.4の新機能「プロパティフック」から学ぶオブジェクト指向設計とリスコフの置換原則
kentaroutakeda
2
540
CursorはMCPを使った方が良いぞ
taigakono
1
180
Result型で“失敗”を型にするPHPコードの書き方
kajitack
4
380
0626 Findy Product Manager LT Night_高田スライド_speaker deck用
mana_takada
0
110
XSLTで作るBrainfuck処理系
makki_d
0
210
[初登壇@jAZUG]アプリ開発者が気になるGoogleCloud/Azure+wasm/wasi
asaringo
0
130
Featured
See All Featured
Embracing the Ebb and Flow
colly
86
4.7k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
Gamification - CAS2011
davidbonilla
81
5.3k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
281
13k
Optimising Largest Contentful Paint
csswizardry
37
3.3k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.9k
Git: the NoSQL Database
bkeepers
PRO
430
65k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
5
210
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
17
940
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
60k
The Cult of Friendly URLs
andyhume
79
6.5k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.8k
Transcript
⽇本語でおk? 【iOS 10】Speech Recognition API をさわってみた感想 Shinji Hayai @_shinjism ARコンテンツ作成勉強会
忘年会 in 2016
• 早井慎⼆ • 熊本県在住フリーランスのプログラマ • Webアプリ / Webシステム開発 Webサイトデザイン &
構築 スマホアプリデザイン & 開発 (主にiOS) など • PHP / JavaScript / C# (Unity) / Swift • #AR_Kumamoto 運営 ⾃⼰紹介
⾳声認識を使いたい
スマホARを できるだけハンズフリーで • カメラをマーカー等にかざして画⾯を タッチするとき両⼿がふさがる • ハコスコやGoogle VRの使⽤中はタッ チ操作できない
アプリ制作の勉強会で iOS 10から使える⾳声認識が あると教えていただきました 5年間で350アプリを作った講師が教える アプリ制作チャレンジ2016秋(全8回予定)熊本会場 https://www.facebook.com/events/1587890414840626/
Speech Recognition API • http://devstreaming.apple.com/videos/wwdc/2016/5 09n1cnykqms19r9jyp/509/509_speech_recognition_a pi.pdf • https://developer.apple.com/library/content/samplec ode/SpeakToMe/Introduction/Intro.html
Speech Recognition APIとは • iOS 10から登場した⾳声認識API • Siriで採⽤されているものと同じ • ⽇本語含め58ヶ国語に対応
• 無償で商⽤利⽤可 • リアルタイム⾳声認識のほか 録⾳済み⾳声データの認識も • 実装がわりと楽にできそう
良い Speech Recognition API を使ってみた結果www ※個⼈の感想です
ただし… • 会話を区切るタイミングが難しい • ネットスラングや流⾏語は厳しいかも ex: 神ってる • 端末ごと、アプリごとに認識回数の制限あり (制限の詳細については公開されていない)
• 連続使⽤は最⼤1分まで • インターネット接続が必要 • バッテリーの消耗が⼼配 • 知⾒が少ない
とりあえず何か 作ってみました ※デモあり、バグ多めw
JIMAKU(仮) written: Unity / Vuforia / Swift (Native Plugin) ⾳声を字幕表⽰+αするアプリ
デモ中はお静かに ご協⼒ありがとうございます
はやくち ことば written: Swift はやくちことばを 練習する(?)アプリ 2016年内公開予定!! ↑↑↑願望↑↑↑ iOSユーザの皆さん 公開したらダウンロードしてね♪
デモ中は お静かに ご協⼒ ありがとうございます
ARコンテンツ作成勉強会 運営の皆さま 参加してくださった皆さま 本年もありがとうございました どうぞよい年をお迎えください