Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「ニューラルかな漢字変換」の 社会実装
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Keita Miwa
May 23, 2026
11
1
Share
「ニューラルかな漢字変換」の 社会実装
生成AI会 Vol.2@渋谷(LLMプロダクト開発・ハーネスエンジニアリング)の発表資料です。
https://seisei-ai.connpass.com/event/388188/
Keita Miwa
May 23, 2026
More Decks by Keita Miwa
See All by Keita Miwa
iOSのKeyboard Extensionで日本語入力できるキーボードアプリを作ろう! - iOSDC2023
miwa_keita
0
2.9k
Featured
See All Featured
Deep Space Network (abreviated)
tonyrice
0
150
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1.4k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
130
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
180
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
150
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
230
Amusing Abliteration
ianozsvald
1
170
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
The Curse of the Amulet
leimatthew05
1
12k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
550
Transcript
「ニューラルかな漢字変換」の 社会実装 生成AI会 Vol.2@渋谷
Keita Miwa Naoki Takahashi Developer of “ azooKey” iOS /
macOS Developer ML Engineer @ Turing Inc. Developer of “InspirationCat” iOS Developer President @ CoeFont Inc.
None
かな漢字変換 x LLM
LLMとかな漢字変換 • GPT-3.5(2022年11月)
LLMとかな漢字変換 • GPT-4(2023年2月)
LLMとかな漢字変換 • GPT-4(2023年2月) これでいいじゃん!
良くない
GPT-4は賢い。だが…… 日本語入力システムへの導入には、課題があった。 • プライバシー:APIに膨大な個人情報を投げるわけにはいかない。 • コスト :APIの料金は普通に高い。 • 遅延 :日本語入力は1秒待てるアプリではない。
実用可能な ニューラルかな漢字変換
• GPT-4を使えば、従来手法を超えた高精度な変換が可能 • だが、GPT-4は「日本語入力システムの要件」にフィットしない • では、どこを妥協すれば解決できるか? 問題の検討
• 2023年7月にLlama 2 (Meta) が公開 ◦ オープンウェイトで、当時としては大規模・高性能だった • これをきっかけに、Llama 2をローカルで動かす手法が登場
◦ 中でもllama.cppがデファクト化していった ローカルLLMの隆盛
• プライバシー:ローカル実行できるモデルなら解決 • コスト :ローカル実行できるモデルなら解決 • 遅延 :追加で高速化が必要 ローカル推論で解決する問題
• モデル:GPT-2 (small)ならllama.cppで余裕を持ってローカルで動く 具体的に検討する①
具体的に検討する① • モデル:GPT-2 (small)ならllama.cppで余裕を持ってローカルで動く • だが、GPT-2 (small)程度のサイズで、かな漢字変換を解決できる モデルは世の中になかった
• モデル:GPT-2 (small)ならllama.cppで余裕を持ってローカルで動く • だが、GPT-2 (small)程度のサイズで、かな漢字変換を解決できる モデルは世の中になかった ◦ なければ作る 具体的に検討する①
具体的に検討する② • ローカルで動くモデルは、ローカルで学習可能 • データを用意し、手元環境(M2 Pro Mac mini)で数日学習を回す • 数回のトライアルでニューラルかな漢字変換モデルが完成
• 結果的にGPT-4oより 強いモデルができた。 • しかもローカルで動く。 具体的に検討する②
具体的に検討する③ 残る問題は遅延。 • 人間のユーザの体感では、 入力からレスポンスまで50msを超えると「重い」と感じる
残る問題は遅延。 • 人間のユーザの体感では、 入力からレスポンスまで50msを超えると「重い」と感じる • 妥協して、GPUを使える環境だけを考える 具体的に検討する③
残る問題は遅延。 • 人間のユーザの体感では、 入力からレスポンスまで50msを超えると「重い」と感じる • 妥協して、GPUを使える環境だけを考える • 「投機的デコーディング」という高速化手法に着目 具体的に検討する③
ニューラルかな漢字変換の仕組み
None
一定の妥協のもと、LLM × かな漢字変換の課題が解決 • プライバシー:GPT-4を諦めてローカル推論で解決 • コスト :GPT-4を諦めてローカル推論で解決 • 遅延 :GPUと投機的デコーディングを利用して解決 →実際にアプリケーション化し、リリース!
検討の結果
リリース後
様々なフォークが生える
評価ベンチが活用されたり、再現実装されたり
オープン化が重要 • 「社会実装」としては、azooKeyに留まらない普及も重要 • 学習用データ、学習済みモデル、ベンチマーク、学習方法などを 公開し、論文化したのは重要だった • azooKey自体は元からオープンソースで運用していたため、フォークしやすかっ たのも寄与した
• 日本語入力は「慣れ」の要素が大 きいシステム。 • かな漢字変換がよくても、他のシ ステムから移行するには精度以 前にUX面のハードルが高い。 精度以外が問題に
プロダクトとしての難しさ • かな漢字変換は、従来手法でもある程度までは精度が出る ◦ 実際、日本語入力ユーザはこの30年以上それでなんとかしていた • ニューラルかな漢字変換は 「すでに99%の精度が出ているところに、 0.9%の精度向上を売り込む」 プロダクトになる
• 商業プロダクトだったら難しかった(趣味プロジェクトなのでやれている)
「ニューラルかな漢字変換」の社会実装 • 一見相性の悪そうな「LLM × 日本語入力」を上手く実現 ◦ LLMの課題(プライバシー、コスト、遅延)をローカル実行で解決 ◦ GPT-2ベースの独自モデルでもGPT-4oを超える精度を達成 ◦
遅延対策としてGPU前提で投機的デコーディングを導入し、 実用レベルの速度を達成 • プロダクトとしては今後も改善を追求していく予定