Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「ニューラルかな漢字変換」の 社会実装
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Keita Miwa
May 23, 2026
71
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
「ニューラルかな漢字変換」の 社会実装
生成AI会 Vol.2@渋谷(LLMプロダクト開発・ハーネスエンジニアリング)の発表資料です。
https://seisei-ai.connpass.com/event/388188/
Keita Miwa
May 23, 2026
More Decks by Keita Miwa
See All by Keita Miwa
iOSのKeyboard Extensionで日本語入力できるキーボードアプリを作ろう! - iOSDC2023
miwa_keita
0
3k
Featured
See All Featured
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
HDC tutorial
michielstock
2
720
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
950
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.4k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
230
23k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
Building the Perfect Custom Keyboard
takai
2
800
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
55k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Navigating Weather and Climate Data
rabernat
0
240
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.5k
Transcript
「ニューラルかな漢字変換」の 社会実装 生成AI会 Vol.2@渋谷
Keita Miwa Naoki Takahashi Developer of “ azooKey” iOS /
macOS Developer ML Engineer @ Turing Inc. Developer of “InspirationCat” iOS Developer President @ CoeFont Inc.
None
かな漢字変換 x LLM
LLMとかな漢字変換 • GPT-3.5(2022年11月)
LLMとかな漢字変換 • GPT-4(2023年2月)
LLMとかな漢字変換 • GPT-4(2023年2月) これでいいじゃん!
良くない
GPT-4は賢い。だが…… 日本語入力システムへの導入には、課題があった。 • プライバシー:APIに膨大な個人情報を投げるわけにはいかない。 • コスト :APIの料金は普通に高い。 • 遅延 :日本語入力は1秒待てるアプリではない。
実用可能な ニューラルかな漢字変換
• GPT-4を使えば、従来手法を超えた高精度な変換が可能 • だが、GPT-4は「日本語入力システムの要件」にフィットしない • では、どこを妥協すれば解決できるか? 問題の検討
• 2023年7月にLlama 2 (Meta) が公開 ◦ オープンウェイトで、当時としては大規模・高性能だった • これをきっかけに、Llama 2をローカルで動かす手法が登場
◦ 中でもllama.cppがデファクト化していった ローカルLLMの隆盛
• プライバシー:ローカル実行できるモデルなら解決 • コスト :ローカル実行できるモデルなら解決 • 遅延 :追加で高速化が必要 ローカル推論で解決する問題
• モデル:GPT-2 (small)ならllama.cppで余裕を持ってローカルで動く 具体的に検討する①
具体的に検討する① • モデル:GPT-2 (small)ならllama.cppで余裕を持ってローカルで動く • だが、GPT-2 (small)程度のサイズで、かな漢字変換を解決できる モデルは世の中になかった
• モデル:GPT-2 (small)ならllama.cppで余裕を持ってローカルで動く • だが、GPT-2 (small)程度のサイズで、かな漢字変換を解決できる モデルは世の中になかった ◦ なければ作る 具体的に検討する①
具体的に検討する② • ローカルで動くモデルは、ローカルで学習可能 • データを用意し、手元環境(M2 Pro Mac mini)で数日学習を回す • 数回のトライアルでニューラルかな漢字変換モデルが完成
• 結果的にGPT-4oより 強いモデルができた。 • しかもローカルで動く。 具体的に検討する②
具体的に検討する③ 残る問題は遅延。 • 人間のユーザの体感では、 入力からレスポンスまで50msを超えると「重い」と感じる
残る問題は遅延。 • 人間のユーザの体感では、 入力からレスポンスまで50msを超えると「重い」と感じる • 妥協して、GPUを使える環境だけを考える 具体的に検討する③
残る問題は遅延。 • 人間のユーザの体感では、 入力からレスポンスまで50msを超えると「重い」と感じる • 妥協して、GPUを使える環境だけを考える • 「投機的デコーディング」という高速化手法に着目 具体的に検討する③
ニューラルかな漢字変換の仕組み
None
一定の妥協のもと、LLM × かな漢字変換の課題が解決 • プライバシー:GPT-4を諦めてローカル推論で解決 • コスト :GPT-4を諦めてローカル推論で解決 • 遅延 :GPUと投機的デコーディングを利用して解決 →実際にアプリケーション化し、リリース!
検討の結果
リリース後
様々なフォークが生える
評価ベンチが活用されたり、再現実装されたり
オープン化が重要 • 「社会実装」としては、azooKeyに留まらない普及も重要 • 学習用データ、学習済みモデル、ベンチマーク、学習方法などを 公開し、論文化したのは重要だった • azooKey自体は元からオープンソースで運用していたため、フォークしやすかっ たのも寄与した
• 日本語入力は「慣れ」の要素が大 きいシステム。 • かな漢字変換がよくても、他のシ ステムから移行するには精度以 前にUX面のハードルが高い。 精度以外が問題に
プロダクトとしての難しさ • かな漢字変換は、従来手法でもある程度までは精度が出る ◦ 実際、日本語入力ユーザはこの30年以上それでなんとかしていた • ニューラルかな漢字変換は 「すでに99%の精度が出ているところに、 0.9%の精度向上を売り込む」 プロダクトになる
• 商業プロダクトだったら難しかった(趣味プロジェクトなのでやれている)
「ニューラルかな漢字変換」の社会実装 • 一見相性の悪そうな「LLM × 日本語入力」を上手く実現 ◦ LLMの課題(プライバシー、コスト、遅延)をローカル実行で解決 ◦ GPT-2ベースの独自モデルでもGPT-4oを超える精度を達成 ◦
遅延対策としてGPU前提で投機的デコーディングを導入し、 実用レベルの速度を達成 • プロダクトとしては今後も改善を追求していく予定