Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ローカルLLMを使ってB2Bサービスを作っていての学び

 ローカルLLMを使ってB2Bサービスを作っていての学び

Avatar for Hiroshige Umino

Hiroshige Umino

June 02, 2026

More Decks by Hiroshige Umino

Other Decks in Programming

Transcript

  1. 自己紹介 海野弘成(@yaotti / やおっち) Qiita (プログラミング情報共有サービス) の創業社長 newmo (タクシー・ライドシェア) でLLMによる電話対応サービスのプロトタイ

    プ→運用(対応率が70%から100% / GENIAC PRIZE 1位) 今年2月に ACK Craft 株式会社 を京都で創業、 「ツギキ(継木)AI」を開発中 「頭の中にある知見や経験を形にする」 に興味があります 2
  2. 業務引き継ぎ支援AI「ツギキ」— ロ ーカルLLM前提のMacアプリ 退職・異動で消える 業務の暗黙知 を、 作業中の画面録画を見せるだけ でマニュアルに するサービス Macアプリ(メニューバー常駐)

    業務情報が対象 → 外部APIは使わずロー カルLLM(gemma4:e4b(約9.6GB) + Ollama)で ローカル完結 観る → まとめる → 聞く の3ステップで、 そこそこ妥当な叩き台 が出る 現在、一部の企業とトライアル(PoC)中 3
  3. 失敗②:処理に時間がかかりすぎる マニュアル生成が30分待っても 2/6 しか進まない。ログを見ると 10s: 0トークン受信 20s: 0トークン受信 ... 170s:

    0トークン受信 最初のトークン受信: 170s 170秒沈黙し続けており、その間ずっとMacは発熱していた 6
  4. 原因:thinking の出力を、content だけ見ていた gemma4:e4b は デフォルトで thinkingモード 出力の大半が message.thinking へ

    message.content は 空のまま → 「沈黙」に見えた Ollama /api/chat に渡す body に think: false を1つ const payload = { model: "gemma4:e4b", messages, stream: true, think: false, // ← options の中ではなく body 直下! options: { temperature: 0.3, num_ctx: 8192 }, }; // fetch(`${OLLAMA}/api/chat`, { body: JSON.stringify(payload) }) 7