「見せ球」「作って終わり」LLM機能卒業のために

「見せ球」「作って終わり」のLLM機能卒業のために 2024.04.24 LLM Night〜本番運用して気づいた課題と学び〜 Ryo Kaneoka SmartHR Product Manager

• リリース前にすること ◦ LLMを交えた機能は、深く課題と限界を理解して、動くものを早く作り切る • リリース後にすること ◦ フィードバックは強めに取りに行く • この2つができれば、社内外に上手く訴求してリリースし、きちんと
ユーザー課題を解決した上でビジネスになるように LLMを使えるはず今日話すこと　これだけは覚えて帰ってほしい

• 開発の詳細 ◦ プロンプトのノウハウや評価パイプラインの話は情報が増えてきたので、今日は特に現場感あるお話にフォーカスして話します！今日あまり話さないこと

Ryo Keneoka（@ryopenguin） • プロダクトマネージャー • SmartHRには2020年10月に入社 • 「従業員サーベイ」「スキル管理」の PM •
LLM利用のタスクフォース、AIの R&Dチームを立ち上げ自己紹介

アジェンダ • はじめに - SmartHRとLLMについて • よくある課題とリリース前後で2つの提案 • リリース前：深く課題と限界を理解して、動くものを早く作り切る •
リリース後：フィードバックは強めに取りに行く • 結論

はじめに - SmartHRとLLMについて

SmartHRの主な機能

オプションの従業員サーベイで「要約AI」機能をリリース

部門横断でLLMハッカソン実施

AIポリシーの策定、AI研究室の立ち上げ AI研究室以後、各プロダクトでのLLM活用を模索

よくある課題とリリース前後で2つの提案

LLMのプロダクト開発、こんな課題はありませんか？社内PoCでとどまるフィードバックが集まらない最初は話題にはなるけど実際には使われない

SmartHRでも顕在化サーベイ要約機能は出せたが、その他の機能がなかなか前に進まない　ユーザーには使われていても、フィードバックが十分ではない

「見せ球」「作って終わり」にしない何かが必要 LLM機能のローンチは検証や開発を含め高コストなものユーザーとビジネスに意味がないともったいなすぎる

リリース前後での2つの提案 • リリース前にすること ◦ LLMを交えた機能は、深く課題と限界を理解して、動くものを早く作り切る • リリース後にすること ◦ フィードバックは強めに取りに行く

リリース前：深く課題と限界を理解して、動くものを早く作り切る

リリース前：深く課題と限界を理解して、動くものを早く作り切るユーザーのコストが想像できるまで課題を理解する LLMの速度・価格・知性の限界を把握しておく動くものを早く作るこのフェーズで紹介すること https://www.vellum.ai/llm-leaderboard https://www.productboard.com/agile-product-management-tool/

リリース前（1/3）ユーザーのコストが想像できるまで課題を理解する LLM利用機能を考える前に人的コストが想像できるレベルにユーザー解像度を上げるのが実は近道要望蓄積SaaSやユーザーインタビューを常に行えるようにする要望を集める仕組みを整備するユーザー課題を解像度高く把握する「サーベイ」のユーザーが数百人以上の自由記述回答を全て読んでいる
ことを知っていた https://www.productboard.com/agile-product-management-tool/

リリース前（2/3）LLMの価格・知性・速度の限界を把握しておくユースケース、ビジネスモデル、ユーザーペルソナによって取れる選択肢は変わってくるリクエストや扱うトークンが多いとGPT-4では厳しいタスクによっては、 GPT-3.5でなんとかなるケースも（例：RAG、要約）利用者が従業員か管理者かで待てる時間は変わってくる価格
知性速度 https://www.vellum.ai/llm-leaderboard https://azure.microsoft.com/ja-jp/prod ucts/ai-services/openai-service

リリース前（3/3）動くものを早く作る未知の技術を使ったソリューションは動くものがないと価値や制約がわからないここはプロダクトアウトに、動くプロトタイプを作ってしまう

「深く課題と限界を理解して、動くものを早く作り切る」効果 ROIの見込みとLLM機能である必然性があってはじめて上手くいくこれらがないとどこかで頓挫するし、ユーザーにも訴求しにくいユーザーのコスト、使うべき LLMと原価が把握でき、 ROIを推測できる投資余地、ROIを推測できるソリューションが適切か評価できるプロトタイピングで本当に
ユーザーの課題を解決できるかも推測できる

「要約AI」機能は3つのアクションが取れたので使われたのかも

リリース後：フィードバックは強めに取りに行く

リリース後：ユーザーフィードバックは強めに取りに行くこのフェーズで紹介することタスク完了時にすぐフィードバックを依頼するユーザーと一緒に操作する

フィードバック収集は、弊社でもうまくできていない部分です 🙏 現時点では後述のように強めに取りに行くしかないと思っているが …パネルディスカッションで議論させてください！ disclaimer：フィードバック収集については…

タスクによっては、機能が役に立ったかがわからない人間が実施していたタスクを LLMに置き換えると「本当に役に立ったか」がわからないプロンプト含めて、本来は改善したい

Good/Badボタンは押されない Good/Badボタンを基本ユーザーは押さない「要約AI」はアンケートへのリンクも用意したが、ほぼ入力されなかった

リリース後（1/2）タスク完了時にすぐフィードバックを依頼するタスク完了時に依頼したり、出力の ABテストをするのは一定有効そう（ ChatGPTに学ぶ）

リリース後（2/2）ユーザーと一緒に操作するユーザビリティテストのように、ユーザーと一緒に画面を見ながら操作するのも有効かも

「フィードバックを強めに取りに行く」効果ソフトウェアプロダクトはリリースして終わりでないのは LLMを使っても一緒特にプロンプトのブラッシュアップは永遠の課題ユーザーの実データで本当に意図した挙動になっているか把握し、適応するユーザーの現場に適応できるモデル仕様の変更など、異常に対応できる APIプロバイダの仕様変更でハルシネーションしてないかなど、チェックは常にしたい
https://openai.com/blog/new-embedding-models-and-api-updates

フィードバック収集は、弊社でもうまくできていない部分です 🙏 現時点では前述のように強めに取りに行くしかないと思っているが …パネルディスカッションで議論させてください！ disclaimer（再掲）：フィードバック収集については…

結論

• リリース前にすること ◦ LLMを交えた機能は、深く課題と限界を理解して、動くものを早く作り切る • リリース後にすること ◦ フィードバックは強めに取りに行く • この2つができれば、社内外に上手く訴求してリリースし、きちんと
ユーザー課題を解決した上でビジネスになるように LLMを使えるはず今日の結論　これだけは覚えて帰ってほしい

ご静聴ありがとうございました！

「見せ球」「作って終わり」LLM機能卒業のために

「見せ球」「作って終わり」LLM機能卒業のために

ryopenguin

More Decks by ryopenguin

Other Decks in Technology

Featured

Transcript

「見せ球」「作って終わり」のLLM機能卒業のために 2024.04.24 LLM Night〜本番運用して気づいた課題と学び〜 Ryo Kaneoka SmartHR Product Manager

• 開発の詳細 ◦ プロンプトのノウハウや評価パイプラインの話は情報が増えてきたので、今日は特に現場感あるお話にフォーカスして話します！今日あまり話さないこと

Ryo Keneoka（@ryopenguin） • プロダクトマネージャー • SmartHRには2020年10月に入社 • 「従業員サーベイ」「スキル管理」の PM •

アジェンダ • はじめに - SmartHRとLLMについて • よくある課題とリリース前後で2つの提案 • リリース前：深く課題と限界を理解して、動くものを早く作り切る •

はじめに - SmartHRとLLMについて

SmartHRの主な機能

SmartHRの主な機能

オプションの従業員サーベイで「要約AI」機能をリリース

部門横断でLLMハッカソン実施

AIポリシーの策定、AI研究室の立ち上げ AI研究室以後、各プロダクトでのLLM活用を模索

よくある課題とリリース前後で2つの提案

LLMのプロダクト開発、こんな課題はありませんか？社内PoCでとどまるフィードバックが集まらない最初は話題にはなるけど実際には使われない

SmartHRでも顕在化サーベイ要約機能は出せたが、その他の機能がなかなか前に進まない　ユーザーには使われていても、フィードバックが十分ではない

「見せ球」「作って終わり」にしない何かが必要 LLM機能のローンチは検証や開発を含め高コストなものユーザーとビジネスに意味がないともったいなすぎる

リリース前後での2つの提案 • リリース前にすること ◦ LLMを交えた機能は、深く課題と限界を理解して、動くものを早く作り切る • リリース後にすること ◦ フィードバックは強めに取りに行く

リリース前：深く課題と限界を理解して、動くものを早く作り切る

リリース前（3/3）動くものを早く作る未知の技術を使ったソリューションは動くものがないと価値や制約がわからないここはプロダクトアウトに、動くプロトタイプを作ってしまう

「要約AI」機能は3つのアクションが取れたので使われたのかも

リリース後：フィードバックは強めに取りに行く

リリース後：ユーザーフィードバックは強めに取りに行くこのフェーズで紹介することタスク完了時にすぐフィードバックを依頼するユーザーと一緒に操作する

タスクによっては、機能が役に立ったかがわからない人間が実施していたタスクを LLMに置き換えると「本当に役に立ったか」がわからないプロンプト含めて、本来は改善したい

Good/Badボタンは押されない Good/Badボタンを基本ユーザーは押さない「要約AI」はアンケートへのリンクも用意したが、ほぼ入力されなかった

リリース後（1/2）タスク完了時にすぐフィードバックを依頼するタスク完了時に依頼したり、出力の ABテストをするのは一定有効そう（ ChatGPTに学ぶ）

リリース後（2/2）ユーザーと一緒に操作するユーザビリティテストのように、ユーザーと一緒に画面を見ながら操作するのも有効かも

結論

ご静聴ありがとうございました！