新規事業「toitta」(インタビュー分析サービス)には複数の AI 機能があります。これらを「動く」プロトタイプレベルからリリースできる品質へ引き上げる過程で課題だったのが、プロダクトの期待を捉えた LLM 出力の評価整備です。まだ定番の方法がない中、評価にどう取り組んできたか、1年間の試行錯誤から得た知見を共有します。
Hatena Engineer Seminar #36 「プロダクトを支えるAI編」を26年1月22日にオンライン開催します #hatenatech - Hatena Developer Blog
Hatena Engineer Seminar #36 プロダクトを支えるAI編 - connpass