PharmaXは、健康を一生涯サポートするかかりつけオンライン薬局『YOJO』を運営しています。
YOJOでは、LLMのマルチエージェント・アプリケーションを構築し、メッセージの薬剤師への提案や一部自動送信を行っています。LLMを用いることで、柔軟でパーソナライズされた対応が迅速に可能になり、ユーザーのメッセージ返信率や初回購入率・継続率が劇的に向上しました。また、安全性担保のため、LLMの出力のリアルタイム評価と、基準値を下回った場合の再生成機能なども導入しています。
PharmaXでは、本番の入出力を修正して、ファインチューニングを活用することで、LLMアプリケーションのコスト削減と精度向上を達成しています。
また、蒸留を活用することで、コスト削減を実現しています。
その成果を下記のような記事にまとめて公開したところ大きな反響をいただきました。
- [GPT-4o-miniのファインチューニングのすゝめ](https://zenn.dev/pharmax/articles/40c0e385a8956b)
- [OpenAIの蒸留機能(Model Distillation)を使って運用中のLLMのコストを削減する取り組み](https://zenn.dev/pharmax/articles/f4ae12a91cca45)
ただし、LLMアプリケーションの精度向上には、ファインチューニングの前にプロンプトエンジニアリングで対応すべきだと考えています。
ここでは、ファインチューニング・蒸留の使い所、気をつけるべきことをまとめてお伝えします。