L M ア プ リ の 評 価 ( L L M a s a J u d g e ) 7 LLMを評価に用いるメリットとは? RAG Agents/Tool use cases Natural Language Comparison SQL General purpose Others 自然言語の意味を考慮した評価ができる! 人を介さず自動で評価ができる! 評価の定量化も可能! AWS Step Functions上に 評価パイプラインを構築! LLMアプリの評価を支援・強化してくれる 便利なPythonライブラリ