・実験1: 多様なエージェント生成方法(逐次、並列、フィルタリング付き並 列)を比較し、コンテキスト認識型の逐次生成法が最も多様性の高いエージェ ントとニーズを生成。 ・実験2: 自動、ステアリング付き自動、手動のELU(共感的リードユーザー) エージェント生成方法を比較し、LLMエージェントが従来の人間インタビュー よりも多くの潜在的ニーズを特定(平均8.8〜10.9個vs約6個)。 ・実験3: LLMによる潜在的ニーズの自動検出を評価し、基準と Chain-of-Thought推論を組み合わせることで高い精度(適合率、再現率、F1ス コア全てで0.95)を達成。 検証方法と結果 ・生成されるインサイトの質はLLMの能力に依存しており、LLMの進化ととも に改善されることが期待される。 ・潜在的ニーズの優先順位付けは設計者の役割であり、完全に自動化されてい ない。 ・今後の研究として、Elicitronが設計者を支援する能力の検証、マルチエー ジェント間の相互作用探索、マルチモーダル入出力の統合などが挙げられてい る。 手法の限界と今後の課題 Fig. 4 Comparison of the average number of latent needs identified by each user agent across the experimental conditions. Fig. 2 Four groups of users' embeddings after reducing dimensions to 2 using t-SNE. Mohammadmehdi Ataei et al, 2024 https://arxiv.org/abs/2404.16045