論文紹介:Trustworthy LLMs: a Survey and Guideline for Evaluating Large Language Models' Alignment
https://huggingface.co/papers/2308.05374
ByteDance ResearchがAugust 9, 2023に出した論文です。
AIの信頼性で予測の不確実性とかHITLを中心に取り組む身として、読んだ内容を共有します。
※論文内にセンシティブな話題が入っているので、苦手な方は注意してください。