Upgrade to Pro — share decks privately, control downloads, hide ads and more …

論文紹介: Dynamic Demonstration Retrieval and Cogni...

Avatar for Tagai Nao Tagai Nao
November 09, 2024

論文紹介: Dynamic Demonstration Retrieval and Cognitive Understanding for Emotional Support Conversation (D2RCU) (SIGIR 2024)

IR Reading 2024 秋 での論文紹介に用いた資料を公開します。
https://sigirtokyo.github.io/post/2024-11-09-irreading_2024fall/

紹介した論文
Dynamic Demonstration Retrieval and Cognitive Understanding for Emotional Support Conversation (D2RCU) (SIGIR 2024)

Avatar for Tagai Nao

Tagai Nao

November 09, 2024
Tweet

Other Decks in Research

Transcript

  1. IR Reading2024 秋 発表者:筑波⼤学 加藤研究室 ⽥⾙ 奈央 Dynamic Demonstration Retrieval

    and Cognitive Understanding for Emotional Support Conversation (D2RCU) Zhe Xu, Daoyuan Chen, Jiayi Kuang, Zihao Yi, Yaliang Li, Ying Shen
  2. 感情的なサポートを提供する対話システム ECS: Emotional Support Conversation 研究背景 • ユーザがネガティブな感情に陥って いるときに共感的な応答を⽣成して ⽀援する

    • 共感、慰め、具体的な助⾔の提供 • カウンセリング、メンタルヘルスサ ポート、カスタマーサポートなどで 有効 • ユーザ体験の向上にもつながる 状況 数⽇前、私は階段を降りる際に転び、2本の前⻭を⽋けさ せ、⾜も折れました。⾜の⼿術を受ける必要があり、⻭科 でクラウンを⽤いて⻭の治療を受ける必要があります。 ⽀援者 ⽀援を 求める⼈ あまり良くありません。 数⽇前に階段から転んで⾜を⾻折し、 2本の前⻭を⽋けさせました。 ⽀援者 ああ、それは本当に痛そうですね。 何か医療⽀援を受けることはできますか? こんにちは、何か話したいことはありますか? 1
  3. ⽀援を求める⼈の状況・状態に応じて段階的に応答を進める[1] 研究背景 ⽀援者 探索フェーズ 状況や感情を理解し話を引き出す それは⼤変でしたね。 他に何か痛みや不安を感じていますか? 安⼼感の提供 フェーズ ⽀援者

    共感を⽰し、安⼼感を与える あなたが今感じている⾟さや痛み、本当に⼼ からお察しします。そんな中でも、お話しい ただきありがとうございます。 ⾏動フェーズ ⽀援者 励まし、具体的な⾏動を促す もし今後不安を感じたら、いつでも私に相談 してください。無理をせず、少しずつ前に進 んでいきましょうね。 2 [1] Clara E Hill. 2009. Helping skills: Facilitating, exploration, insight, and action. American Psychological Association.
  4. 関連研究 関連研究 課題 共通知識の活⽤[2] COMETを⽤い 共通知識を取得し 感情や⽂脈を考慮 認知理解が不⾜し 応答の多様性が制限 感情の模倣と戦略の予測[3]

    感情を模倣し 戦略を予測し応答⽣成 深い⽂脈理解や 認知的な応答⽣成が不⾜ 強化学習と戦略選択[4] 強化学習を⽤い ⽀援を求める⼈の反応に合わせ た最適な戦略を選択 認知的⽂脈理解が不⼗分 個別対応が困難 ペルソナを考慮した 戦略的デコーディング[5] ペルソナ情報を⽤いて 戦略的な応答を⽣成 認知⽂脈理解が不⾜し、複雑な 状況対応に限界 3 [2] Cheng, Y., Liu, W., Li, W., Wang, J., Zhao, R., Liu, B., ... & Zheng, Y. (2022). Improving multi-turn emotional support dialogue generation with lookahead strategy planning. arXiv preprint arXiv:2210.04242. [3] Sabour, S., Zheng, C., & Huang, M. (2022, June). Cem: Commonsense-aware empathetic response generation. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 36, No. 10, pp. 11229-11237). [4] Cheng, Y., Liu, W., Li, W., Wang, J., Zhao, R., Liu, B., ... & Zheng, Y. (2022). Improving multi-turn emotional support dialogue generation with lookahead strategy planning. arXiv preprint arXiv:2210.04242.. [5] Rogers, A., Boyd-Graber, J., & Okazaki, N. (2023, July). Findings of the Association for Computational Linguistics: ACL 2023. In Findings of the Association for Computational Linguistics: ACL 2023.
  5. ⽂脈に応じた過去の例を活⽤し ユーザの認知状態を理解して共感的な応答を⽣成 Challenge ⽀援を 求める⼈ 家族が⾯倒を⾒てくれることに感謝して いますが、私は松葉杖をつき⾜を冷やし ていない時はブーツを履いています。 ペルソナ 私が松葉杖をついている間、家族が⾯倒⾒てくれる。

    先⽇⾜を⾻折し、前⻭を2本折った。 ⽀援者 家族が気にかけてくれることはいいことです。 私も、ギプスをつけることが決まったら、私も きっと落ち込みます。 戦略:⾃⼰開⽰ Challenge2: 認知的状況理解 Challenge1:動的デモンストレーションの取得 彼⼥(娘)が助けを必要としているときに伝えてくれるように、また助 けを受け⼊れる意思を持ってくれるように促してください。 私の友⼈たちがこのような状況でしているのを⾒た限りでは、娘さんが 興味を持っていることを⾒つけてみるのが良いと思います。 難しいかもしれませんが、⽇光は私たちの気分にとって重要です。時間 があるときに⼀息つける瞬間を⾒つけられると良いですね。 私には⼦供はいませんが、散歩に連れて⾏ってくれる⽝がいます。 本当にありがとう! どういたしまして!お役に⽴てて嬉しいです! ⾃⼰開⽰ その他 感情の反映 1st 2nd 3rd In-context Learning COMET: ⼊⼒から常識を獲得 Want Need Intent Effect 健康であること 良くなること 気分が良くなること 安全であること 医者に⾏くこと 痛みを感じること ギプスをつけること 健康であること シャワーを浴びること 良くなること 仕事に⾏くこと 休息を取ること 絆創膏を貼ること ギプスをしていること ギプスをつけること 痛みを感じること 4
  6. 提案⼿法 ‒ D2RCU (1)動的デモンストレーション取得と(2)認知的状況理解を (3)多知識融合デコーダで組み合わせ応答⽣成するD2RCUを提案[6] (1) 動的デモンストレーション取得 (2) 認知的状況理解 (3)

    多知識融合デコーダ 5 [6] XU, Zhe, et al. Dynamic demonstration retrieval and cognitive understanding for emotional support conversation. In: Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2024. p. 774-784.
  7. • ユーザの現在の状況、感情に応じて過 去の会話データから⽂脈に適した応答 例を動的に取得 • 得られた例は応答⽣成の参考に⽤いる ◦ ⽂脈的な関連性や共感性を⾼める • ⼊⼒されたクエリ(persona,

    post)を 元にDPRを⽤いてクエリとパッセージ (strategy, response)のペアを得る • In-context Learningの例として扱う コンポーネント① 動的デモンストレーションセレクタ 6
  8. コンポーネント② 認知的側⾯状況理解 post context Want Need Intent Effect 健康であること 良くなること

    気分が良くなること 安全であること 医者に⾏くこと 痛みを感じること ギプスをつけること 健康であること シャワーを浴びること 良くなること 仕事に⾏くこと 休息を取ること 絆創膏を貼ること ギプスをしていること ギプスをつけること 痛みを感じること Cognitive Encoder Cognitive Refiner Cognitive Selector Cognitive State 𝐂𝐎𝐌 COMET Want Need Intent Effect 良くなること ギプスをつけること 良くなること ギプスをつけること 痛みを感じること ⼈間の常識的な推論を⽣成 認知的な⽂脈表現を獲得 𝐸! " = Encoder(COM") 𝑈! #$! = 𝐻%&'⨁ℎ% #$! 𝐻! (#) = Enc"#)(𝑈% #$!) 認知情報をエンコード エンコードされた認知情報ℎ% #$!と 対話履歴全体の⽂脈情報𝐻%&' を結合 𝐶𝑇𝑋 = 𝑢! ⨁𝑢" ⨁ ⋯ ⨁𝑢# 𝐻! #$! = Enc#$!(𝐸! ") 𝐻! *#+ = Sigmoid(𝐻% (#)) ⊙ 𝐻% (#) 𝐻! = MLP(𝐻% *#+) 利⽤する認知表現を選択 𝑯𝒄 7
  9. • データセット ◦ ESConvデータセット:⽀援者と⽀援を求める⼈の対話で構築 ◦ 各対話は平均約29.8ターン • 評価指標 ◦ 戦略予測精度(ACC)

    ◦ パープレキシティ(PLL) ◦ BLEUスコア(B-1,B-2,B-3,B-4) ◦ 多様性指標(D-1,D-2) ◦ ROUGE-L(R-L) ◦ 総合スコア( ̅ 𝑠norm) • 学習 ◦ モデル:Blenderbot-small 実験設定 9