論文紹介: "Webformer: Pre-training with Web Pages for Information Retrieval (SIGIR2022)"
IR Reading 2022 秋にて紹介した "Webformer: Pre-training with Web Pages for Information Retrieval(SIGIR2022)" の概要スライドです.Web ページのテキストと構造情報の両方を使った事前学習方法を提案した研究です.不適切な記述などがあればご指摘頂ければ幸いです .
• 構造化⽂書検索のモチベーション例 o タイトル中にクエリ語が出てくるのは重要 o <jewelry>Ruby と <skill>Ruby の価値は違う • 代表的な構造化⽂書検索⼿法:BM25F o F は field (タグのこと) を表す o BM25 の語の重み wterm にタグの重要度 wfield を乗算 2022.11.12 IRReading2022秋 5