Roee Shraga(Israel Institute of Technology), Haggai Roitman, Guy Feigenblat, Mustafa Canim (IBM Research AI) (The Web Conference 2020) 紹介する⼈ 筑波⼤学加藤研究室 D1 中野 優 https://sites.google.com/view/yu-nakano
‒ 既存の表の検索 [1][2][本論⽂] • Web ページに含まれる表の中から クエリに関連する表を検索する ‒ 表の⽣成 [3] • 検索結果のために表を⽣成 [1] Cafarella et al., WebTables: Exploring the Power of Tables on the Web. In VLDB 2008. [2] Zhang and Balog, Ad Hoc Table Retrieval using Semantic Similarity. In WWW 2018. [3] Zhang and Balog, On-the-fly Table Generation. In SIGIR 2018. 図は https://www.google.com/search?q=りんご+⽣産量+市町村 より (2020/06/21 閲覧) 2
での応⽤が多いが⽂書検索の研究もある [7] Extrinsic な類似度の計算 8 Extrinsic な類似度の計算⼿順 表 BM25などで クエリとの スコアを計算 表どうしの 類似度を計算 表 A 表 B 表 C 類似度 ⼤ 類似度 ⼩ スコア 表A 0.90 表B 0.50 表C 0.55 多様体 ランキング スコア 表A 0.80 表B 0.60 表C 0.55 もとのスコアを保ちつつ 類似度が⼤きい表の スコアを近くする [5] Zhou et al., Ranking on data manifolds. In NIPS 2004. [6] Xu et al., Efficient Manifold Ranking for Image Retrieval. In SIGIR 2011. [7] Wan et al., Towards a unified approach to document similarity search using manifold-ranking of blocks. Information Processing & Management 44.3 (2008).