評価 2020-12-01 A k 4 2020-12-22 A m 5 2021-02-01 A l 3 ユーザの評価が明示的に与えられている アイテムに対するネガティブな反応も直 接得ることができる ユーザがアイテムを購入したという情報しかな いため負例が存在しない。 (購入していない ≠ ユーザが好まないアイテム) 日時 ユーザ アイテム 2020-12-01 A k 2020-12-22 A m 2021-02-01 A l
week label feature A k 103 1 xxx A m 103 0 xxx A B C データセット作成のTips: • 正例は全て学習に使うのではなく候補として上がった正例アイテムのみを使用する • 正例を1つも含まないuserはデータセットから除く • 負例の比重が多くなるので必要に応じてnegative sampling • 既に販売されていないアイテムを除く
というものを利用しユーザのアクティブ度合いに 応じてNNを分けて学習するよう工夫 4th place solution https://www.kaggle.com/competitions/h-and-m-personalized-fashion-recommendations/discussion/324094 Two tower NN modelによる候補生成