Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLM 商品規格萃取大冒險- Vila

LLM 商品規格萃取大冒險- Vila

Avatar for LINE Developers Taiwan

LINE Developers Taiwan PRO

October 20, 2025
Tweet

Transcript

  1. 淨化試煉 最大化訊號雜訊比 (SNR) • 抑制結構性雜訊 • 分流極端樣本 • 可觀測性 領域詞庫

    + 統計門檻 • 促銷語 • 表情符號 • 附加資訊 北北基 500 桃竹苗 800 中彰投 1000 女神節 免運 滿額贈
  2. 詠唱學院 來源與規格雙層優先序 • 資料來源優先序 • 商品名稱 -> 簡述 ->長述 ->

    網頁資訊 • 規格萃取優先序 • 品牌-> 型號-> 系列名稱 注意力 !
  3. 詠唱學院 禁制範例 目標規格 模型推論 事實 自動生成規格 品牌 華碩 沒有品牌 變造商品數值

    容量 6公升 500 毫升清潔液,整箱 12 瓶 不得自行推論 電流 100A 沒有電流 商品編碼 100a2504 產地 德國 台灣製的德國風格安全帽
  4. 詠唱學院 範例驅動 • 標註準備訓練集,將耗費大量人力和時間 • 少量高品質的熱門商品 Triantafillou, E., Zhu, T.,

    Dumoulin, V., Lamblin, P ., Evci, U., Xu, K., Goroshin, R., Gelada, C., Swersky, K., Manzagol, P.-A., & Larochelle, H. (2020). Meta-Dataset: A dataset of datasets for learning to learn from few examples. In *International Conference on Learning Representations (ICLR 2020)*.