Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LT at nlp_career

LT at nlp_career

yag_ays

July 10, 2019
Tweet

More Decks by yag_ays

Other Decks in Programming

Transcript

  1. pytorchでBERTの⽇本語学習済みモデルを利⽤する - ⽂章埋め込み 編 / SWEM: 単語埋め込みのみを使うシンプルな⽂章埋め込み深層 学習時代の⾔語判定の最新動向 / Fasttextを⽤いた⾔語判定

    / MeCabの形態素解析の結果から正規表現を使って品詞列を抜き出 すmecabpr / 単語埋め込みにおけるout-of-vocabularyの対応 - magnitudeの初期化」 / 後処理のみで単語ベクトルの性能を向上さ せるALL-BUT-THE-TOPを使った⽇本語学習済み分散表現 / 語彙 を限定して単語ベクトルのモデルサイズを⼩さくするminify_w2v / ⽇本語Wikipediaで学習したdoc2vecモデル / Wikipediaの記事ごと のページビューを取得する / Word Embedding based Edit Distanceの実装 / 学習済み分散表現をTensorBoardで可視化する (gensim/PyTorch/tensorboardX) / Unicode絵⽂字の⽇本語読み /キーワード/分類辞書 / 漢字を構成する部⾸/偏旁のデータセッ ト / Wikipedia CirrusSearchのダンプデータを利⽤する / ⽂字の図 3
  2. 良いこと 1. 動く!使える!試せる! プロダクト作るでしょ?実験するでしょ? 2. フィードバック貰える 意⾒を貰える、間違っていれば指摘してくれる (場合もある) 3 ⼈のためになる

    ⽇本語という⼩さい⾔語の中で⾞輪の再発明してる場合じゃねぇ 4. 転職に有利 それがあなたのポートフォリオになる(コードを書けるかはものすごい⼤事) 7