/ MeCabの形態素解析の結果から正規表現を使って品詞列を抜き出 すmecabpr / 単語埋め込みにおけるout-of-vocabularyの対応 - magnitudeの初期化」 / 後処理のみで単語ベクトルの性能を向上さ せるALL-BUT-THE-TOPを使った⽇本語学習済み分散表現 / 語彙 を限定して単語ベクトルのモデルサイズを⼩さくするminify_w2v / ⽇本語Wikipediaで学習したdoc2vecモデル / Wikipediaの記事ごと のページビューを取得する / Word Embedding based Edit Distanceの実装 / 学習済み分散表現をTensorBoardで可視化する (gensim/PyTorch/tensorboardX) / Unicode絵⽂字の⽇本語読み /キーワード/分類辞書 / 漢字を構成する部⾸/偏旁のデータセッ ト / Wikipedia CirrusSearchのダンプデータを利⽤する / ⽂字の図 3