Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テキストマイニングによるTwitter個人アカウントの性格推定 / Personal char...

Jumpei Sakatsu
September 17, 2018

テキストマイニングによるTwitter個人アカウントの性格推定 / Personal character estimation with Twitter - PyConJP 2018

「あなたこともっとよく知りたいの...」

こんな酔狂な願いもPythonなら叶えてくれます。
python-twitter, gensim, scikit-learnなどPythonのライブラリを利用してTwitter個人アカウントの性格推定を試みました。

スライドの詳細はブログをご覧ください。
https://jumpyoshim.hatenablog.com/entry/report-of-pyconjp-2018-lt

Jumpei Sakatsu

September 17, 2018
Tweet

More Decks by Jumpei Sakatsu

Other Decks in Programming

Transcript

  1. テキストマイニングによる テキストマイニングによる Twitter個人アカウントの性格推定 Twitter個人アカウントの性格推定 Character estimation of Twitter personal account

    by text mining Character estimation of Twitter personal account by text mining 2018‒09‒17 PyCon JP 2018 @jumpyoshim (Twitter/Qiita/GitLab/GitHub/はてなブログ) / 吉村 潤平 iRidge, Inc. ‒ Gold Sponsor
  2. 形態素解析(Morphological analysis) 形態素解析(Morphological analysis) 形態素解析 ‒ Wikipedia 形態素解析 ‒ Wikipedia

    形態素解析(けいたいそかいせき、Morphological Analysis)とは、文 法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語 の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素 (Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分 割し、それぞれの形態素の品詞等を判別する作業である
  3. 特徴ベクトル(Feature vector) 特徴ベクトル(Feature vector) gensim ‒ PyPI gensim ‒ PyPI

    Gensim is a Python library for topic modelling, document indexing and similarity retrieval with large corpora. Target audience is the natural language processing (NLP) and information retrieval (IR) community.
  4. 文書分類器(Document classifier) 文書分類器(Document classifier) エゴグラム ‒ Wikipedia エゴグラム ‒ Wikipedia

    エゴグラム (Egogram) とは、エリック・バーン (Eric Berne) の交流分 析における自我状態をもとに、弟子であるジョン・M・デュセイ (John M. Dusay) が考案した性格診断法で、人の心を5つに分類し、その5つの 自我状態が放出する心的エネルギーの高さをグラフにしたもののこと であ る