Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

osaka_tamai.pdf

Avatar for tama-chang tama-chang
October 11, 2019

 osaka_tamai.pdf

Avatar for tama-chang

tama-chang

October 11, 2019
Tweet

More Decks by tama-chang

Other Decks in Technology

Transcript

  1. 3 自己玹介 玉井 励タマむ レむ • デヌタアナリティクス事業本郚 • 倧阪オフィス勀務 •

    奈良県奈良垂出身 • 奈良県葛城垂圚䜏 • 矀れない 媚びない 頑匵らない
  2. 35 スティヌブン・セガヌルの受賞歎 ゎヌルデンラズベリヌ賞 • 最䜎監督賞受賞『沈黙の芁塞』、最䜎䜜品賞ノミネヌト『沈黙の芁塞』、 最䜎䞻挔男優賞ノミネヌト『沈黙の芁塞』1994幎 • 最䜎助挔男優賞ノミネヌト『゚グれクティブ・デシゞョン』1996幎 • 最䜎䞻挔男優賞ノミネヌト『沈黙の断厖』、最䜎䞻題歌賞ノミネヌト『沈

    黙の断厖』、最䜎䜜品賞ノミネヌト『沈黙の断厖』、最䜎スクリヌン・カッ プル賞ノミネヌト『沈黙の断厖』1997幎 • 最䜎䞻挔男優賞『奪還 DAKKAN -アルカトラズ-』2002幎 https://ja.wikipedia.org/wiki/%E3%82%B9%E3%83%86%E3%82%A3% E3%83%BC%E3%83%B4%E3%83%B3%E3%83%BB%E3%82%BB%E3 %82%AC%E3%83%BC%E3%83%AB
  3. 43 分類 • このメヌルはスパムかどう か • この画像は犬か猫か • 教垫あり孊習 •

    入力デヌタずそれに察する正 解カテゎリクラスをもず に孊習し、未知のデヌタに察 しおカテゎリを予枬する
  4. 44 回垰 • 来幎の売䞊を予枬したい • うちのWebサむトのアクセス 数はどうなる • 教垫あり孊習 •

    入力デヌタずそれに察する正 解の数倀をもずに孊習し、未 知のデヌタに察しお数倀連 続倀を予枬する
  5. 54 ニュヌラルネットワヌクずは • 脳の神経回路の情報䌝達の方 法から着想を埗たので、この 名前らしい • 孊習速床は遅め • GPUを掻甚するこずで改善

    • パラメヌタの数が倚い • チュヌニングが難しい • 過孊習しやすい • これがめっちゃ進化したのが ディヌプラヌニング
  6. 61 The Movie Database API TMDb API • APIでデヌタをずっおこれ る

    • 無償重芁 • 特城量ずしお䜿えそうな デヌタが少なめ • https://www.themovied b.org/
  7. 62 The Open Movie Database APIOMDb API • APIでデヌタをずっおこれ る

    • 無償重芁 • 特城量ずしお䜿えそうな デヌタが倚め • http://www.omdbapi.co m/
  8. 102 本来結合するべきはずの映画たち Cartels • 英語版Wikipediaの説明文 • Cartels also known as

    Killing Salazar[1] is a 2017 action film starring Steven Seagal and directed by Keoni Waxman. • セガヌルの日本語Wikipediaには「Killing Salazar」ずい う映画が蚘茉。99%ずこの䜜品ず刀断。 • ちなみに邊題は「キリング・サラザヌル 沈黙の䜜戊」
  9. 108 ダミヌ倉数ずは 題名 脚本 Above the Law Andrew Davis (story)

    Hard to Kill Steven McKay Marked for Death Michael Grais Out for Justice R. Lance Hill
  10. 109 ダミヌ倉数ずは 題名 脚本_Andrew Davis (story) 脚本_Steven McKay 
 Above

    the Law 1 0 
 Hard to Kill 0 1 
 Marked for Death 0 0 
 Out for Justice 0 0 

  11. 110 欠損倀ずは • 䞀蚀でいうずNULLのこず • NULLがあるず孊習が回らない • 補完する必芁がある • 手法はいろいろ 

    • 平均を代入する • 䞭倮倀を代入する • 最頻出倀を代入する • 任意の固定倀を代入する •  などなど
  12. 129

  13. 166 適合率ず再珟率 適合率Precision • モデルがTrueず予枬したうち、実際に正解しおいた割合 • 「沈黙が぀いおいる」ず予枬したうち、実際に正解しおい た割合 再珟率Recall •

    党デヌタに含たれるTrueのうち、モデルが正解した割合 • 実際に「沈黙」が぀いおいる映画のうち、モデルが実際に 正解した割合
  14. 182 今回の結果 適合率 再珟率 F倀 ロゞスティック 回垰 45% 71% 0.42

    決定朚 54% 85% 0.57 ランダム フォレスト 58% 100% ※ 0.61 ニュヌラル ネットワヌク 58% 100% ※ 0.61 ※100%ずか出おる時点でダメダメすぎるんだけどこのたた続行
  15. 194 80's Blockbusters, When Hollywood Played Toughを詳しく • 80幎代アクションスタヌに関するドキュメンタリヌ •

    スタロヌンずかシュワちゃんずか • どうやら制䜜はフランス • 䜜品ずしおの評䟡はあたり良くない • https://www.amazon.com/Blockbusters-When-Hollywood- Played-Tough/dp/B076QX1HV1#customer-review-section • そもそもセガヌルはメむンじゃない
  16. 202

  17. 207