Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャ...

データサイエンティスト協会 エントリー層向けセミナー_データサイエンスでいいエリアの提案にチャレンジ!

講義資料

GA technologies

October 24, 2019
Tweet

More Decks by GA technologies

Other Decks in Technology

Transcript

  1. 本日の内容 【学習目標】 • データ分析の一連の流れを体感し、データからストーリーを構築できるように なること 【Contents】(計 90分) 1. 講師紹介/会社紹介(5分) 2.

    分析による問題解決のプロセス( 45分) 3. 総合演習(30分) 4. 不動産領域におけるデータサイエンス事例紹介( 10分) 5. 参考文献 2
  2. 株式会社GA technologies 5 5 設立年月日 2013年 3月 資本金 11億5,544万9,070円 代表取締役

    樋口龍 事業内容 • 不動産テック総合ブランド「RENOSY」の運営 • オンライン融資申込・審査手続きシステム 「Mortgage Gateway」の運営 • 「BEST BASHO」や「BLUEPRINT by RENOSY」などのAIやRPAを活用した研究開 発 • 中古マンションのリノベーション設計施工 従業員 344名(2019年4月時点) • 2018/7マザーズ上場、設立5年で売上 200 億のPropTech企業(不動産テック) • セールスなど強力なReal人材が多数在籍 の一方で、エンジニアが全社員の 44%と Technologyとの融合に注力 • 2017/4にAI Strategy Centerを設立(不動産業 界初)。技術顧問は杉山将氏 • AI Strategy CenterのVision「事業全体を見 据えて行動を起こせる研究者集団」 ⇒急成長ゆえ課題も多いですが、    Excitingな環境です!  Let’s Join us!
  3. 講師紹介:橋本 武彦 氏名 橋本 武彦(はしもと たけひこ) 所属 ㈱GA technologies AI Strategy

    Center General Manager 電気通信大学 客員准教授 キャリア サマリ • Sier(エンジニア5年/研究員2年)⇒調査会社(リサーチャー3年)⇒  ブレイン パッド(シニアデータサイエンティスト9年)を経て2017年4月から現職 • データサイエンティスト協会(前事務局長)やデータサイエンティスト育成の新 規事業の立ち上げ • 電通大、滋賀大、慶應SFC、立教大など大学や官公庁での講義や講演・執筆 など E-Mail [email protected] Socialアカウント https://www.facebook.com/hashimoto.takehikko / @takenotabi 6
  4. 講師紹介:福中 公輔 氏名 福中 公輔(ふくなか こうすけ) 所属 ㈱   シニア・データサイエンティスト キャリア サマリ

    早稲田大学にて、統計学やデータ解析、テスト理論の研究を行った後、実務へ の応用に興味を持ち、データサイエンティストとなる。学校法人産業能率大学総 合研究所に在籍時は、企業内のデータサイエンティスト育成支援、データ解析 支援、データ解析プロジェクトのコンサルティング等に従事。一般社団法人デー タサイエンティスト協会が主催するデータサイエンスアワードにて、 年度、東 京メトロとのプロジェクト「データサイエンスと働き方改革」で最優秀賞を受賞。こ れまでにデータ活用による業務効率化の仕組みに関する特許を 件取得。 E-Mail [email protected] URL https://uca-works.com/ 7
  5. Problemとは • 明確化 ◦ 問題はなにか、目的はなにか、目標はなに か、etc • 定量化 ◦ 数字で計測できるように定義

    ▪ NG:おしゃれなエリア ▪ OK:ブランド店が多いエリア 一言でいうと「問題の明確化と定量化」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 13
  6. Planとは • 問題に対し ◦ 必要な素材を考え(≒データ) ◦ どう調理するか(≒分析) を描く • (筋のよい)仮説を持つことが大切

    一言でいうと「分析の設計」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 15
  7. Dataとは • 問題に対し必要な素材が手元に揃っているこ とは基本ない • 必要な素材を ◦ どう収集するか ◦ (分析しやすいよう)どう加工するか

    手間と時間がかかるが大事 一言でいうと「(必要な素材(≒データ)の)収集と加工」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 18
  8. Analysisとは • 現状把握(1つのデータ) ◦ 代表値や可視化により、 各変数の現状を把握 • 関係調査(2つのデータ間) ◦ 比較と傾向の観点で、 変

    数間の関係を調査 一言でいうと「現状を把握し、関係を調査」 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 出典:社会人のためのデータサイエンス演習(総務省 統計局) 20
  9. Conclusion • 統合とは ◦ PPDAを踏まえ、問題に 対し結論を提示 ◦ 結論が出ない場合、  必要なプロセスに戻る •

    新たな問題から次のサ イクルへ 一言でいうと「(各プロセスの)統合」 出典:チャンス発見の情報技術 https://www.tdupress.jp/book/b349879.html 出典:センサス@スクール パンフレット https://estat.sci.kagoshima-u.ac.jp/cse/data/ism2012_cas.pdf 23
  10. ケーススタディ:記入Format(30分) (ターゲットを設定(男女 単身 ファミリー)した上で) 「便利」で「安い」おすすめエリアは? Problem 「便利」 駅・路線や店舗、公共施設や病院が多い(比較) 「安い」 地価が低い(比較)、地価の上昇が見込める(傾向)

    Plan 都心 区の地価公示データ( 年分)  ※他のデータがあれば追記 Data 参考にした 表・グラフ グラフの解釈 Anaysis ◯◯区 Conclusion 表・グラフ 解釈 表・グラフ 解釈 表・グラフ 解釈 26
  11. 過去の物件情報をもとに自動査定するAIを開発 32 32 所在階 総階数 住所 竣工年 物件名 この物件は  3200万円~3800万円

    だと予測 ヒストグラムや散布図など基礎的な分析は初期の段階で必ず行っています!