Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データ分析の授業における Google Cloud の活用事例 #GoogleCloud #GoogleCloudNext / 20231116

データ分析の授業における Google Cloud の活用事例 #GoogleCloud #GoogleCloudNext / 20231116

テクノロジーカンファレンス「Google Cloud Next Tokyo ’23」の登壇資料です。

詳細は当社ニュースをご参照ください。
https://kazaneya.com/b5918f6d89054b2cb57edb2785f9ea4b

授業サポートや共同研究、資料ダウンロードのお問い合わせは以下よりお願いします。
https://kazaneya.com/contact

<追記>
ありがたいことに当日は「満席+立ち見3列」「アンケート満足度5点中5点」「登壇10分に対して質疑応答30分」と好評でした。ご来場いただきました皆様、誠にありがとうございました。

風音屋 (Kazaneya)

November 16, 2023
Tweet

More Decks by 風音屋 (Kazaneya)

Other Decks in Education

Transcript

  1. Proprietary
    データ分析の授業における
    Google Cloud の活用事例

    View full-size slide

  2. Proprietary
    Google Cloud Next Tokyo ’23
    横山 翔(@yuzutas0)
    ・株式会社風音屋 代表取締役
    ・Google Cloud Champion Innovator (Data Analytics)
    ・東京大学 経済学研究科 金融教育研究センター 特任研究員
    登壇・発表の実績(一部抜粋)
    ・Pythonのカンファレンス PyCon JP 2017 にてベストトーク優秀賞
    ・Google Cloud Day ‘21, ‘23
    ・日本統計学会 第16回春季集会
    執筆・出版の実績(一部抜粋)
    ・技術評論社『実践的データ基盤への処方箋』『Software Deign 2020年7月号 - ログ分析特集』
    ・内閣府『経済分析 第208号』
    ・自社出版『データマネジメントが30分でわかる本』

    View full-size slide

  3. Proprietary
    Google Cloud Next Tokyo ’23
    風音屋
    事業概要
    ・データ基盤の構築ならびに運用保守
    ・データ分析コンサルティング
    ・月30万円でデータ分析組織を立ち上げる
     支援パッケージ「Virtual Data Team」の提供
    取引先(一部抜粋、実績公開時の社名)
    ・株式会社商船三井
    ・エイベックス・デジタル株式会社
    ・株式会社ビズリーチ
    ・ランサーズ株式会社
    ・株式会社クラシコム
    ・福岡地所株式会社

    View full-size slide

  4. Proprietary
    Google Cloud Next Tokyo ’23
    データ分析教育の As-Is / To-Be
    As-Is To-Be
    データ教育 座学によるインプットが多く、利用
    可能なデータも限定される
    リアルなデータを利用した、実践的な
    データ分析の機会が必要
    インタフェース 学生/講師間の指導やグループ
    ワークのための対話的なインタ
    フェースが不十分
    ノートブックのコラボレーション等を通じ
    て分析結果のディスカッションを行いた

    インフラ 授業ごとの環境構築が大変 授業ごとの実験環境を簡単に準備でき
    る必要がある
    セキュリティ 企業との共同研究やデータ提供に
    おいて、セキュリティ/コンプライアン
    ス面での考慮が必要
    企業データをマスキングして共有し、共
    同研究や授業でのデータ活用を促進し
    たい

    View full-size slide

  5. Proprietary
    Google Cloud Next Tokyo ’23
    授業概要
    ・内容  :Python によるデータ分析の実践
    ・大学  :東京大学 経済学部
    ・授業名 :渡辺努ゼミ プロアクティブラーニングセミナー(単位の出るサブゼミ)
    ・期間  :2023 年5 月 〜 2023 年 7 月
    ・参加者 :学部 3 年、4 年の学生 14 名
    ・講師  :横山翔
    ・ゲスト :NE株式会社 マーケティング統括部執行役員 三原信基
          NE株式会社 データマネジメント部 熱田亮
          グーグル・クラウド・ジャパン合同会社 カスタマーエンジニア 山田雄

    View full-size slide

  6. Proprietary
    Google Cloud Next Tokyo ’23
    各社からのゲスト講師
    東京大学 赤門前にて、左よりNE 三原氏、NE 熱田氏、風音屋 横山、Google Cloud 山田氏
    (※学生のプライバシー保護のため、授業風景の撮影は大学ガイドラインにより禁止)

    View full-size slide

  7. Proprietary
    Google Cloud Next Tokyo ’23
    授業スケジュール
    STEP 日程 教材 内容
    ① 初日 Pythonで学ぶ入門計量経済学*
    (神戸大学 春山先生)
    https://py4etrics.github.io/
    Python の基本的な紹介とハンズオン
    ② 5-6 月 計量経済分析(パネルデータ分析まで)
    ③ 6-7 月 ネクストエンジンの取引データを用いた実証分析
    ・オープンデータ(例:天候)と組み合わせた重回帰分析
    ・カテゴリ別の物価指数の推移を可視化
    ④ 最終日 成果発表会
    *余談ですが軽微な修正をPull Requestで送ったところ快く受け入れてくださいました。

    View full-size slide

  8. Proprietary
    Google Cloud Next Tokyo ’23
    利用データ(企業提供)
    NE株式会社(https://ne-inc.jp/)
    ・複数ネットショップを管理する SaaS 型 EC Attractions「ネクストエンジン」を提供
    ・EC 市場 13.2 兆円のうち、1 兆円を超える流通データを保有
    ・dbt によるデータモデリングや GenAI によるカテゴリ判定を実現
     (Google Cloud Day ‘23 Tour にて発表)
    ・Analytics Hub を利用して一部マスキング済みデータを授業に提供
    https://ne-inc.jp/news/article/seminar_ne_googlecloudday23_2305

    View full-size slide

  9. Proprietary
    Google Cloud Next Tokyo ’23
    利用データ(オープンデータ)
    天気、気温、カレンダー等のオープンデータを参照・利用
    ・BQ FUNの加工済みオープンデータ(技術コミュニティ BQ FUN)
    ・Prepper Open Data Bank (株式会社truestar)
    ・Google Cloud Marketplaceのデータ

    View full-size slide

  10. Proprietary
    Google Cloud Next Tokyo ’23
    分析用データの連携
    データ提供者(NE)のGoogle
    Cloud プロジェクト (Data
    Publisher)
    授業用の Google Cloud プロジェクト
    (Data Consumer)
    BigQuery Analytics Hub
    BigQuery Vertex AI データ分析
    Cloud Logging
    監査ログ
    Analytics Hub でマスキングされた企業データを取得し、BigQuery 及び Vertex AI Workbench で分析
      風音屋のオープンデータ収集基盤
          (Data Aggregator)
    truestar 社の Snowflake
    (Data Publisher)
    BQ FUN の
    Google Cloud プロジェクト
    (Data Publisher)
    BigQuery Analytics Hub
    Snowflake Snowflake
    BigQuery
    監査報告
    Report
    XXXXXXXX
    XXXXXXXX
    XXXXXXXX
    XXXXXXXX

    View full-size slide

  11. Proprietary
    Google Cloud Next Tokyo ’23
    学生の成果発表(一部抜粋)

    View full-size slide

  12. Proprietary
    Google Cloud Next Tokyo ’23
    授業アンケート結果①(一部抜粋)
    ● 計量経済学の基礎的なことから、Python でのデータ分析について実際のデータを使用して実践的な
    分析をすることができ、とても良い経験になりました。なかなか思い通りに行かず苦労することが多
    かったですが、最後はなんとか形になってよかったです。物価やプログラミングについてさらに知識を
    つけて、もっといろいろ分析したいなと思いました。あっという間でしたが、非常に充実していたと思い
    ます。
    ● 実際のデータを見せていただいたことで、統計の学習という枠から抜け出してさまざまな応用方法の
    想像をすることができたように思います。
    ● データの結合、重回帰分析など、実践的なデータ分析の方法を体験することができた。最終的に発
    表の機会を頂けたことで、学びを形にしなければというモチベーションが生まれた。
    ● 膨大なデータを提供くださり、それを分析するという大きな目標を目指して Python を用いる貴重な経
    験ができて、大変であったが達成感を得られた。分析する技術そのものだけでなく、知りたいことが分
    かるような分析方法の検討という、方針だての段階から学ぶことができて面白かった。

    View full-size slide

  13. Proprietary
    Google Cloud Next Tokyo ’23
    授業アンケート結果②(一部抜粋)
    ● パネルデータの特徴など計量経済学の授業で学んだことを Python で手を動かしながら確認するこ
    とができました。
    ● サブゼミの最初の方では、コーディングや統計手法を難しく感じていましたが、実際に分析を始めて
    みると、何をどのように分析してそこから考察する方がよっぽど難しかったです。
    ● データ分析のプロセスについても伺うことができ参考になりました。今学んでいる分析手法の活用先
    を知ることができ、モチベーションが上がりました。
    ● 最終回にはマーケティングの最前線で働かれている方々の前で成果発表をして、FB をいただくこと
    ができたことは貴重な機会だったなと感じました。
    ● 実際のデータ分析の雰囲気を体験できて楽しかったです。データ量が多く分析が難しかったですが、
    調べながらやれば意外とできるんだなと思いました。
    ● お世話になりました。私は Python による実践的な分析をするのが今回が初めてだったため、手探り
    の中コードを書いたり、よくわからないエラーに立ち向かったりと非常に成長できたサブゼミになりまし
    た。ぜひ来年度もよろしくお願いいたします。

    View full-size slide

  14. Proprietary
    Google Cloud Next Tokyo ’23
    データ分析の授業が終わって
    ・春学期のみの予定だったが、授業が好評だったため、秋学期も講師としてゼミに参加。
    ・授業に参加した 14 名のうち 2 名が風音屋にインターン生として参画。
     実際のデータを分析して、クライアント企業の執行役員に分析結果をレポートしている。
    ・人材系 WEB サービスで
     新機能のファネル分析
    ・BigQuery とLooker Studio を
     活用
    ・ネクストエンジンのデータで
     追加テーマに挑戦中
    ・BigQuery と Google Colab を
     活用

    View full-size slide

  15. Proprietary
    Google Cloud Next Tokyo ’23
    Google Cloud を利用してよかった点
    学生(Vertex AI Workbench & Google Workspace)
    ● Google アカウントという使い慣れた ID プロバイダーでツールを利用できる
    ● インフラ知識が不要のため、情報系の学生でなくともデータ分析に挑戦できる
    ● クラウドで完結するため、学生・講師間のコラボレーション、デモンストレーションが容易
    講師(各クラウドサービス)
    ● 環境構築やハードウェアの問題に時間を取られず、データ分析の授業を始められる
    ● 簡単かつ安全にオープンデータや企業データにアクセスできる
    ● 計算に必要なコンピュートリソースをすぐに利用できる
    ● クラウドで完結するため、サンプルコードの受け渡しや学生の実験内容の再現が容易
    企業(Analytics Hub & Cloud Logging)
    ● 簡単に細かな権限管理とデータ提供を実現し、データを安全に管理できる
    ● アカデミア連携により、専門性の高い研究室/ゼミのナレッジを活かせる
    ● 学生目線でのフィードバックを得て、採用活動に活かせる
    ● 分析済みのテーマならダブルチェックを、未実施のテーマなら新たな知見を得られる

    View full-size slide

  16. Proprietary
    Google Cloud Next Tokyo ’23
    教育機関/企業を問わず案件募集中です!
    ● データ分析のための学習環境の提供
    ● データ分析のトレーニング/講座の提供
    ● 共同研究の支援
    ● データ基盤の構築、運用保守
    ● 技術顧問(顧問契約での技術サポート)

    View full-size slide

  17. Thank you
    Proprietary

    View full-size slide