Upgrade to Pro — share decks privately, control downloads, hide ads and more …

大学生が本気でDatabricksを活用してDiscordサークルをデータ駆動させてみた

 大学生が本気でDatabricksを活用してDiscordサークルをデータ駆動させてみた

発表者は現役大学生で、100名超の大学eスポーツ系Discordコミュニティの代表を務めています。イベントは盛り上がる日もあれば、なぜか人が集まらない日もあります。「週末は人が多いはず」「夜の方がアクティブなのではないか」、本当にそうなのでしょうか。

本セッションでは、Discordの活動ログをDatabricksに取り込み、Bronze / Silver / Gold のメダリオン構成でデータパイプラインを構築し、ダッシュボードで可視化するまでの実践事例をご紹介します。

Discord APIによる活動データの取得(メッセージ数、VC参加など)
CursorとDatabricks PATを活用した自動データ蓄積
曜日×時間帯ヒートマップによる活動傾向の構造的把握
機械学習を活用した施策実施日の推測および意思決定支援の検討
学生コミュニティという「非ビジネスデータ」の扱い方、小規模組織でも実装可能なLakehouseアーキテクチャ、「とりあえず可視化」で終わらせないための設計思想、将来的なAutoML・RAG・Action Item Recommendation構想についてもお話しします。

Avatar for Kazuki Date

Kazuki Date

May 29, 2026

Other Decks in Technology

Transcript

  1. 2 1. 自己紹介 2. 課題分析 3. ソリューション 4. デモ 5.

    まとめ 今回お話しする内容 自己紹介 課題分析 ソリューション デモ まとめ
  2. 4 自己紹介❶ 伊達 和輝 イメージ 現役大学生 慶應義塾大学 理工学部 数理科学科 学部4年

    arcbricks株式会社にてインターン 経 歴 Esportsサークル運営 ゲームの大会に出場すること 楽器演奏 趣 味 業 務 経 験 データパイプラインの構築(Databricks) 機械学習モデルの作成(Databricks) プロジェクトマネジメント Data&AI コンサルタント@arcbricks 自己紹介 課題分析 ソリューション デモ まとめ
  3. 5 自己紹介❷ イメージ 台湾出身 arcbricks株式会社にてデータコンサルタント 国立台湾大学 商学部 国際企業マネジメント専攻 経 歴

    台湾で料理人資格を取得 音楽プロデューサー(Spotifyプロファイルあり) Hearthstoneにてアジアサーバー上位800位にランクイン 趣 味 業 務 経 験 RAG実装のPoCプロジェクトリーダー(Databricks) 機械学習・RAGの実装 ビジネスコンサルティング分野でのインターン Wang Cheng Data&AI コンサルタント@arcbricks 自己紹介 課題分析 ソリューション デモ まとめ
  4. 7 ゲームコミュニティ向けの活動拠点 イメージはゲーマー版Slack・Teams 現在では企業・勉強会・学内コミュニティなど 幅広く利用されている チャンネル 一覧 参 加 サ

    ー バ ー チャットタイムライン オンライン メンバー 自アカウント Discord画面UI例 Discordについて 主な特徴 サーバーを誰でも作成できる テキストチャンネルで情報共有 音声チャンネルでリアルタイム会話 画面共有・ビデオ通話も可能 利用用途 自己紹介 課題分析 ソリューション デモ まとめ
  5. 8 大学サークルについて 名称 eスポーツサークルTitanZz 設立 2017年(日本最古レベル) 目的 eスポーツを通して塾生 同士の交流を深める eスポーツの学生シーン

    を広める・盛り上げる 部員 約100名在籍 元プロから初心者まで幅広い層の部員が所属 各学部・学年の部員が偏りなく所属 留学生や帰国生も多い 自己紹介 課題分析 ソリューション デモ まとめ
  6. 9 サマリー イベントを継続的に開催できず、サークルから人が離れてしまう 主要課題 プロセス摩擦 運営工数が重い 担当者の経験に依存 定性的な反省のみ 影響 イベント開催頻度が低下

    人の集まりにブレが発生 改善サイクルを回せない ソリューション Discordログを取得し、Databricksにて ダッシュボードを構築 Databricksで告知文を生成する モデルを構築 勘と手作業の運営から、データで回る運営へ サマリー 実行プロセス イベント企画 日程調整 告知 イベント開催 価値創出 イベント開催 月1→週1に増加 VC利用時間 25%増加 運営作業時間 約3時間短縮 自己紹介 課題分析 ソリューション デモ まとめ
  7. 11 現状の作業フロー イベント企画 日程調整 ❶ Discordで 告知 イベント開催 ❷ ❸

    ❹ 現状のイベント運営は、企画→日程調整→告知→開催 の流れで進んでいる 自己紹介 課題分析 ソリューション デモ まとめ
  8. 目指す運営フロー ❶ ❷ ❸ ❹ ❺ イベントの 目的を決める 開催日時を データで決定

    Discordへ 自動告知 イベント開催 参加データを 自動記録 目的・ターゲット を明確化 過去データを元に 最適日時を選定 適切な内容を 自動で告知・拡散 スムーズな運営で 参加体験を向上 参加実績を蓄積し KPIを可視化 データを次回企画に反映 企画から振り返りまでを、データで繋がる改善サイクルにしたい 12 自己紹介 課題分析 ソリューション デモ まとめ
  9. 理想の運営に足りないもの 理想の運営に近づくためには、判断材料・標準化・記録・指標の4つの不足を埋める必要がある 13 理想のフロー(To-Be) 現状のフロー(As-Is) 足りていないもの(ギャップ) 企画: データで最適化 過去データを元に、最適な内容・ 日時をデータで判断

    告知: Botで自動化 AIで告知文を生成し、Botが適切 なチャンネルへ投稿 開催: データを自動記録 参加者数やリアクションなどのデータ を自動で記録 振り返り: KPIで改善 KPIを確認し、次回の企画・告知 に改善を反映 企画: 勘で決定 担当者の経験や勘で、内容や 日時を決定 告知: 手作業 告知文の作成・投稿を 手作業で実施 開催: 記録なし 参加者数や反応を記録せず、 データが残らない 振り返り: KPIなし KPIがなく、効果検証や 改善ができない 判断に使えるデータ 意思決定の根拠となる、過去の 活動データを蓄積できていない 再現可能な告知運用 告知の作成・投稿が手作業で、 運用が標準化されていない 参加実績のデータ化 参加ログやリアクション等の 実績データを取得できていない 改善判断の指標 改善に繋げるためのKPIや 評価指標が設計されていない 自己紹介 課題分析 ソリューション デモ まとめ
  10. 目指すソリューション データ取得 データ基盤 ❶ 分析・自動化アプリ 可視化・改善 ❷ ❸ ❹ Discord投稿

    イベント情報 ボイスチャンネル参加ログ ログ未取得 → 自動取得へ 根拠データ不足 → データを蓄積 蓄積・整形・集計 属人化・手作業 → 自動化 最適開催日時レコメンド 告知文自動生成 Discord Botで自動告知 参加データ自動記録 ダッシュボード コミュニティ統計情報 ボイスチャンネル参加ログ 効果検証不可 → 改善サイクルへ 取得→蓄積→活用 を繋ぎ、企画から振り返りまでをデータで回す 14 自己紹介 課題分析 ソリューション デモ まとめ
  11. 目指すソリューション 取得 → 蓄積 → 活用 を繋ぎ、企画から振り返りまでをデータで回す 15 今回の発表では、これらについて扱っていく 自己紹介

    ソリューション デモ まとめ データ取得 データ基盤 ❶ 分析・自動化アプリ 可視化・改善 ❷ ❸ ❹ ログ未取得 → 自動取得へ 根拠データ不足 → データを蓄積 属人化・手作業 → 自動化 Discord Botで自動告知 参加データ自動記録 効果検証不可 → 改善サイクルへ 蓄積・整形・集計 Discord投稿 イベント情報 ボイスチャンネル参加ログ 最適開催日時レコメンド 告知文自動生成 ボイスチャンネル参加ログ ダッシュボード コミュニティ統計情報 課題分析
  12. 全体のアーキテクチャ Discord API EC2 Bot ❶ 活動ログ取得 データ取得 ❷ Bronze

    (生データ) Silver (クレンジング) Gold (集約データ) データ基盤(メダリオンアーキテクチャ) データ参照 ❸ Databricks Apps ダッシュボード / 告知文生成 ダッシュボード・Genie 告知文生成 Few-shot LLMノートブック (ワークスペース内) ノートブック 呼び出し ❹ 文章生成 ❻ EC2 Bot 送信リクエスト (生成文章) ❼ メッセージ送信 ❽ Discord データ基盤・可視化フロー 生成AI・配信フロー ログ保存 17 自己紹介 課題分析 ソリューション デモ まとめ
  13. データ基盤・可視化フロー 生成AI・配信フロー ノートブック 呼び出し ❹ 全体のアーキテクチャ Discord API EC2 Bot

    ❶ 活動ログ取得 データ取得 ❷ データ参照 ❸ Databricks Apps ダッシュボード / 告知文生成 ダッシュボード・Genie 告知文生成 Few-shot LLMノートブック (ワークスペース内) 文章生成 ❻ EC2 Bot 送信リクエスト (生成文章) ❼ メッセージ送信 ❽ Discord ログ保存 Bronze (生データ) Silver (クレンジング) Gold (集約データ) データ基盤(メダリオンアーキテクチャ) 18 自己紹介 課題分析 ソリューション デモ まとめ
  14. データモデルについて 活動ログ取得 Bronze(生データ) Silver(クレンジング) Gold(集約データ) discord_channels_raw discord_messages_raw discord_voice_activity_raw activity_by_weekday_hour Discordログをそのまま保存

    guild_dim category_dim channel_dim user_dim Dimensions 正規化とクレンジングを行う Facts message_fact voice_chat_fact 生データ 取り込み・ 正規化 ダッシュボード・分析向けに集積 activity_daily user_activity channel_activity user_voice_summary 整形 ポイント Bronzeテーブルはエラー特定 のために元データを保持 SilverでDimension / Factテーブルに分離(3NF) Goldは用途別・粒度別に集計 19 自己紹介 課題分析 ソリューション デモ まとめ
  15. Gold層の主要テーブル 活動ログ取得 ポイント 表示名はそれぞれのDimension テーブルとJOINして付与 日次・時間帯系の指標は 時間単位に分割して集計 各テーブルはダッシュボードで 直接使いやすい形に整形 activity_by_weekday_hour

    粒度 曜日×時間帯 主な指標 message_count / voice_duration_seconds 主な用途 曜日別ヒートマップ・傾向分析 activity_daily 粒度 日別集計データ 主な指標 message_count / voice_duration_seconds 主な用途 時系列トレンド分析 粒度 ユーザ別 主な指標 message_count / voice_duration_seconds 主な用途 ユーザランキング・活動比較 user_activity 粒度 チャンネル×カテゴリ 主な指標 message_count / voice_duration_seconds 主な用途 チャンネル比較 channel_activity 粒度 ユーザ別(ボイス履歴に特化) 主な指標 voice_duration_seconds 主な用途 通話アクティビティ要約 user_voice_summary 20 自己紹介 課題分析 ソリューション デモ まとめ
  16. データ基盤・可視化フロー 生成AI・配信フロー ノートブック 呼び出し ❹ 全体のアーキテクチャ Discord API EC2 Bot

    ❶ 活動ログ取得 データ取得 ❷ Bronze (生データ) Silver (クレンジング) Gold (集約データ) データ基盤(メダリオンアーキテクチャ) データ参照 ❸ AI Query実行 Few-shot LLMノートブック (ワークスペース内) 文章生成 ❻ EC2 Bot 送信リクエスト (生成文章) ❼ メッセージ送信 ❽ Discord ログ保存 Databricks Apps ダッシュボード / 告知文生成 ダッシュボード・Genie 21 自己紹介 課題分析 ソリューション デモ まとめ
  17. ダッシュボードで見えること 22 サマリーKPI メッセージ数・ボイス時間・健全性シグナルを 一覧で確認 トレンド 日時推移から活動量の増減や イベント影響を把握 時間帯ヒートマップ 曜日×時間帯ごとの盛り上がりを把握

    し、開催候補を検討 ユーザー / チャンネル分析 KPIを確認し、次回の企画・告知に 改善を反映 次スライドにて詳細を確認 自己紹介 課題分析 ソリューション デモ まとめ
  18. ダッシュボードで見えること 23 開催日時を決める 曜日×時間帯ヒートマップで 盛り上がる時間帯を特定し イベントの候補日時を決定 告知先を決める チャンネルランキングから 告知すべき場所と最も影響力の あるチャンネルを特定

    コアメンバーを理解する メッセージ数やVC時間から 日常的に貢献している アクティブメンバーを把握する 変化を早く捉える 離脱リスクと、セッション深度×ア クティブ週数の散布図でフォロー が必要なメンバーを早期に特定 ポイント 可視化はゴールではなく、企画・告知・フォローの判断材料として扱う 自己紹介 課題分析 ソリューション デモ まとめ
  19. データ基盤・可視化フロー 生成AI・配信フロー 全体のアーキテクチャ Discord API EC2 Bot ❶ 活動ログ取得 データ取得

    ❷ データ参照 ❸ 文章生成 ❻ 可視化・ダッシュボード EC2 Bot 送信リクエスト (生成文章) ❼ メッセージ送信 ❽ Discord ログ保存 Bronze (生データ) Silver (クレンジング) Gold (集約データ) データ基盤(メダリオンアーキテクチャ) Databricks Apps ダッシュボード / 告知文生成 Few-shot LLMノートブック (ワークスペース内) AI Query実行 24 ノートブック 呼び出し ❹ 自己紹介 課題分析 ソリューション デモ まとめ
  20. 告知生成について 活動ログ取得 • 生成したいポスト内容 • Tone:真面目 / おふざけ / カジュ

    アル • Length:short / medium / long • Formality:ですます / タメ口 / 敬語 • Emoji Density:なし / 少なめ / 普通 / 多め • Structure:箇条書き中心 / 段 落中心 / 見出し+本文 • Call-to-action strength:控 えめ / 普通 / 強め TitanZz Geoguessr 開催決定! ~配信で話題の"地図当てゲーム"、みんなでワイワ イやろう!~ 日程 :5月24日(土)21:00~ ゲーム :Geoguessr(無料でプレイ!) 場所 :TitanZz Discordサーバー 「配信で見たけどやったことない!」って人も、 いまハマってる人たちも、もっと盛り上がれたら最 高! 途中参加・途中離脱・観戦だけでもOK! 【参加方法】 この投稿にリアクションするだけ 「ちょっとやってみたいかも…」って人も、「俺の地理 力、見せつけるぜ!」って人も、 みんなでワイワイやりましょー!初参加&エンジョイ勢 も大歓迎! お待ちしてます ユーザー要件 Few-shotモデル Databricks Apps - **真面目** - 語彙ルール: 断定・簡潔、冗談なし、事実優先 - ミニ例: 「本日21時より定例練習を実施します。参加者は20:55までに 集合してください。」 パラメタ定義(一部) 例に基づき、文章を生成 結果を出力 ポイント ユーザーからパラメータで生成 内容がコントロールしやすい Few-shotモデルで、チューニン グしやすく、管理が容易 ユーザーはDatabricks Apps で結果を利用できる パラメータで生成内容をコントロール - Case 3: - Hyperparameters: Tone=真面目, Length=long, Formality=敬語, Emoji density=少なめ, Structure=見出し+ 本文, CTA=控えめ - User request: 「参加者向け最終連絡を、丁寧で抜け漏れなく書い て」 ケース例(一部) 25 自己紹介 課題分析 ソリューション デモ まとめ
  21. まとめ❶ 28 運営メンバーの声 日程決めの迷いが減りそう! 告知文生成を早速活用してます! 参加状況が残れば、 反省や改善に活かしやすい 自己紹介 課題分析 ソリューション

    デモ まとめ 2ヶ月運用した効果 イベント開催 月1 → 週1 に増加 日程調整や告知文 作成に使用していた 約3時間短縮 運営作業時間 3月から4月にかけての VC利用時間 2000時間→2500時間 に増加 新入部員 約120名を獲得 その多くがサーバーに定着
  22. まとめ❷ 29 今回達成できたこと ❶ 活動ログの抽出・蓄積 データモデルの整備 ダッシュボードでの可視化 告知文生成 今回のスコープ 今回のスコープ

    次に取り組むこと ❷ Discord Bot連携の完成 更に詳細なDiscord統計 データ取得の検討 告知文投稿の自動化 現在作業中 さらに目指すこと ❷ 機械学習による開催日時 レコメンド機能 イベント内容の推薦機能 継続率・満足度などKPI 拡張の検討 今後の目標 自己紹介 課題分析 ソリューション デモ まとめ