Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【CEDEC2025】LLMを活用したゲーム開発支援と、生成AIの利活用を進める組織的な取り組み

 【CEDEC2025】LLMを活用したゲーム開発支援と、生成AIの利活用を進める組織的な取り組み

2025/07/23 CEDEC2025

Avatar for Cygames

Cygames PRO

July 25, 2025
Tweet

More Decks by Cygames

Other Decks in Technology

Transcript

  1. /84 3 自己紹介 金井 大 AIテクノロジー / 専門役員 2014年、株式会社Cygamesに合流。 研究開発に従事した後、マネージャー

    およびエンジニア2部の部長を歴任。 2024年4月からは専門役員として、 ゲーム開発におけるAI技術の研究開発 と利活用の推進を統括している。 笠原 達也 AIテクノロジー / エンジニア 2023年より株式会社Cygamesに合流。 Unityエンジニアとしてコンテンツ開発 に従事し、現在はAIエンジニアとして 社内AIチャットサービスTaurusの開発 と運用に取り組んでいる。 都築 圭太 AIテクノロジー / エンジニア 2015年に株式会社Cygamesへ合流。 入社後はデータ分析基盤の運用開発や運 用タイトルの不正対策などに従事。現在 は社内AIチャットサービスTaurusの運 用やLLMを用いた業務改善の検証に取り 組んでいる。
  2. /84 9 生成AIの導入と利用における課題 • 使い方や技術的な詳細がよくわからない • 既存のワークフローが大きく変わってしまう • 自分たちの仕事がなくなってしまうかも? •

    倫理的もしくは法律的な懸念がある • そもそも使って良いの? 生成AIの導入は大きな変化=不安とリスク これらを戦略的に取り除く必要がある
  3. /84 10 不安とリスクを取り除くための取り組み 1. 生成AIを主業務とする組織をつくる – 兼任すると、どうしても主業務が優先されてしまう – 生成AIを主業務とする組織を作ることで、この課題を解決する 2.

    生成AIを安全に使うためのルールの策定 – 「自由に使ってください」は逆に使いにくい – 利用のためのガイドライン、問い合わせ窓口を整備する 3. 安心して生成AIを使うための環境の整備 – ガイドラインに沿ったツールや利用に関する情報を発信 – 安心・安全に利用できるようにする
  4. /84 13 生成AI活用委員会の活動内容 1. 生成AI利用のガイドライン策定 2. 様々な生成AIサービスやツールの利用可否の判断 – ChatGPT/GitHub Copilot/etc..

    – Microsoft Azure/OpenAI API/Amazon Bedrock/etc.. – LLMなどのモデルも含む 3. 社内における利用促進施策の実施 – 社内広報サイトによる連載記事 – Slackチャンネルによる互助会 4. 生成AIを用いたツール開発や検証の支援
  5. /84 15 AI専門部署「AIテクノロジー」について 専門役員 AIテクノロジー クリエイティブチーム 画像や動画生成AIといった クリエイティブな生成AIの研究 チーム 部署

    LLMチーム LLMやエージェントの研究開発と ゲーム開発業務への応用 先端コンテンツチーム 先端技術を活用した コンテンツ開発と支援 強化学習チーム 強化学習を活用した ゲームのバランス調整やデバッグ 2024年2月設立、AIサービスの開発やAIの研究開発を行う
  6. /84 16 AIテクノロジーの活動内容 1. AI技術やAIサービスの調査・研究・実証 – 最新AI技術や既存AIサービスの研究調査や技術の進展の分析 2. AIによる具体的なゲーム開発支援 –

    AIを用いたWebサービスやツールの開発と運用 3. Webサービスやツール上での検証や実証 専門性が高いメンバーが作業を専任することで より高度な課題が解決できる
  7. /84 18 生成AIガイドラインの策定 上記を元にガイドラインを明文化し Confluenceにて全スタッフが閲覧可能とする 生成AI 生成AIへの入力に 関するルール 生成AIからの出力に 関するルール

    • どの生成AIの利用を 許可するか? • データセットの出自 や学習の有無をもっ て判断 • 生成AIの出力を適応 できる業務領域と範囲 (コンテンツに含めない) • 出力結果の確認と編集、 トレーサビリティ • 業務情報の入力を どこまで許可するか • 著作権法や 個人情報保護法などへの 法令順守
  8. /84 22 組織の設立とAIチャットツールの導入 2023年4月 「生成AI活用委員会」 が発足 2023年11月 Webアプリ 「Taurus」 アルファ版公開

    2024年2月 「AIテクノロジー」 部署の設立 2025年4月 「Gemini Pro」を 全社へ展開 2023年5月 GPT-3.5搭載の Slackアプリ 「Cygnus」社内公開 2024年1月 ChatGPT Team を導入 2025年1月 ChatGPTを Enterpriseへ移行
  9. /84 31 Taurusが持つ機能 以下の情報へ接続 • 社内報 • スタッフ情報 • フロアマップ

    • 会社近辺の飲食店情報 • ソフトウェア利用可否 • 書籍管理システム • フローティングライセンス管理 以下のLLMを利用可能 • GPT-4o • GPT-4.1 • o4-mini • o4-mini-high • o3 • Claude 3.7 Sonnet • Claude Sonnet 4
  10. /84 33 認証 Taurusのアーキテクチャ バックエンド Elastic Load Balancing Amazon EC2

    Amazon RDS モニタリング Amazon Cloudwatch LLM Azure AWS Amazon Bedrock Anthropic Claude ナレッジ Confluence + Azure API Management Azure OpenAI Service 社内情報 PTU PayG Azure AI Search Datadog Bing Web Search API Confluence API Microsoft Entra ID Amazon ElastiCache Amazon S3 ユーザー OpenAI OpenAI API • 社内報 • スタッフ情報 • フロアマップ • 書籍管理システム • etc…
  11. /84 34 Microsoft Azure OpenAIについて GPT-3.5、GPT-4、GPT-4oといった複数モデルの 管理のために導入。各モデルのデプロイと、 リクエスト数やrate limit、コストを管理している。 特にGPT-4oについて、PTU(Provisioning

    Throughput Unit) 契約を行い処理能力を確保することで、 大量のリクエストに対して安定した運用を実現 ※処理能力 = 入出力トークン数 * リクエスト数 PTU契約によりスループットを確保し 社内のGPT-4oの利用を一元化 Azure API Management Azure OpenAI Service PTU PayG Azure
  12. /84 35 Azure API Managementについて PTUはバーストを許容するが、1PTUを全社利用 するとrate limitを超える可能性がある。 API ManagementによりPayG(従量課金)

    への フォールバックを設定したエンドポイントを 用いることで、この問題を回避する。 API Managementにてエンドポイントごとに 適切なrate limitを設定することで、1つのPTU を複数の用途で利用する際に、優先順位の設定が 可能となる。 Azure API Management Azure OpenAI Service PTU PayG Azure
  13. /84 36 PTUのメリットとデメリット • 安定した性能・低レイテンシ – スループットプロビジョンにより ピーク時でも遅延が少なく、安定し たパフォーマンス・高スループット が得やすい

    • コスト効率 – 支払い金額がトークン数や リクエスト数に依存しない • SLA – ビジネス利用における信頼性が高い • 初期費用と契約コミット – 月額固定費用が発生する。契約は最低 月間ベース、利用が減るとコスト効率 が悪化する • ワークロード予測と運用負荷 – 適切なPTU数の算出には、1分あたり のトークン処理数の見積りが必要 • 柔軟性 – 自動スケールしない。リージョン別の クォータやPTU割り当てが必要
  14. /84 37 Amazon Bedrockについて AWSが提供するフルマネージド・サーバーレスの生成 AI基盤。複数のファウンデーションモデル(Anthropic、 Cohere、Stability、Meta、Amazonなど) を単一APIで利用可能。 Anthropic系のLLMに関してモデルの追従速度が速く (Claude

    Sonnet 3, 3.5, 3.7, 4 は全て即日対応) 、EC2、Lambdaなどの AWSサービスを利用している場合、迅速かつ容易な 導入が可能 Amazon Bedrock Anthropic Claude TaurusはAWSでバックエンドが構築されており、 容易にClaude対応が可能 AWS
  15. /84 39 RAGとTool Useについて RAG(Retrieval Augmented Generation)とは プロンプトに対して、 外部データを検索して得られた 情報を付加する手法のこと

    Tool Useとは プロンプトに応じて、 利用すべきツールとパラメータを LLMが選択する機能のこと LLMが知らない知識を外部データで補い 回答のハルシネーションを抑制する RAG(Retrieval Augmented Generation)とは Tool Useとは
  16. /84 40 TaurusにおけるRAG Taurusでは質問に応じたデータソースを検索し、結果をプロンプトに 含めることで、RAGを実装している。検索するには、1. 正しいデータ ソースを選択し、2. 検索キーワードなど、検索APIごとのパラメータを 決める 必要がある。TaurusではTool

    Useを利用して、これを実現して いる。 LLMが検索するデータソースと APIのパラメータを選択 検索結果を LLMが受け取る Tool Use ユーザーが 会議室のルールが 知りたいと質問 ユーザーは データに基づいた回 答を受け取る RAG 検索を実行 Confluence … 社内報 データソース 1 2 4 3 6 LLMは受け取った 結果に基づいて 回答を生成 5
  17. /84 44 マルチクエリ検索の検討 検索のヒット率向上のため、複数の検索クエリを生成して並列に検索、 それらの検索結果を統合するアプローチ(マルチクエリ検索) を検討したが、 LLMによるクエリ生成が安定せず、結局欲しい情報が得られなかったり、 逆にノイズを生み出すパターンもあった 一定の改善が見られたが根本解決に至らず、対応は見送り 単3電池が欲しい時の

    問い合わせ先を教えて 「単3電池 問い合わせ」 「単3電池 購入」 「単3電池 調達」 乾電池の利用案内 「単3電池」ではヒットせず 夏休みっていつから? 「夏休み 期間」 「夏期休暇 時期」 「サマー休暇 いつ」 夏期休暇について 「夏期休暇」でもヒットする
  18. /84 45 ベクトル検索(意味に基づく検索) Azure Blob Storageへファイルを格納し、 ファイルごとにembeddingを含めたIndexを 作成することで、Azure AI Searchによる

    ベクトル検索(意味に基づく検索) が実行可能となる。 ただし、Azure AI SearchではConfluenceの ページごとの認可を解決できないため、publicな ページのみをIndex化して対処する必要がある Confluence Azure Blob Storage データ取り込み+Index化 Azure AI Search ベクトル検索(意味に基づく検索) により 「単3電池」「乾電池」のような 表記揺れを解決した検索が可能となる
  19. /84 53 月毎の投稿数とアクティブユーザー数 0 200 400 600 800 1000 1200

    1400 1600 0 10000 20000 30000 40000 50000 60000 7月 8月 9月 10月 11月 12月 1月 2月 3月 4月 5月 2024年7月のリリース以後、順調に利用件数が増加 2025年5月時点のMAUは約1400人(全スタッフの4割程度) (回) (人)
  20. /84 60 チケット名 チケット本文 チケット名から、過去のチケットを参考に 指定のフォーマットに合わせてチケット本文を生成する バグチケット作成効率化の目標 キャラXがシーンYで メガネをかけてない ▪詳細:

    キャラXがシーンYでメガネをかけていない ことを確認しました。こちらご確認のほどよろしく お願いいたします。 ▪発生箇所: シーンY ▪手順 1.デバコマ>シーン移動>キャラビュアーに遷移 2.「キャラX」> 「シーンY」>の順にタップ ▪正しい挙動: メガネをかけていること ▪発生頻度: 3/3 ▪発生したバイナリ: yyyy/mm/dd 開発版
  21. /84 65 実際に利用しているプロンプト シンプルに1つのプロンプトを実行するだけの実装 • 参考とする過去チケットはRAGなど使わず全てプロンプトに含める • 再現バージョンなど日々変わるものは、実行時に固定値として入れる あなたは不具合の情報を伝えるAIです。以下の指示に従って、報告文を作成します。 【概要】

    チケットに記載する項目の概要 【不具合報告文作成のルール】 文体のルール 【手順】 カテゴリごとに決められた確認手順の方法 【参考チケット】 実際のチケットを縦に並べたもの。2000行程度 プロンプトのイメージ
  22. /84 66 アプリ運用上の工夫 マネージドサービスを採用して、運用工数を下げる AWS App Runner + S3 の構成で提供

    AWS App Runner: コンテナなどのホスティングサービス AWS App Runner Amazon S3 ユーザー アプリへのアクセス データの保存・取得 • EC2やECSと比較して、必要な設定が少なく手軽に利用できる。 • デプロイ時のダウンタイムが少ない。 裏で新バージョンを準備し、準備できたら自動でルーティングが切り替わる
  23. /84 67 アプリの導入結果 • 4タイトルで導入・検証中 • ツール導入の効果: 0.3人日/月 程度 •

    2025年1月~5月で合計283件の利用 • 1件あたりの短縮時間: 3分/件(5分→2分) • 283件 x 3分/件 ≒ 14.15時間
  24. /84 70 ※ ゲームの要素の例 課題 仮説 ストーリー・難易度・マッチング など 投稿内容のポジネガ分析: 概要

    SNSなどに寄せられた投稿から、ユーザがゲーム内の どの要素に対してどう感じているのかを分析したい。 しかし、投稿数が多くて大変。 LLMを使えば、専用の機械学習モデルなど なしでも分類できるのでは?
  25. /84 71 投稿内容から全体としてのポジネガと、 カテゴリごとのポジネガを分類する 投稿内容のポジネガ分析: 目標 アクションが楽しい! マッチングに時間かかるのだけ なんとかして欲しいけど、 おすすめはできる。

    シナリオも熱かった 感想の投稿 • 全体: ポジティブ • ポジティブなカテゴリ: 操作感, シナリオ • ネガティブなカテゴリ: マッチング 判定結果
  26. /84 72 投稿内容のポジネガ分析: 利用プロンプト 100件のデータについて手動でラベリングを実施し、 それをプロンプトに加えるfew-shot promptingを実施した あなたは[タイトル]の感想を判定するAIです。 # 判定の定義:

    - ポジティブ: 好意的な意見を述べている場合。 - ネガティブ: 否定的な意見を述べている場合。 - ニュートラル: 特に好意的でも否定的でもなく、客観的 な情報や意見を述べている場合。またはゲームと無関係 なことを述べている場合。 # 判定結果例: (以下100個ほど縦に並ぶ) テキスト: [実際の投稿] 判定: ポジティブなカテゴリ: ネガティブなカテゴリ: システムプロンプトのイメージ # 入力テキスト [実際の投稿] # 分析する観点 [分析対象のカテゴリ] # 出力フォーマット {{ "explanation": str(日本語), "positive_categories": ["str"], "negative_categories": ["str"], "sentiment": "pos" | "neg" | "neutral” }} ユーザープロンプトのイメージ
  27. /84 73 投稿内容のポジネガ分析: 結果 • 実施件数: 38750件(900件以上が英語) • 分析精度: 概ね8割程度

    • ポジ/ネガ/ニュートラルの判定 86.5% (173/200) • カテゴリの判定 81.5% (163/200) • 効果: 約4営業日分の時短効果 • 約20件/分(0.05 分/件)かかる作業を自動化 • 38750 件 * 0.05分/件 ≒ 約33時間 ≒ 4営業日
  28. /84 79 画像モデレーションの効率化: 実行例 検証中ではあるが、プロンプトで指示した内容が指摘できる ▼事案:骸骨表現 ▼リスク:中 ▼理由:中国の倫理規定では骸骨をモチーフにしたキャラクターや デザインが禁止される場合があります。特に中国市場向けの コンテンツでは、骸骨表現が不適切とされる可能性が高いです。

    ▼対策: 1. 中国市場向けの場合、骸骨モチーフを避けるか、別のデザインに 変更することを検討してください。 2. 骸骨のデザインを抽象化し、骨の形状を直接的に連想させない形に 修正する。 3. コンテンツの文脈やターゲット市場を明確にし、必要に応じて 注意喚起文を追加する。