Upgrade to Pro — share decks privately, control downloads, hide ads and more …

”知のインストール”戦略:テキスト資産をAIの文脈理解に活かす

 ”知のインストール”戦略:テキスト資産をAIの文脈理解に活かす

zawakin(株式会社ナレッジワーク AIエンジニア)
https://x.com/zawawahoge

※「AI Coding Meetup #1 - チーム開発 ✕ AI、みんなの実践知」(2025/4/8)登壇資料です
https://layerx.connpass.com/event/347094/

More Decks by KNOWLEDGE WORK / 株式会社ナレッジワーク

Other Decks in Technology

Transcript

  1. © Knowledge Work Inc. ⾃⼰紹介 zawakin (@zawawahoge) 株式会社ナレッジワーク AIエンジニア エキスパート

    (2020年⼊社) ⾃社開発BtoB SaaS「ナレッジワーク」のAI機能開発‧導 ⼊を多数経験。 現在やっていること • AI技術戦略策定 • AIエージェント開発 • 組織イネーブルメント(社内AI活⽤推進含む) 2 今の所Cursorが好き
  2. © Knowledge Work Inc. Profile 会社概要 3 Profile 会社概要 創業日 代表者

    事業内容 2020年4月1日 麻野 耕司 ナレッジワークの開発・提供
  3. © Knowledge Work Inc. Agenda ⽬次 4 • 課題:AIは「組織の⽂脈」を読めない? •

    戦略:「テキスト資産」から「知」をインストール • 実践:「知の構造化」プロセスと結果 • 展望:AIによる「⽂脈理解」のその先
  4. © Knowledge Work Inc. Agenda ⽬次 5 • 課題:AIは「組織の⽂脈」を読めない? •

    戦略:「テキスト資産」から「知」をインストール • 実践:「知の構造化」プロセスと結果 • 展望:AIによる「⽂脈理解」のその先
  5. © Knowledge Work Inc. AIの進化とコンテキストサイズ 8 8 理論上は、⼤規模コードベースも扱える!? → これで⼤規模開発の課題は全て解決…

    ?? AIコーディングツール、⽇々進化中 → Cursor, Cline, Devin, … → AI Agent でソフトウェア開発をするのが当たり前の時代に突⼊ LLMの驚異的な進化、特に「コンテキストウィンドウ増加」 • 2023年: 10万トークンが最先端 • → 2025年初頭: 100万~200万トークン時代へ! (数百万トークン)
  6. © Knowledge Work Inc. 巨⼤なコンテキストサイズだけでは解決しない「壁」 10 10 ⼤きなコンテキストサイズを持つだけでは、 AIは真の「組織の⼀員」にはなれない 深い「⽂脈理解」の難しさ

    • 組織⽂化、歴史的経緯、暗黙のルール、設計思想の"ニュアンス" etc. • 例:「この部分は昔問題があったから、あえてこう書いてる」等はAIには分からない 効率‧コスト‧ノイズの問題 • 巨⼤なコンテキストを毎回処理 → コスト‧速度は現実的? • ⼤量の情報(ノイズ含む)から本当に重要な情報を⾒つけられる? 組織ルールの反映不⾜ • コンテキストサイズが⼤きくても「私たちのチームのコーディングスタイル」を完全に守っては くれない…
  7. © Knowledge Work Inc. 「AIに教える」側の難しさ 12 12 AIの限界 (⽂脈理解など) +

    ⼈間の限界 (ルール作成など) → AIに「何を」「どうやって効率的に」教えるかが、これからの鍵! ここで⾔う「AIに組織知⾒を教える」とは主に以下の⼆つ • ルールファイル/コンテキスト(Cursor,Cline等) • プロンプトエンジニアリング ⾔語化が難しい (暗黙知をどうやってルールに?) 粒度が難しい (どこまで細かく書けばいいの?) 管理が⼤変 (ルールが増えるとメンテできない…)
  8. © Knowledge Work Inc. Agenda ⽬次 13 • 課題:AIは「組織の⽂脈」を読めない? •

    戦略:「テキスト資産」から「知」をインストール • 実践:「知の構造化」プロセスとと結果 • 展望:AIによる「⽂脈理解」のその先
  9. © Knowledge Work Inc. 戦略:テキスト資産からの「知」の抽出と構造化 15 15 組織内に眠る「テキスト資産」は宝の⼭ 着眼点:組織内に眠る「テキスト資産」 •

    GitHub Pull Request レビューコメント (数千〜数万件)、議事録、スタイルブック etc. ◦ これらは単なる過去の記録ではない GitHub 議事録 …
  10. © Knowledge Work Inc. 戦略:テキスト資産からの「知」の抽出と構造化 16 16 ⼤量の⽣情報(ノイズ含む)をAIに探させるのではなく… → 凝縮された重要な「知」を与えることで効率と精度を両⽴

    • Step1: テキスト資産から「知(ルール、原則、価値観)」を抽 出 • Step2: AIが理解しやすい形に構造化‧凝縮する • Step3: 構造化された「知」をAIにインストール(ルールや原則 をプロンプトに⼊れる)
  11. © Knowledge Work Inc. ⽬指す姿:AIを「良き開発パートナー」へ 18 18 AIを真の「良き開発パートナー」に育てましょう AIが組織の「⽂脈」を深く理解 •

    単なるコード⽣成ツールを超えた存在へ より「筋の良い」コード⽣成 • 組織のルールや設計思想を⾃然に反映 ◦ → コード品質向上、レビュー負荷軽減に繋がる ⼈間とAIのより⾼度な協調 • AI:組織知に基づいた的確な提案‧⽀援 • ⼈間:より創造的なタスク、本質的な課題解決に集中
  12. © Knowledge Work Inc. Agenda ⽬次 19 • 課題:AIは「組織の⽂脈」を読めない? •

    戦略:「テキスト資産」から「知」をインストール • 実践:「知の構造化」プロセスと結果 • 展望:AIによる「⽂脈理解」のその先
  13. © Knowledge Work Inc. Step 1: 貴重な「テキスト資産」の収集 22 22 対象ユーザーや期間を絞って収集も可能

    対象データ: 厳選されたGitHubレビューコメント(数千件) • なぜコメント? → コードベースの「Why」を含む質の⾼い知⾒の宝庫だから 収集⽅法: GitHub API を利⽤ (Tips) • 権限は Read access to metadata and pull requests でOK (Fine-grained Token) • ⾃動化: Pythonスクリプトで⼀括ダウンロード GitHub コメント コメント コメント コメント
  14. © Knowledge Work Inc. ⽬的: ⼤量のコメントから「ルール」の候補を効率的に抽出 (1) まず「観点」を設定: • ChatGPT等に問いかけ、⼀般的なレビュー観点6つを⽣成

    ◦ 例: 「コードスタイル」「機能実装」「設計」「設計‧モジュール化およびAPI/インターフェース設計」「ドキュメント‧コメントのルール」「テストコードとテスト戦略」「インフラ‧設定‧その他の改善点」 (2) バッチ処理で効率化: • 全コメントを100件ずつのバッチに分割 • 各バッチ × 6観点 でLLM (OpenAI o3-mini) でルール抽出 (3) LLMへの指⽰ (プロンプト): • 例:以下のレビューコメント群から、「{観点名}」に関するルールとその具体例を抽出してください。 • 特に、内容例とポイントを具体的に⽰してください。 (4) 結果: • 各観点ごとにルール候補が多数抽出される • → 全体で約62万⽂字のルールテキスト (JSON) が⽣成! ルール ルール コメント コメント コメント コメント Step 2: LLMを活⽤したルールの⾃動抽出 23 23 同じコメントセットから多⾓的に情報を抽出 → 情報損失を最⼩化!
  15. © Knowledge Work Inc. 「コードスタイル」ルール コメント コメント コメント コメント Step

    2: LLMを活⽤したルールの⾃動抽出 24 24 コメントセットのバッチ処理で多⾓的に情報を抽出 → 情報損失を減らす! コメント コメント コメント コメント 「API/インターフェイス 設計」ルール コメント セット … コメント セット … 観点1 観点2
  16. © Knowledge Work Inc. Step 3: Geminiによる原則への抽象化 25 25 ⼤規模コンテキストを活⽤し、全体像を踏まえた本質的な原則を抽出

    ⽬的: 抽出された⼤量のルール候補 (重複も含む)から、本質的で汎 ⽤的な「原則」を導き出す ⽅法: • 約62万⽂字のルールJSONを Gemini 2.5 Pro (1M トークン!) に⼀括⼊⼒! • → LLMにルールのグルーピングと抽象化を指⽰ ルール ルール ルール ルール 原則 原則 ルール ルール 3600個 30個
  17. © Knowledge Work Inc. 結果:⾒えてきた「組織の⼤原則」 27 27 AIのためのルール化が、結果的に組織⽂化‧価値観の⾔語化にも繋がった! 可読性 &

    保守性 ⼀貫性 & 予測可能性 堅牢性 & 信頼性 テスト容易性 & 品質保証 関⼼事の分離 & 疎結合 明確な意図の伝達
  18. © Knowledge Work Inc. Agenda ⽬次 28 • 課題:AIは「組織の⽂脈」を読めない? •

    戦略:「テキスト資産」から「知」をインストール • 実践:「知の構造化」プロセスと結果 • 展望:AIによる「⽂脈理解」のその先
  19. © Knowledge Work Inc. ⽬標: Cursor などのAIエディタのルールファイルとしてチームで運⽤! 今後の活⽤イメージ:AIエディタ連携 30 原則

    原則 ⼤原則 ルール ファイル ルール ルール 実現したいこと: • AIがコード⽣成や提案を⾏う際に、常に組織の原則‧ルールを考慮する • 開発者が都度指⽰せずとも、⾃然と「組織らしい」コードが書ける世界へ
  20. © Knowledge Work Inc. まとめとメッセージ 31 • 今⽇のポイント ◦ AI時代、「組織知」は競争⼒の源泉

    (テキスト資産は宝の⼭!) ◦ AIの⽂脈理解を深めるため「知の構造化」を実践しよう • まとめ ◦ AIに"何を教えるか"で差がつく ◦ 組織の強みを⾔語化し、AI時代の競争⼒を築こう 「知の構造化」、 ⼩さな⼀歩から始 めてみませんか?