”知のインストール”戦略：テキスト資産をAIの文脈理解に活かす

”知のインストール”戦略：テキスト資産をAIの⽂脈理解に活かす @zawakin (株式会社ナレッジワーク)

© Knowledge Work Inc. ⾃⼰紹介 zawakin (@zawawahoge) 株式会社ナレッジワーク AIエンジニアエキスパート
(2020年⼊社) ⾃社開発BtoB SaaS「ナレッジワーク」のAI機能開発‧導⼊を多数経験。現在やっていること • AI技術戦略策定 • AIエージェント開発 • 組織イネーブルメント（社内AI活⽤推進含む） 2 今の所Cursorが好き

© Knowledge Work Inc. Proﬁle 会社概要 3 Profile 会社概要創業日代表者
事業内容 2020年4月1日麻野耕司ナレッジワークの開発・提供

© Knowledge Work Inc. Agenda ⽬次 4 • 課題：AIは「組織の⽂脈」を読めない？ •
戦略：「テキスト資産」から「知」をインストール • 実践：「知の構造化」プロセスと結果 • 展望：AIによる「⽂脈理解」のその先

© Knowledge Work Inc. ナレッジワークはAIを使った開発を進めてます 6 背景：ナレッジワークはAIを使った開発を進めてます GitHub Copilot Cursor
Cline Devin etc.

© Knowledge Work Inc. 7 ⼤規模コードベースにおいて AI Coding を導⼊する際の課題の⼀つ ↓
「組織の⽂脈」を伝えることが難しい！課題

© Knowledge Work Inc. AIの進化とコンテキストサイズ 8 8 理論上は、⼤規模コードベースも扱える！？ → これで⼤規模開発の課題は全て解決…
？？ AIコーディングツール、⽇々進化中 → Cursor, Cline, Devin, … → AI Agent でソフトウェア開発をするのが当たり前の時代に突⼊ LLMの驚異的な進化、特に「コンテキストウィンドウ増加」 • 2023年: 10万トークンが最先端 • → 2025年初頭: 100万~200万トークン時代へ！ (数百万トークン）

© Knowledge Work Inc. 巨⼤なコンテキストサイズだけでは解決しない「壁」 10 10 ⼤きなコンテキストサイズを持つだけでは、 AIは真の「組織の⼀員」にはなれない深い「⽂脈理解」の難しさ
• 組織⽂化、歴史的経緯、暗黙のルール、設計思想の"ニュアンス" etc. • 例：「この部分は昔問題があったから、あえてこう書いてる」等はAIには分からない効率‧コスト‧ノイズの問題 • 巨⼤なコンテキストを毎回処理 → コスト‧速度は現実的？ • ⼤量の情報（ノイズ含む）から本当に重要な情報を⾒つけられる？組織ルールの反映不⾜ • コンテキストサイズが⼤きくても「私たちのチームのコーディングスタイル」を完全に守ってはくれない…

© Knowledge Work Inc. 「AIに教える」側の難しさ 12 12 AIの限界 (⽂脈理解など) ＋
⼈間の限界 (ルール作成など) → AIに「何を」「どうやって効率的に」教えるかが、これからの鍵！ここで⾔う「AIに組織知⾒を教える」とは主に以下の⼆つ • ルールファイル/コンテキスト(Cursor,Cline等) • プロンプトエンジニアリング⾔語化が難しい（暗黙知をどうやってルールに？）粒度が難しい（どこまで細かく書けばいいの？）管理が⼤変（ルールが増えるとメンテできない…）

戦略：「テキスト資産」から「知」をインストール • 実践：「知の構造化」プロセスとと結果 • 展望：AIによる「⽂脈理解」のその先

© Knowledge Work Inc. 戦略：テキスト資産からの「知」の抽出と構造化 15 15 組織内に眠る「テキスト資産」は宝の⼭着眼点：組織内に眠る「テキスト資産」 •
GitHub Pull Request レビューコメント (数千〜数万件)、議事録、スタイルブック etc. ◦ これらは単なる過去の記録ではない GitHub 議事録 …

© Knowledge Work Inc. 戦略：テキスト資産からの「知」の抽出と構造化 16 16 ⼤量の⽣情報（ノイズ含む）をAIに探させるのではなく… → 凝縮された重要な「知」を与えることで効率と精度を両⽴
• Step1: テキスト資産から「知（ルール、原則、価値観）」を抽出 • Step2: AIが理解しやすい形に構造化‧凝縮する • Step3: 構造化された「知」をAIにインストール（ルールや原則をプロンプトに⼊れる）

© Knowledge Work Inc. ⽬指す姿：AIを「良き開発パートナー」へ 18 18 AIを真の「良き開発パートナー」に育てましょう AIが組織の「⽂脈」を深く理解 •
単なるコード⽣成ツールを超えた存在へより「筋の良い」コード⽣成 • 組織のルールや設計思想を⾃然に反映 ◦ → コード品質向上、レビュー負荷軽減に繋がる⼈間とAIのより⾼度な協調 • AI：組織知に基づいた的確な提案‧⽀援 • ⼈間：より創造的なタスク、本質的な課題解決に集中

© Knowledge Work Inc. 21 実践プロセス全体像：組織知をAIに繋ぐまで 1. データ収集 2.ルール抽出 3.原則導出
4.開発活⽤今⽇はこのステップを順にご紹介します！

© Knowledge Work Inc. Step 1: 貴重な「テキスト資産」の収集 22 22 対象ユーザーや期間を絞って収集も可能
対象データ: 厳選されたGitHubレビューコメント(数千件) • なぜコメント？ → コードベースの「Why」を含む質の⾼い知⾒の宝庫だから収集⽅法: GitHub API を利⽤ (Tips) • 権限は Read access to metadata and pull requests でOK (Fine-grained Token) • ⾃動化: Pythonスクリプトで⼀括ダウンロード GitHub コメントコメントコメントコメント

© Knowledge Work Inc. ⽬的: ⼤量のコメントから「ルール」の候補を効率的に抽出 (1) まず「観点」を設定: • ChatGPT等に問いかけ、⼀般的なレビュー観点6つを⽣成
◦ 例: 「コードスタイル」「機能実装」「設計」「設計‧モジュール化およびAPI/インターフェース設計」「ドキュメント‧コメントのルール」「テストコードとテスト戦略」「インフラ‧設定‧その他の改善点」 (2) バッチ処理で効率化: • 全コメントを100件ずつのバッチに分割 • 各バッチ × 6観点でLLM (OpenAI o3-mini) でルール抽出 (3) LLMへの指⽰ (プロンプト): • 例：以下のレビューコメント群から、「{観点名}」に関するルールとその具体例を抽出してください。 • 特に、内容例とポイントを具体的に⽰してください。 (4) 結果: • 各観点ごとにルール候補が多数抽出される • → 全体で約62万⽂字のルールテキスト (JSON) が⽣成！ルールルールコメントコメントコメントコメント Step 2: LLMを活⽤したルールの⾃動抽出 23 23 同じコメントセットから多⾓的に情報を抽出 → 情報損失を最⼩化！

© Knowledge Work Inc. 「コードスタイル」ルールコメントコメントコメントコメント Step
2: LLMを活⽤したルールの⾃動抽出 24 24 コメントセットのバッチ処理で多⾓的に情報を抽出 → 情報損失を減らす！コメントコメントコメントコメント「API/インターフェイス設計」ルールコメントセット … コメントセット … 観点１観点２

© Knowledge Work Inc. Step 3: Geminiによる原則への抽象化 25 25 ⼤規模コンテキストを活⽤し、全体像を踏まえた本質的な原則を抽出
⽬的: 抽出された⼤量のルール候補（重複も含む）から、本質的で汎⽤的な「原則」を導き出す⽅法: • 約62万⽂字のルールJSONを Gemini 2.5 Pro (1M トークン!) に⼀括⼊⼒！ • → LLMにルールのグルーピングと抽象化を指⽰ルールルールルールルール原則原則ルールルール 3600個 30個

© Knowledge Work Inc. Step 3: Geminiによる原則への抽象化 26 26 ⼤規模コンテキストを活⽤し、全体像を踏まえた本質的な原則を抽出
ルールルールルールルール原則原則ルールルール 3600個 30個⼤原則 6個

© Knowledge Work Inc. 結果：⾒えてきた「組織の⼤原則」 27 27 AIのためのルール化が、結果的に組織⽂化‧価値観の⾔語化にも繋がった！可読性 &
保守性⼀貫性 & 予測可能性堅牢性 & 信頼性テスト容易性 & 品質保証関⼼事の分離 & 疎結合明確な意図の伝達

© Knowledge Work Inc. ⽬標: Cursor などのAIエディタのルールファイルとしてチームで運⽤！今後の活⽤イメージ：AIエディタ連携 30 原則
原則⼤原則ルールファイルルールルール実現したいこと： • AIがコード⽣成や提案を⾏う際に、常に組織の原則‧ルールを考慮する • 開発者が都度指⽰せずとも、⾃然と「組織らしい」コードが書ける世界へ

© Knowledge Work Inc. まとめとメッセージ 31 • 今⽇のポイント ◦ AI時代、「組織知」は競争⼒の源泉
(テキスト資産は宝の⼭！) ◦ AIの⽂脈理解を深めるため「知の構造化」を実践しよう • まとめ ◦ AIに"何を教えるか"で差がつく ◦ 組織の強みを⾔語化し、AI時代の競争⼒を築こう「知の構造化」、⼩さな⼀歩から始めてみませんか？

”知のインストール”戦略：テキスト資産をAIの文脈理解に活かす

”知のインストール”戦略：テキスト資産をAIの文脈理解に活かす

KNOWLEDGE WORK / 株式会社ナレッジワーク PRO

More Decks by KNOWLEDGE WORK / 株式会社ナレッジワーク

Other Decks in Technology

Featured

Transcript

”知のインストール”戦略：テキスト資産をAIの⽂脈理解に活かす @zawakin (株式会社ナレッジワーク)

© Knowledge Work Inc. ⾃⼰紹介 zawakin (@zawawahoge) 株式会社ナレッジワーク AIエンジニアエキスパート

© Knowledge Work Inc. Proﬁle 会社概要 3 Profile 会社概要創業日代表者

© Knowledge Work Inc. Agenda ⽬次 4 • 課題：AIは「組織の⽂脈」を読めない？ •

© Knowledge Work Inc. Agenda ⽬次 5 • 課題：AIは「組織の⽂脈」を読めない？ •

© Knowledge Work Inc. ナレッジワークはAIを使った開発を進めてます 6 背景：ナレッジワークはAIを使った開発を進めてます GitHub Copilot Cursor

© Knowledge Work Inc. 7 ⼤規模コードベースにおいて AI Coding を導⼊する際の課題の⼀つ ↓

© Knowledge Work Inc. AIの進化とコンテキストサイズ 8 8 理論上は、⼤規模コードベースも扱える！？ → これで⼤規模開発の課題は全て解決…

© Knowledge Work Inc. コンテキストサイズが⼤きくなっても、依然として課題がある 9 巨⼤なコンテキストサイズだけでは解決しない「壁」

© Knowledge Work Inc. 巨⼤なコンテキストサイズだけでは解決しない「壁」 10 10 ⼤きなコンテキストサイズを持つだけでは、 AIは真の「組織の⼀員」にはなれない深い「⽂脈理解」の難しさ

© Knowledge Work Inc. 加えて、私たち⼈間側にもボトルネックがある 11 「AIに教える」側の難しさ

© Knowledge Work Inc. 「AIに教える」側の難しさ 12 12 AIの限界 (⽂脈理解など) ＋

© Knowledge Work Inc. Agenda ⽬次 13 • 課題：AIは「組織の⽂脈」を読めない？ •

© Knowledge Work Inc. では、どうやってAIに「組織の⽂脈」を効率的に教えるか？ 14 我々の戦略：テキスト資産からの「知」の抽出と構造化

© Knowledge Work Inc. 戦略：テキスト資産からの「知」の抽出と構造化 15 15 組織内に眠る「テキスト資産」は宝の⼭着眼点：組織内に眠る「テキスト資産」 •

© Knowledge Work Inc. 戦略：テキスト資産からの「知」の抽出と構造化 16 16 ⼤量の⽣情報（ノイズ含む）をAIに探させるのではなく… → 凝縮された重要な「知」を与えることで効率と精度を両⽴

© Knowledge Work Inc. この「知のインストール」戦略によって⽬指すもの 17 ⽬指す姿：AIを「良き開発パートナー」へ

© Knowledge Work Inc. ⽬指す姿：AIを「良き開発パートナー」へ 18 18 AIを真の「良き開発パートナー」に育てましょう AIが組織の「⽂脈」を深く理解 •

© Knowledge Work Inc. Agenda ⽬次 19 • 課題：AIは「組織の⽂脈」を読めない？ •

© Knowledge Work Inc. では、具体的にどうやって「知」を抽出‧構造化するか？ 20 実践プロセス全体像：組織知をAIに繋ぐまで

© Knowledge Work Inc. 21 実践プロセス全体像：組織知をAIに繋ぐまで 1. データ収集 2.ルール抽出 3.原則導出

© Knowledge Work Inc. Step 1: 貴重な「テキスト資産」の収集 22 22 対象ユーザーや期間を絞って収集も可能

© Knowledge Work Inc. ⽬的: ⼤量のコメントから「ルール」の候補を効率的に抽出 (1) まず「観点」を設定: • ChatGPT等に問いかけ、⼀般的なレビュー観点6つを⽣成

© Knowledge Work Inc. 「コードスタイル」ルールコメントコメントコメントコメント Step

© Knowledge Work Inc. Step 3: Geminiによる原則への抽象化 25 25 ⼤規模コンテキストを活⽤し、全体像を踏まえた本質的な原則を抽出

© Knowledge Work Inc. Step 3: Geminiによる原則への抽象化 26 26 ⼤規模コンテキストを活⽤し、全体像を踏まえた本質的な原則を抽出

© Knowledge Work Inc. 結果：⾒えてきた「組織の⼤原則」 27 27 AIのためのルール化が、結果的に組織⽂化‧価値観の⾔語化にも繋がった！可読性 &

© Knowledge Work Inc. Agenda ⽬次 28 • 課題：AIは「組織の⽂脈」を読めない？ •

© Knowledge Work Inc. 抽出‧構造化された「組織知」を、どうやって⽇々の開発に活かすのか？ 29 今後の活⽤イメージ：AIエディタ連携

© Knowledge Work Inc. ⽬標: Cursor などのAIエディタのルールファイルとしてチームで運⽤！今後の活⽤イメージ：AIエディタ連携 30 原則

© Knowledge Work Inc. まとめとメッセージ 31 • 今⽇のポイント ◦ AI時代、「組織知」は競争⼒の源泉

© Knowledge Work Inc. 【宣伝】エンジニア積極募集中！ 32 32 https://kwork.studio/recruit-engineer ナレッジワークではエンジニアを絶賛大募集中です！