Upgrade to Pro — share decks privately, control downloads, hide ads and more …

エンジニアは生成AIと どのように向き合うべきか? ことばの意味という観点から

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

エンジニアは生成AIと どのように向き合うべきか? ことばの意味という観点から

Avatar for Hitomi Yanaka

Hitomi Yanaka

May 29, 2026

More Decks by Hitomi Yanaka

Other Decks in Technology

Transcript

  1. 生成AIを活用した開発業務の効率化が急速に普及 代表例(ごくごく一部) • コーディング支援 ◦ GitHub Copilot、Claude Code、Gemini CLI、Codex CLIなど

    • テキスト生成 ◦ チャットボット、文書校正、機械翻訳、情報検索など • 画像生成 ◦ デザインプロトタイプ作成、コンテンツ制作支援など 4
  2. 生成AIを活用した開発業務の効率化が急速に普及 代表例(ごくごく一部) • コーディング支援 ◦ GitHub Copilot、Claude Code、Gemini CLI、Codex CLIなど

    • テキスト生成←今日はこちらを中心に話します ◦ チャットボット、文書校正、機械翻訳、情報検索など • 画像生成 ◦ デザインプロトタイプ作成、コンテンツ制作支援など 5
  3. どうやって単語の意味を表す?(1):one-hotベクトル 文を一定の区切り(トークン)で分割し、各トークンにID(次元)を振り、one-hot ベクトル(局所表現)にする 今日(1,0,0,0,0,0,0)      今日 (1,0,0,0,0,0,0) は (0,1,0,0,0,0,0)      は (0,1,0,0,0,0,0)

    晴れ(0,0,1,0,0,0,0)      休み (0,0,0,0,0,1,0) て (0,0,0,1,0,0,0)      だ (0,0,0,0,0,0,1) いる (0,0,0,0,1,0,0) 今日 は 晴れ て いる 1 2 3 4 5 今日 は 休み だ 1 2 6 7 9 トークン ID ※トークンの区切り方は複数通り考えられることに注意 (例:「て いる」と「ている」)モデルによって異なる
  4. 単語の意味から文の意味を計算する:言語モデル トークン系列w 1 , w 2 ,…,w i-1 の次に続くトークンw i

    の 出現確率(確からしさ)P(w 1 , w 2 ,…,w i )を計算するモデル     P(今日,の,天気,は,GPT)=0.0000003     P(今日,の,天気,は,パンダ)=0.0000007     P(今日,の,天気,は,晴れ)=0.0000127 出現確率が高い文を自然な文として生成するように学習     →今日,の,天気,は,晴れ 11
  5. 大規模言語モデルの根幹にあるモデル:Transformer [Vaswani+2017] 12 Encoder Attentionに基づくEncoder-Decoder (系列変換)モデル • Attention : 入力系列の重要な情報(どの単語に注目するか)

    を用いるしくみ マルチヘッドで並列処理可能、LLMの誕生へ • Encoder-Decoder : 入力系列を1つの埋め込みベクトルに変換する Encoderモデルと、 Encoderのベクトルを受け取り1トークンずつ生成 するDecoderモデルから構成 Decoder
  6. GPT-3:現在のChatGPTの前身[Brown+2020] • OpenAIが開発したLLM • 基本構成はGPTと同じだが、事前学習に用いるデータサイズやパラメータ 数が桁違いに大きい ◦ 570GBのテキストデータで事前学習、パラメータ数は175B ◦ LLMの性能は基本的には計算資源・データサイズ・パラメータ数が多いほど良

    い[Kaplan+2020] • GPT-3以降のLLMは、タスクの説明と少数の正解例をプロンプト として入 力に含めれば、ある程度タスクに適応できる(文脈内学習) • 現在のLLMは事前学習に加えて指示チューニング(プロンプト遵守率を高 める追加学習)、思考過程の生成を促す追加学習なども実施 14
  7. LLMの課題1:分布仮説に起因する問題 否定、量化、数量、時制、比較、代名詞など、文法が関わる意味は、 分布仮説に従うとは限らない 15 機械翻訳の例 日本語:私は泳げなくないわけではない 英語:Not that I can't

    swim. 複雑な構文になると、入力の認識や出力の生成を誤ることがある 「喫煙席のないカフェ」で 検索したのに、喫煙席のある カフェばかり出てくる… 情報検索の例
  8. LLMの課題をふまえたLLMの活用方法(1)プロンプト • LLMにどういうタスクをやってもらいたいのか、 単純な語・構文・構造で、曖昧さを残さずに、具体的に書こう ◦ 複数の意味を持つ語、否定、指示語の多用など、複雑な構文になると ハルシネーション(幻覚)を起こしやすい[Watson+2026] ◦ 悪い例:あのスピードについて教えて 「あの」は何を指す?「スピード」は映画?トランプのゲーム?

    ◦ タイポや無駄な空白も、性能に影響を与える[Romanou+2026] ◦ プロンプト最適化を使用する場合も、結局初期のプロンプト設定が重要 • LLMの学習データの多くは英語である ことを考慮しよう ◦ LLM内部では英語で思考しているという研究も[Zhong+2024] ◦ 日本語ではなく英語で聞いた方が正しい場合もある(ただし、複数言語が混在 するコードスイッチングクエリは悪化する場合もある[Zeng+2026]) 17
  9. LLMの課題をふまえたLLMの活用方法(2)タスク設定 • なるべく単純なタスク設定にしよう ◦ 人間が解けないタスクは、基本的にはLLMも解けない ◦ 1つのプロンプトで複数のタスクを聞かない(エージェントを分ける) • タスク設定やプロンプトが適切か、テストデータで確認 しよう

    ◦ 実際に頻出するデータと、例外的なデータの両方でテスト ◦ 適切なfew-shot example、参考URLなどエビデンスを与えると効果的 • タスクの背景、ロール、ペルソナをシステムプロンプト で明確に ◦ 例:あなたは社内チャットボットを開発しているエンジニアです ◦ ただし、複数の背景を与えると、部分的にしか考慮してくれない場合も • タスクに合った出力形式を指定しよう ◦ 長い文字数の遵守は苦手 例:2000字でLLMとは何か説明して 18
  10. LLMの課題をふまえたLLMの活用方法(3)人間のチェック • LLMのバイアスやハルシネーションの問題は原理的に避けられない。プロ ンプトインジェクションや情報漏洩などの安全性の問題も ◦ プロンプトインジェクション:悪意のあるプロンプトを入力してシステムプロンプト を引き出すなどの不正な挙動を誘発する攻撃 • RAG (Retrieval-Augmented

    Generation) による事実照合やガードレール モデルなど、データや用途に合わせて技術を使い分けよう ◦ 大規模データの高速な照合はベクトル検索型RAG、流動データの照合はエー ジェント型RAG、入力のフィルタリングはガードレールモデル • 人間ーモデル間の効率的なチェック体制( human-in-the-roop) を考えるこ とも重要 ◦ ハーネスエンジニアリング 19
  11. 今後、LLMとどのように向き合うと良いか 20 • LLMは様々な業務の効率化に活用できるようになったが、どういうタスクを 解いてもらいたいのかをことばで正確にLLMに伝える力が求められている • LLMと向き合う力は、PM力とも少し近い? ◦ 役割・仕事内容・制約を正確にわかりやすく伝える ◦

    仕事内容が問題ないか効率的に人手でチェックするしくみを考える ◦ ただし、図でLLMに意図を伝えることは(現状)難しい。 また、人に意図を伝える場合は表情や感情など、非合理な部分も大切 といった違いがあることにも注意 • LLMを効果的に活用して、効率的に業務を進めよう ご清聴ありがとうございました!