Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成AIによって変わる世界 -可能性とリスクについて考える-
Search
Kazuki Maeda
October 02, 2024
Technology
2
110
生成AIによって変わる世界 -可能性とリスクについて考える-
某中高一貫校での講義に利用した資料
Kazuki Maeda
October 02, 2024
Tweet
Share
More Decks by Kazuki Maeda
See All by Kazuki Maeda
新しいことを組織ではじめる、そしてつづける
kzkmaeda
5
760
20240824_JAWS_PANKRATION_2024
kzkmaeda
0
45
20240416_devopsdaystokyo
kzkmaeda
1
380
20240321_生成AI時代のDevOps
kzkmaeda
2
990
20240222_LangChain_ver0.1.0_LCEL
kzkmaeda
4
360
20240201_クラウド利用料を 半額にするために取り組んだ10+のコト
kzkmaeda
4
7.1k
20231027_Bedrock勉強会
kzkmaeda
3
1.2k
20231011_LangChainコントリビュートのすゝめ
kzkmaeda
0
1.2k
LangChain Japan MeetUp 2023-07-20
kzkmaeda
0
590
Other Decks in Technology
See All in Technology
【令和最新版】AWS Direct Connectと愉快なGWたちのおさらい
minorun365
PRO
5
760
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.9k
SRE×AIOpsを始めよう!GuardDutyによるお手軽脅威検出
amixedcolor
0
150
Incident Response Practices: Waroom's Features and Future Challenges
rrreeeyyy
0
160
これまでの計測・開発・デプロイ方法全部見せます! / Findy ISUCON 2024-11-14
tohutohu
3
370
AIチャットボット開発への生成AI活用
ryomrt
0
170
B2B SaaSから見た最近のC#/.NETの進化
sansantech
PRO
0
870
OTelCol_TailSampling_and_SpanMetrics
gumamon
1
190
Python(PYNQ)がテーマのAMD主催のFPGAコンテストに参加してきた
iotengineer22
0
500
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
220
10XにおけるData Contractの導入について: Data Contract事例共有会
10xinc
6
650
BLADE: An Attempt to Automate Penetration Testing Using Autonomous AI Agents
bbrbbq
0
320
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Thoughts on Productivity
jonyablonski
67
4.3k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
Site-Speed That Sticks
csswizardry
0
27
The World Runs on Bad Software
bkeepers
PRO
65
11k
Side Projects
sachag
452
42k
10 Git Anti Patterns You Should be Aware of
lemiorhan
655
59k
Why Our Code Smells
bkeepers
PRO
334
57k
Raft: Consensus for Rubyists
vanstee
136
6.6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
44
2.2k
Optimizing for Happiness
mojombo
376
70k
[RailsConf 2023] Rails as a piece of cake
palkan
52
4.9k
Transcript
生成 AIによって変わる世界 可能性とリスクについて考える 1
イントロダクション イントロダクション 2
自己紹介 前田 和樹 atama plus株式会社 Engineer Manager データや機械学習、生成 AIに関する開発 イントロダクション
3
アンケート結果を見てみる イントロダクション 4
クイズ 引用: https://vdata.nikkei.com/newsgraphics/ai-art/ イントロダクション 5
イントロダクション 6
イントロダクション 7
イントロダクション 8
触ってみよう イントロダクション 9
以下の指示(プロンプト)を ChatGPTに入れてみよう 好きな言葉を入れて ChatGPTに小説を書いてもらおう あなたは小説家です。以下のシチュエーションの小説を400字程度で作成してください。 - ジャンルは〇〇〇です - 主人公は〇〇〇です -
他に〇〇〇〇〇〇が登場します - 〇〇〇〇〇〇〇〇といったストーリーです イントロダクション 10
作成された記事を対話で進化させよう - もっと〇〇〇なストーリーにしてください - 登場人物に〇〇〇な人を追加してください - 〇〇〇で続きを書いてください イントロダクション 11
この技術が、 世の中にどんな価値をもたらしていくのか?? イントロダクション 12
生成 AIの種類と活用 生成 AIの種類と活用 13
テキスト生成 概要 与えられた命令( prompt)に応じて自然言語のテキスト、文章を生成する技術 主なツール ChatGPT、 Geminiなど 生成 AIの種類と活用 14
テキスト生成の活用例 チャットボット Webサイトなどの問い合わせ対応の裏側で活躍 コンテンツ生成 記事、ブログなどの文章コンテンツの自動生成 コーチング アイデアや困りごとの相談、解決支援 生成 AIの種類と活用 15
画像・動画生成 概要 与えられた命令( prompt)に応じて画像や動画を生成する技術 主なツール ChatGPT(旧 DALL-E) 、 Stable Diffusionなど
生成 AIの種類と活用 16
画像・動画生成の活用例 広告とデザイン バナーやプロモーション素材の自動生成。 アートとエンターテイメント AIアートやキャラクターデザインの制作。 映像制作 動画や映画のシーン生成、特撮の補助。 生成 AIの種類と活用 17
実際に活用されはじめている事例 みなさんの身近で生成 AIが活用されている事例の紹介 生成 AIの種類と活用 18
メルカリ メルカリ AIアシスト メルカリの利用シーンにおいて AIが支援 商品が売れるよう出品者に改善 提案を行う機能 引用:メルカリ AIアシスト 生成
AIの種類と活用 19
マクドナルド プロモーション動画の生成 生成 AIを用いて制作したプロモーション動 画を Xで公開 一部で批判的な反応も 引用:マクドナルドが作った AI広告動画 生成
AIの種類と活用 20
コカコーラ Create Real Magic 生成 AIを用いて自分だけのクリスマス カードを制作 消費者参加型広告に生成 AIによるオリ ジナリティを組み合わせた事例
引用: Create Real Magic 生成 AIの種類と活用 21
教育分野での活用事例 生成 AIの種類と活用 22
レアジョブ AIレッスンレポート 英会話レッスン後の復習を効率化す るサービス 他にも AIが自動採点を行うスピーキン グテストサービスなども提供 引用: AIレッスンレポート β
生成 AIの種類と活用 23
ベネッセ 自由研究おたすけ AI 小学生向けに自由研究のテーマ選定 や子供達の疑問に対するアドバイス を提供 引用:自由研究おたすけ AI β版 生成
AIの種類と活用 24
より発展的な生成 AIの活用事例 実際に産業や学術の世界を変えつつある生成 AIの活用事例 生成 AIの種類と活用 25
創薬業界 NVIDIA BioNeMo タンパク質構造予測やタンパク質配 列生成を可能とする生成 AI 創薬にかかる研究開発スピードの短 縮を狙う 引用: NVIDIA
BioNeMo 生成 AIの種類と活用 26
自動運転業界 Turing Heron 完全自動運転に向けた柔軟な状況判 断を生成 AIで実現しようとしている 複雑な現実世界を理解し、人間のよ うに考えて判断することを目指す 引用: Turing
Heron 生成 AIの種類と活用 27
AIと生成 AIの仕組み 生成 AIのしくみ 28
AIとは何か コンピューターが人間のように考えたり(考えているように見えたり) 、学んだり できる技術 生成 AI以前から実生活に多く利用されている たとえば スマホの顔認識機能 Amazonのおすすめ商品 機械翻訳
生成 AIのしくみ 29
AIの歴史 1950年代 : アラン・チューリングが「機械は知能を持てるか?」という問いを提 起。ここから AIの研究がスタート。 1980年代 : ルールベースのエキスパートシステムが主流。特定の知識に基づいて問 題解決を行う
AI。 2000年代 : 機械学習と大量のデータを利用した AIが注目を集める。特に、データ 解析の分野で活躍。 2010年代 : ディープラーニング(深層学習)が大きな飛躍を遂げ、 AIが画像認識や 自然言語処理で急速に進化。 生成 AIのしくみ 30
AIは言語を学習できるのか?:記号設置問題 そもそも人間はどうやって言語能力を習得するのか? i. はじめは周囲の大人が話す言葉をじっと聞いている ii. 徐々に言葉と概念を紐付け始める(オノマトペ) iii. 徐々に単語が増え、複数の単語を繋げ、やがて文章をつくる この過程において、 「単語」と「現実世界の概念」との関係を学習する
これを「記号設置問題」と呼ぶ 詳細な言語獲得プロセスに関してはまだまだ謎が多い 生成 AIのしくみ 31
AIは言語を学習できるのか?:形態 素解析 言語処理は AIの研究分野の一つ、自然言語 処理として発達 文の構造や意味を考える前に単語を認識す る必要があり、意味を持つ最小単位に分割 する「形態素解析」が発達 分割した単語を構文解析などで分類 生成
AIのしくみ 32
AIは言語を学習できるのか?:形態素解析 簡単なプログラムで形態素解析の動きを見てみましょう 生成 AIのしくみ 33
AIは言語を学習できるのか?:機械学習 初期の AIは専門家が辞書やルールを作り、それらを機械に読み込ませていた(エ キスパートシステム) 一定規模以上の知識になると、人間が入力することに限界があった 2000年代から、機械が自ら学習する手法が台頭(機械学習) コンピューターの性能が劇的に進化した インターネットにより学習可能なテキストデータが大量に手に入るようにな った 生成
AIのしくみ 34
AIは言語を学習できるのか?:機械学習の限界 機械学習の活用を進めても、機械に言語を学習させるのは難しかった 目的別の学習用データを大量に用意する必要がある 学習効率が悪い(人間と比べて) 目的が明確でない場合、学習用データの用意もできない 人間の言語習得プロセスもまだ謎が多いので、それを機械に習得させるのは難し い 生成 AIのしくみ 35
生成 AIの登場まで:シャノンの情報理論 1948年、クロード・シャノンという科学者が「情報 理論」を提唱 情報を「ビット」という数値に変えることで、言葉 から意味をなくし、言葉を確率的に扱えるようにな った 情報量:高確率で使われる言葉の情報量は大きく、 低確率で使われる言葉の情報量は小さく扱う 生成
AIのしくみ 36
生成 AIの登場まで: 言語モデル 情報を言葉に適用し、文章を構 成する際に、意味ではなく、次 に来る確率が高い単語を選択す ることで文章を生成できる 言語モデル : 文に対して確率を割
り当てることができるモデル 生成 AIのしくみ 37
生成 AIの登場まで: 言語モデル 簡単なプログラムで言語モデルの動 きを見てみましょう 生成 AIのしくみ 38
生成 AIの登場まで:言語モデル 補足 : 言語モデルでは言葉をベクトルとして捉えている 生成 AIのしくみ 39
生成 AIの登場まで:学習する言語モデル 言語モデルを巨大にして、確率的に単語の推測が可能な状態を目指す インターネットにある学習データを用いて機械が自分で問題を設定し、自分 で答え合わせする(自己教師あり学習) 言葉の意味は分からずとも、インターネットにある膨大な量のデータを全て数字 と確率で処理できるようになる こうして作られた言語モデルは、言葉の意味を捨て、前の単語から後の単語を確 率的に予測できるようになる 生成
AIのしくみ 40
生成 AIの登場まで: (補足)画像や音楽への転用 ここまで話してきたテキストに対する言語モデルと同様に、画像や音楽でも、そ れぞれを数値データとして扱い、次に来るデータを確率的に予測するモデルを作 成することができる 大まかな原理は、テキストの際と変わらない 生成 AIのしくみ 41
生成 AIの登場まで:ここまでのまとめ 記号設置問題 形態素解析 シャノンの情報理論 言語モデル 生成 AIのしくみ 42
生成 AIの登場まで:ここまでのまとめ 記号設置問題 : 「単語」と「現実世界の概念」との関係をどうやって結びつけるか 形態素解析 : 文章を意味を持つ最小単位に分割する シャノンの情報理論 :
情報を数値に変えることで、言葉から意味をなくし、言葉を 確率的に扱う 言語モデル : 文に対して確率を割り当てることができるモデル 生成 AIのしくみ 43
生成 AIの登場まで:ここまでのまとめ 言葉から「意味」をなくし、全て「数値」と「確率」で扱えるようになった 生成 AIのしくみ 44
生成 AIの登場:大規模言語モデル インターネット上の大量のデータと、コンピューターの性能をフル活用して言語 モデルの拡張に関する研究が近年盛んに行われてきた 代表的な企業が、 OpenAI(米) 、 Anthropic(米) 、 Google(米)
、 Meta(米) 生成 AIのしくみ 45
生成 AIの登場:大規模言語モデル 学習に用いるデータ量と、学習自体の複雑さを示すパラメータ数が劇的に進化す ることで、言語モデルは大規模言語モデルに進化し、圧倒的な性能を示すように なった 名称 企業名 訓練データ量 パラメータ数 発表年
GPT-1 OpenAI 4.5 GB 1.2 億 2018年 GPT-2 OpenAI 40 GB 15 億 2019年 GPT-3 OpenAI 570 GB 1750億 2020年 GPT-4 OpenAI 1500 GB(推定) 数千億 ~ 数兆 2023年 生成 AIのしくみ 46
生成 AIの登場:大規模言語モデル データ量とパラメータ数を大きくするには、その分膨大なコンピューターが必要 お金と時間をかけて各社競い合うようにモデルを進化させている 一つのモデルに対し、数十億円以上のお金がかかっていると言われる 生成 AIのしくみ 47
生成 AIのしくみ 48
生成 AIの登場:大規模言語モデル どのくらいのデータとパラメータを与えるといいのか? 訓練データを増やせば増やすほど、 パラメータ数を大きくすればするほど、 コンピューターにたくさん計算させればさせるほど、 言語モデルの性能は改善されていくということがわかった(べき乗則) 生成 AIのしくみ 49
生成 AIの登場:大規模言語モデル モデルを大きくすると、徐々に性能が改善するだけでなく、ある規模になると急 にこれまで解けなかった問題が解けるようになる現象が観測されている(創発) 数十億パラメータでは解けなかった問題が、数百億パラメータになると急に 解けるようになる、など この現象が発生する理由については、未だ解明されていない 生成 AIのしくみ 50
生成 AIの登場: 大規模言語モデルと生成 AIの違い 大規模言語モデル : 言葉の確率的な振る舞いを決め る知能 生成 AI技術
: テキストに限らず、画像や音楽 を生成する技術 生成 AIサービス : 生成 AI技術を使いやすい形のサ ービスとして提供 生成 AIのしくみ 51
生成 AIの登場:ここまでのまとめ 言語モデルを実用可能なレベルまで拡張するため、各社が莫大な時間とお金を投 資して大規模化したものを大規模言語モデルと呼ぶ 大規模言語モデルは、データやパラメータを増やせば増やすほど高性能化してい くことが知られている(べき乗則) また、ある一定の規模になると、それまで解けなかった問題が突然解けるように なる現象も観測されている(創発) 大規模言語モデルなどの生成 AI技術を一般に利用しやすい形で提供しているのが
ChatGPTなどのサービス 生成 AIのしくみ 52
触ってみよう ② 生成 AIのしくみ 53
以下の指示(プロンプト)を ChatGPTに入れてみよう 好きな言葉を入れて ChatGPTに小説を書いてもらおう あなたは小説家です。以下のシチュエーションの小説を400字程度で作成してください。 - ジャンルは〇〇〇です - 主人公は〇〇〇です -
他に〇〇〇〇〇〇が登場します - 〇〇〇〇〇〇〇〇といったストーリーです 生成 AIのしくみ 54
休憩・疑問解消タイム 休憩 55
生成 AIとリスク 生成 AIとリスク 56
情報の信憑性 ここまで述べたように、生成 AIは厳密な知識をもって解答を生成しているわけで はない 従って、正しくない情報が生成されることがある(幻覚・ハルシネーション) 幻覚により生成された誤った情報が、人間や、専門家でさえも区別できないこと もある 生成 AIとリスク 57
情報の信憑性:事例 三豊市の「ごみ出し案内」への ChatGPT活用 東大松尾研と三豊市が共同で行った実証実験 市民からのゴミ出しルールなどの問い合わせに ChatGPTで解答する仕組みを検討 脱線:ここで ChatGPTと呼んでいるのが正しいかどうか考えてみよう 正答率は 94%ほどであったが、
5%以上も正しくない情報が出力されるため、市の 業務としては利用できないと判断し、断念した https://www.city.mitoyo.lg.jp/kakuka/shiminkankyou/eisei/2/chatGPT/index.html 生成 AIとリスク 58
プライバシーの問題 ChatGPTなどの生成 AIサービスは、何を聞いても即座に答えてくれるので、人には 言えないことの相談相手として使われることもある 一方で、生成 AIサービスを提供している会社は、誰がどんな内容を書き込んだの かのデータを保有することとなる また、一部の生成 AIサービスは、ユーザーからの入力を基にさらに学習すること で精度を上げていくものもある
プライベートな相談が言語モデルに組み込まれ、知らない誰かに届いてしまう可 能性も・・ 生成 AIとリスク 59
プライバシーの問題:事例 OpenAI社は、 ChatGPTで行われた会話データは、自社の言語モデルの再学習に利 用するポリシーとしている 学習への利用を望まない場合、自身で学習させない設定をする必要がある Anthropicなど、ユーザーのデータをモデルの学習に再利用しないポリシーの会社 もあるので、利用しているサービスのポリシーを理解しておくことが大事 OpenAI 利用規約 生成
AIとリスク 60
プライバシーの問題:事例 ChatGPTで、自分以外のユーザーの会話履歴の一部が見れてしまうバグが発生 ※現在は修正済み OpenAI社は「会話に個人情報をを共有しないよう」に呼びかけている https://japan.cnet.com/article/35201548/ 生成 AIとリスク 61
法律的な問題 生成 AIによって生成されたテキストや画像などの権利(著作権)の帰属や、その 生成責任について問題となるケースがある 生成 AIに指示して作成させた画像の著作権は、指示した人に帰属するのか? その画像が誰かの著作物と類似している(著作権を侵害しているとみなされ る)場合、その責任は支持した人が負うべきなのか? 生成 AIと著作権の問題はまだ議論の過渡期にある
日本の著作権法上では、 AIが生成した画像には著作権がないとの見方が強い 生成 AIとリスク 62
法律的な問題:事例 生成 AIで生成された、模倣イラストがインターネッ ト上に無数に存在している https://vdata.nikkei.com/newsgraphics/ai-anime/ 生成 AIとリスク 63
倫理的な問題 大規模言語モデルの学習データには、多様な価値観や偏見をもったデータが含ま れている そういったデータを学習しモデル化された大規模言語モデルは、時に偏見や誤っ た価値観に基づいた発言を生成する恐れがある 大規模言語モデルはどのような価値観を持つべきか?利用者は出力をどう取り入 れるべきか? 生成 AIとリスク 64
倫理的な問題:事例 (生成 AIより前の事例) Amazonの AIを用いた採用プロセス 履歴書審査において、 Amazonにより適した人を選別する際に AIを用いた審査を実 施 この時、過去に
Amazon(特に開発職において)では男性を採用することが多かっ たことから、 AIが女性に対して不利な判定を行っていたことが判明した 現在は AIを用いた審査は実施されていない アマゾンがAI採用打ち切り (2018) 生成 AIとリスク 65
本人の証明の難しさ 生成 AIにより、誰かに似せた声や見た目で本人とは全く関係のない発言を行わせ たりすることも簡単にできるように ディープフェイクと呼ばれる 有名人に本人の思想とは無関係な過激な発言をさせたり、非常に精巧な詐欺サイ トを作成することも可能 インターネットで簡単に得られる情報が、本当に正しい情報なのか見極める責務 が利用者により強く求められる 生成
AIとリスク 66
本人の証明の難しさ:事例 岸田総理の動画を悪用したフェイク 動画が Youtubeなどに拡散 これを機に都知事選に立候補した安 野さんと岸田総理が意見交換するな ど、専門家による対策検討が急がれ ている 生成 AIとリスク
67
産業構造への影響 生成 AIが多くの職業の生産性を向上させる期待がある一方、雇用消失や格差拡大 といった懸念もある 生成 AIが得意な領域の多くを担う職種に対しては、業務の 90%以上が自動化され る可能性がる、という研究も 生成 AIとリスク
68
生成 AIとどう向き合っていくか 生成 AIとどう向き合っていくか 69
AIは道具であると認識する あくまでも AI・生成 AIは道具である、という認識のもとで利用する 道具である以上、その道具の使い方に習熟する必要はあり、使い方を間違えると 逆効果を生むこともある 生成 AIとどう向き合っていくか 70
AIにできることを見極める 生成 AIは数字で確率的にテキストや画像を生成するもので、知識を持っているわ けでもなく、間違いを起こすことも十分にある AIは与えられたデータからルールを発掘したり、判断したりすることは得意なの で、道具としての AIに如何にデータを与え、判断させるか、最終的な決定は人間に 帰属させるか、といった使い方を意識する 生成 AIとどう向き合っていくか
71
人間らしい複雑な問題に挑戦する 世の中は日増しに複雑さを増しており、生成 AIに解けないような問題、代替でき ない仕事は無くなることはない また、 AIは自分で課題を見つけて設定することはできない これからの時代を生きていくのに、複雑で抽象的な課題を自ら見つけ、解決して いける(その過程で生成 AIを活用する!)ような人になってほしいです 生成
AIとどう向き合っていくか 72
ありがとうございました 生成 AIとどう向き合っていくか 73
参考文献 大規模言語モデルは新たな知能か (岩波科学ライブラリー ) AI白書 2023 (AI白書編集委員会 ) 大規模言語モデル入門 (技術評論社
) 生成 AIとどう向き合っていくか 74