Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
Search
Y-h. Taguchi
September 22, 2024
Science
0
61
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
十色会日本研究会
9/23 11:00-17:00
於:東京大学本郷キャンパス 文学部教員談話室(法文2号館)
Y-h. Taguchi
September 22, 2024
Tweet
Share
More Decks by Y-h. Taguchi
See All by Y-h. Taguchi
マウス肝炎ウイルス感染の遺伝子発現へのテンソル分解の適用によるSARS-CoV-2感染関連重要ヒト遺伝子と有効な薬剤の同定
tagtag
0
53
大学のアウトリーチ活動(中央大学学員(OB)会主催学術講演で講演して)
tagtag
1
23
マルチオミクスデータ解析のためのカーネルテンソル分解による新しい特徴選択法
tagtag
1
55
学術講演会中央大学学員会大分支部
tagtag
0
97
学術講演会中央大学学員会いわき支部
tagtag
0
110
テンソル分解を用いた教師なし学習による変数選択法のシングルセルマルチオミックスデータ解析への応用
tagtag
1
96
学術講演会中央大学学員会八王子支部
tagtag
0
250
教師なしテンソル分解に基づく、有糸分裂後の転写再活性化におけるヒストン修飾ブックマークとしての転写因子候補の抽出法
tagtag
0
140
遺伝子発現プロファイルに基づく新しい薬物間相互作用予測法
tagtag
0
170
Other Decks in Science
See All in Science
Spectral Sparsification of Hypergraphs
tasusu
0
200
[第62回 CV勉強会@関東] Long-CLIP: Unlocking the Long-Text Capability of CLIP / kantoCV 62th ECCV 2024
lychee1223
1
760
JSol'Ex : traitement d'images solaires en Java
melix
0
120
機械学習を支える連続最適化
nearme_tech
PRO
1
180
Causal discovery based on non-Gaussianity and nonlinearity
sshimizu2006
0
200
【人工衛星】座標変換についての説明
02hattori11sat03
0
130
ほたるのひかり/RayTracingCamp10
kugimasa
0
420
Snowflake上でRを使う: RStudioセットアップとShinyアプリケーションのデプロイ
ktatsuya
PRO
0
480
AI科学の何が“哲学”の問題になるのか ~問いマッピングの試み~
rmaruy
1
2.3k
(論文読み)贈り物の交換による地位の競争と社会構造の変化 - 文化人類学への統計物理学的アプローチ -
__ymgc__
1
130
DEIM2024 チュートリアル ~AWSで生成AIのRAGを使ったチャットボットを作ってみよう~
yamahiro
3
1.4k
Mechanistic Interpretability の紹介
sohtakahashi
0
420
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Fireside Chat
paigeccino
34
3.1k
Speed Design
sergeychernyshev
25
670
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
520
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
The World Runs on Bad Software
bkeepers
PRO
66
11k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Building Adaptive Systems
keathley
38
2.3k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.9k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.3k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Transcript
十色会日本研究会 1 AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか— 中央大学理工学部物理学科 田口善弘 PDF→
十色会日本研究会 2 AI=機械学習 機械学習を巡る最近の話題
十色会日本研究会 3 ChatGPTのようないわゆる最近のAIに「東京駅 から30分以内でいける映画館を教えてください」 と聞いたら正解できると思いますか?
十色会日本研究会 4
十色会日本研究会 5 Gemini https://gemini.google.com/
十色会日本研究会 6 Claude(無料版) https://claude.ai/chats
十色会日本研究会 7 Windows copilot
十色会日本研究会 8
十色会日本研究会 9 ところがうんと難しいことはちゃんと答えられたりする
十色会日本研究会 10
十色会日本研究会 11 マルクスの資本論では労働者の搾取についてどんなふうに説明していますか? (Windows Copilot) マルクスの資本論では、労働者の搾取について以下のように説明しています。 • 労働者は自分の労働力を商品として資本家に売り、賃金として生活費に相当 する金額しかもらえない。 •
労働者が生み出した商品の価値は、労働力の価値を上回るが、その差額は 剰余価値として資本家に搾取される。 • 資本家は剰余価値を最大化するために、労働者の労働時間を延長したり、生 産力を向上させたりする。 • これによって、労働者は貧困から脱出できず、資本家は富を蓄積していく。
十色会日本研究会 12 経済学におけるMMT理論とはどのようなものですか? (Windows Copilot) 経済学におけるMMT理論とは、現代貨幣理論とも呼ばれる、貨幣や財政 政策に関する新しい理論です。MMT理論の主な主張は以下のようなもの です。 • 自国通貨を発行できる政府は、債務不履行になることはなく、インフレが
起きない限り、財政赤字を拡大しても問題ない。 • 財政赤字は、国内の需要不足を補うために必要であり、国債発行によっ て資金調達することができる。 • 税は、政府の収入源ではなく、通貨の価値を維持し、流通させるための 手段である。 MMT理論は、従来の経済学とは異なる視点から貨幣や財政を分析し、経 済政策の提案を行っています。しかし、MMT理論には批判も多く、その実 効性や問題点については議論が続いています。
十色会日本研究会 13 画像生成(ChatGPT 4o :有料版) ことばで指示するだけで絵を描く機械学習 日本のアニメに出てくる戦闘少女の絵を描いてください。
十色会日本研究会 14 富士山の冬の景色を描いてください
十色会日本研究会 15 田園を走る日本の列車の絵を描いてください。
十色会日本研究会 16 なんでこんな魔法のようなことが可能なのか? 今日はそれを説明する
十色会日本研究会 17 GPTがしていること 文章の「次の単語」を学んで、初めてみた文でも次に何が来るか予 想できるようにする。 「今日は晴れているので洗濯物を干そうと思ったら雨が降ってきた」 今日は 今日は晴れて 今日は晴れているので 今日は晴れているので洗濯物を
今日は晴れているので洗濯物を干そうと 今日は晴れているので洗濯物を干そうと思ったら 今日は晴れているので洗濯物を干そうと思ったら雨が
十色会日本研究会 18 なんで「次の単語を当てる」という学習をするだけで人間の様に 話せるのか? 「今日は」と来たらその次が「さつまいも」である場合より「晴れ て」である場合が圧倒的に高いだろう。 しかし、「今日は」だけではいろんな単語が来る可能性が高い。 ある程度長い文章なら次にくる単語は限られる。 今日は晴れているので洗濯物を干そうと思ったら → 雨が
十色会日本研究会 19 しかし、長い文章になると「一度も見たことがない文章」になること が多くなる。どうする? → 一度もみたことがない文章でもすでに学習した「見たことのあ る文章」のなかで一番似たようなものを探して使えるようにする。 あまりない文章には精度が下がる。だから、東京駅から30分の の映画館、みたいな答えも出てきてしまう。画像生成もあまりな さそうなことを要求すると途端に精度が下ってしまう。
十色会日本研究会 20 「こちらが海で踊る教授の 絵です。楽しそうですね!」 GPT-4o 海で踊る教授の絵を描いて ください。
十色会日本研究会 21 物理を教えるウサギの絵を描いてください (ChatGPT-4o) 物理→数学
十色会日本研究会 22 O1 (Open-AI) 自分の出力を フィードバック して正解するま で考える(学習 時間だけじゃ なく思考時間
も重要という 新方針)→数 学力が上昇
十色会日本研究会 23 その他の生成AI
十色会日本研究会 24 Suno AI:作曲 https://taziku.co.jp/blog/suno-ai-web (歌詞はChatGPTで作成)
十色会日本研究会 25 KING AI 1.5 : 動画生成AI https://klingai.com/
十色会日本研究会 26 小説生成(体験なし) https://note.com/it_navi/n/ne16da8c418ce
十色会日本研究会 27 なんでこんなこと (短文を入れただけで 長文の返答を作る、 画像を作る、 動画を作る、 小説を作る) が可能になったのか?
十色会日本研究会 28 情報(意味のある) ・文字の並び(長文の返し) ・画素の並び(画像) ・画素の並びと時間変化(動画) ・文字の並び(小説) はまれ、ということが本質。
十色会日本研究会 29 100字の「文」をたくさん作ったとする。 例えば1万文。100字の「文字の羅列」の総数は全部ひらがなだと しても50の100乗なので8×10169。つまり8の後に0が169個並ぶ。 ちなみに一兆は1の後に0が8個並ぶだけ。169を8で割ると21くら いなので一兆の一兆倍の一兆倍の・・・を21回やっただけの数。 この「ランダムな100字の文字列」のうち「人間が読んで意味があ る」文字列(文になっている文字列)は全体のごく僅かに過ぎない。
十色会日本研究会 30 想像力をたくましくして3次元よ りずっと高次元の空間に全て の100文字の文を配置して「意 味が似ているもの•」をまとめ ると多分「何の意味もないただ の文字列•」と別れて固まるよ うな配置が作れる(はず)。 ここに•の真ん中の「空きスペース」
に•をおくとその点は多分「まだ作ら れていない未知の意味のある文」に 対応するはず これが文の生成になる!
十色会日本研究会 31 「今日は晴れです」 「今日は雨です」 「今日は曇りです」 空きスペースに•を置くとそれは2つの文と似て いるが異なった文に対応すると考えられる。
十色会日本研究会 32 これは他のすべてに当てはまる。 ※「意味のある画像」は「各ピクセルに適当な色をラ ンダムに置いた画像」全体のごく一部。 ※「意味のある音楽」は「毎ミリ秒に適当な音を置い た音楽(つまりノイズ)」全体のごく一部。 ※「意味のある動画」は「毎ミリ秒に適当な画像を置 いた映像」全体のごく一部。
十色会日本研究会 33 つまり、文字列、画像、動画、音声、などなどについて 1)(ごく一部分の)意味のある「もの」がまとまっている高 次元空間 2)逆にこのような空間の一点を与えるとそれを文章、画 像、動画、音声に「逆変換」する関数 の2つが可能になれば自由に何かを生成するAIが作れ る。これが最近流行の生成系AIの本質。
十色会日本研究会 34 なぜ、こんなことが急に出来るようになったのか? アルゴリズムやコンピュータの性能の向上により今ま ででは考えられないような膨大なデータを使って1)と 2)を実現できるようになった。 ChatGPTの学習量:数千億語 画像生成系AIの学習量:数十億枚 これだけの数を学習できるようになったので、1)と2) の課題が可能になった。
十色会日本研究会 35 なぜ「文章」から画像、音楽、動画がつくれるか? 画像、動画、音楽を処理する時、それらを記述する「短い文 章」を込みで処理しておく。そうすると、「短いセンテンス」を 入れるだけで「どこ」を使えばいいか解るようになる。
十色会日本研究会 36 画像1 「陸の戦闘」 + 画像2 「海の戦闘」 + 「宇宙の戦闘」 画像3
十色会日本研究会 37 いくつかの実用例
十色会日本研究会 38 データの整形 データの整形 Term Overlap P-value Adjusted P-value Amanitin
Down 10/247 9.56E-08 8.83E-04 LY-2606368 Up 9/233 6.47E-07 2.08E-03 Okadaic-Acid Up 9/246 1.02E-06 2.08E-03 WH-4023 Down 9/248 1.09E-06 2.08E-03 Triptolide Down 9/249 1.12E-06 2.08E-03 RS-102221 Down8/242 8.83E-06 8.36E-03 ZG-10 Down 8/243 9.10E-06 8.36E-03 Dorsomorphin Down 8/244 9.38E-06 8.36E-03 SID-26681509 Down 8/245 9.66E-06 8.36E-03 UNC-0646 Down 8/245 9.66E-06 8.36E-03 を
十色会日本研究会 39 こうしたい。
十色会日本研究会 40 いちばん面倒なこと 2.08E-03 を 2.08 × 10-3 にする •
E-03をと上付きにしたい。 • -03を-3というようにゼロを覗きたい • 列をそろえて罫線を入れる。
十色会日本研究会 41 latexというものを使う。大巾な加筆が必要。 \begin{tabular}{llll} \toprule \textbf{Term} & \textbf{Overlap} & \textbf{P-value}
& \textbf{Adjusted P-value} \\ \midrule Amanitin Down & 10/247 & $9.56 \times 10^{-8}$ & $8.83 \times 10^{-4}$ \\ LY-2606368 Up & 9/233 & $6.47 \times 10^{-7}$ & $2.08 \times 10^{-3}$ \\ Okadaic-Acid Up & 9/246 & $1.02 \times 10^{-6}$ & $2.08 \times 10^{-3}$ \\ WH-4023 Down & 9/248 & $1.09 \times 10^{-6}$ & $2.08 \times 10^{-3}$ \\ Triptolide Down & 9/249 & $1.12 \times 10^{-6}$ & $2.08 \times 10^{-3}$ \\ RS-102221 Down & 8/242 & $8.83 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ ZG-10 Down & 8/243 & $9.10 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ Dorsomorphin Down & 8/244 & $9.38 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ SID-26681509 Down & 8/245 & $9.66 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ UNC-0646 Down & 8/245 & $9.66 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ \bottomrule \end{tabular}
十色会日本研究会 42 以下の表をlatexのtabular環境で書いてください。指数表示は10のべき乗の 形式に変えてください。\hlineの代わりに\toprule, \midrule,\botruleを使 い、途中の行は線で区切らないでください。また10^{-06}の様にマイナスの後 に0が来てしまう場合はこの0は除いて下さい。 Term Overlap P-value
Adjusted P-value Amanitin Down 10/247 9.56E-08 8.83E-04 LY-2606368 Up 9/233 6.47E-07 2.08E-03 Okadaic-Acid Up 9/246 1.02E-06 2.08E-03 WH-4023 Down 9/248 1.09E-06 2.08E-03 Triptolide Down 9/249 1.12E-06 2.08E-03 RS-102221 Down 8/242 8.83E-06 8.36E-03 ZG-10 Down 8/243 9.10E-06 8.36E-03 Dorsomorphin Down 8/244 9.38E-06 8.36E-03 SID-26681509 Down 8/245 9.66E-06 8.36E-03 UNC-0646 Down 8/245 9.66E-06 8.36E-03 ChatGPT-4
十色会日本研究会 43 以下は指示に基づいて作成したLaTeXコードです。\toprule、\midrule、\bottomruleを使用し、指数 表記で不要なゼロを除いています。 \documentclass{article} \usepackage{booktabs} % 表でtoprule, midrule, bottomruleを使用するために必要
\begin{document} \begin{tabular}{llll} \toprule \textbf{Term} & \textbf{Overlap} & \textbf{P-value} & \textbf{Adjusted P-value} \\ \midrule Amanitin Down & 10/247 & $9.56 \times 10^{-8}$ & $8.83 \times 10^{-4}$ \\ LY-2606368 Up & 9/233 & $6.47 \times 10^{-7}$ & $2.08 \times 10^{-3}$ \\ Okadaic-Acid Up & 9/246 & $1.02 \times 10^{-6}$ & $2.08 \times 10^{-3}$ \\ WH-4023 Down & 9/248 & $1.09 \times 10^{-6}$ & $2.08 \times 10^{-3}$ \\ Triptolide Down & 9/249 & $1.12 \times 10^{-6}$ & $2.08 \times 10^{-3}$ \\ RS-102221 Down & 8/242 & $8.83 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ ZG-10 Down & 8/243 & $9.10 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ Dorsomorphin Down & 8/244 & $9.38 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ SID-26681509 Down & 8/245 & $9.66 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ UNC-0646 Down & 8/245 & $9.66 \times 10^{-6}$ & $8.36 \times 10^{-3}$ \\ \bottomrule \end{tabular} \end{document}
十色会日本研究会 44 このコードは、表の見出し行の下に\topruleを、最後の行の下に\ bottomruleを使用し、中間の行は線で区切っていません。数値は10の べき乗の形式で、指数のマイナス記号の後に不要なゼロがないように 記述しています。このテキストをLaTeX環境にコピーしてコンパイルする ことで、正しい形式の表が生成されます。
十色会日本研究会 45 データのエクセル化
十色会日本研究会 46 以下の表をエクセルファイルにしてください。 Term Overlap P-value Adjusted P-value Amanitin Down
10/247 9.56E-08 8.83E-04 LY-2606368 Up 9/233 6.47E-07 2.08E-03 Okadaic-Acid Up 9/246 1.02E-06 2.08E-03 WH-4023 Down 9/248 1.09E-06 2.08E-03 Triptolide Down 9/249 1.12E-06 2.08E-03 RS-102221 Down 8/242 8.83E-06 8.36E-03 ZG-10 Down 8/243 9.10E-06 8.36E-03 Dorsomorphin Down 8/244 9.38E-06 8.36E-03 SID-26681509 Down 8/245 9.66E-06 8.36E-03 UNC-0646 Down 8/245 9.66E-06 8.36E-03
十色会日本研究会 47
十色会日本研究会 48 生成AIの今後
十色会日本研究会 49 言語、画像、音声、動画を同時に学習 →実際、人間はこれができている。 「字幕付きの映画の視聴」 をしているときは言語(字幕)、映像(映画のシーン)、音声(サウ ンドトラック)から同時に情報を取り入れて理解している。 生成AIは現状、これがある程度出来ている。 → Windows CopilotやChatGPTで可能に!
十色会日本研究会 50 この画像は、カナダのアルバータ州にあるバンフ国立公園内のモレーン湖の息 をのむような景色を捉えています。モレーン湖はその鮮やかなターコイズブ ルーの水で知られており、夏には氷河の溶けた水が湖を満たすため、色が最も 鮮明になります。背景には十峰谷の険しい雪をかぶった山々があり、壮観な景 観を提供しています。湖岸には松の木の密林が広がり、自然の美しさを一層引 き立てています。前景では、水面が山々を完璧に映し出しており、鏡のような反 射を見せています。この静寂な環境は、写真撮影やアウトドア活動に人気のス ポットです。
この画像に写っているも のを説明してください (ChatGPT-4 有料版)
十色会日本研究会 51 正解:カナダ、アルバータ州のバ ンフ国立公園にあるモレーン湖
十色会日本研究会 52 GPT-4o この画像には、澄んだ青い湖が写っています。湖面には 周囲の雪山と木々が美しく反射しています。左手前には 緑の針葉樹がフレームに入っており、遠くには雪を頂い た山々が連なっています。画像全体に穏やかな自然の 風景が広がり、澄み切った空が広がっています。 →湖の名前を自発的に言わなくなった(訊けば正しく 答える)のでむしろ劣化?
十色会日本研究会 53 https://www.youtube.com/watch?v=c2DFg53Zhvw GPT-4oがリアルタイム 通訳を実現!
十色会日本研究会 54 人間と会話しながら作業できるロボット https://youtu.be/Sq1QZB5baNw
十色会日本研究会 55 要するに最近はかなりなんでもあり になっていて何が出てきても驚けな い感じになりつつある。仕組みがわ からなくても「Aを入れてBを出力」 するようなものがデータさえあれば なんでも作れるように見える。
十色会日本研究会 56 数年から十年くらいの間に ・イラストは生成AIが作成するようになるので、これを使いこな せないイラストレーターの職は危うくなる。 ・文章の作製も同じことが言えるのでライターの仕事も同じこ とが起きる。 ・クリエーター関係が失業するわけではなく、生成AIにはでき ないことができる人間だけが生き残る。
十色会日本研究会 57 法的な規制 ・生成AIは人間が作った文章、画像や映像を「学習」して生成 しているのでオリジナルの文章、画像や映像の製作者にどう やってベネフィットを還元するかが問題(日本では世界的にみ て生成AIに有利な法改正がされているが「著作権者に著しい 被害がないこと」という保留事項があり、実際には判例を積み 重ねる必要あり。 ・世界的には多くの訴訟が起きているので今後は見通せな
い。cf. google mapのストリートビュー機能、google booksの 機能。
十色会日本研究会 58 最終的には朝起きたら「こんな映画がみたいな?」と言った らそれっぽい90分の映画を作ってもらって楽しめるように なると思う。 教育も様変わりして個別対応が可能なAIに補強された機 能(現状、間違いを教える可能性が0にはならないので完 全に丸投げは難しい)が付加される。
十色会日本研究会 59 終わりに 僕は2021年に機械学習の啓蒙書を出しまし た。実際に執筆したのは2020年の5月くらい なので生成AIについては文章と画像について ちょっと触れただけでした。まさかこんな劇的な 進歩があるとは僕は想像もしていませんでし た。なのでこの本はたった3年前の出版なのに あっという間に内容が古くなってしまいました。
今日最後に述べた今後の予想もとてもうまく当 たるかどうかはよくわかりません。 ただ劇的な社会の変化があることは間違い無 さそう。
十色会日本研究会 60 おまけ 最近出た言語生成AIの解説本(大変評判がいいです。ちょっと難 しいかもしれませんが)。
十色会日本研究会 61 さらに難しくはなるのですが数式は出て こないのでおすすめです
十色会日本研究会 62 最近出た本。 機械学習を自分で試している民間の 会社の人の本。歴史も書かれている
十色会日本研究会 63 実用寄り 「生成AI導入の教科書」「生成AIで世界はこう変わる」
十色会日本研究会 64 さっきの「生データをLatexのキ レイな表にする」みたいな作業 の例がたくさん書かれている