Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ゼロから実装まで!機械学習入門

 ゼロから実装まで!機械学習入門

アーカイブ動画:
https://video.ibm.com/recorded/134019858

「機械学習(マシンラーニング)」と聞いて、どのような技術や用途が思い浮かびますか?

ディープラーニング、生成AI、異常検知、ゲーム攻略など、さまざまな技術が頭に思い浮かぶかもしれません。 しかし、それぞれの違いや技術の関係性を明確に説明できる方は少ないのではないでしょうか。

生成AIが注目される今、機械学習の基礎を学ぶことは非常に重要です。基本を理解することで応用技術への理解が深まり、ビジネスの現場でも効果的に活用できるようになります。

本セミナーでは機械学習の基本概念から解説しますので、誰でも安心してご参加いただけます。 また、既に基礎を学んでいる方には、実際のデータ分析に役立つSPSS Modeler Flowを用いた実装デモを通じて、実践的なスキルを学ぶことができる内容になっています。

Natsuki Okamura

October 07, 2024
Tweet

Other Decks in Technology

Transcript

  1. 写真撮影 動画撮影 資料公開 SNS拡散 ◯ × 後日公開します ◯ ◯ #IBMDojo

    セッション受講における注意事項 セッション中に迷惑行為が発覚した場合は、強制退出、セッション中止などの措置を講じます
  2. 自己紹介 Data&AI Customer Success Manager 岡村 夏希 Natsuki Okamura 日本アイ・ビー・エム株式会社

    Career/Skills 大学・大学院で情報学を専攻 深層学習、強化学習の研究 「強化学習を用いた ICTシステムの自動設計技術」 2024年4月新卒入社 Information e-mail:[email protected] Linkedin: https://www.linkedin.com/in/natsuki-okamura/
  3. 機械学習とは 主要なサイトで機械学習の意味を検索してみた 初学者からすると定義が曖昧で難しい Wikipedia 機械学習(きかいがくしゅう、英: machine learning)とは、経験からの学習により自動で改善するコンピューターアルゴリズム もしくはその研究領域で、人工知能の一種であるとみなされている。 機械学習(machine learning)とは、コンピュータプログラムにある分野のデータを繰り返し与えることで内在する規則性などを学習させ、

    未知のデータが与えられた際に学習結果に当てはめて予測や判断、分類などを行えるようにする仕組み。 現代の人工知能(AI)研究における最も有力な手法の一つ。 機械学習とは、言語やゲームなどをはじめとした人間の様々な知的活動の中で、人間が自然と行っているパターン認識や経験則を 導き出したりするような活動を、コンピュータを使って実現するための技術や理論、またはソフトウェアなどの総称である。 e-Words BINARY https://ja.wikipedia.org/wiki/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92 https://e-words.jp/w/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92.html https://www.sophia-it.com/content/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92
  4. 機械学習とは 機械が自動でデータの背景にあるルールやパターンを学習する お掃除ロボット チャットAI 大量の書籍・ブログ モデル 機械学習っ て何? 機械学習は AIの一種で〜

    言語や単語のルールやパターンを学習させる 障害物や家の構造 モデル 掃除のために移動するルールやパターンを学習させる 障害物があるか ら左に曲がろう
  5. 機械学習とは 機械が自動でデータの背景にあるルールやパターンを学習する お掃除ロボット チャットAI 大量の書籍・ブログ モデル 機械学習っ て何? 機械学習は AIの一種で〜

    言語や単語のルールやパターンを学習させる 障害物や家の構造 モデル 掃除のために移動するルールやパターンを学習させる 障害物があるか ら左に曲がろう データからルールやパターンを学習 新たなデータに対して目的にアクションを起こす
  6. 教師あり学習 入力データと出力データ(正解)をもとに、予測モデルを作成する 学習の目的は分類と回帰 データがどのグループに属するか 例)メールのスパム判定 数値を予測する 例)店舗の販売予測 Spam 販売予測:18個 天気

    気温 販売個数 晴れ 25° 20個 雨 18° 4個 曇り 20° 12個 ⋮ ⋮ ⋮ 天気 気温 晴れ 20° 分類 回帰 Spam 未知のメール スパムメールである 未来のデータ 正解を付与した 大量のメール 過去の販売データ
  7. 教師なし学習 正解がわからないデータを使ってデータの特徴を学習する 学習の目的はクラスタリング データをグループ分けする クラスタリング Group2 名前 年齢 年収 A

    30 400万 B 18 100万 C 58 1000万 ⋮ ⋮ ⋮ Group1 Group2 Group3 名前 年齢 年収 Z 40 800万 Group別に効果的なアプローチ 大量の顧客データ 新規の顧客データ
  8. 強化学習 エージェントが環境において得られる報酬が最適化できるかの行動を学習する 例)将棋、掃除ロボット エージェント:Player 現在の盤面(状態) a1 a2 a3 a4 a5

    a6 a7 a8 a9 a7 報酬:1 報酬:0 a2(行動) 次のターンで勝てる 次のターンで負ける 次の盤面 報酬 これを繰り返し行うと… 新しいAIで何度も挑戦 状態 行動 報酬 S1 a5 0.8 S2 a4 0.1 S3 a1 1 ⋮ ⋮ ⋮ 最適な行動を学習 行動の選択肢
  9. 機械学習アルゴリズムとは 教師あり学習 教師なし学習 強化学習 代表的な機械学習アルゴリズム データ アルゴリズム モデル 𝑥, 𝑦

    = 1, 3 , 2, 5 𝑦 = 𝑎𝑥 + 𝑏 𝑦 = 2𝑥 + 1 𝑦 = 7 𝑥 = 3 機械学習アルゴリズムとモデル 機械学習アルゴリズムとは、データの中から規則性やパターンを発見し予測を行うプロセス データをアルゴリズムに投入してできたロジックがモデル 決定木 ニューラルネット k-means法 主成分分析 Q学習 モンテカルロ法
  10. デモシナリオ【データ収集】 過去のキャンペーンを実施したときのデータを収集 ハンズオンで使用するデータは顧客属性、利用履歴、反応の3つ 顧客番号 キャンペーン反応 10001 FALSE 10002 FALSE ⋮

    ⋮ 利用日 顧客番号 用途 利用金額 2017-01-01 15937 航空会社 11236 2017-01-01 10520 ETC 20736 ⋮ ⋮ ⋮ ⋮ 顧客番号 性別 居住地区 持ち家 年収 生年月日 10001 女性 世田谷区 あり 3600000 1976-10-02 10002 女性 目黒区 あり 6800000 1981-04-17 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 顧客属性データ 利用履歴データ キャンペーン反応データ
  11. ワークショップ、セッション、および資料は、IBMまたはセッション発表者によって準備され、それぞれ独自の見解を反映したものです。それらは情報 提供の目的のみで提供されており、いかなる参加者に対しても法律的またはその他の指導や助言を意図したものではなく、またIBM製品やサービスがお 客様に適用ある特定の法令に適合することを保証するものでもありません。本講演資料に含まれている情報については、完全性と正確性を期するよう努 めておりますが、「現状のまま」提供され、明示または黙示にかかわらず、商業性、特定の目的への適合性、非侵害性を含め、いかなる保証も伴わない ものとします。本講演資料またはその他の資料の使用によって、あるいはその他の関連によって、いかなる損害が生じた場合も、IBMは責任を負わない ものとします。 本講演資料で言及されるIBM製品、プログラム、またはサービスは、IBMがビジネスを行っているすべての国・地域でご提供可能なわけ ではありません。本講演資料で言及される将来の展望(製品リリース日付や製品機能を含む)は、市場機会またはその他の要因に基づいてIBM独自の決 定権をもっていつでも変更できるものとし、将来の製品または機能が使用可能になること、もしくは特定の結果を確約することを意図するものではあり ません。本講演資料は、言及される

    IBM製品またはサービスに適用ある契約条件を変更するものでも、追加の表明または保証を意図するものでもありま せん。 本講演資料に含まれている内容は、参加者の活動によって特定の結果が生じると述べる、または暗示することを意図したものでも、またそのような結果 を生むものでもありません。 パフォーマンスは、管理された環境において標準的なIBMベンチマークを使用した測定と予測に基づいています。ユーザー が経験する実際のスループットやパフォーマンスは、ユーザーのジョブ・ストリームにおけるマルチプログラミングの量、入出力構成、ストレージ構成、 および処理されるワークロードなどの考慮事項を含む、数多くの要因に応じて変化します。したがって、個々のユーザーがここで述べられているものと 同様の結果を得られると確約するものではありません。記述されているすべてのお客様事例は、それらのお客様がどのようにIBM製品を使用したか、ま たそれらのお客様が達成した結果の実例として示されたものです。実際の環境コストおよびパフォーマンス特性は、お客様ごとに異なる場合があります。 • IBM、IBM ロゴ、ibm.com、IBM SPSS Modeler Flowは、 世界の多くの国で登録されたInternational Business Machines Corporationの商標です。 他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、 www.ibm.com/legal/copytrade.shtmlをご覧ください。