Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI・DS領域を学習したい方に向けて

makaishi2
December 14, 2022

 AI・DS領域を学習したい方に向けて

 本日は、自著を紹介する場を持たせていただくことになりました。
 せっかくの機会なので、単なる書籍紹介にとどまらず、「なぜ、この本を出そうと考えたのか」という、著者としての「思い」を中心に説明させていただこうかと考えています。
 この講演を聞かれている方は、これからAI・データサイエンス系の勉強をしていきたいという方が多いかと思います。そうした方に少しでも参考となる話を持ち帰っていただければ幸いです。

makaishi2

December 14, 2022
Tweet

More Decks by makaishi2

Other Decks in Business

Transcript

  1. 講演者プロフィール ⾚⽯ 雅典 2020年12⽉までIBMに在職。最後の数年は、Watsonやデータサイエンス系製品の技術セールスとして活動 2021年3⽉アクセンチュア⼊社。データ分析⼈材育成プロジェクトやテキスト分析系AIプロジェクトを主に担当 京都情報⼤学院⼤学 客員教授 著書 『最短コースでわかるPyTorch&深層学習プログラミング』 ⽇経BP

    『Pythonで儲かるAIをつくる』 ⽇経BP 『最短コースでわかるディープラーニングの数学』 ⽇経BP 『現場で使える!Python⾃然⾔語処理⼊⾨』(共著) 翔泳社 『Watson Studioで始める機械学習・深層学習』 リックテレコム SNS https://www.linkedin.com/in/makaishi2 https://qiita.com/makaishi2 https://twitter.com/makaishi2 https://github.com/makaishi2
  2. 最新著書 紹介 『最短コースでわかる Pythonプログラミングとデータ分析』 2022年12⽉17⽇ 出版予定 アマゾンリンク https://www.amazon.co.jp/dp/4296201123 サポートページリンク http://bit.ly/3TV1E57

    主な特徴 (DSスキル習得の「⾼速道路」) • 必要⼗分な知識項⽬の精査 (データ分析の「出る単」) 「データ分析」という⽬標を実現するのに必要⼗分な知識項⽬を精査・体系化 • プログラミングスキルの実地訓練 各節の最後に演習問題を設定し、抽象的な業務要件を具体的実装に落とすトレーニングを実施 • 試⾏錯誤によろライブラリ関数機能の体得 セットアップゼロで即利⽤可能なGoogle Colabを活⽤して、試⾏錯誤で関数機能を理解 • 分析シナリオで洞察導出 公開データセットの活⽤で実業務に近い分析シナリオを提⽰し、洞察導出の過程も経験
  3. はじめに AI・DS領域を学習したい方に向けて - 著者としての「思い」を中心に - 先日、Facebookに教えられて知ったのですが、私が最初に執筆した『Watson Studioで始める機 械学習・深層学習』※を出版して、ちょうど4年になりました。この本を出した当時、まさか4年間 で6冊もの本を出版することになるとは想像もつきませんでした。非常に感慨深いものがあります。 本日は、Facebookで知り合った井伊さんにお声がけいただき、自著を紹介する場を持たせていた

    だくことになりました。 せっかくの機会なので、単なる書籍紹介にとどまらず、「なぜ、この本を出そうと考えたのか」 という、著者としての「思い」を中心に説明させていただこうかと考えています。 この講演を聞かれている方は、これからAI・データサイエンス系の勉強をしていきたいという方が 多いかと思います。そうした方に少しでも参考となる話を持ち帰っていただければ幸いです。 ※ 記念すべきこの書籍は、⼤変残念なことに現在は絶版となっています。
  4. 「AI」と「データサイエンス」はひとくくりに考えがちですが、対象データ、利⽤⽬的で種類の異なるものがいくつかあります。 更に⼈材像の観点では、ビジネスとの関わりに責任を持つビジネス系と、実装(モデル構築)に責任を持つ技術系に分かれます。 「AI⼈材」や「必要スキル」について議論する場合、どのポジションに関する話か意識することが重要です。 AI分野 主なアルゴリズム 対象データ 主な利⽤⽬的 構造化データ (表形式の数値等) ⾮構造化データ

    (画像、⾳声、テキスト等) 線形回帰、決定⽊、勾配ブースティング等様々 ディープラーニング 未知データに対する予測 →予測⾃体に価値がある データサイエンス分野 既知データから知⾒抽出 →業務改善に活⽤ AI・データサイエンスの区別と人材像 強化学習の環境モデル ロボット制御等 (強化学習) Q学習, DQN ⽅策勾配法 ⼈材像 データサイエンティスト (ビジネス系) データサイエンティスト (技術系) AIエンジニア(ビジネス系) ⾮構造化AIエンジニア (技術系) 構造化AIエンジニア (技術系) 強化学習エンジニア (技術系)
  5. 構造化 AIエンジニア (技術系) 強化学習 エンジニア (技術系) 紹介した書籍が、主にどの領域の⼈材をターゲットとしているか、マッピングした結果です。 構造化AI ⾮構造化AI データサイエンス

    スキル・人材像と書籍の対応 強化学習 データサイエンティスト (ビジネス系) データサイエンティスト (技術系) AIコンサルタント ⾮構造化 AIエンジニア (技術系) ディープラーニング・プログ ラミングを実装面で解説 ディープラーニング・アルゴ リズムを数学面で解説 • 構造化AI・データサイエンス • ビジネス系・技術系 それぞれの観点をバランス良く解説 ビジネス系 スキル 技術系 スキル 基礎 スキル 1 章・2章 プログラミングと機械学習で 必須ライブラリの使い方 3章・4章 機械学習一歩手前のデータ分 析系スキル
  6. 『Pythonプログラミングとデータ分析』 目次(前半) 1章 Pythonプログラミング入門 1.1 Pythonとその実行環境 1.2 Google Colabの基本操作 1.3

    変数 1.4 データ型と算術演算 1.5 条件分岐 1.6 関数呼び出しとメソッド呼び出し 1.7 リストとループ処理 1.8 タプルと集合、辞書 1.9 関数定義 1.10 やや高度なループ処理 2章 データ分析ライブラリ入門編 2.1 ライブラリ入門 2.2 NumPy入門 2.3 Matplotlib入門 2.4 pandas入門
  7. 『Pythonプログラミングとデータ分析』 目次(後半) 3章 データ分析ライブラリ中級編 3.1 データ分析の主要タスク 3.2 データ読み込み 3.3 データ確認・加工(前処理)

    3.4 データ集計 3.5 データ可視化 3.6 データ検索・結合 3.7 日付データの処理 4章 データ分析実践編 4.1 タイタニック・データセット 4.2 データ読み込み 4.3 データ確認・加工(前処理) 4.4 データ集計 4.5 データ可視化 4.6 仮説立案・検証 4.7 深掘り分析
  8. 『Pythonプログラミングとデータ分析』 後半(3章・4章)の特徴 • 3章の冒頭で主要タスクとタスク間の関係を整理し、学習中に迷子にならないようにした • pandasの多くの関数・メソッドを目的別に体系化し、理解しやすくした • 3 章も公開データセットを用いたシナリオベースの展開にし、読者が興味を持ちやすい工夫をした •

    各シナリオごとに導出される洞察の例を提示し、データ分析で最も難しい洞察導出のスキル育成も意識 • 4章は、一連の分析タスクをストーリー仕立てで演習にして、実際のデータ分析タスクのイメージが持て るようにした
  9. 本日のまとめ • AI・DSといってもいろいろなタスク・人材像があり、必要スキルも異なる。 学習するにあたり、自分としてのゴールを明確にすることが重要。 • すべての出発点はPythonプログラミング。高速道路でこのスキルをマスターしたいなら、拙著「Python プログラミングとデータ分析」をお試しを • データ分析では、機械学習を用いなくても意味のある結果は数多く出せる。まずは、このアプローチで 「洞察」を導出する訓練をすることがお勧め。拙著「Pythonプログラミングとデータ分析」の後半は

    この目的でも最適。 • AI系の最新状況として、様々な分野で利用可能なOSSの事前学習済みモデルが出ている。PyTorchを使 いこなせるようにしておけば今後活用分野が広がるかも。(講演者の私見。今日のスライドでは語ってい ない話) • PyTorchを使いこなせるようになることが目的の場合「ディープラーニングの数学」「PyTorch&深層学 習プログラミング」のセットがお勧め