Upgrade to Pro — share decks privately, control downloads, hide ads and more …

情報処理応用B第08回/InfoAdv08

Avatar for Kazuhisa Fujita Kazuhisa Fujita
September 27, 2023

 情報処理応用B第08回/InfoAdv08

Avatar for Kazuhisa Fujita

Kazuhisa Fujita

September 27, 2023
Tweet

More Decks by Kazuhisa Fujita

Other Decks in Education

Transcript

  1. 講義の予定 • 第1回 ガイダンス • 第2回 情報の表現(画像,音声,文 字コード) • 第3回

    ハードウェア・産業構造 • 第4回 ソフトウェアの種類・ライセ ンス・特許 • 第5回 インターネットとビジネス • 第6回 コンピュータネットワークの 仕組み • 第7回 情報セキュリティ • 第8回 IoTとビッグデータ • 第9回 人工知能1 -人工知能時代の 到来- • 第10回 人工知能2 -人工知能を実現 するには- • 第11回 人工知能3 -人工知能の技術 - • 第12回 人工知能4 -人工知能を使い こなす上で必要な能力- • 第13回 人工知能5 -人工知能研究者 はどこに進めばよいのか- • 第14回 人工知能6 -プロンプトエン ジニアリング- • 第15回 人工知能7 -人工知能のリス ク-
  2. ビッグデータとは • インターネットでは,様々なデータが湯水の如く湧き出し,山のよう に保存されている. • 常時生成され続ける多種多様な大量のデータのことをビッグデータと 呼ぶ. • ビッグデータの特徴 •

    3V(volume, velocity, variety) • 大量(volumeが大きい) • 生成量が大きい(velocityが大きい) • 多種多様である(varietyに富む) • 多次元データである. 世界のトラッフィクの推移及び予測 令和5年度情報通信白書 データの次元とは 定期試験のデータが有る.数学の点しかない場合,学籍番号と数学の2つの数値しかないので2次元 データとなる. 数学,物理,化学,英語,現国の点があるなら学籍番号を含めると6次元データとなる.
  3. データマイニングとは • 大量のデータから何か意味のある情報を取り出す. • データ+マイニング(採掘) • データを解析することで予想外の関係が見出される事がある • データマイニングの伝説 •

    おむつを買った人はビールを買う傾向がある. ビッグデータ 数値の山 何の意味があるかわからない データマイニング 価値のある情報 が手に入るかも
  4. 応用例 • 大阪ガス • 過去の修理歴とコールセンターの依頼内容から交換部品の自動抽出 • Tsutaya • 購買歴を分析し、ソフトの仕入れに活かす •

    日本食品 • クーポンの効果的な発行 • ダイドードリンコ • 視線の動きを解析し,視線が行きやすい場所に主力製品を置くことで売上 • スシロー • 寿司皿にICタグを取り付け,寿司の情報を管理する.ICタグから得られた 情報から需要を予測し,レーンに流すネタや量をコントロールする • その他,需要予測,価格の決定など様々な場面で活用される.
  5. オープンデータ • データが一切の制限無しで,全ての人が望むように利用・再掲載できるよ うな形で入手すべきであるという考え方,またはそのデータ(wikipedia より改) • オープンデータ基本指針におけるオープンデータの定義 • 営利目的,非営利目的を問わず2次利用可能なルールが適用されたもの •

    機械判読に適したもの • PDFで公開されているものはコンピュータで読み取りしにくく,せっかくデータを公 開しても活用できない. • 無償で利用できるもの • 例 • 鯖江市が公開している路線や時刻表、現在走っている場所のデータを用い,バ スの場所を調べるアプリを開発 • 全国の自治体が公開している避難所情報を用い,避難所へのルート案内するア プリを開発
  6. ビッグデータはすでに手元にある • インターネット上にはすでに大量のデー タが存在している. • それを収集して活用する事もできる. • ウェブサイトからデータを取り込む技術 をスクレイピングという. •

    ウェブサイトから定期的にデータを収集 しデータベース化するソフトをクローラ と言う. • 2022年話題になったイラスト生成人工知 能は,イラスト投稿サイトからデータをス クレイピングした画像を使って学習したと 言われている. 音楽 写真 インターネット 動画 小説 イラスト 絵画 スクレイピングによ り収集 SNS投稿
  7. OECD8原則 • 経済協力開発機構(OECD)理事会で採択された「プライバシー保護 と個人データの国際流通についての勧告」の中で挙げられている8つの 原則。1980年9月に発表されたもので、日本を含む各国の個人情報保 護の考え方の基礎になっている。 • 目的明確化の原則 • 個人データの収集目的を明確にし,データ利用は収集目的に合致すべき.

    • 利用目的制限の原則 • 同意を得た利用目的の範囲内でしか利用してはいけない. • 収集制限の原則 • 本人の同意なしにデータを収集してはいけない. • データ内容の原則 (Data quality principal) • 収集した個人情報は正確で最新の状態を保つ必要がある. • 安全保護の原則 • 個人情報は紛失や破壊しないよう合理的な措置をする必要がある. • 公開の原則 • 個人情報の取扱について公開する必要がある. • 個人参加の原則 • 収集した個人情報は個人データを提出した本人に開示,訂正,削除する権利を保証する必要がある. • 責任の原則 • 個人データの管理者は上記の原則を守る責任がある.
  8. 個人情報とは • 生存する個人に関する情報で特定の個人を識別することができるもの. • 氏名,生年月日と氏名の組み合わせ,顔写真,個人識別符号など • 個人識別符号 • 身体の一部分の特徴を電子計算機のために変換された符号 •

    DNA,顔認証データ,虹彩,指紋,歩行の態様,手指の静脈,指紋,掌紋 • サービス利用や書類において対象者ごとに割り振られる符号(公的な番 号) • 旅券番号,基礎年金番号,免許証番号,住民票コード,マイナンバー等
  9. 事業者が守るべきルール • 取得・利用 • 利用目的を特定して,その範囲内で利用する. • 利用目的を通知または公表する. • 保管 •

    漏えい等が生じないよう,安全に管理する. • 従業者・委託先にも安全管理を徹底する. • 提供 • 第三者に提供する場合は,あらかじめ本人から同意を得る. • 第三者に提供した場合・第三者から提供を受けた場合は,一定事項を記録 する. • 開示請求等への対応 • 本人から開示などの請求があった場合はこれに対応する. • 苦情等に適切・迅速に対応する.
  10. 罰則 • 事業者の法遵守の状況は,個人情報保護委員会が監視 • 国からの命令違反 • 6ヶ月以下の懲役または30万円以下の罰金 • 虚偽の報告 •

    30万円以下の罰金 • 従業員が不正な利益を図る目的で個人情報データベース等を提供・盗 用 • 1年以下の懲役または50万円以下の罰金(法人にも罰金)
  11. 要配慮個人情報 • 慎重な扱いを要する個人情報 • 人種、信条、社会的身分、病歴、犯罪の経歴、犯罪により害を被った事実 その他本人に対する不当な差別、偏見その他の不利益が生じないようにそ の取扱いに特に配慮を要するものとして政令で定める記述等が含まれる個 人情報 • 病歴に準ずるもの

    • 診断情報,調剤情報,健康診断の結果,健康指導の内容,障害,ゲノム情報 • 本人の同意を得ないで要配慮個人情報を取得してはいけない. • 本人の同意を得ないで,個人データを第三者に提供してはいけない. • 予め個人データを第三者に提供することについて通知または認識しうる状態 にしておき,本人が反対しない限り同意したと見なす,オプトアウトによる 第三者提供を禁止している. 第10回 個人情報保護委員会 資料1
  12. 次世代医療基盤法 • 匿名加工情報は本人の同意なしに第三者に提供できることは,施行前 でも可能. 現行法で可能な匿名加工医療情報の提供の仕組み ◦ 匿名加工情報とは、特定の個人を識別することができないように個人情報を加工して得られる個人に関する情報であって、当 該個人情報を復元することができないようにしたもの。 ◦ 匿名加工情報については、本人の同意なく第三者に対する提供が可能。

    ◦ このため、個別医療機関は、保有する医療情報( 個人情報) の匿名加工を自ら又は事業者に委託して行い、利活用者 に本人の同意なく提供することは可能である。 【現在の状況( イメージ図) 】 受診 情報利用者 ( 例) 研究機関 ( 大学等) 製薬会社 行政 医療機関等A 医療機関等B 医療機関等C 個人情報 ( 同意不要) 利活用成果 ( 例) 質や費用対 効果の分析 未知の副作 用の発見 新薬の 開発 国民や医療機関等への 価値のフィードバック 患者・国民Z 患者・国民Y 患者・国民X : 匿名加工情報 匿名加工の委託 氏名 山田太郎 住所 東京都 : 匿名化 氏名 _ _ _ _ 住所 _ _ _ : : 匿名加工事業者 : : 匿名加工情報 自ら個人情報 を匿名加工 3 医療分野の研究開発に資するための匿名加工医療情報に関する法律について 施行 前
  13. 次世代医療基盤法 • 個人の権利利益の保護に配慮しつつ,匿名加工された医療情報を安心 して円滑に利活用する仕組みを整備 • 高い情報セキュリティを確保し、十分な匿名加工技術を有するなどの一定 の基準を満たし、医療情報の管理や利活用のため の匿名化を適正かつ確実 に行うことができる者を認定する仕組み(=認定匿名加工医療情報作成事 業者)を設ける。

    • 医療機関等は、本人が提供を拒否しない場合、認定事業者に対し、医療情 報を提供できることとする。 • 認定事業者は、収集情報を匿名加工し、医療分野の研究開発の用に供する。 医療分野の研究開発に資するための匿名加工医療情報に関する法律について 次世代医療基盤法の全体像(匿名加工医療情報の円滑かつ公正な利活用の仕組みの整備) 個人の権利利益の保護に配慮しつつ、匿名加工された医療情報を安心して円滑に利活用することが可能な仕組みを整備。 ①高い情報セキュリティを確保し、十分な匿名加工技術を有するなど の一定の基準を満たし、医療情報の管理や利活用のため の匿名化を適正かつ確実に行うことができる者を認定する仕組み( =認定匿名加工医療情報作成事業者) を設ける。 ②医療機関等は、本人が提供を拒否しない場合、認定事業者に対し、医療情報を提供できることとする。 認定事業者は、収集情報を匿名加工し、医療分野の研究開発の用に供する。 【次世代医療基盤法のイメージ図】 受診 情報利用者 ( 例) 研究機関 ( 大学等) 製薬会社 本人は提供 拒否可能 × 行政 高い情報セキュリティ等を認定で担保 ※次世代医療基盤法で可能となる機能 医療機関等A 医療機関等B 医療機関等C 医療機関等D : 利活用成果 ( 例) 質や費用対 効果の分析 未知の副作 用の発見 新薬の 開発 国民や医療機関等への 価値のフィードバック 患者・国民Z 患者・国民Y 患者・国民X : 匿名加工情報 : 個人を識別できない ように加工した情報 個人情報 氏名 山田太郎 住所 東京都 : 氏名 _ _ _ _ 住所 _ _ _ : 認定事業者B 認定事業者A 匿名化 4
  14. 匿名加工医療情報の活用イメージ • 人工知能による診療支援のために、大量の画像を機械学習させたい。 • 氏名、生年月日、性別等特定の個人を識別することができる記述を削除した上で、一般人 をもって特定の個人の識別が不可能であるような画像は、匿名加工情報として提供するこ とが可能。 • 複数の医療機関が保有する情報を個人別に突合し、市区町村別の集団毎の健康状態 について分析したい。

    • 認定事業者においてあらかじめ個人別に突合した上で、医療機関内での管理のために用い られているID等や、市区町村以下の住所情報や病院名を削除した匿名加工情報を提供可能 • 医薬品等の安全対策の向上のため、投薬等の医療行為と副作用等の発症の因果関係 等の解析したい。 • 生年月日、投薬日等の日付情報を一律にずらすことにより、医療行為と副作用等の発生の 関係を崩さずに情報を提供可能。 • 治験の実施に当たり、軽症の糖尿病で、合併症がないような対象者等の分布をあら かじめ把握したい。 • 認定事業者内において必要な統計処理等をした結果を匿名加工情報又は統計情報として提 供可能。 医療分野の研究開発に資するための匿名加工医療情報に関する法律について
  15. IoT

  16. IoTの時代 • IoT (Internet of Things)とはモノのインターネットとも呼ばれ,あら ゆるモノがインターネットにつながる社会やその様子を表す. • 現在でも,パソコンやスマートフォンだけではなく,テレビ,スマー トスピーカー,車,監視カメラ,電子レンジなどもインターネットに

    繋がっている場合がある. • IoT機器とは,インターネットに繋がるあらゆるモノのことで,特にパ ソコンやスマートフォンのような以前からインターネットにつながっ ていたIT機器以外を指すことが多い.
  17. 監視カメラの事例 • 監視カメラはインターネットから動画の視聴,カメラの向きの制御な どが行えるものがある. • 監視カメラの画像の流出 • 監視カメラの中には,画像がインターネットに公開される設定になってい るものがある.世界中の監視カメラ画像を見られるサイトも存在する. •

    監視カメラの乗っ取り • 2018年上尾市の河川監視カメラに不正アクセスがあり,「I’m hacked. bye2」と監視カメラの画像に表示された.さらに,パスワードが変更され, 制御不可能になった (https://www.sankei.com/region/news/180428/rgn1804280045-n1.htm, https://scan.netsecurity.ne.jp/article/2018/05/01/40886.html)
  18. テスラモデルSの遠隔操作 • テスラ車の通信機能に存在した脆弱な仕様をついて車載情報端末用の 車内ネットワークに侵入 • 車載情報端末のWebブラウザーに存在した脆弱性を攻撃して、任意の コードを実行可能に • 車載情報端末のLinuxカーネルに存在した脆弱性を攻撃して、ルート権 限を取得

    • 情報端末用の車内ネットワークと、制御系ネットワーク(CAN)とを つなぐ「コントローラー」を攻撃して、コントローラーのファームウ エアを書き換え • コントローラーから電子制御ユニット(ECU)に偽のコマンドを送り 自動車を遠隔操作 http://business.nikkeibp.co.jp/atcl/report/15/061700004/072800212/
  19. 演習 • ビッグデータを企業が活用している事例はどれか。(基本情報平成29年 秋期) 1. カスタマセンタへの問合せに対し,登録済みの顧客情報から連絡先 を抽出する。 2. 最重要な取引先が公表している財務諸表から,売上利益率を計算す る。

    3. 社内研修の対象者リスト作成で,人事情報から入社10年目の社員を 抽出する。 4. 多種多様なソーシャルメディアの大量な書込みを分析し,商品の改 善を行う。
  20. 演習 • ビッグデータを企業が活用している事例はどれか。(基本情報平成29年 秋期) 1. カスタマセンタへの問合せに対し,登録済みの顧客情報から連絡先 を抽出する。 2. 最重要な取引先が公表している財務諸表から,売上利益率を計算す る。

    3. 社内研修の対象者リスト作成で,人事情報から入社10年目の社員を 抽出する。 4. 多種多様なソーシャルメディアの大量な書込みを分析し,商品の改善 を行う。
  21. 演習 • データマイニングの説明として,適切なものはどれか。(基本情報平成 19年秋期) 1. 大量のデータを高速に検索するための並行的アクセス手法 2. 大量のデータを統計的,数学的手法で分析し,法則や因果関係を見 つけ出す技術 3.

    販売実績や製造実績などの時系列データを大量に蓄積するデータ ベースの保存手法 4. ユーザの利用目的に合わせて,部門別のデータベースを作成する技 術
  22. 演習 • データマイニングの説明として,適切なものはどれか。(基本情報平成 19年秋期) 1. 大量のデータを高速に検索するための並行的アクセス手法 2. 大量のデータを統計的,数学的手法で分析し,法則や因果関係を見つ け出す技術 3.

    販売実績や製造実績などの時系列データを大量に蓄積するデータ ベースの保存手法 4. ユーザの利用目的に合わせて,部門別のデータベースを作成する技 術
  23. 演習 • IoT(Internet of Things)を説明したものはどれか。(基本情報技術者試験平成28年春 期) 1. インターネットとの接続を前提として設計されているデータセンタのことであり, サーバ運用に支障を来さないように,通信回線の品質管理,サーバのメンテナン ス,空調設備,瞬断や停電に対応した電源対策などが施されている。

    2. インターネットを通して行う電子商取引の一つの形態であり,出品者がWebサイ ト上に,商品の名称,写真,最低価格などの情報を掲載し,期限内に最高額を提 示した入札者が商品を落札する,代表的な CtoC 取引である。 3. 広告主のWebサイトへのリンクを設定した画像を広告媒体となるWebサイトに掲 載するバナ一広告や,広告主のWebサイトの宣伝をメールマガジンに掲載する メール広告など,インターネットを使った広告のことである。 4. コンピュータなどの情報通信機器だけでなく様々なものに通信機能をもたせ,イ ンターネットに接続することによって自動認識や遠隔計測を可能にし,大量の データを収集・分析して高度な判断サービスや自動制御を実現することである。
  24. 演習 • IoT(Internet of Things)を説明したものはどれか。(基本情報技術者試験平成28年春 期) 1. インターネットとの接続を前提として設計されているデータセンタのことであり, サーバ運用に支障を来さないように,通信回線の品質管理,サーバのメンテナン ス,空調設備,瞬断や停電に対応した電源対策などが施されている。

    2. インターネットを通して行う電子商取引の一つの形態であり,出品者がWebサイ ト上に,商品の名称,写真,最低価格などの情報を掲載し,期限内に最高額を提 示した入札者が商品を落札する,代表的な CtoC 取引である。 3. 広告主のWebサイトへのリンクを設定した画像を広告媒体となるWebサイトに掲 載するバナ一広告や,広告主のWebサイトの宣伝をメールマガジンに掲載する メール広告など,インターネットを使った広告のことである。 4. コンピュータなどの情報通信機器だけでなく様々なものに通信機能をもたせ,イ ンターネットに接続することによって自動認識や遠隔計測を可能にし,大量の データを収集・分析して高度な判断サービスや自動制御を実現することである。