Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オープンデータの基礎知識
Search
Sayaka Ishizuka
March 09, 2020
Technology
2
1.3k
オープンデータの基礎知識
デジタルツインとそれを活用したエコシステム形成のために必要なオープンデータに関して改めて基礎知識をまとめました。
神CSV、シン・オープンデータ5スターなどの初出しネタも満載。
Sayaka Ishizuka
March 09, 2020
Tweet
Share
More Decks by Sayaka Ishizuka
See All by Sayaka Ishizuka
デジタル化・DX推進あるある
y150saya
0
390
地方自治体業務あるある ーアナログ最適化編-
y150saya
1
700
サービス設計12箇条で紐解く「サービスデザイン思考」
y150saya
0
2.4k
地方自治体業務あるある ー世帯所得合算編
y150saya
1
1.8k
地方自治体業務あるある
y150saya
6
11k
地方自治体DXにおける領域整理
y150saya
1
560
危機関連保証申請認定のスマート申請化
y150saya
0
240
No one will be left bihindな地方自治体を目指して
y150saya
0
620
スマート自治体実現に向けてー デザイン思考とサービス設計 ー
y150saya
1
2.1k
Other Decks in Technology
See All in Technology
YOLOv10~v12
tenten0727
3
860
試験は暗記より理解 〜効果的な試験勉強とその後への活かし方〜
fukazawashun
0
340
LLM as プロダクト開発のパワードスーツ
layerx
PRO
1
200
AI Agentを「期待通り」に動かすために:設計アプローチの模索と現在地
kworkdev
PRO
2
390
技術者はかっこいいものだ!!~キルラキルから学んだエンジニアの生き方~
masakiokuda
2
110
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
390
ウォンテッドリーにおける Platform Engineering
bgpat
0
190
7,000名規模の 人材サービス企業における プロダクト戦略・戦術と課題 / Product strategy, tactics and challenges for a 7,000-employee staffing company
techtekt
0
260
ゆるくVPC Latticeについてまとめてみたら、意外と奥深い件
masakiokuda
2
230
Amazon S3 Tables + Amazon Athena / Apache Iceberg
okaru
0
240
Beyond {shiny}: The Future of Mobile Apps with R
colinfay
1
370
大AI時代で輝くために今こそドメインにディープダイブしよう / Deep Dive into Domain in AI-Agent-Era
yuitosato
1
270
Featured
See All Featured
Six Lessons from altMBA
skipperchong
27
3.7k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Product Roadmaps are Hard
iamctodd
PRO
52
11k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2k
A better future with KSS
kneath
239
17k
Facilitating Awesome Meetings
lara
54
6.3k
The Language of Interfaces
destraynor
157
24k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.6k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Embracing the Ebb and Flow
colly
85
4.6k
Docker and Python
trallard
44
3.3k
Git: the NoSQL Database
bkeepers
PRO
430
65k
Transcript
オープンデータの基礎知識
プロフィール 本業:横浜市経済局成長戦略推進部新産業創造課ICT専任職 (局内外におけるICT活用に関するアドバイス、研修などを担当) 副業:総務省地域情報化アドバイザー、ユニバーサルメニュー普及協会研究員 サードプレイス:Code for Japan/Code for YOKOHAMA、よこはまYYラボ 番外:地方公務員が本当にすごい!と思う地方公務員アワード2017受賞
GovInsider アジアでGovtechを推進する女性55人 石塚 清香 -Sayaka Ishizuka-
2 街にどんなデータが隠れていますか?
3 街にどんなデータが隠れていますか? 電力使用量 イベント 飲食店 車両通行量 輸出入 客船入港数 人口 立地企業数
パーソントリップ インバウンド MICE ゴミ収集 宿泊者数 工業生産 公共交通 水道使用量 DSM/DEM BIM 都市デザイン 医療機関 救命救急 文化・芸術 消費活動
4 現実世界に溢れるデータを電脳世界で再現する(デジタルツイン) エコシステム形成にフィジカル空間を活用 テクノロジーを漠然と受容することなく、社会実装を強く意識して、国民生活・経済活動の質向上 のために能動的かつ積極的に活用し、産業競争力の強化、社会課題の解決に役立てる
エコシステム形成にフィジカル空間を活用 5 そのためにはサイバー空間側に「データをきちんと送る」ことが重要 Point!
エコシステム形成にフィジカル空間を活用 6
エコシステム形成にフィジカル空間を活用 7 サイバー空間側のサービスを駆動させるために 行政も保有情報(データ)を「社会の公共財」として開放 Open Data
オープンデータとは 8 様々なサービスに行政が保有するデータを使えるよう「開放」すること
オープンデータとは 9 公開=Publish Open=開放 自由な出入りを許すこと 使用を許すこと 様々な主体にデータを使ってもらいたいという思想のもと、より前向きな意味の 「オープン(開放)」を使用 ➢ データを活用した課題解決プロセスの創造
➢ 協働による社会変革活動の展開
オープンデータ=オープンガバナンスの第一歩 10
オープンガバナンスとは 11 Code for Japan 関治之氏スライドより抜粋(https://speakerdeck.com/codeforjapan/detahuo-yong-togong-chuang 行政側のオープン化と、市民側の積極的な課題解決への関与をもって 達成する、社会全体の新しい統治プロセス体系
オープンガバナンスの例 12 東京都が新型コロナウイルス感染症対策サイトの ソースコードをGitHubにオープンソースとして公開
オープンガバナンスの例 13 東京都が新型コロナウイルス感染症対策サイトの ソースコードをGitHubにオープンソースとして公開 2020年3月4日のGitHubリポジトリ開設から4日で ✓ 1010コミット ✓ 68人のコントリビューター(貢献者) ✓
341のイシュー提示(うち229がクローズ) ✓ 451のプルリクエスト(うち362がクローズ) ※2020年3月8日7:00現在
オープンガバナンスの例 14 なんと!あの有名な台湾のデジタル大臣 オードリー・タン氏も参戦 オープンソース万歳
オープンデータと言える条件(1) 15 二次利用を許可することを明示 「クリエイティブコモンズライセンス」 「この条件を守れば私の作品を自由に使って構いません。」 という意思表示をするためのツール
オープンデータと言える条件(1) 16 オープンデータあるある① 「オープンデータが改ざんされたらどうするんですか!」 元データ (WEB等) 悪意のある 引用 出典なし 出典表示
義務なし ファクトチェックできない 元データ (オープンデータ) 悪意のある 引用 出典あり 出典表示 義務あり ファクトチェックできる 情報の受け手 オープンデータは危険性ではなく安全性を高めるための仕組み。
オープンデータと言える条件(2) 17 (構造化データ) 機械可読できる形式であること コンピューターは「ちゃんと教えないと 仕事ができない」ツールだから。 ✓ どこがイベント名称? ✓ どこが日付?
✓ どこが対象? なんで? ???
オープンデータと言える条件(2) 18 オープンデータあるある② 使用前のデータ供養(クレンジング)で力尽きる この状態(非構造化)から この状態(構造化)にするのが クレンジング サイバー空間で使えるデータをきちんと送るために、「データの質」に も目を向けましょう。
オープンデータと言える条件(2) 19 ここの大多数がクレンジング 作業が必要なデータでは使い 物になりません。 最初から電脳世界で扱える データのカタチにすることを 意識してください。 電脳世界 現実世界
5スター・オープンデータ 20 段階 公開の状態 データ形式 ★ オープンライセンスでデータを公開 PDF、JPG ★★ コンピュータで処理可能なデータを公開
XLS、DOC ★★★ オープンに利用できるフォーマットでデータを公開 XML、CSV ★★★★ Web標準(RDF等)のフォーマットでデータを公開 RDF ★★★★★ 他へのリンクを入れたデータ(LOD)を公開 Linked-RDF 編集不可 編集可 機械可読 https://5stardata.info/en/ オープンデータを機械可読の しやすさでランク付け ここが問題
なにが起こったか 21 神CSVの量産 神EXCELならぬ
5スター・オープンデータ 22 「XLS(EXCELで扱う形式) ではダメだから、CSVにすればいいのね~」 で、こうなる。
5スター・オープンデータ 23 誰でもできる神CSVの作り方 ①神EXCELを作ります。セル結合、セル内改行など存分に使いましょう。 ②[ファイル]⇒[名前を付けて保存]⇒「CSV形式」を選択⇒保存 ただよう「そうじゃない感」
提案します 24 シン・5スターオープンデータ 段階 公開の状態 アクション ★ 誰でも使ってね!という想いを表そう CCライセンスをつけて出す ★★
PDFを卒業してみよう 元データをそのまま出す ★★★ ちょっとコンピューターの気持ちになってみよう 構造化データ ★★★★ もっといろんなデータとつなげて使ってほしい! 共通化された語彙を使う XML、RDFで出す ★★★★★ ワールドワイドにデータをつなげたい! Linked-RDFで出す 各組織におけるオープンデータへの理解度とデータ運用 マネジメントのレベルに応じて段階を決める
まとめ 25 ➢ 現実世界には色々なデータがあふれている ➢ 現実世界にあふれるデータを再現した電脳世界(デジタルツイン) を活用して、様々なエコシステムを形成する ➢ 行政が持つ情報(データ)もデジタルツインで「社会の公共財」 として使えるように開放(オープンデータ化)しよう
➢ オープンデータによって「透明化・参加・協働」の流れが駆動し、 市民参加を実現できる ➢ 機械可読の正しい形を知った上でオープンデータにしよう
Thank you!! 本スライドのうち、クリエイティブコモンズライセンスの表示があるスライド については、以下のクレジットを入れていただくことで二次利用が可能です。 © Sayaka Ishizuka :2020