Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オープンデータの基礎知識
Search
Sayaka Ishizuka
March 09, 2020
Technology
1.4k
2
Share
オープンデータの基礎知識
デジタルツインとそれを活用したエコシステム形成のために必要なオープンデータに関して改めて基礎知識をまとめました。
神CSV、シン・オープンデータ5スターなどの初出しネタも満載。
Sayaka Ishizuka
March 09, 2020
More Decks by Sayaka Ishizuka
See All by Sayaka Ishizuka
地方自治体における持続可能な行政サービスのための新たな役割分担
y150saya
2
2k
地方自治体の個別の行政事務における事務執行上の課題についての意見
y150saya
1
960
デジタル化・DX推進あるある
y150saya
0
560
地方自治体業務あるある ーアナログ最適化編-
y150saya
1
810
サービス設計12箇条で紐解く「サービスデザイン思考」
y150saya
0
2.7k
地方自治体業務あるある ー世帯所得合算編
y150saya
1
2k
地方自治体業務あるある
y150saya
6
11k
地方自治体DXにおける領域整理
y150saya
1
650
危機関連保証申請認定のスマート申請化
y150saya
0
300
Other Decks in Technology
See All in Technology
オライリーイベント登壇資料「鉄リサイクル・産廃業界におけるAI技術実応用のカタチ」
takarasawa_
0
400
Agent Skillsで実現する記憶領域の運用とその後
yamadashy
2
1.8k
自動テストだけで リリース判断できるチームへ - 鍵はテストの量ではなくリリース判断基準の再設計にあった / Redesigning Release Criteria for Lightweight Releases
ewa
7
3.7k
古今東西SRE
okaru
2
180
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
15
100k
SLI/SLO、「完全に理解した」から「チョットデキル」へ
maruloop
5
440
(きっとたぶん)人材育成や教育のような何かの話
sejima
0
720
ブラウザの投機的読み込みと投機ルールAPIを理解し、Webサービスのパフォーマンスを最適化する
shuta13
3
300
そのSLO 99.9%、本当に必要ですか? 〜優先度付きSLOによる責任共有の設計思想〜 / Is that 99.9% SLO really necessary? Design philosophy of shared responsibility through prioritized SLOs
vtryo
0
650
AI飲み会幹事エージェントを作っただけなのに
ykimi
0
180
全社統制を維持しながら現場負担をどう減らすか〜プラットフォームチームとセキュリティチームで進めたSecurity Hub活用によるAWS統制の見直し〜/secjaws-security-hub-custom-insights
mhrtech
1
440
Every Conversation Counts
kawaguti
PRO
0
220
Featured
See All Featured
Crafting Experiences
bethany
1
140
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9k
For a Future-Friendly Web
brad_frost
183
10k
Designing Experiences People Love
moore
143
24k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
Into the Great Unknown - MozCon
thekraken
41
2.5k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3k
Side Projects
sachag
455
43k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
690
Producing Creativity
orderedlist
PRO
348
40k
Transcript
オープンデータの基礎知識
プロフィール 本業:横浜市経済局成長戦略推進部新産業創造課ICT専任職 (局内外におけるICT活用に関するアドバイス、研修などを担当) 副業:総務省地域情報化アドバイザー、ユニバーサルメニュー普及協会研究員 サードプレイス:Code for Japan/Code for YOKOHAMA、よこはまYYラボ 番外:地方公務員が本当にすごい!と思う地方公務員アワード2017受賞
GovInsider アジアでGovtechを推進する女性55人 石塚 清香 -Sayaka Ishizuka-
2 街にどんなデータが隠れていますか?
3 街にどんなデータが隠れていますか? 電力使用量 イベント 飲食店 車両通行量 輸出入 客船入港数 人口 立地企業数
パーソントリップ インバウンド MICE ゴミ収集 宿泊者数 工業生産 公共交通 水道使用量 DSM/DEM BIM 都市デザイン 医療機関 救命救急 文化・芸術 消費活動
4 現実世界に溢れるデータを電脳世界で再現する(デジタルツイン) エコシステム形成にフィジカル空間を活用 テクノロジーを漠然と受容することなく、社会実装を強く意識して、国民生活・経済活動の質向上 のために能動的かつ積極的に活用し、産業競争力の強化、社会課題の解決に役立てる
エコシステム形成にフィジカル空間を活用 5 そのためにはサイバー空間側に「データをきちんと送る」ことが重要 Point!
エコシステム形成にフィジカル空間を活用 6
エコシステム形成にフィジカル空間を活用 7 サイバー空間側のサービスを駆動させるために 行政も保有情報(データ)を「社会の公共財」として開放 Open Data
オープンデータとは 8 様々なサービスに行政が保有するデータを使えるよう「開放」すること
オープンデータとは 9 公開=Publish Open=開放 自由な出入りを許すこと 使用を許すこと 様々な主体にデータを使ってもらいたいという思想のもと、より前向きな意味の 「オープン(開放)」を使用 ➢ データを活用した課題解決プロセスの創造
➢ 協働による社会変革活動の展開
オープンデータ=オープンガバナンスの第一歩 10
オープンガバナンスとは 11 Code for Japan 関治之氏スライドより抜粋(https://speakerdeck.com/codeforjapan/detahuo-yong-togong-chuang 行政側のオープン化と、市民側の積極的な課題解決への関与をもって 達成する、社会全体の新しい統治プロセス体系
オープンガバナンスの例 12 東京都が新型コロナウイルス感染症対策サイトの ソースコードをGitHubにオープンソースとして公開
オープンガバナンスの例 13 東京都が新型コロナウイルス感染症対策サイトの ソースコードをGitHubにオープンソースとして公開 2020年3月4日のGitHubリポジトリ開設から4日で ✓ 1010コミット ✓ 68人のコントリビューター(貢献者) ✓
341のイシュー提示(うち229がクローズ) ✓ 451のプルリクエスト(うち362がクローズ) ※2020年3月8日7:00現在
オープンガバナンスの例 14 なんと!あの有名な台湾のデジタル大臣 オードリー・タン氏も参戦 オープンソース万歳
オープンデータと言える条件(1) 15 二次利用を許可することを明示 「クリエイティブコモンズライセンス」 「この条件を守れば私の作品を自由に使って構いません。」 という意思表示をするためのツール
オープンデータと言える条件(1) 16 オープンデータあるある① 「オープンデータが改ざんされたらどうするんですか!」 元データ (WEB等) 悪意のある 引用 出典なし 出典表示
義務なし ファクトチェックできない 元データ (オープンデータ) 悪意のある 引用 出典あり 出典表示 義務あり ファクトチェックできる 情報の受け手 オープンデータは危険性ではなく安全性を高めるための仕組み。
オープンデータと言える条件(2) 17 (構造化データ) 機械可読できる形式であること コンピューターは「ちゃんと教えないと 仕事ができない」ツールだから。 ✓ どこがイベント名称? ✓ どこが日付?
✓ どこが対象? なんで? ???
オープンデータと言える条件(2) 18 オープンデータあるある② 使用前のデータ供養(クレンジング)で力尽きる この状態(非構造化)から この状態(構造化)にするのが クレンジング サイバー空間で使えるデータをきちんと送るために、「データの質」に も目を向けましょう。
オープンデータと言える条件(2) 19 ここの大多数がクレンジング 作業が必要なデータでは使い 物になりません。 最初から電脳世界で扱える データのカタチにすることを 意識してください。 電脳世界 現実世界
5スター・オープンデータ 20 段階 公開の状態 データ形式 ★ オープンライセンスでデータを公開 PDF、JPG ★★ コンピュータで処理可能なデータを公開
XLS、DOC ★★★ オープンに利用できるフォーマットでデータを公開 XML、CSV ★★★★ Web標準(RDF等)のフォーマットでデータを公開 RDF ★★★★★ 他へのリンクを入れたデータ(LOD)を公開 Linked-RDF 編集不可 編集可 機械可読 https://5stardata.info/en/ オープンデータを機械可読の しやすさでランク付け ここが問題
なにが起こったか 21 神CSVの量産 神EXCELならぬ
5スター・オープンデータ 22 「XLS(EXCELで扱う形式) ではダメだから、CSVにすればいいのね~」 で、こうなる。
5スター・オープンデータ 23 誰でもできる神CSVの作り方 ①神EXCELを作ります。セル結合、セル内改行など存分に使いましょう。 ②[ファイル]⇒[名前を付けて保存]⇒「CSV形式」を選択⇒保存 ただよう「そうじゃない感」
提案します 24 シン・5スターオープンデータ 段階 公開の状態 アクション ★ 誰でも使ってね!という想いを表そう CCライセンスをつけて出す ★★
PDFを卒業してみよう 元データをそのまま出す ★★★ ちょっとコンピューターの気持ちになってみよう 構造化データ ★★★★ もっといろんなデータとつなげて使ってほしい! 共通化された語彙を使う XML、RDFで出す ★★★★★ ワールドワイドにデータをつなげたい! Linked-RDFで出す 各組織におけるオープンデータへの理解度とデータ運用 マネジメントのレベルに応じて段階を決める
まとめ 25 ➢ 現実世界には色々なデータがあふれている ➢ 現実世界にあふれるデータを再現した電脳世界(デジタルツイン) を活用して、様々なエコシステムを形成する ➢ 行政が持つ情報(データ)もデジタルツインで「社会の公共財」 として使えるように開放(オープンデータ化)しよう
➢ オープンデータによって「透明化・参加・協働」の流れが駆動し、 市民参加を実現できる ➢ 機械可読の正しい形を知った上でオープンデータにしよう
Thank you!! 本スライドのうち、クリエイティブコモンズライセンスの表示があるスライド については、以下のクレジットを入れていただくことで二次利用が可能です。 © Sayaka Ishizuka :2020