Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オープンデータをオープンにしよう
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
watambo
February 07, 2020
Technology
4.7k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
オープンデータをオープンにしよう
2020/2/7に某市で実施したオープンデータに関する講演資料です。公開用に一部改変しています。
ライセンス:CC-BY
watambo
February 07, 2020
More Decks by watambo
See All by watambo
オープンデータをオープンにしよう2022
watambo
0
55
キカク株式会社(KIKAKU Inc.)の事業紹介
watambo
0
320
行政をハックし、行政データをオープンにしてみようとした結果
watambo
16
26k
Other Decks in Technology
See All in Technology
時期が悪い!それでもRaspberry Piを買って遊んで活用するには / 20260627-osc26do-rpi-jikigawarui
akkiesoft
0
830
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
160
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
470
5分でわかる Amazon Connect_20260608
hwangbyeonghun
0
110
感情と身体を置き去りにしない、エンジニアの生きのこり方 ──いまから、ここから「自分の状態」を扱うという選択
saorimurooka
0
340
【2026年版】 ベクトル検索とEmbedding最前線
mocobeta
24
7.6k
AIチャット検索改善の3週間
kworkdev
PRO
2
180
Agile and AI Redmine Japan 2026
hiranabe
4
480
AIが自律的に回る開発ループを設計してチーム開発に組み込む
nekorush14
0
130
10年間のブログ発信を振り返って見えたWebアプリケーションエンジニアとしての軌跡
stefafafan
0
190
OTel × Datadog で 「AI活用」を計測し、改善に繋げる
shihochan
2
770
2026 AI Memory Architecture
nagatsu
0
330
Featured
See All Featured
First, design no harm
axbom
PRO
2
1.2k
Writing Fast Ruby
sferik
630
63k
GitHub's CSS Performance
jonrohan
1033
470k
How to make the Groovebox
asonas
2
2.2k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
370
GraphQLとの向き合い方2022年版
quramy
50
15k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
240
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
1k
Un-Boring Meetings
codingconduct
0
320
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
190
A Modern Web Designer's Workflow
chriscoyier
698
190k
Transcript
ΦʔϓϯσʔλΛ Φʔϓϯʹ͠Α͏ 2020/02/07 Fri ᬑ ྄ี (@watambo)
@watamboͰ͢ ɾᬑ ྄ี (Θͨͳ Γΐ͏͚͢) ɾਓࡐܥاۀͷϓϩμΫτϚωʔδϟʔ ɾVi−King CEO (ΞϓϦ։ൃʴίϛϡχςΟӡӦ) ɾΩΧΫ
CEO (σʔλΤϯδχΞϦϯά×RPA)
https://camph.net/
https://speakerdeck.com/watambo/xing-zheng-wohatukusi-xing-zheng-detawoopunnisitemiyoutositajie-guo
https://blog.watambo.com/2019/12/opendatahack2019.html
ࠓɻ WHY Φʔϓϯσʔλ ͳΜͰΦʔϓϯσʔλΒͳ͔͋Μͷʁ WHAT Φʔϓϯσʔλ ΦʔϓϯσʔλͬͯԿͳΜʁ HOW Φʔϓϯσʔλ ΦʔϓϯσʔλͬͯͲ͏ΔΜʁ
͍ͬͯ͏Λ͠·͢
ΞΠεϒϨΠΫͰ͢ ɾ2ਓ1ʹͳ͍ͬͯͩ͘͞ ɾ(ॳΊ·ͯ͠ͷ߹) ࣗݾհ͍ͯͩ͘͠͞ ɾࠓͷݚमʹظ͍ͯ͠Δ͜ͱΛ͓ޓ͍ʹڞ ༗͍ͯͩ͘͠͞
ࠓͷ͓ଋ͝ͱ ɾ໌͔Β͕ࣗΦʔϓϯσʔλʹऔΓΉͱ ͯ͠Կ͕Ͱ͖ͦ͏͔ʁΛߟ͑Δ࣌ؒͱͯ͠׆༻ ͍ͯͩ͘͠͞ ɾ࣭͍ͭͰOK 🙆 Ͱ͢ɻ ͋ͳͨʹࠣࡉͱࢥ͑Δٙɺผͷਓʹͱ ͯॏཁͳ͜ͱ͋Γ·͢
WHY Φʔϓϯσʔλʁ
ग़యɿҰൠ৬ۀհঢ়گʢ৬ۀ҆ఆۀ౷ܭʣʢްੜ࿑ಇলʣΛݩʹ࡞
ٻਓഒ͕ߴ͗͢Δ ɾٻਓΛग़ͯ͠࠾༻Ͱ͖ͳ͍࣌ ɾͳΜͰʁ →ʮಇ͍ͯ΄͍͠ʯͷ૯ʹରͯ͠ ɹʮಇ͖͍ͨʯͷ૯͕Γͯͳ͍͔Β
ಇ͘ਓ͕Γͳ͍࣌ ͦΕͰ๛͔͞Λҡ࣋͢ΔͨΊʹɺ1ਓ͕Ͱ͖ Δ͜ͱΛ૿͍͔ͯ͘͠͠ͳ͍
AWS Transcribe
AWS Transcribe ɾAWS (AmazonͷΫϥυίϯϐϡʔςΟϯ άαʔϏε) ͕ఏڙ͢ΔʮԻͷจࣈى͜͠ʯ ɾྫ͑ɺձٞͷԻΛԻ͓͚ͯ͠ɺٞࣄ ΛੜͰ͖Δ
None
ΊͪΌͪ͘Ό͍҆͠Χϯλϯ ɾ2࣌ؒͷձٞͷٞࣄΛ300ԁͰ࡞ΕΔ ɾಉ͜͡ͱΛਓؒʹͤΔͱ…12,000ԁ͘Β͍ ɹ(ʮϥϯαʔζ ςʔϓى͜͠ʯͰάάͬͨ) ɾͪͳΈʹGUI (ը໘ΫϦοΫ͢Δ͚ͩ) ϕʔε
Cloud Vision API
Cloud Vision API ɾGCP (GoogleͷΫϥυίϯϐϡʔςΟϯά αʔϏε) ͕ఏڙ͢Δʮը૾ͷࣝผʯ ɾྫ͑ɺ൜Χϝϥͷεφοϓγϣοτ͔Β ෆ৹ऀΛࣗಈݕग़Ͱ͖Δ
None
None
͜ΕΒΛࢧ͑Δٕज़ػցֶश ɾػցֶशʮσʔλ͔ΒϧʔϧύλʔϯΛ Έ͚ͭΔ͜ͱͰɺԿ͔Λ༧ଌͨ͠Γɺݟ͚ͨ Γ͢Δํ๏ʯͷ͜ͱ ɾػցֶशͷਫ਼Λ্͛ΔͨΊʹେྔͷσʔ λ͕ඞཁ
Google Dataset Search
Google Dataset Search ɾGoogle͕ఏڙ͢Δػցֶशʹ͏σʔληο τͷݕࡧαΠτ ɾੈքதͷػցֶशΤϯδχΞ͕͏σʔλ ηοτͱͯ͠ެ։͞Εͳ͍ͱɺࣝผͱ༧ଌͷର ͱ͞Εͳ͘ͳΔ
None
DataRobot ɾػցֶशͷຽओԽɻ୭ͰػցֶशΛͬͨ ࣝผͱ༧ଌ͕Ͱ͖Δɻ ɾGUIϕʔεͰΊͪΌͪ͘ΌΧϯλϯɻ ɾ͜Ε͕ΞλϦϚΤʹͳΔͱʮσʔλΛ࣋ͬͯ Δ͜ͱ͕େࣄʯͳੈքʹͳΔʢͣʣɻ
ٻਓഒͷͭ͘Γํ ɾٻਓഒʹϋϩʔϫʔΫͷٻਓථ/ٻ৬ऀ ɾຽͱʹॏཁͳࢦඪ ɾͰɺͳͥҙຯ͕͋Δͷ͔ʁ
GoogleτϨϯυͰΈΔ ϋϩʔϫʔΫͱλϯϫʔΫ
ͭ·Γɻ ࠃ࣏ࣗମ͕࣋ͬͯΔ͚ͲɺຽؒͰ͍࣋ͬͯ ͳ͍σʔλ͕ͨ͘͞Μ͋Δɻ ͜ΕΒΛΦʔϓϯʹ͍ͯ͘͜͠ͱɺੈͷதʹ ͱͯՁ͕͋Δɻ
WHAT Φʔϓϯσʔλʁ
Φʔϓϯσʔλͱ ࣍ͷ3ͭͷ݅Λຬ͍ͨͯ͠Δσʔλɻ 1. ίϯϐϡʔλ͕ಡͰ͖Δ 2. ӦརɾඇӦརΘͣ̎࣍ར༻Մೳͳϧʔϧ༗ 3. ແঈͰ͔ͭ͑Δ
ίϯϐϡʔλ͕ಡͰ͖Δ ɾʮػցಡՄೳʯͱݴΘΕΔ ɾిࢠϑΝΠϧ ≠ ػցಡՄೳ ɾHTML ɾCSV ɾXML, JSON ɾPDF
ɾεΩϟϯͨ͠PDF ɾը૾ ࢴ
ͿͬͪΌ͚ɺ ిࢠϑΝΠϧͳΒػցಡՄೳ Cloud Vision API͑ɺͨͱ͑ը૾σʔλͷ ॻྨςΩετʹจࣈى͜͠Ͱ͖Δ ΊΜͲ͍͚͘͞ͲɺΤϯδχΞϦϯάͰԿͱ͔ Ͱ͖Δ
“ೋ࣍ར༻ͷଅਐͷͨΊͷলͷσʔλެ։ʹؔ͢Δجຊతߟ͑ํʢΨΠυϥΠϯʣ” ૯ল https://www.kantei.go.jp/jp/singi/it2/cio/dai52/kihon.pdf
̎࣍ར༻Մೳɺແঈ ࣗ༝ʹ͑Δσʔλɺͭ·Γ Ӧརతར༻ɺసࡌɺൢചɺվมͳͲ׆༻ࣗ༝ All rights reserved શͯͷஶ࡞ݖΛओு Creative Commons Attribution
(ΫϦΤΠςΟϒɾίϞϯζ දࣔɺCC-BY) ׆༻ࣗ༝ɻग़య͚ͩهࡌͯͪ͠ΐ
ແஅͰసࡌ ແஅͰՃ ແஅͰൢച ༻݅ ཁ૬ஊ ग़య໌ࣔ
·ͱΊ ɾΦʔϓϯσʔλɺίϯϐϡʔλͰѻ͍͢ ͍ܗࣜͰެ։͢Δɻ ※ͨͩ͠ɺΉΛಘͳ͍ཧ༝͕͋Δͱ͖ը૾PDFͰΑ͠ ɾެ։ʹ͋ͨͬͯɺࣗ༝ʹ͑ΔΑͱ͍͏ ϧʔϧ (CC-BY) Λએݴ͓ͯ͘͠
ྫʣΩϟογϡϨεؐݩࣄۀ ɾܦࡁ࢈ۀল͕ެ։ͨ͠ʮΩϟογϡϨεɾফ අऀؐݩࣄۀऀʯͷҰཡ͕PDFͰ͔͠μϯ ϩʔυͰ͖ͳ͔ͬͨ ɾՈܭΞϓϦͷZaim͕ɺPDFΛύʔε͠ςΩ ετใ͔ΒϚοϓΛ։ൃ (։ൃظؒ1) ɾܦࡁ࢈ۀল͕σʔλ࿈ܞઌͱͯ͠ਖ਼ࣜ࠾
😵 😄 https://content.zaim.net/cashless/
Φʔϓϯσʔλͷ͍Έͪ 1. ࣄͷखؒΛݮΒ͢ 2. Ҭ՝ͷղܾ
͜Μͳ͜ͱɺͳ͍Ͱ͔͢ʁ🤔 ɾใެ։ٻͰɺಉ͡Α͏ͳσʔλͷ։ࣔΛ ܁Γฦ͠ٻΊΒΕΔ ɾҟͳΔۀ୲՝Ͱɺಉ͡Α͏ͳσʔλΛ ผʑʹ࡞͍ͯ͠Δ ɾใͷఏڙ͕Εͨ͜ͱͰɺࢢຽ͔Β͕ۤ ΑͤΒΕΔ
ใެ։ٻͷ݅ ɾࠃަ௨লɹ500݅ / ɾްੜ࿑ಇলɹ4,800݅ / ɾ౦ژɹɹɹ12,000݅ /
“෮ܧଓతʹ։͕ࣔͳ͞Εͨใͷఏڙʹ͍ͭͯ" ૯ল https://www.soumu.go.jp/main_content/000369392.pdf
ใެ։ٻͷܰݮ (੩Ԭࢢ) ੩ԬࢢͰɺใެ։ٻ݅ͷଟ͔ͬͨ৯ӦۀڐՄࡁͷࣄۀऀ σʔλΛΦʔϓϯσʔλͱͯ͠ެ։͢Δ͜ͱͰɺۀෛ୲ͷܰݮʹ ޭ H25
H26 H27 H28 ใެ։ٻ ͷΈͰରԠ ࢢͷHPͰ ใఏڙ ΦʔϓϯσʔλԽ ৯ӦۀڐՄʹؔ͢Δใެ։ٻ݅ (੩Ԭࢢ) ग़యɿVLEDʮୈ4ճσʔλӡ༻ݕ౼Պձʢ20172݄13ʣʯࢿྉΑΓ࡞ ؒ100݅ݮ →300࣌ؒͷ ۀ࣌ؒݮʹ
ͨͱ͑ ɾ৯ؔӦۀऀா ɾපӃɾྍॴɺࢪज़ॴͷҰཡ(ࠎӃɺΓ) ɾެӦॅͷۭ͖ՈҰཡ ɾ֤छ౷ܭσʔλɺॅډදࣔா ͳͲΛΦʔϓϯσʔλͱͯ͠ެ։͢Δ͜ͱͰɺ ࢢຽ͔Βͷ͓͍߹Θͤɺ࣏ࣗମ৬һͷۀ ͷखؒΛݮ͢Δ͜ͱʹͳΔ͔ʁ
ϫʔΫγϣοϓ ɾࣗͷ՝Ͱཧ͍ͯ͠ΔσʔλΛϙετΠο τʹॻ͖ग़͍ͯͩ͘͠͞ ɾ4ਓ1ʹͳ͍ͬͯͩ͘͞ ɾॻ͖ग़ͨ͠༰Λڞ༗͍ͯͩ͘͠͞
ϫʔΫγϣοϓଓ͖ ɾઌఔॻ͖ग़ͨ͠ɺࣗͷ՝Ͱཧ͍ͯ͠Δ σʔλʹ͍ͭͯɺΦʔϓϯʹ͢ΔͱΑͦ͞͏ͳ ͷʹˑҹΛ͚͍ͭͯͩ͘͞ɻΦʔϓϯʹ͢Δ ͱͲΜͳ͍͍͜ͱ͕͋Γͦ͏͔ॻ͍ͯͩ͘͞ ͍ ɾઌఔͷ4ਓάϧʔϓʹͳ͍ͬͯͩ͘͞ ɾॻ͖ग़ͨ͠༰Λڞ༗͍ͯͩ͘͠͞
Φʔϓϯσʔλ×ຽؒαʔϏε ʹࢢຽͷHAPPY 😍
σʔλͷ׆༻ຽؒʹͤͯ ͍͍͔ ߦ ຽؒ Ϣʔβ Φʔϓϯ σʔλ αʔϏε ☺ 😁
Φʔϓϯ σʔλ αʔϏε Φʔϓϯ σʔλ αʔϏε 😍 ަ௨ ҩྍ อҭ &more
څ৯σʔλ×ΞϓϦ 4919 for Ikoma (ੜۨࢢ) ֶߍڅ৯ͷใΛ௨ͯ͡ࢠͲͷ৯ҭΛαϙʔτ ;I , 42(U]gX) 6AGG&7Sebg7
3 ZafVG*% 6HCG&_Y`gG*% 6"SebgL3ZafV ED2F0@M $! O*% /G =2JM'2OF DKG2(OU]gX@M P\b8 DK=2JM'2G&LSebg7PdcTf73Zaf VEDOGV^gX[RfB<N::QaVXCKF.F#+B>M8 &7inmh7 3kplojG*% HCG& _Y`g*% 9G_Y`gG PdcTfO*% XW\ 1 5PdcTf ) 69G_Y`gGPdc TfO*%@M?CB7 -O@ XMNJND6QTUGORTSPYo83/9C /,0/n'X}Y_ ?(W <5 n D%z~n2'_ iVKIIM^uKIJLnN@ iJKr\hZwWKIJLH!>/+;p c[egcjy7"mXMNJND6QTUGORTSPYoV$j_ eV $4Dm]bwz~ yBajjrmV *}s #ElkDmAfw-)lyfwcjy*)m ?(dxgW $ & " "#& !% 4D&1 'Fn4D&1n| y =qV{ lkmtw:.i ^vsf`4Dnz y:.eVkrnD6yfwW https://cio.go.jp/opendata100
GTFS×Google Maps ɾGTFS (General Transit Feed Speci fi cation) ͱɺެڞަ௨ػؔͷ࣌ࠁදͱཧతใʹͭ
͍ͯͷΦʔϓϯϑΥʔϚοτ ɾGTFSରԠͯ͠ͳ͍ͱόεใ͕GoogleϚο ϓʹࡌΒͳ͍ɻͭ·ΓɺόεʹΓ͍ͨਓ͕ GoogleϚοϓͰௐͯ࣌ࠁදʹḷΓண͚ͳ͍
None
“όεϩέʔγϣϯγεςϜಋೖௐࠪࣄۀͷ݁Ռൃදʹ͍ͭͯ” Ѵࢢ https://www.city.asahikawa.hokkaido.jp/kurashi/452/453/454/d056483.html
5374 (͝Έͳ͠) ɾCode for Kanazawa͕ͭͬͨ͘ɺҬͷΰϛ ͷऩू͕͔ΔWebαΠτ ɾ5374ͷιʔείʔυGithub (ίʔυͷཧ πʔϧ) Ͱެ։͞Ε͓ͯΓɺར༻ϧʔϧʹै͑
ɺ୭ͰΧϯλϯʹݩͷΰϛऩूݕࡧα Πτ͕ͭ͘ΕΔ ɾhttps://github.com/codeforkanazawa-org/5374
ɾURLɿhttps://ttzk.graffer.jp/ ɾҬɿ֤ ɾ֓ཁɿ֤࣏ࣗମͷϗʔϜϖʔδʹܝࡌ͞Ε͍ͯΔసग़ೖɺ݁ࠗɾग़࢈ͱ͍ͬͨखଓ͖ͷํΛ࣏ࣗମΛ·͍ͨͰެ։͍ͯ͠ΔαʔϏεɻ αΠτ্Ͱ࣭ʹ͍͚͑ͯͩ͘Ͱ࣏ࣗମఏग़Ͱ͖ΔॻྨΛ؆୯ʹ࡞͢Δ͜ͱ͕Ͱ͖·͢ɻͨͱ͑ށ੶౽ຊͳͲɺ݁ࠗͱ͔গͳ ͍ϥΠϑΠϕϯτͰ͔͠Θͳ͍ͷͳͷͰൃߦͷํ๏ΛΒͳ͍ਓ͕ଟ͍ͱࢥ͍·͕͢ɺʮ͘Β͠ͷ͖ͯͭͮʯΛݟΕखଓ͖ͷ֓ཁͱ ΦϯϥΠϯ݁Ͱྃɺͱ͍͏ͷͱͯϕϯϦͩͱ͓͍·͢ɻ ɾӡӦɿגࣜձࣾάϥϑΝʔ
None
੫ۚͲ͜ʹߦͬͨʁ ɾURLɿhttp://spending.jp/ ɾ֓ཁɿ֤࣏ࣗମ͕ެද͍ͯ͠Δ༧ࢉʹؔ͢ΔΦʔϓϯσʔλΛ׆༻ͯ͠ɺݸਓͷ੫ۚͷҰ͋ͨΓͷࢧग़ֹΛ͍ࣔͯ͠·͢ɻ ࢲͨͪຊདྷͰ͋Εࢧͬͨ੫ۚͰΉެڞαʔϏεΛड͚Δݖར͕͋Γ·͢ɻͦͷͨΊʹ੫ۚͷΘΕํΛΔࣄ͕ඞ ཁͰ͕͢ɺ؆୯ʹΔज़͕͋Γ·ͤΜɻΠΪϦεͷWhere Does My Money Go? Λࢀߟʹɺ༗ࢤʹΑ্ཱͬͯͪ͛ΒΕɺ
ݱࡏ ɺଟ͘ͷ༗ࢤͷਓͷखʹΑΓαΠτ্ཱ͕͕͍ͪͬͯ·͢ɻ ɾӡӦɿOpen Knowledge Foundation Japan
·ͱΊ ɾΦʔϓϯσʔλɺ ίϯϐϡʔλ͕ѻ͑ΔܗࣜͷͷͰɺࣗ༝ʹ ͑ΔϧʔϧΛఆΊͨσʔλͷ͜ͱ ɾΦʔϓϯσʔλΛެ։͢Δͱɺ ࣏ࣗମ৬һͷࣄͷखؒΛݮΒͨ͠Γɺຽؒ αʔϏεͱͷίϥϘϨʔγϣϯΛ௨ͯ͡Ҭ՝ ͷղܾʹͭͳ͕ͬͨΓ͢Δ
ٳܜλΠϜ ☕
HOW Φʔϓϯσʔλʁ
ΰʔϧ ࢲʹΦʔϓϯσʔλΛެ։Ͱ͖ͦ͏ͩʂ ͱࢥ͑Δ͜ͱ
Φʔϓϯσʔλͱ ࣍ͷ3ͭͷ݅Λຬ͍ͨͯ͠Δσʔλɻ 1. ίϯϐϡʔλ͕ಡͰ͖Δ 2. ӦརɾඇӦརΘͣ̎࣍ར༻Մೳͳϧʔϧ༗ 3. ແঈͰ͔ͭ͑Δ ࠶ܝ
Φʔϓϯσʔλ🎉
࠷ݶɺίίΛΫϦΞ͠Α͏ ɾϗʔϜϖʔδܝࡌ͍ͯ͠Δ͚ͩͰɺར༻ ऀ͕σʔλͷՃ࠶ͳͲΛߦ͑ͳ͍ͱࢥ ͏Մೳੑ͕͋Δ ɾσʔλͱซͤͯɺӦརɾඇӦརΛΘͣ̎࣍ ར༻ՄೳͰ͋ΔࢫͳͲར༻نͱͯ͠໌֬ʹఏ ࣔ͢Δඞཁ͕͋Δ
ͲΜͳར༻ϧʔϧ͕ඞཁʁ ɾ̎࣍ར༻ՄೳͰ͋Δ͜ͱɺར༻ͷࡍͷ݅ ͷهࡌ͕ඞཁ ɾ໔ࣄ߲Λද໌͓ͯ͘͜͠ͱ͕·͍͠
ᶃσʔλʹద༻͢ΔϥΠηϯεΛهࡌ ɹಛஈͷཧ༝͕ͳ͍ݶΓCC-BYਪ ᶄΦʔϓϯσʔλެ։ʹ͋ͨͬͯ ɾίϯςϯπͷਖ਼֬ੑΛอূ͠ͳ͍ ɾίϯςϯπΛ༻͍ͯߦ͏Ұͷߦҝʹ ɹެදऀΛΘͳ͍ Λද໌͢Δͷ͕·͍͠
໔ࣄ߲ʹ͍ͭͯิ ɾؒҧͬͨσʔλΛެ։ͨ͠Β৬һͷʹͳΔͷͰʁˠެ։ ͠ͳ͍ɺͱͳΔͷମͳ͍Ͱ͢ 😢 ɾCC-BYʹແอূ͓Αͼ੍ݶͷؚ߲͕·Ε͍ͯ·͕͢ɺ ར༻ऀʹର࣮ͯ֬͠ʹ௨͖͢ࣄฑͰ͋ΔͨΊɺར༻ऀͷʹ ৮Ε͍͢ͱ͜Ζʹɺແอূɺ໔ʹ͍ͭͯܝࣔ͢Δ͜ͱ͕· ͍͠Ͱ͢ɻͨͩ͠ɺར༻ϧʔϧʢCC-BYͷແอূ͓Αͼ੍ݶ ߲ʣͷ݅ͱໃ६͢Δ༰ʹͳΒͳ͍Α͏ҙ ɾਖ਼֬ੑΛอূ͠ͳ͍ɺͱ͍͏໔ࣄ߲Λهࡌͨ͠ͱͯ͠ɺσʔ
λʹؒҧ͍͕͋Δ͜ͱΛݟ͚ͭͨ߹ɺσʔλΛඇެ։ʹͨ͠ Γɺ͔ʹσʔλΛमਖ਼͢Δͱ͍ͬͨରԠ͕·͍͠Ͱ͢
5˒Φʔϓϯσʔλ https://5stardata.info/ja/
ը૾ͷΦʔϓϯσʔλ ɾը૾ͷOCRʹɺͦΕͳΓͷԼ४උ͕ඞཁɻ ͦͷίετΛຽ͕ؒෛ୲͢Δ͜ͱʹͳΔ ɾྫ͑ࢴͷॻྨΛεΩϟϯ͠ɺͦΕΛOCRϥ ΠϒϥϦͰɺಛʹύϥϝʔλઃఆͤͣʹॲཧ࣮ ߦ͢Δͱ…
None
˒গͳ͘ͱPDFʹ͠Α͏ PDFͩͱɺύʔεϥΠϒϥϦ͕ἧͬͯΔ ɾPythonͷpdfminer ɾJavaͷiText ɾAdobeͷAcrobat API ɹͱ͔ͱ͔
˒˒ExcelͰެ։͠Α͏ ExcelGUIͰѻ͍͍͢ɻͰ… ɹ🙅 ωਃΤΫηϧ࡞Γ͕ͪ ɹ🙅 Microsoft Of fi ce࣋ͬͯͳ͍ͱ͑ͳ͍ ɹɹ
ʹશһ͕ݟΒΕΔΘ͚Ͱͳ͍
This is ωਃΤΫηϧ
CSVͰެ։Λඪʹɻ
˒˒˒CSVʹ͠Α͏ ɾCSVϑΝΠϧɺ֤ྖҬ (Excelͷηϧ) ΛΧϯ Ϛ (ʮ,ʯ) Ͱ۠ͬͨςΩετϑΝΠϧͷ͜ͱ
CSVͷ͍͍ͱ͜Ζ ☺ ɾ֤ྻʹͲΜͳใ͕ೖ͍ͬͯΔ͔͕໌֬Ͱɺ 1ߦ1σʔλͱ͍͏ߏͳͷͰɺίϯϐϡʔλ͕ ʮͲͷྻʹԿ͕ೖྗ͞Ε͍ͯΔ͔ʯΛஅ͠ ͍͢ ɾ߲ͷݟग़͠ͱ༰͕ɺҟͳΔߦʹೖྗ͞Ε ͍ͯΔͷͰɺίϯϐϡʔλ͕༰͚ͩΛಡΈऔ Δ͜ͱ͕༰қ
Excel͔ΒCSV࡞ΕΔ ExcelϑΝΠϧΛ։͖ɺ ʮ໊લΛ͚ͯอଘʯΛબޙ ϑΝΠϧܗ͔ࣜΒʮCSVʯΛબ ͢ΕOKʂ
͜ΜͳCSVΠϠͩ 1. දͷཝ֎ʹλΠτϧ͕ೖ͍ͬͯΔ 2. ݟग़͕͠ෳߦ 3. ߦྻͰ͕ಉ͡ηϧΛ݁߹͍ͯ͠Δ 4. ηϧվߦ 5.
ܩઢ͚ͩͷߦΛ͍ͯ͠Δ 6. ηϧͷʹφκͷۭന 7. ͕ۭཝͷͱ͖ʹΘΓͷจࣈྻΛೖΕΔ ૯লʮΦʔϓϯσʔλݚमϙʔλϧʯࢿྉΛݩʹ࡞
3. ߦྻͰ͕ಉ͡ηϧΛ ݁߹͍ͯ͠Δ 2. ݟग़͕͠ෳߦ 1. දͷཝ֎ʹλΠτϧ ͕ೖ͍ͬͯΔ ͜ΜͳCSVΠϠͩᶃ 😢
1. දશମͰڞ௨͢Δ༰ ཝ֎Ͱͳ͘1߲ͱͯ͠ه ࡌ͢Δ ͜ΜͳCSVʹ͠Α͏ᶃ 😊 3. ߦྻͰ͕ಉ͡Ͱશ ͯͷηϧʹใΛೖྗ͢Δ 2.
ݟग़͠Λ1ߦʹ͢Δ
͜ΜͳCSVΠϠͩᶄ 😢 4. ηϧվߦ 5. ܩઢ͚ͩͷߦΛͯ͠ ͠·͍ͬͯΔ
͜ΜͳCSVʹ͠Α͏ᶄ 😊 4. ηϧվߦ͠ͳ͍ 5. σʔλ͕ͳ͍ߦܩઢΛ͞ ͳ͍ (CSVͱͯ͠อଘͨ͠ͱ͖ʹ ແବͳߦ͕ग़ྗ͞ΕΔͷΛ͙)
͜ΜͳCSVΠϠͩᶅ 😢 ਆಸ ౦ɹژ
6. ηϧͷʹφκͷۭന 7. ͕ۭཝͷͱ͖ʹφκͷ จࣈྻ
͜ΜͳCSVʹ͠Α͏ᶅ 😊 ਆಸ ౦ژ
6. ෆཁͳۭനೖΕͳ͍Α͏ʹ͢Δ 7. ͕ۭཝͷͱ͖ʹۭཝͷ ϚϚʹ͓ͯ͘͠
্ڃฤ
RDFͱLOD ɾRDF (Resource Description Framework) ɾLOD (Linked Open Data)
https://www.ted.com/talks/tim_berners_lee_the_next_web
ςΟϜɾόʔφʔζ=Ϧʔ ɾΣϒͱ͍͏ͷΛ࡞ͬͨਓ ɾURLɺHTTPɺHTMLͱ͔Λ࠷ॳʹઃܭͨ͠ ɾΣϒͷΑ͏ʹσʔλΛ૬ޓʹͭͳ͛Δ Linked Dataͱ͍͏ߏΛఏএ
Linked Dataͷ࣮ྫ
http://linkdata.org/work/rdf1s5416i
RDFͱ ɾ֤σʔλΛɺओޠɾड़ޠɾతޠͷ3ͭͰදݱ ͢Δͱ͍͏ߏจʢʮτϦϓϧʯʣʹΑͬͯදݱ ͢Δ ɾʮઍཬதԝӺͷུশ”ͤΜͪΎ͏”Ͱ͋Δʯ ͳΒɺ ɹओޠɿઍཬதԝӺ ɹड़ޠɿུশͰ͋Δ ɹతޠɿͤΜͪΎ͏ ઍཬதԝӺ
ͤΜͪΎ͏ ུޠͰ͋Δ
RDFදݱ͜͏ͳΔ <rdf:RD F xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns# " xmlns:dcterms="http://purl.org/dc/terms/" > <rdf:Description rdf:about="https://www.wikidata.org/wiki/Q2056658" >
<dcterms:alternative>ͤΜͪΎ͏</dcterms:alternative > </rdf:Description > </rdf:RDF> ड़ޠ ओޠ తޠ ɾRDFʹ͓͚Δओޠɾड़ޠURIͰهड़͢Δ ɾεΫϥονͰ·ͣॻ͚ͳ͍
RDFͱRDFΛͭͳ͛Δͷ͕LOD RDFͰهड़͞ΕͨෳͷΦʔϓϯσʔλΛͭͳ ͛ͨͷ͕LOD େࡕ 1,899 ژ ྡͷಓݝ ໘ੵ େࡕ 8,823,000
ਓޱ ਓޱʹؔ͢ΔΦʔϓϯσʔλ େࡕͷཧใʹ͍ͭͯͷ Φʔϓϯσʔλ ≒ ͦΕͧΕͷେࡕΛද͢URI͕ಉ ͡Ͱ͋ΔͱΈͳͤΕɺ2ͭͷΦʔ ϓϯσʔλΛඥ͚Δ͜ͱ͕Մೳ
ެ։͢Δσʔλͷબఆ ɾԿ͕ࢢຽʹͱͬͯՁ͋Δσʔλ͔ʁΛߟ͑ ΔͷେมͰ͢ΑͶ… ɾͱΓ͋͑ͣऔΓΈΛ࢝ΊΔͳΒɺਪσʔ ληοτͷެ։͕Φεεϝ
https://cio.go.jp/policy-opendata ·ͣίί͔ΒऔΓΉͷ͕ Αͦ͞͏👍
ଞʹެ։͍͖͍ͯͨ͠ʂͲ͏ ͢Εʁ Ҿ༻ http://u-site.jp/alertbox/20000319 Λͱʹຊޠ༁ ςετΛ͢Δਓ ݟ͔ͭͬͨϢʔβϏϦςΟ՝ͷ ϢʔβϏϦςΟςετͷ̍ਓͷ ඃݧऀ͔Βɺશମͷ30ˋ͘Β͍ ͷ՝Λฉ͖ग़͢͜ͱ͕Ͱ͖Δɻ
ςετΛ͢ΔʹͭΕɺ͢Ͱʹ͔ ͍ͬͯΔ͜ͱ͕ଟ͘ͳΓɺ ̑ਓ͘Β͍Ͱશମͷ80ˋఔͷ՝ Λચ͍ग़͢͜ͱ͕Ͱ͖Δɻ χʔϧηϯത࢜ͷʮ5ਓʹฉ͍ͯΈΑ͏ʯϧʔϧ
ܧଓతʹऔΓΉ ɾҰެ։ͨ͠Φʔϓϯσʔλɺσʔλ༰ ͕มߋ͞ΕΔͱߋ৽͕ඞཁ ྫ͑ɺ ✓AEDͷઃஔॴɺઃஔॴͷߋ৽͕͋Ε Ұཡσʔλͷߋ৽͕ඞཁ ✓ਓޱɺ͕࣍มΘΔͱ৽͍͠σʔλͷՃ ͕ඞཁ
ܧଓతʹऔΓΉ ɾ͍͍͢Α͏ʹɺ߲Λ૿͍ͯ͘͜͠ͱ େࣄɻσʔλ໊߲߲Λඪ४ͷͷʹ د͍ͤͯ͘ ɾ·ͣɺਪσʔληοτʹ͍ͭͯɺσʔλ ߲ఆٛΛࢀߟʹ໊߲ͷमਖ਼ͱ߲ͷ֦ॆΛ ͢Δͷ͕Φεεϝ
໊߲͕όϥόϥ ྫཱྀ͑ؗͷҰཡɻࢪઃॴࡏɺӦۀॴॴࡏɺॅॴΛΧϥ ϜׂɺͳͲͳͲ… ৽॓۠ தԝ۠ ੈా୩۠
σʔλ߲ͷՃ No. ໊߲ هೖྫ 1 NO 3 2 ໊শ ◦◦খֶߍ
3 ໊শ_Χφ ◦◦γϣΨοί 4 ॅॴ ౦ژࠇ্۠ࠇ2-◦-◦ 5 ํॻ ◦◦Ϗϧ1֊ 6 Ң 7 ܦ 8 ඪߴ 9 ి൪߸ 000-000-0000 Before No. ໊߲ هೖྫ 1 NO 3 2 ໊শ ◦◦খֶߍ 3 ໊শ_Χφ ◦◦γϣΨοί 4 ॅॴ ౦ژࠇ্۠ࠇ2-◦-◦ 5 ํॻ ◦◦Ϗϧ1֊ 6 Ң 43.064200 7 ܦ 140.344114 8 ඪߴ 20.5 9 ి൪߸ 000-000-0000 After
ࠓͷ·ͱΊ
·ͱΊ ɾ࣏ࣗମຽؒʹͳ͍σʔλΛ͍࣋ͬͯΔɻ ͦΕΒΛΦʔϓϯσʔλͱͯ͠ެ։͢Δ͜ͱ Ͱɺ৬һͷۀͷޮԽʹͳΔ͠ɺҬͷ՝ Λղܾ͢Δ͜ͱʹͳΔ ɾࠓϗʔϜϖʔδʹใΛܝࡌ͍ͯ͠Δ߹ CC-BYͳͲར༻ϧʔϧΛهࡌ͓͚ͯͩ͘͠Ͱ ΦʔϓϯσʔλΛ࢝ΊΔ͜ͱ͕Ͱ͖Δ ɾσʔλͷܗࣜCSVͩͱΈΜͳ͕ͤʹͳΔ
͍͞͝ʹ ɾ2ਓ1ʹͳ͍ͬͯͩ͘͞ ɾࠓͷݚमͷײɺֶͼϙΠϯτɺ໌͔Β ͬͯΈ͍ͨ͜ͱΛ͓ޓ͍ʹڞ༗͍ͯͩ͘͠͞ ※ʮͬͯΈ͍ͨʯʮΒͳ͚Ε͍͚ͳ͍ʯͰͳ͍Ͱ͢
͓͔ͭΕ͞·Ͱͨ͠ 👏 ࠓͷ͕গ͠ͰࢀߟʹͳΕ͍Ͱ͢ ɾfacebook ɾTwitter ɾblog ɾݸผʹ૬ஊ͍ͨ͜͠ͱ͕͋ΕDM͍ͩ͘͞
ࢀߟࢿྉ ɾCIOϙʔλϧ > Φʔϓϯσʔλ https://cio.go.jp/policy-opendata ɾVLED σʔλӡ༻ݕ౼Պձ http://www.vled.or.jp/committee/utilization/managementreview/ ɾ5˒Φʔϓϯσʔλ https://5stardata.info/ja/
ɾΦʔϓϯσʔλݚमϙʔλϧ https://www.opendata-training.org/
ࢀߟࢿྉᶄ ɾLinked DataɿWebΛάϩʔόϧͳσʔλۭ ؒʹ͢ΔΈ https://amzn.to/39j14qG ɾςΟϜɾόʔφʔζ=Ϧʔ͕ࣔ࣍͢ͷΣϒ https://www.ted.com/talks/tim_berners_lee_the_next_web