Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オープンデータをオープンにしよう
Search
watambo
February 07, 2020
Technology
2
4.6k
オープンデータをオープンにしよう
2020/2/7に某市で実施したオープンデータに関する講演資料です。公開用に一部改変しています。
ライセンス:CC-BY
watambo
February 07, 2020
Tweet
Share
More Decks by watambo
See All by watambo
オープンデータをオープンにしよう2022
watambo
0
33
キカク株式会社(KIKAKU Inc.)の事業紹介
watambo
0
300
行政をハックし、行政データをオープンにしてみようとした結果
watambo
16
25k
Other Decks in Technology
See All in Technology
帳票構造化タスクにおけるLLMファインチューニングの性能評価
yosukeyoshida
1
240
S3 Glacier のデータを Athena からクエリしようとしたらどうなるのか/try-to-query-s3-glacier-from-athena
emiki
0
190
Amazon Qで2Dゲームを作成してみた
siromi
0
120
Foundation Model × VisionKit で実現するローカル OCR
sansantech
PRO
1
310
相互運用可能な学修歴クレデンシャルに向けた標準技術と国際動向
fujie
0
210
専門分化が進む分業下でもユーザーが本当に欲しかったものを追求するプロダクトマネジメント/Focus on real user needs despite deep specialization and division of labor
moriyuya
1
1.1k
AI によるドキュメント処理を加速するためのOCR 結果の永続化と再利用戦略
tomoaki25
0
430
隙間時間で爆速開発! Claude Code × Vibe Coding で作るマニュアル自動生成サービス
akitomonam
3
250
AIに目を奪われすぎて、周りの困っている人間が見えなくなっていませんか?
cap120
1
440
Kiroでインフラ要件定義~テスト を実施してみた
nagisa53
3
310
마라톤 끝의 단거리 스퍼트: 2025년의 AI
inureyes
PRO
1
690
人に寄り添うAIエージェントとアーキテクチャ #BetAIDay
layerx
PRO
8
2k
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
695
190k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Statistics for Hackers
jakevdp
799
220k
Embracing the Ebb and Flow
colly
86
4.8k
Making Projects Easy
brettharned
117
6.3k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
21
1.4k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
110
19k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
Balancing Empowerment & Direction
lara
1
530
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
880
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.5k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Transcript
ΦʔϓϯσʔλΛ Φʔϓϯʹ͠Α͏ 2020/02/07 Fri ᬑ ྄ี (@watambo)
@watamboͰ͢ ɾᬑ ྄ี (Θͨͳ Γΐ͏͚͢) ɾਓࡐܥاۀͷϓϩμΫτϚωʔδϟʔ ɾVi−King CEO (ΞϓϦ։ൃʴίϛϡχςΟӡӦ) ɾΩΧΫ
CEO (σʔλΤϯδχΞϦϯά×RPA)
https://camph.net/
https://speakerdeck.com/watambo/xing-zheng-wohatukusi-xing-zheng-detawoopunnisitemiyoutositajie-guo
https://blog.watambo.com/2019/12/opendatahack2019.html
ࠓɻ WHY Φʔϓϯσʔλ ͳΜͰΦʔϓϯσʔλΒͳ͔͋Μͷʁ WHAT Φʔϓϯσʔλ ΦʔϓϯσʔλͬͯԿͳΜʁ HOW Φʔϓϯσʔλ ΦʔϓϯσʔλͬͯͲ͏ΔΜʁ
͍ͬͯ͏Λ͠·͢
ΞΠεϒϨΠΫͰ͢ ɾ2ਓ1ʹͳ͍ͬͯͩ͘͞ ɾ(ॳΊ·ͯ͠ͷ߹) ࣗݾհ͍ͯͩ͘͠͞ ɾࠓͷݚमʹظ͍ͯ͠Δ͜ͱΛ͓ޓ͍ʹڞ ༗͍ͯͩ͘͠͞
ࠓͷ͓ଋ͝ͱ ɾ໌͔Β͕ࣗΦʔϓϯσʔλʹऔΓΉͱ ͯ͠Կ͕Ͱ͖ͦ͏͔ʁΛߟ͑Δ࣌ؒͱͯ͠׆༻ ͍ͯͩ͘͠͞ ɾ࣭͍ͭͰOK 🙆 Ͱ͢ɻ ͋ͳͨʹࠣࡉͱࢥ͑Δٙɺผͷਓʹͱ ͯॏཁͳ͜ͱ͋Γ·͢
WHY Φʔϓϯσʔλʁ
ग़యɿҰൠ৬ۀհঢ়گʢ৬ۀ҆ఆۀ౷ܭʣʢްੜ࿑ಇলʣΛݩʹ࡞
ٻਓഒ͕ߴ͗͢Δ ɾٻਓΛग़ͯ͠࠾༻Ͱ͖ͳ͍࣌ ɾͳΜͰʁ →ʮಇ͍ͯ΄͍͠ʯͷ૯ʹରͯ͠ ɹʮಇ͖͍ͨʯͷ૯͕Γͯͳ͍͔Β
ಇ͘ਓ͕Γͳ͍࣌ ͦΕͰ๛͔͞Λҡ࣋͢ΔͨΊʹɺ1ਓ͕Ͱ͖ Δ͜ͱΛ૿͍͔ͯ͘͠͠ͳ͍
AWS Transcribe
AWS Transcribe ɾAWS (AmazonͷΫϥυίϯϐϡʔςΟϯ άαʔϏε) ͕ఏڙ͢ΔʮԻͷจࣈى͜͠ʯ ɾྫ͑ɺձٞͷԻΛԻ͓͚ͯ͠ɺٞࣄ ΛੜͰ͖Δ
None
ΊͪΌͪ͘Ό͍҆͠Χϯλϯ ɾ2࣌ؒͷձٞͷٞࣄΛ300ԁͰ࡞ΕΔ ɾಉ͜͡ͱΛਓؒʹͤΔͱ…12,000ԁ͘Β͍ ɹ(ʮϥϯαʔζ ςʔϓى͜͠ʯͰάάͬͨ) ɾͪͳΈʹGUI (ը໘ΫϦοΫ͢Δ͚ͩ) ϕʔε
Cloud Vision API
Cloud Vision API ɾGCP (GoogleͷΫϥυίϯϐϡʔςΟϯά αʔϏε) ͕ఏڙ͢Δʮը૾ͷࣝผʯ ɾྫ͑ɺ൜Χϝϥͷεφοϓγϣοτ͔Β ෆ৹ऀΛࣗಈݕग़Ͱ͖Δ
None
None
͜ΕΒΛࢧ͑Δٕज़ػցֶश ɾػցֶशʮσʔλ͔ΒϧʔϧύλʔϯΛ Έ͚ͭΔ͜ͱͰɺԿ͔Λ༧ଌͨ͠Γɺݟ͚ͨ Γ͢Δํ๏ʯͷ͜ͱ ɾػցֶशͷਫ਼Λ্͛ΔͨΊʹେྔͷσʔ λ͕ඞཁ
Google Dataset Search
Google Dataset Search ɾGoogle͕ఏڙ͢Δػցֶशʹ͏σʔληο τͷݕࡧαΠτ ɾੈքதͷػցֶशΤϯδχΞ͕͏σʔλ ηοτͱͯ͠ެ։͞Εͳ͍ͱɺࣝผͱ༧ଌͷର ͱ͞Εͳ͘ͳΔ
None
DataRobot ɾػցֶशͷຽओԽɻ୭ͰػցֶशΛͬͨ ࣝผͱ༧ଌ͕Ͱ͖Δɻ ɾGUIϕʔεͰΊͪΌͪ͘ΌΧϯλϯɻ ɾ͜Ε͕ΞλϦϚΤʹͳΔͱʮσʔλΛ࣋ͬͯ Δ͜ͱ͕େࣄʯͳੈքʹͳΔʢͣʣɻ
ٻਓഒͷͭ͘Γํ ɾٻਓഒʹϋϩʔϫʔΫͷٻਓථ/ٻ৬ऀ ɾຽͱʹॏཁͳࢦඪ ɾͰɺͳͥҙຯ͕͋Δͷ͔ʁ
GoogleτϨϯυͰΈΔ ϋϩʔϫʔΫͱλϯϫʔΫ
ͭ·Γɻ ࠃ࣏ࣗମ͕࣋ͬͯΔ͚ͲɺຽؒͰ͍࣋ͬͯ ͳ͍σʔλ͕ͨ͘͞Μ͋Δɻ ͜ΕΒΛΦʔϓϯʹ͍ͯ͘͜͠ͱɺੈͷதʹ ͱͯՁ͕͋Δɻ
WHAT Φʔϓϯσʔλʁ
Φʔϓϯσʔλͱ ࣍ͷ3ͭͷ݅Λຬ͍ͨͯ͠Δσʔλɻ 1. ίϯϐϡʔλ͕ಡͰ͖Δ 2. ӦརɾඇӦརΘͣ̎࣍ར༻Մೳͳϧʔϧ༗ 3. ແঈͰ͔ͭ͑Δ
ίϯϐϡʔλ͕ಡͰ͖Δ ɾʮػցಡՄೳʯͱݴΘΕΔ ɾిࢠϑΝΠϧ ≠ ػցಡՄೳ ɾHTML ɾCSV ɾXML, JSON ɾPDF
ɾεΩϟϯͨ͠PDF ɾը૾ ࢴ
ͿͬͪΌ͚ɺ ిࢠϑΝΠϧͳΒػցಡՄೳ Cloud Vision API͑ɺͨͱ͑ը૾σʔλͷ ॻྨςΩετʹจࣈى͜͠Ͱ͖Δ ΊΜͲ͍͚͘͞ͲɺΤϯδχΞϦϯάͰԿͱ͔ Ͱ͖Δ
“ೋ࣍ར༻ͷଅਐͷͨΊͷলͷσʔλެ։ʹؔ͢Δجຊతߟ͑ํʢΨΠυϥΠϯʣ” ૯ল https://www.kantei.go.jp/jp/singi/it2/cio/dai52/kihon.pdf
̎࣍ར༻Մೳɺແঈ ࣗ༝ʹ͑Δσʔλɺͭ·Γ Ӧརతར༻ɺసࡌɺൢചɺվมͳͲ׆༻ࣗ༝ All rights reserved શͯͷஶ࡞ݖΛओு Creative Commons Attribution
(ΫϦΤΠςΟϒɾίϞϯζ දࣔɺCC-BY) ׆༻ࣗ༝ɻग़య͚ͩهࡌͯͪ͠ΐ
ແஅͰసࡌ ແஅͰՃ ແஅͰൢച ༻݅ ཁ૬ஊ ग़య໌ࣔ
·ͱΊ ɾΦʔϓϯσʔλɺίϯϐϡʔλͰѻ͍͢ ͍ܗࣜͰެ։͢Δɻ ※ͨͩ͠ɺΉΛಘͳ͍ཧ༝͕͋Δͱ͖ը૾PDFͰΑ͠ ɾެ։ʹ͋ͨͬͯɺࣗ༝ʹ͑ΔΑͱ͍͏ ϧʔϧ (CC-BY) Λએݴ͓ͯ͘͠
ྫʣΩϟογϡϨεؐݩࣄۀ ɾܦࡁ࢈ۀল͕ެ։ͨ͠ʮΩϟογϡϨεɾফ අऀؐݩࣄۀऀʯͷҰཡ͕PDFͰ͔͠μϯ ϩʔυͰ͖ͳ͔ͬͨ ɾՈܭΞϓϦͷZaim͕ɺPDFΛύʔε͠ςΩ ετใ͔ΒϚοϓΛ։ൃ (։ൃظؒ1) ɾܦࡁ࢈ۀল͕σʔλ࿈ܞઌͱͯ͠ਖ਼ࣜ࠾
😵 😄 https://content.zaim.net/cashless/
Φʔϓϯσʔλͷ͍Έͪ 1. ࣄͷखؒΛݮΒ͢ 2. Ҭ՝ͷղܾ
͜Μͳ͜ͱɺͳ͍Ͱ͔͢ʁ🤔 ɾใެ։ٻͰɺಉ͡Α͏ͳσʔλͷ։ࣔΛ ܁Γฦ͠ٻΊΒΕΔ ɾҟͳΔۀ୲՝Ͱɺಉ͡Α͏ͳσʔλΛ ผʑʹ࡞͍ͯ͠Δ ɾใͷఏڙ͕Εͨ͜ͱͰɺࢢຽ͔Β͕ۤ ΑͤΒΕΔ
ใެ։ٻͷ݅ ɾࠃަ௨লɹ500݅ / ɾްੜ࿑ಇলɹ4,800݅ / ɾ౦ژɹɹɹ12,000݅ /
“෮ܧଓతʹ։͕ࣔͳ͞Εͨใͷఏڙʹ͍ͭͯ" ૯ল https://www.soumu.go.jp/main_content/000369392.pdf
ใެ։ٻͷܰݮ (੩Ԭࢢ) ੩ԬࢢͰɺใެ։ٻ݅ͷଟ͔ͬͨ৯ӦۀڐՄࡁͷࣄۀऀ σʔλΛΦʔϓϯσʔλͱͯ͠ެ։͢Δ͜ͱͰɺۀෛ୲ͷܰݮʹ ޭ H25
H26 H27 H28 ใެ։ٻ ͷΈͰରԠ ࢢͷHPͰ ใఏڙ ΦʔϓϯσʔλԽ ৯ӦۀڐՄʹؔ͢Δใެ։ٻ݅ (੩Ԭࢢ) ग़యɿVLEDʮୈ4ճσʔλӡ༻ݕ౼Պձʢ20172݄13ʣʯࢿྉΑΓ࡞ ؒ100݅ݮ →300࣌ؒͷ ۀ࣌ؒݮʹ
ͨͱ͑ ɾ৯ؔӦۀऀா ɾපӃɾྍॴɺࢪज़ॴͷҰཡ(ࠎӃɺΓ) ɾެӦॅͷۭ͖ՈҰཡ ɾ֤छ౷ܭσʔλɺॅډදࣔா ͳͲΛΦʔϓϯσʔλͱͯ͠ެ։͢Δ͜ͱͰɺ ࢢຽ͔Βͷ͓͍߹Θͤɺ࣏ࣗମ৬һͷۀ ͷखؒΛݮ͢Δ͜ͱʹͳΔ͔ʁ
ϫʔΫγϣοϓ ɾࣗͷ՝Ͱཧ͍ͯ͠ΔσʔλΛϙετΠο τʹॻ͖ग़͍ͯͩ͘͠͞ ɾ4ਓ1ʹͳ͍ͬͯͩ͘͞ ɾॻ͖ग़ͨ͠༰Λڞ༗͍ͯͩ͘͠͞
ϫʔΫγϣοϓଓ͖ ɾઌఔॻ͖ग़ͨ͠ɺࣗͷ՝Ͱཧ͍ͯ͠Δ σʔλʹ͍ͭͯɺΦʔϓϯʹ͢ΔͱΑͦ͞͏ͳ ͷʹˑҹΛ͚͍ͭͯͩ͘͞ɻΦʔϓϯʹ͢Δ ͱͲΜͳ͍͍͜ͱ͕͋Γͦ͏͔ॻ͍ͯͩ͘͞ ͍ ɾઌఔͷ4ਓάϧʔϓʹͳ͍ͬͯͩ͘͞ ɾॻ͖ग़ͨ͠༰Λڞ༗͍ͯͩ͘͠͞
Φʔϓϯσʔλ×ຽؒαʔϏε ʹࢢຽͷHAPPY 😍
σʔλͷ׆༻ຽؒʹͤͯ ͍͍͔ ߦ ຽؒ Ϣʔβ Φʔϓϯ σʔλ αʔϏε ☺ 😁
Φʔϓϯ σʔλ αʔϏε Φʔϓϯ σʔλ αʔϏε 😍 ަ௨ ҩྍ อҭ &more
څ৯σʔλ×ΞϓϦ 4919 for Ikoma (ੜۨࢢ) ֶߍڅ৯ͷใΛ௨ͯ͡ࢠͲͷ৯ҭΛαϙʔτ ;I , 42(U]gX) 6AGG&7Sebg7
3 ZafVG*% 6HCG&_Y`gG*% 6"SebgL3ZafV ED2F0@M $! O*% /G =2JM'2OF DKG2(OU]gX@M P\b8 DK=2JM'2G&LSebg7PdcTf73Zaf VEDOGV^gX[RfB<N::QaVXCKF.F#+B>M8 &7inmh7 3kplojG*% HCG& _Y`g*% 9G_Y`gG PdcTfO*% XW\ 1 5PdcTf ) 69G_Y`gGPdc TfO*%@M?CB7 -O@ XMNJND6QTUGORTSPYo83/9C /,0/n'X}Y_ ?(W <5 n D%z~n2'_ iVKIIM^uKIJLnN@ iJKr\hZwWKIJLH!>/+;p c[egcjy7"mXMNJND6QTUGORTSPYoV$j_ eV $4Dm]bwz~ yBajjrmV *}s #ElkDmAfw-)lyfwcjy*)m ?(dxgW $ & " "#& !% 4D&1 'Fn4D&1n| y =qV{ lkmtw:.i ^vsf`4Dnz y:.eVkrnD6yfwW https://cio.go.jp/opendata100
GTFS×Google Maps ɾGTFS (General Transit Feed Speci fi cation) ͱɺެڞަ௨ػؔͷ࣌ࠁදͱཧతใʹͭ
͍ͯͷΦʔϓϯϑΥʔϚοτ ɾGTFSରԠͯ͠ͳ͍ͱόεใ͕GoogleϚο ϓʹࡌΒͳ͍ɻͭ·ΓɺόεʹΓ͍ͨਓ͕ GoogleϚοϓͰௐͯ࣌ࠁදʹḷΓண͚ͳ͍
None
“όεϩέʔγϣϯγεςϜಋೖௐࠪࣄۀͷ݁Ռൃදʹ͍ͭͯ” Ѵࢢ https://www.city.asahikawa.hokkaido.jp/kurashi/452/453/454/d056483.html
5374 (͝Έͳ͠) ɾCode for Kanazawa͕ͭͬͨ͘ɺҬͷΰϛ ͷऩू͕͔ΔWebαΠτ ɾ5374ͷιʔείʔυGithub (ίʔυͷཧ πʔϧ) Ͱެ։͞Ε͓ͯΓɺར༻ϧʔϧʹै͑
ɺ୭ͰΧϯλϯʹݩͷΰϛऩूݕࡧα Πτ͕ͭ͘ΕΔ ɾhttps://github.com/codeforkanazawa-org/5374
ɾURLɿhttps://ttzk.graffer.jp/ ɾҬɿ֤ ɾ֓ཁɿ֤࣏ࣗମͷϗʔϜϖʔδʹܝࡌ͞Ε͍ͯΔసग़ೖɺ݁ࠗɾग़࢈ͱ͍ͬͨखଓ͖ͷํΛ࣏ࣗମΛ·͍ͨͰެ։͍ͯ͠ΔαʔϏεɻ αΠτ্Ͱ࣭ʹ͍͚͑ͯͩ͘Ͱ࣏ࣗମఏग़Ͱ͖ΔॻྨΛ؆୯ʹ࡞͢Δ͜ͱ͕Ͱ͖·͢ɻͨͱ͑ށ੶౽ຊͳͲɺ݁ࠗͱ͔গͳ ͍ϥΠϑΠϕϯτͰ͔͠Θͳ͍ͷͳͷͰൃߦͷํ๏ΛΒͳ͍ਓ͕ଟ͍ͱࢥ͍·͕͢ɺʮ͘Β͠ͷ͖ͯͭͮʯΛݟΕखଓ͖ͷ֓ཁͱ ΦϯϥΠϯ݁Ͱྃɺͱ͍͏ͷͱͯϕϯϦͩͱ͓͍·͢ɻ ɾӡӦɿגࣜձࣾάϥϑΝʔ
None
੫ۚͲ͜ʹߦͬͨʁ ɾURLɿhttp://spending.jp/ ɾ֓ཁɿ֤࣏ࣗମ͕ެද͍ͯ͠Δ༧ࢉʹؔ͢ΔΦʔϓϯσʔλΛ׆༻ͯ͠ɺݸਓͷ੫ۚͷҰ͋ͨΓͷࢧग़ֹΛ͍ࣔͯ͠·͢ɻ ࢲͨͪຊདྷͰ͋Εࢧͬͨ੫ۚͰΉެڞαʔϏεΛड͚Δݖར͕͋Γ·͢ɻͦͷͨΊʹ੫ۚͷΘΕํΛΔࣄ͕ඞ ཁͰ͕͢ɺ؆୯ʹΔज़͕͋Γ·ͤΜɻΠΪϦεͷWhere Does My Money Go? Λࢀߟʹɺ༗ࢤʹΑ্ཱͬͯͪ͛ΒΕɺ
ݱࡏ ɺଟ͘ͷ༗ࢤͷਓͷखʹΑΓαΠτ্ཱ͕͕͍ͪͬͯ·͢ɻ ɾӡӦɿOpen Knowledge Foundation Japan
·ͱΊ ɾΦʔϓϯσʔλɺ ίϯϐϡʔλ͕ѻ͑ΔܗࣜͷͷͰɺࣗ༝ʹ ͑ΔϧʔϧΛఆΊͨσʔλͷ͜ͱ ɾΦʔϓϯσʔλΛެ։͢Δͱɺ ࣏ࣗମ৬һͷࣄͷखؒΛݮΒͨ͠Γɺຽؒ αʔϏεͱͷίϥϘϨʔγϣϯΛ௨ͯ͡Ҭ՝ ͷղܾʹͭͳ͕ͬͨΓ͢Δ
ٳܜλΠϜ ☕
HOW Φʔϓϯσʔλʁ
ΰʔϧ ࢲʹΦʔϓϯσʔλΛެ։Ͱ͖ͦ͏ͩʂ ͱࢥ͑Δ͜ͱ
Φʔϓϯσʔλͱ ࣍ͷ3ͭͷ݅Λຬ͍ͨͯ͠Δσʔλɻ 1. ίϯϐϡʔλ͕ಡͰ͖Δ 2. ӦརɾඇӦརΘͣ̎࣍ར༻Մೳͳϧʔϧ༗ 3. ແঈͰ͔ͭ͑Δ ࠶ܝ
Φʔϓϯσʔλ🎉
࠷ݶɺίίΛΫϦΞ͠Α͏ ɾϗʔϜϖʔδܝࡌ͍ͯ͠Δ͚ͩͰɺར༻ ऀ͕σʔλͷՃ࠶ͳͲΛߦ͑ͳ͍ͱࢥ ͏Մೳੑ͕͋Δ ɾσʔλͱซͤͯɺӦརɾඇӦརΛΘͣ̎࣍ ར༻ՄೳͰ͋ΔࢫͳͲར༻نͱͯ͠໌֬ʹఏ ࣔ͢Δඞཁ͕͋Δ
ͲΜͳར༻ϧʔϧ͕ඞཁʁ ɾ̎࣍ར༻ՄೳͰ͋Δ͜ͱɺར༻ͷࡍͷ݅ ͷهࡌ͕ඞཁ ɾ໔ࣄ߲Λද໌͓ͯ͘͜͠ͱ͕·͍͠
ᶃσʔλʹద༻͢ΔϥΠηϯεΛهࡌ ɹಛஈͷཧ༝͕ͳ͍ݶΓCC-BYਪ ᶄΦʔϓϯσʔλެ։ʹ͋ͨͬͯ ɾίϯςϯπͷਖ਼֬ੑΛอূ͠ͳ͍ ɾίϯςϯπΛ༻͍ͯߦ͏Ұͷߦҝʹ ɹެදऀΛΘͳ͍ Λද໌͢Δͷ͕·͍͠
໔ࣄ߲ʹ͍ͭͯิ ɾؒҧͬͨσʔλΛެ։ͨ͠Β৬һͷʹͳΔͷͰʁˠެ։ ͠ͳ͍ɺͱͳΔͷମͳ͍Ͱ͢ 😢 ɾCC-BYʹແอূ͓Αͼ੍ݶͷؚ߲͕·Ε͍ͯ·͕͢ɺ ར༻ऀʹର࣮ͯ֬͠ʹ௨͖͢ࣄฑͰ͋ΔͨΊɺར༻ऀͷʹ ৮Ε͍͢ͱ͜Ζʹɺແอূɺ໔ʹ͍ͭͯܝࣔ͢Δ͜ͱ͕· ͍͠Ͱ͢ɻͨͩ͠ɺར༻ϧʔϧʢCC-BYͷແอূ͓Αͼ੍ݶ ߲ʣͷ݅ͱໃ६͢Δ༰ʹͳΒͳ͍Α͏ҙ ɾਖ਼֬ੑΛอূ͠ͳ͍ɺͱ͍͏໔ࣄ߲Λهࡌͨ͠ͱͯ͠ɺσʔ
λʹؒҧ͍͕͋Δ͜ͱΛݟ͚ͭͨ߹ɺσʔλΛඇެ։ʹͨ͠ Γɺ͔ʹσʔλΛमਖ਼͢Δͱ͍ͬͨରԠ͕·͍͠Ͱ͢
5˒Φʔϓϯσʔλ https://5stardata.info/ja/
ը૾ͷΦʔϓϯσʔλ ɾը૾ͷOCRʹɺͦΕͳΓͷԼ४උ͕ඞཁɻ ͦͷίετΛຽ͕ؒෛ୲͢Δ͜ͱʹͳΔ ɾྫ͑ࢴͷॻྨΛεΩϟϯ͠ɺͦΕΛOCRϥ ΠϒϥϦͰɺಛʹύϥϝʔλઃఆͤͣʹॲཧ࣮ ߦ͢Δͱ…
None
˒গͳ͘ͱPDFʹ͠Α͏ PDFͩͱɺύʔεϥΠϒϥϦ͕ἧͬͯΔ ɾPythonͷpdfminer ɾJavaͷiText ɾAdobeͷAcrobat API ɹͱ͔ͱ͔
˒˒ExcelͰެ։͠Α͏ ExcelGUIͰѻ͍͍͢ɻͰ… ɹ🙅 ωਃΤΫηϧ࡞Γ͕ͪ ɹ🙅 Microsoft Of fi ce࣋ͬͯͳ͍ͱ͑ͳ͍ ɹɹ
ʹશһ͕ݟΒΕΔΘ͚Ͱͳ͍
This is ωਃΤΫηϧ
CSVͰެ։Λඪʹɻ
˒˒˒CSVʹ͠Α͏ ɾCSVϑΝΠϧɺ֤ྖҬ (Excelͷηϧ) ΛΧϯ Ϛ (ʮ,ʯ) Ͱ۠ͬͨςΩετϑΝΠϧͷ͜ͱ
CSVͷ͍͍ͱ͜Ζ ☺ ɾ֤ྻʹͲΜͳใ͕ೖ͍ͬͯΔ͔͕໌֬Ͱɺ 1ߦ1σʔλͱ͍͏ߏͳͷͰɺίϯϐϡʔλ͕ ʮͲͷྻʹԿ͕ೖྗ͞Ε͍ͯΔ͔ʯΛஅ͠ ͍͢ ɾ߲ͷݟग़͠ͱ༰͕ɺҟͳΔߦʹೖྗ͞Ε ͍ͯΔͷͰɺίϯϐϡʔλ͕༰͚ͩΛಡΈऔ Δ͜ͱ͕༰қ
Excel͔ΒCSV࡞ΕΔ ExcelϑΝΠϧΛ։͖ɺ ʮ໊લΛ͚ͯอଘʯΛબޙ ϑΝΠϧܗ͔ࣜΒʮCSVʯΛબ ͢ΕOKʂ
͜ΜͳCSVΠϠͩ 1. දͷཝ֎ʹλΠτϧ͕ೖ͍ͬͯΔ 2. ݟग़͕͠ෳߦ 3. ߦྻͰ͕ಉ͡ηϧΛ݁߹͍ͯ͠Δ 4. ηϧվߦ 5.
ܩઢ͚ͩͷߦΛ͍ͯ͠Δ 6. ηϧͷʹφκͷۭന 7. ͕ۭཝͷͱ͖ʹΘΓͷจࣈྻΛೖΕΔ ૯লʮΦʔϓϯσʔλݚमϙʔλϧʯࢿྉΛݩʹ࡞
3. ߦྻͰ͕ಉ͡ηϧΛ ݁߹͍ͯ͠Δ 2. ݟग़͕͠ෳߦ 1. දͷཝ֎ʹλΠτϧ ͕ೖ͍ͬͯΔ ͜ΜͳCSVΠϠͩᶃ 😢
1. දશମͰڞ௨͢Δ༰ ཝ֎Ͱͳ͘1߲ͱͯ͠ه ࡌ͢Δ ͜ΜͳCSVʹ͠Α͏ᶃ 😊 3. ߦྻͰ͕ಉ͡Ͱશ ͯͷηϧʹใΛೖྗ͢Δ 2.
ݟग़͠Λ1ߦʹ͢Δ
͜ΜͳCSVΠϠͩᶄ 😢 4. ηϧվߦ 5. ܩઢ͚ͩͷߦΛͯ͠ ͠·͍ͬͯΔ
͜ΜͳCSVʹ͠Α͏ᶄ 😊 4. ηϧվߦ͠ͳ͍ 5. σʔλ͕ͳ͍ߦܩઢΛ͞ ͳ͍ (CSVͱͯ͠อଘͨ͠ͱ͖ʹ ແବͳߦ͕ग़ྗ͞ΕΔͷΛ͙)
͜ΜͳCSVΠϠͩᶅ 😢 ਆಸ ౦ɹژ
6. ηϧͷʹφκͷۭന 7. ͕ۭཝͷͱ͖ʹφκͷ จࣈྻ
͜ΜͳCSVʹ͠Α͏ᶅ 😊 ਆಸ ౦ژ
6. ෆཁͳۭനೖΕͳ͍Α͏ʹ͢Δ 7. ͕ۭཝͷͱ͖ʹۭཝͷ ϚϚʹ͓ͯ͘͠
্ڃฤ
RDFͱLOD ɾRDF (Resource Description Framework) ɾLOD (Linked Open Data)
https://www.ted.com/talks/tim_berners_lee_the_next_web
ςΟϜɾόʔφʔζ=Ϧʔ ɾΣϒͱ͍͏ͷΛ࡞ͬͨਓ ɾURLɺHTTPɺHTMLͱ͔Λ࠷ॳʹઃܭͨ͠ ɾΣϒͷΑ͏ʹσʔλΛ૬ޓʹͭͳ͛Δ Linked Dataͱ͍͏ߏΛఏএ
Linked Dataͷ࣮ྫ
http://linkdata.org/work/rdf1s5416i
RDFͱ ɾ֤σʔλΛɺओޠɾड़ޠɾతޠͷ3ͭͰදݱ ͢Δͱ͍͏ߏจʢʮτϦϓϧʯʣʹΑͬͯදݱ ͢Δ ɾʮઍཬதԝӺͷུশ”ͤΜͪΎ͏”Ͱ͋Δʯ ͳΒɺ ɹओޠɿઍཬதԝӺ ɹड़ޠɿུশͰ͋Δ ɹతޠɿͤΜͪΎ͏ ઍཬதԝӺ
ͤΜͪΎ͏ ུޠͰ͋Δ
RDFදݱ͜͏ͳΔ <rdf:RD F xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns# " xmlns:dcterms="http://purl.org/dc/terms/" > <rdf:Description rdf:about="https://www.wikidata.org/wiki/Q2056658" >
<dcterms:alternative>ͤΜͪΎ͏</dcterms:alternative > </rdf:Description > </rdf:RDF> ड़ޠ ओޠ తޠ ɾRDFʹ͓͚Δओޠɾड़ޠURIͰهड़͢Δ ɾεΫϥονͰ·ͣॻ͚ͳ͍
RDFͱRDFΛͭͳ͛Δͷ͕LOD RDFͰهड़͞ΕͨෳͷΦʔϓϯσʔλΛͭͳ ͛ͨͷ͕LOD େࡕ 1,899 ژ ྡͷಓݝ ໘ੵ େࡕ 8,823,000
ਓޱ ਓޱʹؔ͢ΔΦʔϓϯσʔλ େࡕͷཧใʹ͍ͭͯͷ Φʔϓϯσʔλ ≒ ͦΕͧΕͷେࡕΛද͢URI͕ಉ ͡Ͱ͋ΔͱΈͳͤΕɺ2ͭͷΦʔ ϓϯσʔλΛඥ͚Δ͜ͱ͕Մೳ
ެ։͢Δσʔλͷબఆ ɾԿ͕ࢢຽʹͱͬͯՁ͋Δσʔλ͔ʁΛߟ͑ ΔͷେมͰ͢ΑͶ… ɾͱΓ͋͑ͣऔΓΈΛ࢝ΊΔͳΒɺਪσʔ ληοτͷެ։͕Φεεϝ
https://cio.go.jp/policy-opendata ·ͣίί͔ΒऔΓΉͷ͕ Αͦ͞͏👍
ଞʹެ։͍͖͍ͯͨ͠ʂͲ͏ ͢Εʁ Ҿ༻ http://u-site.jp/alertbox/20000319 Λͱʹຊޠ༁ ςετΛ͢Δਓ ݟ͔ͭͬͨϢʔβϏϦςΟ՝ͷ ϢʔβϏϦςΟςετͷ̍ਓͷ ඃݧऀ͔Βɺશମͷ30ˋ͘Β͍ ͷ՝Λฉ͖ग़͢͜ͱ͕Ͱ͖Δɻ
ςετΛ͢ΔʹͭΕɺ͢Ͱʹ͔ ͍ͬͯΔ͜ͱ͕ଟ͘ͳΓɺ ̑ਓ͘Β͍Ͱશମͷ80ˋఔͷ՝ Λચ͍ग़͢͜ͱ͕Ͱ͖Δɻ χʔϧηϯത࢜ͷʮ5ਓʹฉ͍ͯΈΑ͏ʯϧʔϧ
ܧଓతʹऔΓΉ ɾҰެ։ͨ͠Φʔϓϯσʔλɺσʔλ༰ ͕มߋ͞ΕΔͱߋ৽͕ඞཁ ྫ͑ɺ ✓AEDͷઃஔॴɺઃஔॴͷߋ৽͕͋Ε Ұཡσʔλͷߋ৽͕ඞཁ ✓ਓޱɺ͕࣍มΘΔͱ৽͍͠σʔλͷՃ ͕ඞཁ
ܧଓతʹऔΓΉ ɾ͍͍͢Α͏ʹɺ߲Λ૿͍ͯ͘͜͠ͱ େࣄɻσʔλ໊߲߲Λඪ४ͷͷʹ د͍ͤͯ͘ ɾ·ͣɺਪσʔληοτʹ͍ͭͯɺσʔλ ߲ఆٛΛࢀߟʹ໊߲ͷमਖ਼ͱ߲ͷ֦ॆΛ ͢Δͷ͕Φεεϝ
໊߲͕όϥόϥ ྫཱྀ͑ؗͷҰཡɻࢪઃॴࡏɺӦۀॴॴࡏɺॅॴΛΧϥ ϜׂɺͳͲͳͲ… ৽॓۠ தԝ۠ ੈా୩۠
σʔλ߲ͷՃ No. ໊߲ هೖྫ 1 NO 3 2 ໊শ ◦◦খֶߍ
3 ໊শ_Χφ ◦◦γϣΨοί 4 ॅॴ ౦ژࠇ্۠ࠇ2-◦-◦ 5 ํॻ ◦◦Ϗϧ1֊ 6 Ң 7 ܦ 8 ඪߴ 9 ి൪߸ 000-000-0000 Before No. ໊߲ هೖྫ 1 NO 3 2 ໊শ ◦◦খֶߍ 3 ໊শ_Χφ ◦◦γϣΨοί 4 ॅॴ ౦ژࠇ্۠ࠇ2-◦-◦ 5 ํॻ ◦◦Ϗϧ1֊ 6 Ң 43.064200 7 ܦ 140.344114 8 ඪߴ 20.5 9 ి൪߸ 000-000-0000 After
ࠓͷ·ͱΊ
·ͱΊ ɾ࣏ࣗମຽؒʹͳ͍σʔλΛ͍࣋ͬͯΔɻ ͦΕΒΛΦʔϓϯσʔλͱͯ͠ެ։͢Δ͜ͱ Ͱɺ৬һͷۀͷޮԽʹͳΔ͠ɺҬͷ՝ Λղܾ͢Δ͜ͱʹͳΔ ɾࠓϗʔϜϖʔδʹใΛܝࡌ͍ͯ͠Δ߹ CC-BYͳͲར༻ϧʔϧΛهࡌ͓͚ͯͩ͘͠Ͱ ΦʔϓϯσʔλΛ࢝ΊΔ͜ͱ͕Ͱ͖Δ ɾσʔλͷܗࣜCSVͩͱΈΜͳ͕ͤʹͳΔ
͍͞͝ʹ ɾ2ਓ1ʹͳ͍ͬͯͩ͘͞ ɾࠓͷݚमͷײɺֶͼϙΠϯτɺ໌͔Β ͬͯΈ͍ͨ͜ͱΛ͓ޓ͍ʹڞ༗͍ͯͩ͘͠͞ ※ʮͬͯΈ͍ͨʯʮΒͳ͚Ε͍͚ͳ͍ʯͰͳ͍Ͱ͢
͓͔ͭΕ͞·Ͱͨ͠ 👏 ࠓͷ͕গ͠ͰࢀߟʹͳΕ͍Ͱ͢ ɾfacebook ɾTwitter ɾblog ɾݸผʹ૬ஊ͍ͨ͜͠ͱ͕͋ΕDM͍ͩ͘͞
ࢀߟࢿྉ ɾCIOϙʔλϧ > Φʔϓϯσʔλ https://cio.go.jp/policy-opendata ɾVLED σʔλӡ༻ݕ౼Պձ http://www.vled.or.jp/committee/utilization/managementreview/ ɾ5˒Φʔϓϯσʔλ https://5stardata.info/ja/
ɾΦʔϓϯσʔλݚमϙʔλϧ https://www.opendata-training.org/
ࢀߟࢿྉᶄ ɾLinked DataɿWebΛάϩʔόϧͳσʔλۭ ؒʹ͢ΔΈ https://amzn.to/39j14qG ɾςΟϜɾόʔφʔζ=Ϧʔ͕ࣔ࣍͢ͷΣϒ https://www.ted.com/talks/tim_berners_lee_the_next_web