Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ITエンジニアのための住所システムのお話
Search
Takayuki Miyauchi
October 22, 2020
Technology
0
140
ITエンジニアのための住所システムのお話
和歌山のITコミュニティ Wacker で発表したスライドです。
Takayuki Miyauchi
October 22, 2020
Tweet
Share
More Decks by Takayuki Miyauchi
See All by Takayuki Miyauchi
データ連携基盤としてのベクトルタイル
miya0001
1
180
不動産に関連しそうなデータもろもろ
miya0001
0
64
Geolonia Maps for SmartCity
miya0001
0
690
ベクトルタイルで見えてきたデジタル地図の未来
miya0001
0
260
不動産IDの仕組みと今後の課題
miya0001
0
290
オープンソースでつくるオープンソースっぽい地図の会社の挑戦
miya0001
0
260
TileCloudの裏側
miya0001
0
340
地方の子供たちを宇宙へ! きのくにICT教育
miya0001
1
260
ホスティングの立場からのWordPressへの貢献と協力
miya0001
0
1.1k
Other Decks in Technology
See All in Technology
AIを駆使したゲーム開発戦略: 新設AI組織の取り組み / sge-ai-strategy
cyberagentdevelopers
PRO
1
130
ガチ勢によるPipeCD運用大全〜滑らかなCI/CDを添えて〜 / ai-pipecd-encyclopedia
cyberagentdevelopers
PRO
3
210
MAMを軸とした動画ハンドリングにおけるAI活用前提の整備と次世代ビジョン / abema-ai-mam
cyberagentdevelopers
PRO
1
120
2024-10-30-reInventStandby_StudyGroup_Intro
shinichirokawano
1
630
Shift-from-React-to-Vue
calm1205
3
1.3k
いまさらのStorybook
ikumatadokoro
0
140
新卒1年目が向き合う生成AI事業の開発を加速させる技術選定 / ai-web-launcher
cyberagentdevelopers
PRO
7
1.5k
APIテスト自動化の勘所
yokawasa
7
4.2k
急成長中のWINTICKETにおける品質と開発スピードと向き合ったQA戦略と今後の展望 / winticket-autify
cyberagentdevelopers
PRO
1
160
30万人が利用するチャットをFirebase Realtime DatabaseからActionCableへ移行する方法
ryosk7
5
350
いまならこう作りたい AWSコンテナ[本格]入門ハンズオン 〜2024年版 ハンズオンの構想〜
horsewin
9
2.1k
初心者に Vue.js を 教えるには
tsukuha
5
390
Featured
See All Featured
Statistics for Hackers
jakevdp
796
220k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
Product Roadmaps are Hard
iamctodd
PRO
48
10k
A Philosophy of Restraint
colly
203
16k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Ruby is Unlike a Banana
tanoku
96
11k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
Embracing the Ebb and Flow
colly
84
4.4k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
228
52k
Transcript
ITエンジニアのための 住所システムのお話 株式会社 Geolonia https://geolonia.com/ 宮内 隆行 2020/10/18 1 1
先日イケてるベンチャー企業の Geolonia が 住所データを公開してとても話題になりました。 • 最大10万PV/日以上の閲覧 • はてなブックマークで累計3,000以上 • 日経新聞、TechCrunch、InternetWatch
など多くのメディアで紹介 2 おかげさまでこの2ヶ月間で64件の政府 関係、自治体、大学、企業、団体の皆様 からのお問い合わせをいただきました。
なんで公開したの? • おもしろそうだと思ったから。。。 • 公開することで実現できそうなもっと大きな未来が見えたから。 3
なぜそんなに話題になったの? 住所というのはベースレジストリと呼ばれる社会の基本台帳の一つ。 • 購入すれば500万円/年以上の費用がかかるデータ。 • ありとあらゆるデータがこれにつながる。 4
住所はコンピューターにとってとても扱いが難しい データのひとつ • 「1丁目1番1号」 = 「一丁目一番一号」 = 「1-1-1」 などに代表される揺れ •
京都の「通り名」に代表される多様なシステム 5 自然言語処理と 言えるほどの複雑さ
それでもよくできたシステムなのかも • 京都の通り名、札幌の「条」システム、堺市の「丁」システムなど、地方自治体ごとに 多様なシステムが存在しながらも、とりあえず機能している。 • 宅急便とか郵便が無事に届かないことをあまり心配したことないですよね? 6 海外と比べて悪い仕組みというわけではない。 (むしろよくできているのでは?)
日本には2つの住所システムがあることに 気づいてました? 7 目的 例 地番住所 土地を指す住所 ◦◦市◦◦町◦◦番地 住居表示住所 住居を指す住所
◦◦市◦◦丁目◦◦番◦◦号 • 例えば法務局の登記簿に記載されている住所は地番住所。 • 郵便の宛先として使う住所は住居表示住所。 • 住居表示住所を導入していない自治体もある。 • 「Geolonia 住所データ」がカバーしているのは住居表示住所のみ。
なんでそんなことに? • そもそも住所という仕組みは GPS の衛星が飛び回る前の時代から存在している。 • 土地と建物の関係は必ずしも 1:1 とは限らない。 8
• 左の例では、▪ が地番住所の境界で、 ▪が 住居住所の境界。 • このように複数の地番をまたがる住居や、 ひとつの地番を共有する住居がありえる。 わかりやすくするためにかなり大雑把な説明です。 ちなみに地番住所の区画のひとつひとつは「筆」という単位を使用します。 「筆」は土地の売買等によって合体したり分割されたりすることがあり、それぞれ「合筆」「分筆」と呼ばれ、それによっ て地番住所が変更されます。
システム上の問題点 住所はプログラマーが期待するような一意なシステムではない。 • 住人が引っ越していなくても、住居住所の整備による変更が起こりうる。 ◦ たとえば東京都町田市では町ごとに順次住所の整理を行っている。 (例)町田市△△町1234番地56 → 町田市〇〇〇一丁目〇番〇号 ◦
ビフォーアフターを予測することが困難な変更であり、たとえば正規表現等による置換等でどうにか なる問題ではない。 • 文字列としての「ゆれ」以外にも、「住居表示」か「地番」かによる「ゆれ」が生じる。 ◦ たとえば建築確認申請等で誤って住居住所が入力されるなど。 9
目的地は本当にそこか?問題 • たとえば自動運転車で〇〇大学を目的地とした場合、ほんとうに目指すべき場所 は、指定された住所ではなく「その場所にいくのに便利そうな駐車場」である。 • 一方で住居表示住所は建物につくものなので、駐車場には住所がない。 • 緯度経度も完璧ではない。 ◦ 住所ではあいまいすぎるが、緯度経度ではピンポイントすぎで、緯度経度で指定された点を含む特
定のエリア内を指すなにかが必要。 10 ドローン配送や自動運転車において、 ラストワンマイルの実装が困難。
ローマ字/英語表記問題 いろいろ混乱はあるが、アプリケーションの国際化では、国土地理院にならい「ヘボン 式」でいい気がする。。。(たぶん) • だけど Minami-Alps (南アルプス市) という例外もあるので、なんでもかんでもロー マ字に変換すればすむわけではなさそう。。。 •
「東京都港区」は「Minato city, Tokyo」だけど「大阪市港区」は「Minato ward, Osaka」などのように東京23区だけは別扱いだったりする。 参考: 国土地理院「地名等の英語表記規定」 https://www.gsi.go.jp/common/000138865.pdf 11
「ゆれ」問題 OCR などによる誤認識も考慮に入れると修羅場。 • カタカナの「ニ」と漢数字の「二」や、「ハ」と「八」など • 「巿」(ふつ)と「市」(いち) • 新字体と旧字体、JIS第2水準と第1水準 •
「塩竈市」と「塩釜市」、「埠頭」と「ふ頭」、「藪」と「薮」など • 「ケ」と「ヶ」、「カ」と「ヵ」、「ノ」と「の」など 12
住所に関連する Geolonia の取り組み • 特定の地図サービスへのロックインがなく地番住所にも対応したジオコーダーの整 備。 ◦ 様々な企業や団体と連携してのデータ集め。 • 住居住所
⇔ 地番住所の相互変換を実現するための様々なアクション ◦ 政府、自治体、関係団体との交渉など。 • 住所の変更をトラッキングするためのシステム開発。 ◦ 新旧住所の変換 ◦ 住所の正規化エンジンの開発 13 たとえばこれらの課題を解決して不動産IDを実現するだけでも、 経済効果が数千億円以上と言われています。
開発における戦略 • 無料版をオープンソースで公開して、コミュニティのみなさんと数年かけて育ててい きたい。 ◦ 住所マスター ◦ 住所正規化エンジン ◦ ジオコーダー
• エンタープライズ向けには当面の間、パートナー企業のみなさんと連携し有料版 として提供。 • 政府や自治体がオープンデータ化してくれればもっとうれしいけど、じっと待たなく てもなにかしら前には進められる気がする。。。 14
ありがとうございました! 15