Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ITエンジニアのための住所システムのお話
Search
Takayuki Miyauchi
October 22, 2020
Technology
0
160
ITエンジニアのための住所システムのお話
和歌山のITコミュニティ Wacker で発表したスライドです。
Takayuki Miyauchi
October 22, 2020
Tweet
Share
More Decks by Takayuki Miyauchi
See All by Takayuki Miyauchi
Geolonia のデータ連携基盤とスマートシティ構想
miya0001
1
98
データ連携基盤としてのベクトルタイル
miya0001
1
200
不動産に関連しそうなデータもろもろ
miya0001
0
67
Geolonia Maps for SmartCity
miya0001
0
720
ベクトルタイルで見えてきたデジタル地図の未来
miya0001
0
270
不動産IDの仕組みと今後の課題
miya0001
0
300
オープンソースでつくるオープンソースっぽい地図の会社の挑戦
miya0001
0
260
TileCloudの裏側
miya0001
0
370
地方の子供たちを宇宙へ! きのくにICT教育
miya0001
1
280
Other Decks in Technology
See All in Technology
Nekko Cloud、 これまでとこれから ~学生サークルが作る、 小さなクラウド
logica0419
2
980
30分でわかる『アジャイルデータモデリング』
hanon52_
9
2.7k
オブザーバビリティの観点でみるAWS / AWS from observability perspective
ymotongpoo
8
1.5k
地方拠点で エンジニアリングマネージャーってできるの? 〜地方という制約を楽しむオーナーシップとコミュニティ作り〜
1coin
1
230
開発スピードは上がっている…品質はどうする? スピードと品質を両立させるためのプロダクト開発の進め方とは #DevSumi #DevSumiB / Agile And Quality
nihonbuson
2
3k
なぜ私は自分が使わないサービスを作るのか? / Why would I create a service that I would not use?
aiandrox
0
760
PHPで印刷所に入稿できる名札データを作る / Generating Print-Ready Name Tag Data with PHP
tomzoh
0
110
OpenID Connect for Identity Assurance の概要と翻訳版のご紹介 / 20250219-BizDay17-OIDC4IDA-Intro
oidfj
0
280
データマネジメントのトレードオフに立ち向かう
ikkimiyazaki
6
1k
速くて安いWebサイトを作る
nishiharatsubasa
11
13k
Data-centric AI入門第6章:Data-centric AIの実践例
x_ttyszk
1
410
トラシューアニマルになろう ~開発者だからこそできる、安定したサービス作りの秘訣~
jacopen
2
2k
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
100
18k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.5k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
RailsConf 2023
tenderlove
29
1k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.1k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
GraphQLとの向き合い方2022年版
quramy
44
13k
Visualization
eitanlees
146
15k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
Transcript
ITエンジニアのための 住所システムのお話 株式会社 Geolonia https://geolonia.com/ 宮内 隆行 2020/10/18 1 1
先日イケてるベンチャー企業の Geolonia が 住所データを公開してとても話題になりました。 • 最大10万PV/日以上の閲覧 • はてなブックマークで累計3,000以上 • 日経新聞、TechCrunch、InternetWatch
など多くのメディアで紹介 2 おかげさまでこの2ヶ月間で64件の政府 関係、自治体、大学、企業、団体の皆様 からのお問い合わせをいただきました。
なんで公開したの? • おもしろそうだと思ったから。。。 • 公開することで実現できそうなもっと大きな未来が見えたから。 3
なぜそんなに話題になったの? 住所というのはベースレジストリと呼ばれる社会の基本台帳の一つ。 • 購入すれば500万円/年以上の費用がかかるデータ。 • ありとあらゆるデータがこれにつながる。 4
住所はコンピューターにとってとても扱いが難しい データのひとつ • 「1丁目1番1号」 = 「一丁目一番一号」 = 「1-1-1」 などに代表される揺れ •
京都の「通り名」に代表される多様なシステム 5 自然言語処理と 言えるほどの複雑さ
それでもよくできたシステムなのかも • 京都の通り名、札幌の「条」システム、堺市の「丁」システムなど、地方自治体ごとに 多様なシステムが存在しながらも、とりあえず機能している。 • 宅急便とか郵便が無事に届かないことをあまり心配したことないですよね? 6 海外と比べて悪い仕組みというわけではない。 (むしろよくできているのでは?)
日本には2つの住所システムがあることに 気づいてました? 7 目的 例 地番住所 土地を指す住所 ◦◦市◦◦町◦◦番地 住居表示住所 住居を指す住所
◦◦市◦◦丁目◦◦番◦◦号 • 例えば法務局の登記簿に記載されている住所は地番住所。 • 郵便の宛先として使う住所は住居表示住所。 • 住居表示住所を導入していない自治体もある。 • 「Geolonia 住所データ」がカバーしているのは住居表示住所のみ。
なんでそんなことに? • そもそも住所という仕組みは GPS の衛星が飛び回る前の時代から存在している。 • 土地と建物の関係は必ずしも 1:1 とは限らない。 8
• 左の例では、▪ が地番住所の境界で、 ▪が 住居住所の境界。 • このように複数の地番をまたがる住居や、 ひとつの地番を共有する住居がありえる。 わかりやすくするためにかなり大雑把な説明です。 ちなみに地番住所の区画のひとつひとつは「筆」という単位を使用します。 「筆」は土地の売買等によって合体したり分割されたりすることがあり、それぞれ「合筆」「分筆」と呼ばれ、それによっ て地番住所が変更されます。
システム上の問題点 住所はプログラマーが期待するような一意なシステムではない。 • 住人が引っ越していなくても、住居住所の整備による変更が起こりうる。 ◦ たとえば東京都町田市では町ごとに順次住所の整理を行っている。 (例)町田市△△町1234番地56 → 町田市〇〇〇一丁目〇番〇号 ◦
ビフォーアフターを予測することが困難な変更であり、たとえば正規表現等による置換等でどうにか なる問題ではない。 • 文字列としての「ゆれ」以外にも、「住居表示」か「地番」かによる「ゆれ」が生じる。 ◦ たとえば建築確認申請等で誤って住居住所が入力されるなど。 9
目的地は本当にそこか?問題 • たとえば自動運転車で〇〇大学を目的地とした場合、ほんとうに目指すべき場所 は、指定された住所ではなく「その場所にいくのに便利そうな駐車場」である。 • 一方で住居表示住所は建物につくものなので、駐車場には住所がない。 • 緯度経度も完璧ではない。 ◦ 住所ではあいまいすぎるが、緯度経度ではピンポイントすぎで、緯度経度で指定された点を含む特
定のエリア内を指すなにかが必要。 10 ドローン配送や自動運転車において、 ラストワンマイルの実装が困難。
ローマ字/英語表記問題 いろいろ混乱はあるが、アプリケーションの国際化では、国土地理院にならい「ヘボン 式」でいい気がする。。。(たぶん) • だけど Minami-Alps (南アルプス市) という例外もあるので、なんでもかんでもロー マ字に変換すればすむわけではなさそう。。。 •
「東京都港区」は「Minato city, Tokyo」だけど「大阪市港区」は「Minato ward, Osaka」などのように東京23区だけは別扱いだったりする。 参考: 国土地理院「地名等の英語表記規定」 https://www.gsi.go.jp/common/000138865.pdf 11
「ゆれ」問題 OCR などによる誤認識も考慮に入れると修羅場。 • カタカナの「ニ」と漢数字の「二」や、「ハ」と「八」など • 「巿」(ふつ)と「市」(いち) • 新字体と旧字体、JIS第2水準と第1水準 •
「塩竈市」と「塩釜市」、「埠頭」と「ふ頭」、「藪」と「薮」など • 「ケ」と「ヶ」、「カ」と「ヵ」、「ノ」と「の」など 12
住所に関連する Geolonia の取り組み • 特定の地図サービスへのロックインがなく地番住所にも対応したジオコーダーの整 備。 ◦ 様々な企業や団体と連携してのデータ集め。 • 住居住所
⇔ 地番住所の相互変換を実現するための様々なアクション ◦ 政府、自治体、関係団体との交渉など。 • 住所の変更をトラッキングするためのシステム開発。 ◦ 新旧住所の変換 ◦ 住所の正規化エンジンの開発 13 たとえばこれらの課題を解決して不動産IDを実現するだけでも、 経済効果が数千億円以上と言われています。
開発における戦略 • 無料版をオープンソースで公開して、コミュニティのみなさんと数年かけて育ててい きたい。 ◦ 住所マスター ◦ 住所正規化エンジン ◦ ジオコーダー
• エンタープライズ向けには当面の間、パートナー企業のみなさんと連携し有料版 として提供。 • 政府や自治体がオープンデータ化してくれればもっとうれしいけど、じっと待たなく てもなにかしら前には進められる気がする。。。 14
ありがとうございました! 15