Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ITエンジニアのための住所システムのお話
Search
Takayuki Miyauchi
October 22, 2020
Technology
260
1
Share
ITエンジニアのための住所システムのお話
和歌山のITコミュニティ Wacker で発表したスライドです。
Takayuki Miyauchi
October 22, 2020
More Decks by Takayuki Miyauchi
See All by Takayuki Miyauchi
Geolonia のデータ連携基盤とスマートシティ構想
miya0001
1
290
データ連携基盤としてのベクトルタイル
miya0001
1
270
不動産に関連しそうなデータもろもろ
miya0001
0
120
Geolonia Maps for SmartCity
miya0001
0
910
ベクトルタイルで見えてきたデジタル地図の未来
miya0001
0
350
不動産IDの仕組みと今後の課題
miya0001
0
350
オープンソースでつくるオープンソースっぽい地図の会社の挑戦
miya0001
0
320
TileCloudの裏側
miya0001
0
440
地方の子供たちを宇宙へ! きのくにICT教育
miya0001
1
340
Other Decks in Technology
See All in Technology
Strands Agents超入門
kintotechdev
1
130
Spring AI × MCP 入門〜AIエージェントへのツール公開、境界設計から始める最小構成 〜
yuyamiyamoto
0
120
GitHub Copilot CLIでWebアクセシビリティを改善した話
tomokusaba
0
110
『家族アルバム みてね』における インシデント対応との向き合い方 / Approach incident response in Family Album
kohbis
2
230
Copilot CLI・IDE・Web・スマホで途切れない開発フローを目指して / One Copilot flow - CLI IDE Web Mobile
aeonpeople
1
1.1k
RubyでRuby拡張を書いたらRubyより35倍速になったってどういうこと??
kazuho
3
650
基礎から解説!Icebergで紐解くSnowflake×Databricks連携の現在地
cm_yasuhara
0
340
AI時代の私の技術インプットとアウトプット術
tonkotsuboy_com
15
7.3k
責任あるソフトウェアエンジニアリングの紹介4章・5章 / RSE_Ch4-5
ido_kara_deru
0
350
権限管理設計を完全に理解した
rsugi
2
220
Harnessing the Power of Mocks and Stubs in PHPUnit / #laravellivejp
asumikam
0
700
Python開発環境にハーネス適用を検討する
yuuka51
1
540
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
50
15k
The browser strikes back
jonoalderson
0
1.1k
Between Models and Reality
mayunak
4
300
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
390
Raft: Consensus for Rubyists
vanstee
141
7.4k
Writing Fast Ruby
sferik
630
63k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
710
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2.1k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
570
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
350
Statistics for Hackers
jakevdp
799
230k
Transcript
ITエンジニアのための 住所システムのお話 株式会社 Geolonia https://geolonia.com/ 宮内 隆行 2020/10/18 1 1
先日イケてるベンチャー企業の Geolonia が 住所データを公開してとても話題になりました。 • 最大10万PV/日以上の閲覧 • はてなブックマークで累計3,000以上 • 日経新聞、TechCrunch、InternetWatch
など多くのメディアで紹介 2 おかげさまでこの2ヶ月間で64件の政府 関係、自治体、大学、企業、団体の皆様 からのお問い合わせをいただきました。
なんで公開したの? • おもしろそうだと思ったから。。。 • 公開することで実現できそうなもっと大きな未来が見えたから。 3
なぜそんなに話題になったの? 住所というのはベースレジストリと呼ばれる社会の基本台帳の一つ。 • 購入すれば500万円/年以上の費用がかかるデータ。 • ありとあらゆるデータがこれにつながる。 4
住所はコンピューターにとってとても扱いが難しい データのひとつ • 「1丁目1番1号」 = 「一丁目一番一号」 = 「1-1-1」 などに代表される揺れ •
京都の「通り名」に代表される多様なシステム 5 自然言語処理と 言えるほどの複雑さ
それでもよくできたシステムなのかも • 京都の通り名、札幌の「条」システム、堺市の「丁」システムなど、地方自治体ごとに 多様なシステムが存在しながらも、とりあえず機能している。 • 宅急便とか郵便が無事に届かないことをあまり心配したことないですよね? 6 海外と比べて悪い仕組みというわけではない。 (むしろよくできているのでは?)
日本には2つの住所システムがあることに 気づいてました? 7 目的 例 地番住所 土地を指す住所 ◦◦市◦◦町◦◦番地 住居表示住所 住居を指す住所
◦◦市◦◦丁目◦◦番◦◦号 • 例えば法務局の登記簿に記載されている住所は地番住所。 • 郵便の宛先として使う住所は住居表示住所。 • 住居表示住所を導入していない自治体もある。 • 「Geolonia 住所データ」がカバーしているのは住居表示住所のみ。
なんでそんなことに? • そもそも住所という仕組みは GPS の衛星が飛び回る前の時代から存在している。 • 土地と建物の関係は必ずしも 1:1 とは限らない。 8
• 左の例では、▪ が地番住所の境界で、 ▪が 住居住所の境界。 • このように複数の地番をまたがる住居や、 ひとつの地番を共有する住居がありえる。 わかりやすくするためにかなり大雑把な説明です。 ちなみに地番住所の区画のひとつひとつは「筆」という単位を使用します。 「筆」は土地の売買等によって合体したり分割されたりすることがあり、それぞれ「合筆」「分筆」と呼ばれ、それによっ て地番住所が変更されます。
システム上の問題点 住所はプログラマーが期待するような一意なシステムではない。 • 住人が引っ越していなくても、住居住所の整備による変更が起こりうる。 ◦ たとえば東京都町田市では町ごとに順次住所の整理を行っている。 (例)町田市△△町1234番地56 → 町田市〇〇〇一丁目〇番〇号 ◦
ビフォーアフターを予測することが困難な変更であり、たとえば正規表現等による置換等でどうにか なる問題ではない。 • 文字列としての「ゆれ」以外にも、「住居表示」か「地番」かによる「ゆれ」が生じる。 ◦ たとえば建築確認申請等で誤って住居住所が入力されるなど。 9
目的地は本当にそこか?問題 • たとえば自動運転車で〇〇大学を目的地とした場合、ほんとうに目指すべき場所 は、指定された住所ではなく「その場所にいくのに便利そうな駐車場」である。 • 一方で住居表示住所は建物につくものなので、駐車場には住所がない。 • 緯度経度も完璧ではない。 ◦ 住所ではあいまいすぎるが、緯度経度ではピンポイントすぎで、緯度経度で指定された点を含む特
定のエリア内を指すなにかが必要。 10 ドローン配送や自動運転車において、 ラストワンマイルの実装が困難。
ローマ字/英語表記問題 いろいろ混乱はあるが、アプリケーションの国際化では、国土地理院にならい「ヘボン 式」でいい気がする。。。(たぶん) • だけど Minami-Alps (南アルプス市) という例外もあるので、なんでもかんでもロー マ字に変換すればすむわけではなさそう。。。 •
「東京都港区」は「Minato city, Tokyo」だけど「大阪市港区」は「Minato ward, Osaka」などのように東京23区だけは別扱いだったりする。 参考: 国土地理院「地名等の英語表記規定」 https://www.gsi.go.jp/common/000138865.pdf 11
「ゆれ」問題 OCR などによる誤認識も考慮に入れると修羅場。 • カタカナの「ニ」と漢数字の「二」や、「ハ」と「八」など • 「巿」(ふつ)と「市」(いち) • 新字体と旧字体、JIS第2水準と第1水準 •
「塩竈市」と「塩釜市」、「埠頭」と「ふ頭」、「藪」と「薮」など • 「ケ」と「ヶ」、「カ」と「ヵ」、「ノ」と「の」など 12
住所に関連する Geolonia の取り組み • 特定の地図サービスへのロックインがなく地番住所にも対応したジオコーダーの整 備。 ◦ 様々な企業や団体と連携してのデータ集め。 • 住居住所
⇔ 地番住所の相互変換を実現するための様々なアクション ◦ 政府、自治体、関係団体との交渉など。 • 住所の変更をトラッキングするためのシステム開発。 ◦ 新旧住所の変換 ◦ 住所の正規化エンジンの開発 13 たとえばこれらの課題を解決して不動産IDを実現するだけでも、 経済効果が数千億円以上と言われています。
開発における戦略 • 無料版をオープンソースで公開して、コミュニティのみなさんと数年かけて育ててい きたい。 ◦ 住所マスター ◦ 住所正規化エンジン ◦ ジオコーダー
• エンタープライズ向けには当面の間、パートナー企業のみなさんと連携し有料版 として提供。 • 政府や自治体がオープンデータ化してくれればもっとうれしいけど、じっと待たなく てもなにかしら前には進められる気がする。。。 14
ありがとうございました! 15