Upgrade to Pro — share decks privately, control downloads, hide ads and more …

住まい探しの利便性向上にデータベース・情報アクセス技術が 果たした役割 / The Role ...

住まい探しの利便性向上にデータベース・情報アクセス技術が 果たした役割 / The Role of Database and Information Access Technology in Improving the Convenience of Housing Search

日本データベース学会主催 最強データベース講義 #22
2023年1月18日
https://dblectures.connpass.com/

Kiyota Yoji, Ph.D.

January 18, 2023
Tweet

More Decks by Kiyota Yoji, Ph.D.

Other Decks in Technology

Transcript

  1. 清⽥ 陽司 博⼠(情報学) 株式会社LIFULL AI戦略室 主席研究員 兼 東京⼤学空間情報科学研究センター 客員研究員 麗澤⼤学AI・ビジネス研究センター

    客員准教授 1975年 福岡県⽣まれ 2004年 京都⼤学⼤学院情報学研究科 博⼠課程修了 2004-2012年 東京⼤学情報基盤センター 助⼿・助教・特任講師 2007-2011年 株式会社リッテル 上席研究員・取締役CTO 2011年 株式会社LIFULL 主席研究員(バイアウト) 関⼼分野: ⾃然⾔語処理応⽤ → 検索・推薦 → 情報リテラシー (図書館) → ⽣活領域 (不動産、介護 etc.)、産学連携 主な対外的活動 • DEIM 2023産学連携委員⻑ • 情報処理学会 データベースシステム研究会 運営委員 (2020.4〜) • 情報科学技術協会(INFOSTA)会⻑ (2022.7〜) • ⼈⼯知能学会 理事/編集委員⻑ (2020.6〜2022.6)
  2. 株式会社LIFULL AI戦略室 • 2018年7⽉、社⻑直轄のAIビジネス実装部⾨として 設置 • 主なミッション • 物件画像への深層学習適⽤ •

    グローバル不動産市場における物件価値推定 • 不動産マーケティングの⾃動化 • etc.
  3. 6

  4. 7

  5. 10

  6. 1. 不動産市場とテクノロジー 1.1 AIと不動産業 1.2 不動産のマッチング 1.3 不動産テックによる社会課題解決 1.4 良質なデータ資源の重要性:Garbage

    in garbage out 2. 不動産市場分析の理論 2.1 ヘドニックアプローチによる不動産価格分析 2.2 ヘドニック価格関数の推定 2.3 不動産価格の分解と予測 2.4 不動産価格の実際の推計 3. 不動産テックにおける機械学習の数理 3.1 不動産市場分析と機械学習 3.2 勾配降下法 3.3 線形回帰 3.4 分類(ロジスティック回帰) 3.5 ニューラルネットワーク 3.6 ノーフリーランチ定理 4. 不動産市場分析における統計・機械学習の利⽤ 4.1 不動産市場分析における統計・機械学習の⼿法 4.2 線形回帰モデル 4.3 分位点回帰 4.4 ニューラルネットワーク 4.5 その他の⼿法 4.6 ⼿法の適⽤ 5. 不動産市場への機械学習の応⽤ 5.1 不動産市場分析の実際 5.2 予測モデルのための不動産価格データの⽤意 5.3 推計⼿法の選択肢 5.4 不動産価格の予測モデル 5.5 不動産市場における介⼊効果の測定 5.6 傾向スコアを⽤いた実証分析の事例 5.7 不動産市場分析における機械学習の応⽤と課題 6. 不動産市場分析におけるGISの活⽤ 6.1 不動産市場分析とGIS 6.2 GIS の活⽤ 6.3 空間集計における基本操作 6.4 空間データの相関と補間 6.5 空間特性に配慮した不動産価格構造の推定 6.6 空間構造の取り扱い 6.7 実データを⽤いた推計例 6.8 推計結果 6.9 不動産市場分析の発展可能性 7. GISを⽤いたエリア指標の開発 7.1 エリア指標と不動産テック 7.2 不動産の価値評価 7.3 「Walkability Index」の開発 7.4 Walkability Index研究の発展可能性 8. 不動産間取り図の認識と応⽤ 8.1 市場探索⾏動における不動産間取り図 8.2 関連研究 8.3 間取り画像のグラフ化⼿法 8.4 実験 8.5 不動産間取り図の認識と応⽤に関するまとめ 9. 不動産物件情報の流通と活⽤を⽀えるデータベース・情報ア クセス技術 9.1 データベース・情報アクセス技術の発展 9.2 不動産物件情報へのデータベース・情報アクセス技術の応 ⽤ 9.3 RDBMSの仕組み 9.4 不動産物件画像への深層学習の適⽤ 9.5 質の⾼い不動産物件データベースの構築 10. 官⺠ビッグデータを⽤いた空き家分布把握⼿法の開発 10.1 わが国における空き家の増加とその問題背景 10.2 既存の空き家分布把握の⼿法 10.3 空き家分布把握に有⽤なデータ 10.4 ⿅児島県⿅児島市の事例 10.5 群⾺県前橋市の事例 10.6 空き家は予測できるのか? 11. 不動産⾦融市場における不動産テック 11.1 不動産投資信託(REIT)市場におけるデータ資源 11.2 REIT市場データとREIT研究の動向 11.3 ⻑期的な資産⼊替の分析 11.4 REIT情報を⽤いた不動産市場分析の⽅向性
  7. 14

  8. 15

  9. 16

  10. 主な出来事 データベース・情報アクセス技術 不動産情報と不動産テック 18世紀〜 19世紀 産業⾰命 (蒸気機関、鉄道など) 図書⽬録(カード式) ※機械式計算機の時代 不動産取引業者による定期的

    な情報交換の場(⽶国、MLSの 起源?) 1900年代 真空管の発明 全⽶リアルター協会(NAR)の 成⽴ 1930年代 チューリングによる「知能 機械」の概念の提唱 ⽶国におけるMLSの普及 1940年代 第⼆次世界⼤戦 ENIACの開発 マンハッタン計画(原爆) ドキュメンテーション研究の端緒 Vannevar Bushによる「memex」構想(現在の Webにつながる概念?) 1950年代 世界初の⼈⼯衛星スプート ニク1号の打ち上げ(ソ連) Young and Kentによるデータベースに関する先 駆的研究 IBMのLuhnによる⽂献検索の研究 1960年代 ⽶ソ間の冷戦の激化 (キューバ危機など) ARPANETの開発 IBMのCoddによる関係データベースの提案 医学⽂献検索システムMEDLARSの実⽤化 SaltonらによるSMARTシステムの開発 1970年代 世界初の商⽤マイクロプロ セッサ(Intel 4004) パソコンの販売開始 関係データベースの実装(SQLデータベー ス)の商⽤化(Oracleなど) MLSのデータベース化 1980年代 パソコン通信の実⽤化 冷戦の終結 各種⽂献検索サービスの発達 商⽤データベースサービスのビジネス拡⼤ MLSのオンラインサービス化 1990年代 インターネットの商⽤開 放・爆発的普及 マルチメディア技術(画像や動画)の発展 Googleのサービス開始(PageRank) REINSのサービス開始 不動産情報サイトの出現 2000年代 SNSやスマートフォンの出現 ビッグデータに対応したデータベース技術 (NoSQL)の開発 Zillow設⽴(Microsoftからのス ピンオフ) 2010年代 ⽶GAFAMや中BATの台頭 深層学習による画像・動画処理 不動産テック企業群の増加 2020年代 (⽶中対⽴の激化?) ? ? 19
  11. 26 Codd, E.F. (1970). “A Relational Model of Data for

    Large Shared Data Banks”. Communications of the ACM 13 (6): 377–387. doi:10.1145/362384.36268
  12. 主な出来事 データベース・情報アクセス技術 不動産情報と不動産テック 18世紀〜 19世紀 産業⾰命 (蒸気機関、鉄道など) 図書⽬録(カード式) ※機械式計算機の時代 不動産取引業者による定期的

    な情報交換の場(⽶国、MLSの 起源?) 1900年代 真空管の発明 全⽶リアルター協会(NAR)の 成⽴ 1930年代 チューリングによる「知能 機械」の概念の提唱 ⽶国におけるMLSの普及 1940年代 第⼆次世界⼤戦 ENIACの開発 マンハッタン計画(原爆) ドキュメンテーション研究の端緒 Vannevar Bushによる「memex」構想(現在の Webにつながる概念?) 1950年代 世界初の⼈⼯衛星スプート ニク1号の打ち上げ(ソ連) Young and Kentによるデータベースに関する先 駆的研究 IBMのLuhnによる⽂献検索の研究 1960年代 ⽶ソ間の冷戦の激化 (キューバ危機など) ARPANETの開発 IBMのCoddによる関係データベースの提案 医学⽂献検索システムMEDLARSの実⽤化 SaltonらによるSMARTシステムの開発 1970年代 世界初の商⽤マイクロプロ セッサ(Intel 4004) パソコンの販売開始 関係データベースの実装(SQLデータベー ス)の商⽤化(Oracleなど) MLSのデータベース化 1980年代 パソコン通信の実⽤化 冷戦の終結 各種⽂献検索サービスの発達 商⽤データベースサービスのビジネス拡⼤ MLSのオンラインサービス化 1990年代 インターネットの商⽤開 放・爆発的普及 マルチメディア技術(画像や動画)の発展 Googleのサービス開始(PageRank) REINSのサービス開始 不動産情報サイトの出現 2000年代 SNSやスマートフォンの出現 ビッグデータに対応したデータベース技術 (NoSQL)の開発 Zillow設⽴(Microsoftからのス ピンオフ) 2010年代 ⽶GAFAMや中BATの台頭 深層学習による画像・動画処理 不動産テック企業群の増加 2020年代 (⽶中対⽴の激化?) ? ? 27
  13. 28

  14. 不動産情報のデータベース化の 始まり • 18世紀の⽶国で、不動産取引業者同⼠が定期的に 集まって情報交換を始めたとされる • Multiple Listing Service(MLS) •

    不動産の売り情報をリスト化、共有化して取引を⽀援す る仕組み • 20世紀初頭から、⽶国を中⼼に発達 • 1970年代からデータベースサービス開始 • ⽇本でも、1990年代より不動産流通機構(レイン ズ)によるオンラインサービス開始 29
  15. 空室 (売物件) オーナー (売主) 指定流通機構 (REINS) 不動産 管理会社 (売⼿媒介) 不動産

    仲介会社 物件情報 コンバーター 運営会社 不動産ポータル 運営会社 借主 (買主) (1) (2) (3) (4) (5) (6) (7) 物件情報が届く仕組み
  16. 不動産テックにおけるデータベース・ 情報アクセス技術の役割 • 良質なデータ資源の形成(1.4章, p. 12) • 「いくらゴミを学習させてもゴミしか出てこない」 (Garbage in,

    Garbage out) • 不動産情報の「⺠主化」 • 専⾨家(不動産会社の社員や不動産鑑定⼠)だけがアク セスする情報から、不動産物件を取引する誰もがアクセ スする情報へ 32
  17. 参考図書 35 データサイエンスのためのデータベース (データサイエンス⼊⾨シリーズ) 吉岡 真治 (著), 村井 哲也 (著),

    ⽔⽥ 正弘 (編集) リレーショナルデータベース⼊⾨ ―データモデル・SQL・管理システム・NoSQL 増永 良⽂ (著)
  18. データベースシステムの分類 • 関係データベース(relational database) • IBMのCoddによる関係モデル概念の提唱(1970年) • 関係データベース管理システムとしての実装(RDBMS = Relational

    DataBase Management System) • 問い合わせ⾔語の開発 • SEQUEL(Structured English QUEry Language)→ SQL • SQLの標準化 (SQL-86, SQL-92, …, SQL:2006) • NoSQL:関係モデルによらないデータベース実装 • インターネットに適したデータベースの開発(XML、 ビッグデータ、…) 36
  19. 40

  20. CAP定理 E. Brewerによる整理(2002年) • C: Consistency:データの⼀貫性の確保 • A: Availability:データの⾼い可⽤性(データをいつ でも利⽤可能にすること)

    • P: Torrelance to network Partitions:データの分散に 対する⾼い許容度 上記の3つの性質を同時に成り⽴たせるシステムは存 在しない (多くのRDBMSは、C, Aを満たすがPは満たさない) 42
  21. 主なNoSQLデータベース • Key-Value Storeデータベース • ⼤量のKeyとValueの組み合わせを保存する • 代表例: Redis, Memcached

    • 列指向データベース • 疎な(sparse)データに適したデータベース(⽂書-単語 の関係など) • 代表例: Apache Cassandra, Google Bigtable • ドキュメント指向データベース • XMLやJSONなどの半構造化データに適したデータベース • 代表例: MongoDB, Couchbase • RDFデータベース • Linked Open Dataやナレッジグラフの扱いに適したデータ ベース • 代表例: Neo4j, JanusGraph 44
  22. 空室 (売物件) オーナー (売主) 指定流通機構 (REINS) 不動産 管理会社 (売⼿媒介) 不動産

    仲介会社 物件情報 コンバーター 運営会社 不動産ポータル 運営会社 借主 (買主) (1) (2) (3) (4) (5) (6) (7) 物件情報の 棟寄せ・⼾寄せ問題
  23. 国⽴情報学研究所 情報学研究データリポジトリ (NII-IDR) LIFULL HOME’Sデータセット • 2015年11⽉より提供開始 • データセットの内容 •

    スナップショット • 2015年8⽉現在の全賃貸物件 データ • 上記に紐付く画像データ • ⽉次データ • 2015年7⽉〜2017年6⽉の24ヶ ⽉分 • 緯度・経度が付与 2019年10⽉、延べ利⽤申し込み数が 100を超えました (⽇本国内のほか、⽶国・カナダ・ 中国)
  24. ⻑尾 真 先⽣ (1936-2021) インタビュー “⼤学には⾊々な研究者がいるし、いろいろな学問もありますが、 異分野の⼈たちと真剣に議論する場がすごく⼤事だと思いますね。 私なんかはどちらかというと、⼀⼈で考えて⾒つけることが多い のですが、⼈と議論をしていると、⾃分⾃⾝で⾯⽩いことを⾔っ ている時があって、なんで⾃分はこんな⾯⽩いことを⼝⾛ったの

    かなあと思うこともありますね。異分野の⼈との対話が⼤切です。 総合⼤学は、異分野の⼈と徹底的に議論するということをもっと もっとやってく必要があると思います。私が教授になった時、35、 6歳の頃から、⾔語学や⼼理学の⼈たちや医学の⼈たちと⽉に⼀ 回、徹底的な議論をしました。そういうところからも⾯⽩いテー マが出てきます。総合⼤学はそういうことを積極的にやって、新 しいものの考え⽅を切り拓いていかないと、タコ壺みたいなこと をやっていたら、総合⼤学の意味はない。そういう余裕を持って もらいたいです。やっぱり、研究はロマンを持たないと。それが ⼀番⼤事なんじゃないかと思います。” 弁護⼠ドットコムニュース: 「未来から来た」情報⼯学者・⻑尾真、飽くなき⼈間への興味と哲学への回帰. 2019年1⽉24⽇掲載. https://www.bengo4.com/c_23/n_9133/