Upgrade to Pro — share decks privately, control downloads, hide ads and more …

(JSAI2020)賃料推定AIを活用した 相場比較タグの開発と ユーザーへの提示効果の検証/...

(JSAI2020)賃料推定AIを活用した 相場比較タグの開発と ユーザーへの提示効果の検証/JSAI2020-AI-Real-Estate-Estimator

大浜毅美

June 10, 2020
Tweet

Other Decks in Science

Transcript

  1. 2

  2. 3 不動産仲介IT化の試み – ietty「対話型eコマース」 チャットセンター (手動) 人工知能 (チャットボット) 質問 物件評価

    希望条件 転居時期 物件提案 物件提案 回答 入居希望者 「徒歩0秒の不動産屋さん」 ietty 内見・契約 自社営業 業務委託 会社 web上の来店カード web上の接客カウンター • 「接客」と「物件のご紹介」をチャットで行う • 店舗を持たずに仲介業の前半部分をオンライン化する • 随所にAIを活用することで、オペレーションの自動化を図る 原則すべて自社システムで完結。
  3. カテゴリ型 路線名 駅名 契約形態 管理会社ID 部屋の向き … 数量値型 専有面積 礼金

    間取り 保証金 築年数 情報登録日 情報更新月 敷金 最高階 契約年数 階数 駅徒歩 … bool型 駐輪場 フローリング 南向き 収納スペース CATV 都市ガス 二人入居可 洗濯機置場有り システムキッチン 温水洗浄便座 モニタ付きインターホン 追い焚き機能 オートロック ガスコンロ可 バス・トイレ別 … iettyが2015年から蓄積する265万物件を288変数で表現。 6万円〜100万円までのマンション・アパートに対して学習 特徴量選定 *内10%(26.5万件)の物件を精度検証用として取り置き
  4. Redfin / Zirrowが開示している指標を算出。 売買と賃貸の違いがあるため単純比較できないが、傾向は類似している。 乖離率と乖離率中央値 23区の2019年1月以降掲載物件の乖離率中央値と比率、最大値 MER within_5% within_10% within_20%

    max 練馬区 1.54% 83.0% 94.9% 99.3% 561.8% 目黒区 1.62% 80.8% 93.0% 99.0% 207.3% 墨田区 1.30% 84.2% 95.0% 99.1% 183.6% 北区 1.50% 82.6% 94.6% 99.2% 233.1% 豊島区 1.53% 80.9% 92.9% 99.1% 386.6% 文京区 1.57% 79.9% 93.3% 98.7% 103.0% 品川区 1.48% 82.0% 94.0% 99.2% 106.4% 板橋区 1.52% 83.1% 94.5% 98.7% 52.6% 中野区 1.69% 80.3% 93.5% 99.1% 86.4% 中央区 1.23% 83.0% 93.8% 99.0% 72.5% 大田区 1.54% 83.1% 95.0% 99.3% 296.0% 台東区 1.21% 83.4% 94.2% 99.1% 74.6% 足立区 1.51% 82.3% 95.1% 99.3% 152.1% 千代田区 1.41% 77.6% 87.9% 97.1% 136.9% 世田谷区 1.59% 81.6% 94.2% 99.2% 80.0% 杉並区 1.69% 80.2% 93.5% 99.2% 187.4% 新宿区 1.45% 81.2% 92.8% 98.8% 138.3% 渋谷区 1.41% 80.2% 92.1% 98.2% 353.1% 荒川区 1.24% 84.7% 94.5% 99.2% 315.2% 港区 1.28% 79.6% 90.7% 97.3% 162.8% 江東区 1.29% 83.4% 93.8% 98.8% 388.2% 江戸川区 1.56% 82.8% 94.9% 99.1% 100.3% 葛飾区 1.46% 82.2% 94.9% 99.3% 82.7%
  5. 間取りは「1R」「2LDK」などの部屋数+記号で表現される。 カテゴリとして投入することも可能だが、 記号部分を数量値化することでさらに精度を高めた。 特徴量エンジニアリング 記号 英語表記 意味 係数 R Room

    居住用ではほぼ「1R(ワンルーム)」でしか利用されない -0.6 K Kitchen 居室数+キッチン。DKやLDKに比べてbed roomが実質1つ減る -0.3 DK Dining キッチンのある部屋が5-8帖(1DK)または6-10帖(2DK以上) 1.0 LDK Living キッチンのある部屋がDKの基準値以上 1.5 例) リビング1+寝室1となる間取り 2K = 2-0.3 = 1.7 1DK = 1+1.0 = 2.0 1LDK = 1+1.5 = 2.5 リビング1+寝室2となる間取り 3K = 3-0.3 = 2.7 2DK = 2+1.0 = 3.0 2LDK = 2+1.5 = 3.5
  6. 2019年にiettyのDBに1件以上の物件が登録された管理会社は17,885事業所 うち1万件以上の物件が登録されたのは9社のみの超ロングテイル濫立市場 しかし、賃料の査定は管理会社ごとに特色があり、AIとしての重要度は高い 「電話番号」をIDとして事業所単位を特徴量とすると、最も精度が上がる 特徴量エンジニアリング 管理会社と2019年度登録物件数 0 5000 10000 15000

    20000 25000 30000 35000 40000 1 39 77 115 153 191 229 267 305 343 381 419 457 495 533 571 609 647 685 723 761 799 837 875 913 951 989 1027 1065 1103 1141 1179 1217 1255 1293 1331 1369 1407 1445 1483 1521 1559 1597 1635 1673 1711 1749 1787 1825 1863 1901 1939 1977 2015 2053 2091 2129 2167 2205 2243 2281 2319 2357 2395 2433 2471 2509 2547 2585 2623 2661 2699 2737 2775 2813 2851 2889 2927 2965 3003 3041 3079 3117 3155 3193 3231 3269 3307 3345
  7. 賃貸の募集では、オーナーや管理会社の意向により住所をあえて住宅番号 や地番まで開示していないことも多い。 特徴量エンジニアリング(論文提出後の追加研究) Google Maps Platformを利用し、緯度経度を 取得すると同時に、住所の記載レベルを推定 レベル 意味 出現率

    ROOFTOP 家屋特定 71.4% GEOMETRIC_CENTER 街区レベルの幾何学中心 8.4% APPROXIMATE 丁目レベルまたは概算値 20.2% 記載レベルと座標を元に、 名寄せやジオデモグラフィーデータを特徴量に。 ゼンリン Chomonicx 4.0 による地域クラスタ
  8. 「お借り得RATE」は概ね左右対称(若干>1寄り)の分布となる。 リアルタイム推定システムの予測誤差率分布 2020年5月募集開始物件のお借り得rate分布 0 200 400 600 800 1000 1200

    1400 1600 0.506 0.533 0.561 0.59 0.614 0.632 0.651 0.668 0.686 0.699 0.71 0.722 0.732 0.742 0.753 0.763 0.773 0.783 0.793 0.803 0.813 0.823 0.833 0.843 0.853 0.863 0.873 0.883 0.893 0.903 0.913 0.923 0.933 0.943 0.953 0.963 0.973 0.983 0.993 1.003 1.013 1.023 1.033 1.043 1.053 1.063 1.073 1.083 1.093 1.103 1.113 1.123 1.133 1.143 1.153 1.163 1.173 1.183 1.193 1.203 1.213 1.223 1.233 1.244 1.254 1.264 1.274 1.286 1.3 1.313 1.328 1.343 1.36 1.378 1.395 1.413 1.45 1.488 1.538
  9. 25 お部屋探しアプリ「ietty」への導入 2019年11月に物件の特徴をタグ表示する「タグ付与機能」をリリース。 前後1ヶ月の[相場よりお得・超お得]該当物件の「内見する」評価を比較 2.11% 2.41% 2.30% 2.77% 0.00% 0.50%

    1.00% 1.50% 2.00% 2.50% 3.00% リリース前 リリース後 相場並み 相場以上 0.19 0.36 「タグ」の効果で全体的に評価が向上しているが、 「相場よりお得」タグによりお得な物件の内見可能性がより高まっている。 (提案総数)n=484,897