第1回 国土交通省
地理空間情報データチャレンジ
~国土数値情報編~
(開催期間:2024年10~12月、表彰式:2025年1月)
国土交通省政策統括官付地理空間情報課では、国土数値情報を始めとした、地理空間情報のオープンデータを活用したイノベーションの創出に取り組んでいます。また、国土数値情報を、より開かれた・使われるデータとしていく方針のもと、新たなユーザーを増やすための各種取り組みもおこなっています。こういった中で今回、データサイエンティスト等の高度なIT人材による地理空間情報および国土数値情報の利用拡大を目的として、国土交通省初のデータ分析コンペティションである「第1回 国土交通省 地理空間情報データチャレンジ ~国土数値情報編~」を、2024年10月から12月にかけて開催しました。
国土数値情報の活用を条件に、不動産賃料を予測する機械学習モデルを構築し、予測結果の精度を競う「モデリング部門」と、不動産市場の物件価値を高めるためのアイデアを提出し、審査員による評価がおこなわれる「アイデア部門」の2部門にて構成され、多くの皆様にご参加いただき、盛況のうちに終わることができました。
コンペティションと並行して計9回に渡って開催したサイドイベント(協賛企業によるオンライン勉強会や、モデリング部門上位の参加者による振り返り会 等)を含め、第1回 地理空間情報データチャレンジの開催結果を特集いたしましたので、是非ご覧ください。
・ 主催:国土交通省 政策統括官付 地理空間情報課
・ 運営:一般社団法人不動産建設データ活用推進協会
・ 協賛、協力
■ 株式会社LIFULL
■ 株式会社SIGNATE
■ 株式会社GA technologies
■ 株式会社ゼンリン
■ 株式会社ネットデータ
■ 日本マイクロソフト株式会社
■ Snowflake合同会社
■ データブリックス・ジャパン株式会社
■ 株式会社YX Partners
・ 2024年10月9日(水)開会式キックオフイベント
・ 2024年10月15日(火)コンペティション開始
・ 2024年11月14日(木)中間結果発表会
・ 2024年12月13日(金)コンペティション終了
・ 2025年1月9日(木)アイデア部門審査会
・ 2025年1月31日(金)表彰式(G空間EXPO内)
・ 2025年2月21日(金)振り返りイベント
▲「第1回 国土交通省 地理空間情報データチャレンジ ~国土数値情報編~」開会式キックオフイベントにて
▲コンペ参加者のデータ利用実態
■ 参加者へのアンケート結果
73.5%:国土数値情報及びGISデータ自体を使ったことがない(今回が初めて)
7.2%:GISデータのみ使用経験がある
4.6%:国土数値情報のみ使用経験がある
14.7%:国土数値情報や他のオープンデータを既に利用した経験がある
→ 8割以上(80.7%)の参加者が国土数値情報を初めて利用したと回答
▲コンペ参加者の業界
IT業界が約38.6%と最も多く、次いで学生が24.2%という結果になりました。その他にも金融や製造業といった多様な業界から参加がありました。
■ 株式会社Signate:データコンペティションプラットフォームシステム「Signate」のプラットフォーム提供
国内最大10万人超のAI・データ人材会員ネットワークを通じて、様々な産業領域におけるDX推進や生成AIプロジェクトの支援実績を通してコンペの企画・運営を担当されました。
■ 株式会社LIFULL:全国の賃貸物件データの提供
2019年〜2023年の全国賃貸マンション・アパートの賃料や間取り等の物件情報。モデル構築やデータ分析のために活用されました。
■ 株式会社ゼンリン:「ZENRIN Maps API」の提供
住所のクレンジングや位置情報の整備、地図上のデータ可視化を可能にするAPI。地理的要素の特徴量作成や視覚化に利用されました。
■ 株式会社GA technologies:コンペ活性化のための勉強会の開催
Pythonを使って国土数値情報等を用いた賃料予測の基礎から応用まで学べる教材コンテンツを提供し、初心者から上級者までコンペの参加を促しました。
■ 株式会社ネットデータ:「土地バンク」の提供
不動産関連の多様なデータ(坪単価、国勢調査統計、学校区など)を地図上に可視化する営業支援DXサービス。物件周辺環境の分析や特徴量作成に役立てられました。
■ データブリックス・ジャパン株式会社、日本マイクロソフト株式会社:Databricks分析環境の提供
大量のデータ処理や予測モデルの構築・評価が可能なクラウド環境。参加者が手元に解析環境を構築せずとも、プラットフォーム上でスムーズにデータ分析を行えるよう支援しました。
■ Snowflake合同会社:SnowflakeのAIデータクラウド環境の提供
官民データの統合や共有、AI・機械学習を活用した高度な分析を実施するためのクラウド環境。複数のデータを迅速に結合・処理するための分析基盤として提供されました。
■ 株式会社YX Partners:本コンペティションの事務局機能の提供
コンペ開催における問題作成、参加者対応等の事務局機能を担当しました。
■ 国土数値情報(国土交通省) ※使用必須
■ 登記所備え付け情報地図データ(法務省)
■ 全国の賃貸物件の募集データ(株式会社LIFULL)
■ ZENRIN Maps API(株式会社ゼンリン)
■ 土地BANK(株式会社ネットデータ)
■ クラウド分析環境「Databricks」(データブリックス・ジャパン株式会社・日本マイクロソフト株式会社)
■ AIデータクラウド環境「Snowflake」(Snowflake合同会社)
▲モデリング部門の流れ
モデリング部門では、不動産賃料をできるだけ正確に予測することが求められました。
評価指標にはRMSE(Root Mean Square Error)が採用され、これは予測値と実際の値との誤差の二乗平均平方根で、誤差が小さいほど良いモデルであることを意味します。参加者はこのRMSE(Root Mean Square Error)を可能な限り小さくすべく、多くの試行錯誤を重ねました。
また、参加者は、国土数値情報や協賛企業からの提供データ等の豊富なデータセットを活用し、データの前処理(欠損値の補完や異常値の除去など)や、モデルの予測精度を高めるための特徴量エンジニアリング(有用な指標・変数の生成)、そして機械学習アルゴリズムを用いた予測モデルの構築を行いました。例えば、物件の所在地や周辺施設情報を組み合わせて新たな指標を作り出したり、地図データから最寄り駅までの距離や周辺の生活環境スコアを計算したり、といった工夫もなされました。なお、分析環境として提供されたクラウドツール上で大規模データの処理・可視化が可能だったことも寄与し、参加者は効率的にデータ分析を進めることができました。
▲「第1回 国土交通省 地理空間情報データチャレンジ ~国土数値情報編~」モデリング部門の最終結果
上位に食い込んだユーザー/チームの多くは100回を超える投稿をおこない、モデルの改良を重ねていました。コンペティション期間中は、途中経過がリーダーボードに公開され、参加者は他のユーザー/チームのスコアを参考にしながら戦略を調整するなど、終始ハイレベルな戦いとなりました。
最終的な順位決定は最終評価用データセットによっておこなわれ、コンペティション期間中のリーダーボードとは異なる隠れデータで最終評価がされたため、公平性が保たれています。
アイデア部門では、国土数値情報の活用を必須条件に「不動産市場の物件価値(経済的価値、社会的価値、環境的価値、文化的価値、利便性 等)を高める具体的なアイデア」について、「解決したい課題・具体的なアイデア・データ活用方法・この提案がもたらすメリット 等」を、A4用紙4ページ以内のレポート形式でまとめ、PDFファイルとして提出いただきました。提出されたレポートは、有識者審査員により「課題の重要性・アイデアの独自性・データ活用の適切さ・実現した際のインパクト 等」を考慮し、順位を決定しました。
瀬戸 寿一 氏
駒澤大学文学部地理学科 准教授 / 東京大学空間情報科学研究センター 特任准教授
略歴:博士(文学)。専門分野は、社会地理学・地理情報科学で、参加型GISやシビックテック・データガバナンスに関する研究に従事。立命館大学文学部・東京大学空間情報科学研究センターを経て、2021年4月より現職(放送大学・客員准教授も兼務)。国土交通省「デジタル情報活用推進コミッティ」委員、PLATEAUコンソーシアム・アドバイザリーボード、 情報処理推進機構「データ環境推進委員会」委員、国土交通省地理空間情報課ラボ・スペシャルサポーター、内閣官房イチBizアワード・スペシャルアドバイザー、OSGeo日本支部・運営委員、Code for Japanフェロー、(一社)社会基盤情報流通推進協議会・理事等を務めている。
長島 聡 氏
きづきアーキテクト株式会社 取締役会長、工学博士
略歴:早稲田大学理工学研究科博士課程修了後、早稲田大学理工学部助手を経て、ローランド・ベルガーに参画。日本法人代表取締役社長を経て、2020年3月までグローバル共同代表。2020年7月に新事業の量産を目的とした会社、きづきアーキテクト株式会社を創業。文化やアートを含む異能人材のコラボレーションのプロデュースで新規事業の量産を推進。グリーンイノベーション基金委員、DADCアドバイザリーボード、スタートアップのアドバイザー多数、NEDO技術委員などを歴任。
永田 ゆかり 氏
データビズラボ株式会社 代表取締役社長
略歴:内閣府 日本学術会議 総合工学委員会 社会に資する可視化の小委員会 委員 / 早稲田大学商学部、政治経済学部 講師 / 早稲田大学トランスナショナルHRM研究所 招聘研究員 / Tableau ZEN MASTER 2019/2020/2021 / Tableau Ambassador /データ視覚化のデザイン』『データ分析のリアル まるごとQ&A』著者 / Google Women Founders Academy 2021選出 / 株式会社アドベンチャー(東証グロース6030)社外取締役。アクセンチュア、楽天、KPMGなどを経て独立。データ分析&視覚化、データマネジメント/データガバナンス、クラウドデータ分析基盤構築に係るデータコンサルティングを提供。データ活用の「自走型組織」を創り上げることを支援。スクラムでのデータエンジニアリング、コンサルティングが得意領域。早稲田大学政治経済学部卒。
▲「第1回 国土交通省 地理空間情報データチャレンジ ~国土数値情報編~」アイデア部門の最終結果
2025年1月31日(金)に、G空間EXPO(会場:東京ビッグサイト)の特設ステージにて、地理空間情報データチャレンジの表彰式を開催しました。𠮷井章 国土交通大臣政務官が、開会挨拶をおこない、「地理空間情報を新たなビジネスの創出やDXに活用できないかご検討いただけると幸いです」と、官民データ連携によるデータ活用の可能性を強調されました。続いて、𠮷井政務官から、モデリング部門及びアイデア部門の優勝者へ賞状およびトロフィーが授与されました。また、国土交通省 地理空間情報課 矢吹周平課長から、モデリング部門及びアイデア部門の2位・3位入賞者へ表彰がおこなわれました。
▲「第1回 国土交通省 地理空間情報データチャレンジ ~国土数値情報編~」表彰式にて:左から、モデリング部門優勝 kenkoooo氏、𠮷井 章 国土交通大臣政務官、アイデア部門優勝 TC_DS-Volve チーム代表
▲左から、モデリング部門第3位AioRaito氏、第2位Kitsune氏、矢吹 周平 地理空間情報課長、アイディア部門第2位Wagayaチーム
協賛企業賞の授与もおこなわれました。協賛企業のプロダクトやツールを活用した方を各社が表彰し、自社記念品や賞金が贈られました。
▲ZENRIN Maps APIの効果的な活用
(「情報連携キーとしてのZIDの有効活用」または「地図描画機能を使ったデータの地図表現」)
受賞者:fumito氏
▲LIFULL賞
予測が難しい物件(外れ値など)に対して斬新的な発想で精度向上に取り組んだ分析内容
受賞者:miyama氏
▲SIGNATE賞
slackにてコンペの運営円滑化や他参加者のフォローに貢献いただいた方
受賞者:kenkoooo氏
▲RENOSY賞
泥臭くデータに向き合った分析内容(データ前処理や名寄せを丁寧に行ったなど)
MKS氏
土地BANK賞
土地バンクの活用内容(土地バンク利用者もしくはエンドユーザーに有益と思われる内容)
受賞者:NGUS氏
▲Snowflake賞
Snowflakeのデータ共有機能(Private Listing)を使って別の参加者に最もデータを共有いただいた方
受賞者:saanai氏
▲データブリックス・日本マイクロソフト賞
Databricksを利用して分析した結果・過程
表彰式当日の様子、大会関係者や優勝者へのインタビューをまとめたアフタームービーを作成しました。ぜひご覧ください。
今回の地理空間情報データチャレンジでは、国土数値情報をはじめとする官民データを最大限に活用するために、多くの参加者が必要な知識・スキルを身につけられるよう、協賛企業の支援をいただき、サポートを実施しました。また、勉強会や振り返り会を通じて、参加者同士や主催者・協賛企業との交流を促進し、コミュニティの醸成とコンペティション全体の盛り上げを図りました。
▲計9回に及ぶ勉強会や結果発表会、振り返りイベントの開催
▲開催イベントの主担当および実施日、参加人数
データ分析の基礎から実践的な活用ノウハウ、そしてツールの使い方に至るまで、さまざまなレベルの参加者を支援するプログラムを提供することで、初学者から上級者までが一緒になって学び合える環境の提供を目指しました。
モデリング部門のランキング上位者に成果を共有いただく中間結果報告会および振り返り会では、どのような特徴量やモデルが有効だったのか、またどのように国土数値情報を活用したのかといった具体的な手法が共有されました。参加者同士や協賛企業との活発な質疑応答もあり、コンペティションを通じて得られた知見をコミュニティ全体で共有する貴重な場となりました。データサイエンスに詳しくない方にも理解しやすいよう工夫された発表も多く、データ活用の可能性が具体的な事例とともに紹介され、「非常に参考になった」「データの力を実感した」と好評を博しました。
【開会式キックオフイベント】 https://pcdua241009.peatix.com/
【オンライン勉強会① ~GA technologies編~】 https://241030.peatix.com/
Part1 https://youtu.be/0jf09Eg83q8 Part2 https://youtu.be/EWGHGAxipRo
【オンライン勉強会② ~データブリックス編~】 https://241108.peatix.com/
Part1 https://youtu.be/l5YfzAlbgD4 Part2 https://youtu.be/hBQoipHny3k Part3 https://youtu.be/BMIkRpPC1DQ
【オンライン勉強会③ ~スノーフレイク編~】 https://pcdua241113.peatix.com/
Part1 https://youtu.be/MqGt50FBc04 Part2 https://youtu.be/6qd56nB_xD4
【中間結果発表会】 https://241114.peatix.com/
Part1 https://youtu.be/XsCfsBILZTE Part2 https://youtu.be/4ye810pCy-U
【オンライン勉強会④ ~土地バンク編~】 https://pcdua1115.peatix.com/
Part1 https://youtu.be/7QmjunKEoIg Part2 https://youtu.be/6KiUnWOo6tw
【オンライン勉強会⑤ ~アイディア部門編~】https://pcdua1209.peatix.com/
【表彰式】 https://250131.peatix.com/
【振り返り会】 https://250221.peatix.com/
Part1 https://youtu.be/uYyUAtjapPM Part2 https://youtu.be/8k7Qa1qarUI Part3 https://youtu.be/uMwV8HilQqw
今回の地理空間情報データチャレンジを通じて、公的なオープンデータである国土数値情報と民間データを組み合わせることで生まれる新たな価値が示されたと考えられます。不動産分野において、データ分析による課題解決やビジネス創出の可能性を多くの人々が実感できたことは、大きな成果と言えます。この成果を踏まえ、今後も国土数値情報をはじめとするオープンデータのさらなる利活用、民間企業との連携によるデータ活用の取り組みも一層進められていくことが期待されます。第二回以降の地理空間情報データチャレンジ開催や、他分野へのデータ分析コンペティション展開なども視野に入れつつ、官民が協力してデータに基づく新たな価値創造に挑戦していきます。
「第1回 国土交通省 地理空間情報データチャレンジ ~国土数値情報編~」は、約1,500名と多くの皆様にご参加いただいたコンペティションとなりました。データ分析上級者の現役のデータサイエンティストの皆様から、初学者の未来のデータサイエンティストの皆様まで、データ分析に関わる幅広い層の皆様に、国土数値情報を見て触れて使っていただいたことは大変貴重な機会でした。多くのご参加者様が、日々の仕事や活動の中でも、国土数値情報を活用しようと思う、きっかけとなっていましたら幸いです。また、コンペティションの中で、ご参加者様からいただいた国土数値情報への感想・要望 等のフィードバックにつきましては、今後の国土数値情報の整備・提供方法の改善に活かして参りたいと思います。
今回の取り組みによって、国土数値情報が、今後のデジタル化社会に貢献する「より開かれた・使われるデータ」へと進化することを期待しています。
第1回 国土交通省 地理空間情報データチャレンジ ~国土数値情報編~(SIGNATE公式ページ)
https://signate.jp/competitions/1484
国土交通省プレスリリース(2024年10月4日):「地理空間情報を活用したデータ分析コンペティションを初開催します」
https://www.mlit.go.jp/report/press/tochi_fudousan_kensetsugyo17_hh_000001_00042.html
G空間EXPO2025公式サイト(表彰式開催イベントページ)