Власти Сингапура перестроят город с помощью больших данных

Сингапур, как и многие другие города, делится на деловой центр, где работает большинство людей, и пригородные районы — жилые и промышленные зоны. Поездки из пригорода в центр и обратно становятся причиной заторов в часы пик. Чтобы облегчить транспортную ситуацию, сингапурское правительство работает над созданием региональных центров к 2030 году. Проектировщики надеются стимулировать владельцев бизнеса открывать офисы в региональных центрах по всему городу-государству.

Чтобы перепланировать город, Сингапурское агентство науки, технологий и исследований (Singapore’s Agency for Science, Technology and Research, A*STAR) прибегает к анализу больших данных.

Что делали ученые

Исследователи составили карту пассажиропотока, загрузив и обработав обезличенные данные из городской системы оплаты проезда (в базу попали данные о 20 миллионах поездок). Эту карту объединили с общегородской информацией о землепользовании (как земля распределена под бизнес, промышленность, жилье, парки отдыха и т. д.).

В частности, ученые проанализировали земельные участки вокруг станций в трех радиусах (125 м, 250 м и 500 м для автобусных станций; 250 м, 500 м и 1 км — для станций метро). На цифровой карте одному километру соответствовало примерно 32 пикселя растровой карты. Каждому участку задавалась «плотность», которая была рассчитана на шести категориях землепользования и показывала уровень инфраструктуры, то есть количество местных «удобств» (кафе, развлечения, медицинские центры и т. д.).

Команда применила три модели анализа, чтобы найти связь между «удобствами вокруг станций» и загруженностью транспорта. Они искали ту модель, которая отвечает четырем критериям: 1) прогностическая точность, 2) общность в решениях (то есть, чтобы общие случаи можно было легко свести к частным), 3) мощностные затраты на вычисление, 4) «интерпретируемость», то есть легкое восприятие результатов простыми пользователями.

Исследователи обнаружили, что модель дерева принятия решений показала самую высокую точность предсказаний для данных и метро, и автобусных станций. Модель коллаборативной фильтрации тоже показала хорошую точность, и к тому же оказалось устойчивой к случайному расщеплению данных в учебном тесте. А вот метод опорных векторов показал худшие результаты.

Выводы исследования

Прогностическая модель показала, что рост «бытовой» инфраструктуры вокруг станций действительно снизит пассажиропоток, притом у снижения будет две критические точки: когда количество местных «удобств» вырастет на 55% и на 110%.

Ученые подчеркивают, что модель может быть применена в любом городе с доступом к подобным данным с высоким разрешением.

Полный текст исследования опубликован здесь.