Данные Ее Величества: как британское правительство раскрывает big data

В 2010 году британское правительство начало полномасштабный переход к политике открытых данных. Именно тогда состоялся запуск пользовательской версии портала data.gov.uk — хранилища всех сколько-нибудь значимых сведений о работе органов власти, жизнеобеспечения, инфраструктуры и социальной сферы Соединенного Королевства.

Как это работает

Данные о работе госорганов в Великобритании публиковались и до 2010 года. Однако единого портала не было. Сайт data.gov.uk стал площадкой интеграции потоков данных от госорганов, общественных служб и местных властей.

В ноябре 2010 года тогдашний премьер-министр Великобритании Дэвид Кэмерон выпустил специальное видеообращение, в котором амбициозно заявил о планах правительства Ее Величества стать одним из самых открытых в мире.

Дэвид Кэмерон: «Мы хотим открыто говорить о том, что мы делаем и, особенно, о том, как и сколько мы тратим. Начиная с сегодняшнего дня ежемесячно каждый департамент правительства будет отчитываться обо всех тратах, превышающих 25 тысяч фунтов. Люди смогут получить представление обо всех значимых расходах правительства. В случае чрезмерных трат граждане смогут инициировать расследование, тем самым помогая государству экономить».

На момент публикации этого материала портал data.gov.uk содержит свыше 36,5 тысяч массивов данных. Разумеется, теперь это не только сведения о расходах правительства. Здесь собраны фактические и статистические данные о состоянии экономики и бизнеса, здравоохранения, образования и науки, транспортной инфраструктуры, включая карты и схемы общественного транспорта, данные о состоянии безопасности и уровне преступности, о погоде в разных частях страны и многое другое.

Вся информация представлена в формате, доступном для машинной обработки и поисковых систем. То есть никаких сканов документов. Все тексты оцифрованы и каталогизированы, а карты масштабируемы и интерактивны.

Пользователей не ограничивают в способах обработки и использования информации с сайта. Любой человек в любом уголке мира может применить эти данные для своего исследования, публикации в СМИ или коммерческих целей. Более того, разработчики поощряют фирмы и стартапы использовать опубликованные данные для разработки приложений и сервисов.

Согласно требованию закона, все опубликованные данные деперсонализированы и анонимизированы. В первую очередь это требование касается записей о правоохранительной деятельности, здравоохранения и социальной сферы.

 

С чего все началось

Ключевые фигуры проекта data.gov.uk – сэр Тим-Бернерс Ли и сэр Найджел Шэдболт. Первый – не кто иной, как один из создателей World Wide Web, Всемирной паутины. Сэр Шэдболт – ученый, профессор факультета компьютерных наук в Оксфордском университете.

Они являются сооснователями Института открытых данных (Open Data Institute), некоммерческой организации со штаб-квартирой в Лондоне. Заявленная цель института — создавать инновационные подходы к работе с данными.

Однажды в разговоре с Тимом-Бернерсом Ли премьер-министр Великобритании Гордон Браун спросил: «Что может сделать правительство, чтобы максимально эффективно использовать интернет?». На что сэр Ли дал простой совет: «Разместите все свои данные онлайн». Говорят, что Браун тут же ответил: «Хорошо, давайте это сделаем». Якобы именно этот разговор и положил начало взаимопониманию между британским правительством и движением open data.

Роль The Guardian

Сама идеология бесплатного доступа к информации существует давно и продвигается на различных уровнях. Запрос на открытость государственного аппарата начинается снизу. И лишь затем, реагируя на запрос, государственный аппарат дает или не дает доступ к своим информационным закромам.

Одним из таких «движений снизу» стала серия репортажей влиятельной газеты The Guardian, которая одной из первых в Великобритании стала активно продвигать новый жанр журналистики – «журналистики данных» – и пропагандировать открытость этих данных.

Именно журналисты The Guardian еще в 2006 году запустили движение под названием «Освободите наши данные» (Free Our Data). В основе этой кампании лежал простой аргумент: такие структуры как государственное агентство Ordnance Survey (аналог Федерального агентства геодезии и картографии), Гидрографическая служба Великобритании и Управление автомобильных дорог (Highways Agency) собирают данные за счет граждан страны. Тогда почему граждане не могут воспользоваться этой информацией бесплатно, как, например, сервисом Google Maps?

Эти агентства формально действуют как коммерческие структуры, которые зарабатывают свои деньги. Но, согласно отчетам, до 50% их финансирования идет из бюджета, то есть формируется из налогов рядовых британцев. Следовательно, эти госструктуры не имеют права брать плату за пользование данными, подсчитали активисты. И потребовали раскрыть сведения, которые представляют наибольший интерес для общественности: данные о дорожном движении и ситуации с пробками, топографические карты местности и сведения об изменениях климата.

«Бесплатный общий доступ к этим данным – по аналогии с сервисами Amazon и Google – значительно расширит выбор услуг для населения. Неприемлемо, что американская коммерческая структура Google сейчас является более популярным источником данных для создания новых приложений в Великобритании, нежели отечественные организации», — говорится в заявлении на странице движения Free Our Data.

Активисты движения призвали граждан требовать от своих депутатов лоббировать раскрытие данных на уровне национального парламента.

В 2009 году The Guardian запустил специальный раздел на сайте, посвященный освещению проблемы открытых данных. В этом разделе публиковались аналитические материалы, основанные на доступных данных правительства, выступали влиятельные сторонники движения за демократизацию данных.

После парламентских выборов 2010 года и прихода к власти коалиции во главе с Дэвидом Кэмероном ключевые парламентские партии уже включили в свои программы пункты о раскрытии правительственных данных. А уже в ноябре того года новый премьер выступил с заявлением, которое дало официальное начало полномасштабному переходу правительства Ее Величества к политике open data.

 

Молодой советник премьера

Еще одна ключевая фигура в британском правительстве, кого называют ответственным за сдвиг к открытости – это советник Дэвида Кэмерона Роэн Силва. 35-летний Силва вдохновился идеей закона о максимальной открытости государственных структур наподобие того, который приняли в США при администрации Барака Обамы.

Роэн Силва написал проект обращения Дэвида Кэмерона ко всем министерствам, в котором предлагал раскрывать государственные траты свыше 50 тысяч фунтов. (Позже, как мы знаем, порог снизили до 25 тысяч).

«Реакция, которую мы получили на то письмо: “Вы что, с ума сошли? Это сколько ресурсов потребуется для раскрытия всех таких данных?”», — вспоминает Силва.

Однако вскоре молодому советнику премьера удалось на конкретных примерах доказать, что никаких особых затрат открытость правительственных данных на этом этапе не требует. Дальнейшие идеи Силвы каждый раз встречали не меньшее сопротивление, как со стороны правительства, так и со стороны членов парламента.

«Мы продолжали настаивать на необходимости раскрывать больше сведений. Однако оказалось довольно трудно убедить в этом даже Дэвида Кэмерона и Джорджа Осборна (министр финансов в правительстве Кэмерона), не говоря уже об остальных», — говорит Силва.

Позднее Роэн стоял практически за всеми решениями в области открытых данных, вплоть до программных речей на этот счет.

Источник фото
В итоге Великобритания сделала это: сегодня портал data.gov.uk содержит один из самых больших наборов открытых данных в мире – от отчетов о государственных расходах до состояния преступности в отдельных населенных пунктах по всей стране.

Как используют данные

Потребители открытых данных во всем мире делятся на четыре основные группы, пишет директор фонда «Информационная культура» Иван Бегтин:

• Институты гражданского общества (некоммерческие организации, активисты)
• СМИ
• Коммерческие организации
• Учебные заведения и научные организации

Понятно, что «сырые» данные редко представляют интерес для рядовых граждан. Поэтому существует множество независимых разработчиков и фирм, которые переформатируют выложенные на портале сведений в удобоваримую форму.

Один из ярких примеров – десятки мобильных приложений, разработанных на основе открытых данных лондонского агентства Transport for London. Вскоре после раскрытия баз – прежде всего метрополитену и железным дорогам – появились популярные приложения и сайты RailwayStation, Stationboard, Tubestation, Trains.im и многие другие.

Одна из самых популярных категорий на портале data.gov.uk – это Crime and Justice, посвященный криминальной статистике, дорожным происшествиям и работе полиции. Разумеется, раскрытие этой категории данных в свое время встретило ожидаемое и ожесточенное сопротивление. Как бы то ни было, сегодня большинство неконфиденциальных данных полицейской статистики раскрываются.

Часть данных с общего портала обрабатывается и размещается на специализированном сайте Police.uk. Здесь представлены, в частности, сведения об уровне преступности в каждом районе и городе, адреса и контактные данные местных органов полиции и интерактивная карта преступности.

Страница с картой преступности была запущена 1 февраля 2011, после чего сайт сразу упал, не справившись с трафиком. И сегодня это один из самых популярных разделов полицейской информации. Журналист Telegraph даже предположил, что, основываясь на данных этой карты, можно будет предсказать падение цен на недвижимость в тех или иных районах.

Популярностью пользуются также данные о социальной сфере – здравоохранении и образовании.

Так, раздел Health (Здоровье) содержит почти 2 тысячи наборов данных, которые охватывают статистику по социально-значимым заболеваниям (ожирение, сердечно-сосудистые заболевания, рак), сведения о проценте курильщиков, количестве регулярно принимающих лекарства граждан, а также информацию о медицинских учреждениях, врачах общей практики по регионам и т. п. Раздел также содержит сводный анализ состояния здоровья населения по годам.

В разделе Education (Образование) можно получить сведения о количестве студентов по университетам и специальностям, информацию о школах по городам и регионам, данные о программе бесплатного школьного питания и прочее. Этот сегмент портала содержит более 1 тысячи массивов данных.

Для более удобного поиска по регионам создан раздел Map Search (поиск на карте). Здесь действует простой трехэтапный принцип: пользователь выбирает нужный регион или город, при необходимости выделяет конкретный квадрат на карте и выбирает из списка нужную категорию данных.

Критика

С самого начала реализации проект data.gov.uk ожидаемо вызывал критику с двух позиций: одни говорили, что данных мало или они некорректные, другие – что данных слишком много и некоторые не мешало бы снова «засекретить». Позиция вторых касалась в основном чувствительных сведений, касающихся уровня преступности, точной криминальной характеристики тех или иных регионов, расовой и национальной принадлежности преступников и т. д.

Британский аналитик Эдди Коупленд недавно выступил с еще одной позиции. Он заявил, что правительство само в недостаточной мере использует данные для улучшения своей работы. Он пишет, что 2016 год ознаменовал окончательное формирование политики открытых данных в Великобритании. Теперь настало время новой трансформации – превращения государственной бюрократической машины в «правительство как услугу» или GaaS – Government as a Service (по аналогии с явлением SaaS, Software as a Service).

И в заключение приведем мнение российского специалиста по открытым данным — Ивана Бегтина — который считает, что даже если часть открытых государственных данных может быть сфальсифицирована, система является саморегулирующейся. Инструмент контроля заложен в самой открытости, считает Бегтин. Если выявляются некорректные данные, то это неизбежно становится поводом для обсуждения и совершенствования системы. В этом – один из главных смыслов философии open data.

За 2015 год Великобритания занимает второе место в рейтинге открытых правительств Open Data Index (для сравнения — Россия на 61 позиции) и первое место в рейтинге Open Data Barometer (Россия — на 42).