Ученые с помощью Твиттера определили, в каких штатах чаще едят вредную пищу

Ученые Университета Вермонта в США запустили онлайн-сервис Lexicocalorimeter. Он измеряет потребление и расход калорий жителей страны по сообщениям из Twitter и других соцсетей.

Инструмент анализирует десятки миллионов постов с гео-тегами, размещенных в открытом доступе в соцсетях. На их основе система определяет, в каком штате больше едят, а где больше двигаются.

Массив данных разбивается на две категории — «потребление калорий» и «расход калорий» — а затем визуализируется. Так создается карта, на которой цветом обозначены уровни физической активности и потребления калорий.

Lexicocalorimeter собирает определенные слова и выражения, обозначающие еду и виды активности, например, «яблоки», «мороженое», «бекон», «бегаю», «катаюсь на лыжах», «смотрю телевизор» и т.п. Каждому найденному слову присваивается значение в калориях со знаком «плюс» или «минус».

Соответственно, сообщения, содержащие слово «бекон», прибавляют штату калорий, а сообщения типа «вышел на прогулку» убавляют.

Соавтор исследования Питер Доддс говорит: «Этот сервис может стать мощным инструментом в исследовании общественного здоровья. Это вроде спутниковой карты, на которой видно, что едят люди и какими видами спорта занимаются».

Согласно исследованию, в настоящее время «самым здоровым» штатом является Колорадо. Он лидирует по количеству сообщений, в которых упоминаются «бег» и «лапша».

В тройку лидеров по упоминаемости в Колорадо вошли также «прогулка», «лыжи» и «шоколадные конфеты».

Последним штатом в рейтинге калорийности стал Миссисипи. Судя по постам в соцсетях, люди там явно перебирают с тортами и выпечкой, а на первых местах среди активностей упоминаются, помимо бега и танцев, такое занятие как «поесть».

Нью-Джерси по расходованию калорий находится ниже среднеамериканского уровня, потому что оттуда приходит много сообщений на тему «крашу ногти». Очевидно, что такое занятие мало способствует сбросу лишнего веса.

Среди активностей система учитывает довольно необычные занятия, включая охоту на аллигаторов и танцы вокруг шеста.

Карта находится в открытом доступе, но предназначена не столько для тех, кто следит за фигурой, сколько для представителей власти и здравоохранения.

Разработчики «Лексикокалориметра» говорят, что их исследование довольно точно коррелирует с уже имеющимися данными о состоянии здоровья населения в разных штатах. По меньшей мере показания «карты калорийности» сходятся с информацией о распространенности ожирения и диабета. В то же время авторы исследования признают, что данные карты интересны не столько в абсолютных показателях, сколько в сравнительных.

Платформа обработки больших данных, лежащая в основе Lexicocalorimeter, может быть в будущем расширена для других подобных исследований. Сотрудники Университета Вермонта говорят о планах по созданию «Бессонницеметра» для изучения сообщений о сне и бессоннице и «Похмельеметра» – для оценки уровня алкоголизации населения.