Большие данные помогли найти переломные точки в истории Великобритании

В каком году электричество победило паровые двигатели? Когда футбол заменил крикет как самый популярный вид спорта? И в какое время женщины начинают чаще упоминаться в британской прессе, чем мужчины?

Команда исследователей из Бристольского университета использовала алгоритмы искусственного интеллекта, чтобы проанализировать статьи из 100 британских региональных газет за период с 1800 по 1950 год. Ученые сотрудничали с компанией Find My Past, которая оцифровала газеты из Британской библиотеки в рамках проекта «Архив британских газет» (British Newspaper archive).

Алгоритм проанализировал 28,6 миллиарда слов из более 35 миллионов статей. Ученые хотели понять, можно ли обнаружить исторические и культурные изменения страны на основе анализа содержания местной периодики. Историки традиционно обращаются к газетам при изучении того или иного периода, теперь за них это сделала машина.

Результаты говорят, что такой анализ может показывать социальные и политические настроения разных времен. Например, до 1930-х годов либералы упоминались в газетах чаще, чем консерваторы. Но в 1924 году либералы не набрали большинство в парламенте, и Лейбористская партия стала основным соперником консерваторов.

Источник изображения: http://thinkbig.enm.bris.ac.uk

 

Кроме того, исследователи обнаружили, что 1898 год был точкой перелома: электричество стало популярнее паровых двигателей. А 1902 можно обозначить как год, когда на поездах стали ездить чаще, чем на лошадях. В 1909 году футбол стал заметнее, чем крикет.

Упоминания о радио достигали пика в военные времена, в частности, в годы Второй мировой войны. Телевидение упоминалось все чаще и чаще к концу исследуемого периода, то есть к 1950 году.

В течение всего 150-летнего отрезка мужчины упоминаются в местной прессе чаще, чем женщины. Однако ученые установили, что присутствие женщин в газетах постепенно увеличивается после 1900 года. Правда, не удалось связать это ни с каким инцидентом.

Хотя исследование показало, что анализ больших данных состоять на службе у историков, авторы работы подчеркивают, что: «практика внимательного ознакомления с текстами не может быть заменена алгоритмами». «Что не может быть автоматизировано — так это понимание последствий выводов такого исследования для людей. Эта та часть работы, которая всегда будет прерогативой социальных и гуманитарных наук», говорит Том Лэнсдалл-Уэлфэ (Tom Lansdall-Welfare), научный сотрудник, который возглавлял вычислительную часть исследования.

Работа была опубликована в рамках проекта ThinkBIG, который направлен на изучение взаимосвязи между социальными и гуманитарными науками с анализом больших данных.