Искусственный интеллект научили лучше распознавать эмоции в тексте

Исследователи некоммерческой группы OpenAI из Сан-Франциско научили нейронную сеть LSTM точнее распознавать эмоциональную составляющую текста. Теперь машина почти безошибочно опознает настроение в отзывах покупателей на Amazon и кинорецензиях на Rotten Tomatoes.

Распознавание эмоций в тексте – технология сама по себе не новая. Однако исследование OpenAI отличается высокой точностью анализа.

Предложенная модель намного превосходит существующие методы распознавания настроения текста. Это было доказано при анализе одинаковых отзывов и рецензий из интернета. Программа точно определяет позитивное и негативное содержание текста.

Пример распознавания текста. Слева — позитивные отзывы, справа — негативные. Источник: TechCrunch

Исследователи OpenAI применили в этой работе вид рекуррентной нейронной сети LSTM (Long short-term memory – «Долгая краткосрочная память»). Этот вид нейронной сети хорошо зарекомендовал себя в распознавании написанного текста и человеческой речи. Ей принадлежит рекорд минимума ошибок при распознавании речи – 17,7%.

Проблему машинного определения настроения текста пытались решить давно, еще до эпохи искусственного интеллекта. Применяемые методики обычно заключались в поиске ключевых слов. А это не всегда эффективный метод.

Например, выражение «Надеюсь, ты счастлив» можно отнести к текстам с позитивной коннотацией только потому, что в нем находится слово «счастлив». Но если это выражение поставить в контекст – «Ты убил его. Надеюсь, ты счастлив» – то вывод окажется ошибочным.

Технология искусственного интеллекта позволяет учитывать контекст.

В основу новой модели, предложенной OpenAI, положено исследование 2015 года. Авторы Андрей Карпаты, Джастин Джонсон и Фей-Фей Ли показали, что нейронная сеть LSTM способна интерпретировать такие атрибуты текста, как длина строк и предложений, кавычки, скобки и знаки препинания.

Пока трудно сказать, для чего еще можно применить новую модель, помимо распознавания эмоций в текстах. Как рассказал один из разработчиков в OpenAI Алек Редфорд, при подходе «обучение без учителя» нельзя точно прогнозировать, какие результаты машина будет выдавать в других сферах применения.