Злой или просто хмурый: почему компьютер еще не научили распознавать эмоции

Исследователи выяснили, что роботы вслед за людьми идут по тупиковому пути

100%

Nature Communications

Психологи обнаружили, что люди плохо считывают эмоции по фотографии, а сложные чувства почти невозможно распознать без контекста. Если не умеют люди — не умеют и компьютерные системы. То есть разработчики программ для чтения мимики, которые полагаются лишь на движения лицевых мышц, идут по тупиковому пути, считают исследователи из Массачусетса.

Алгоритмы распознавания лиц применяются с самыми разными целями — от разблокировки смартфона до поиска преступников, следующий шаг для разработчиков программного обеспечения – научить алгоритм понимать человеческую мимику. В настоящий момент технологии позволяют найти лицо конкретного человека среди миллиона фотографий. Теперь же перед специалистами стоит другая задача --научиться определять, что означает выражение лица человека. Тем более видов эмоций существует не так много.

Из этой предпосылки исходят многие современные разработчики. По их мнению, каждой эмоции можно приписать конкретную комбинацию формы губ, прищура глаз, движения щек и других жестов. На первый взгляд это подтверждается лабораторными экспериментами на добровольцах. Правда настоящих чувств от них добиться сложно — приглашенные люди лишь изображают испуг, гнев, страх или удивление. Стереотипные мимические жесты зачастую и ложатся в основу компьютерных алгоритмов.

Теперь американским психологам во главе с Лизой Барретт из Северо-Восточного университета из Бостона удалось выяснить, что такой подход не приведет к большим успехам. В статье в журнале Nature Communication ученые поставили под сомнение исследования мимики, основанные на актерской игре случайных людей. Вместо этого психологи обратились к людям, в чью игру можно поверить — к профессиональным актерам.

Психологическому исследованию для надежности нужна серьезная выборка, но научная организация не смогла себе позволить нанять сотни актеров. Авторы работы решили использовать более 600 снимков фотопроекта, посвященному актерам в образе. Эти портреты показали 839 добровольцам, которые должны были сказать, что чувствует человек на фотографии. Хитрость исследования состояла в том, что части добровольцев объяснили сюжет фотографии, а части показали лишь само изображение без комментариев. Чтобы упростить работу ученых, испытуемые выбирали эмоцию актера на фотографии из 13 доступных вариантов, а не описывали ее своими словами.

Оказалось, что при взгляде на фотографию актера без контекста люди считывают выражение лица совсем иначе, чем если они знают, что на ней происходит. В настоящий момент роботов пытаются научить воспринимать мимику хотя бы на уровне обычного человека. Теперь выясняется, что по фотографии этого не умеют делать и сами люди.

«Результаты нашего исследования входят в прямое противоречие с традиционным подходом к обучению искусственного интеллекта чтению эмоций, – говорит Лиза Барретт. – Многие IT-компании заявляют, что у них есть продукт, который может обнаруживать на фотографии, например, злобу. На самом деле в лучшем случае у них есть детектор хмурого выражения лица, которое может означать, а может и не означать недовольство».

Более того, в ходе исследования добровольцы часто правильно угадывали простые эмоции, типа боли или удивления. Но когда речь заходила о сложных чувствах, вроде стыда или уважения, ответы участников испытания, не знавших контекста снимка, становились почти случайными.

Вместо того, чтобы учить роботов определять эмоции по картинке, опираясь на стереотипном представлении о проявлении чувств, авторы работы предлагают фундаментально иной подход.

Следует смотреть не только на глаза и губы, а на общую ситуацию. Одна и та же улыбка может скрывать смущение, выражать радость или служить издевательством. Таким образом, если ученые хотят действительно создать алгоритм для восприятия эмоций, сначала его придется научить понимать простое человеческое общение, отмечается в исследовании.