Почему мы переоцениваем уверенность ИИ? Результаты нового исследования

Пользователи цифровых помощников и чат-ботов часто полагаются на их советы при выборе товаров, поиске информации или планировании контента, но новое исследование психологов из Университета Ватерлоо и Университетского колледжа Лондона показало, что люди систематически преувеличивают уверенность таких систем в собственных ответах. Исследователи проводили эксперименты с участием добровольцев, которые сравнивали ответы человека и искусственного интеллекта на одни и те же вопросы: даже когда тексты ответов полностью совпадали, участники приписывали больше уверенности машинному алгоритму. Результаты работы опубликованы в профильном психологическом журнале, а авторы проекта подчеркивают, что такая ошибка восприятия может приводить к неоправданно высокому доверию к рекомендациям, которые на деле могут содержать неточности.

 

Почему люди доверяют советам чат-ботов

При общении с другими людьми мы привыкли ориентироваться не только на содержание совета, но и на то, насколько уверен в нем собеседник. Человек может сказать, что сомневается, или, напротив, уверенно отстаивать свою точку зрения — эти сигналы помогают нам решить, стоит ли следовать рекомендации. С чат-ботами ситуация иная: большинство современных систем, включая популярные голосовые помощники и текстовые чаты, не сообщают о степени своей уверенности в ответе.

Человек доверяет ответу искусственного интеллекта

Пользователи часто обращаются к алгоритмам за советом по покупке техники или выбору фильма, не осознавая, что система может выдавать вероятностный результат. Исследователи отмечают, что люди склонны переносить привычки общения с людьми на взаимодействие с машинами, пытаясь угадать уверенность алгоритма по косвенным признакам.

 

Как проходило исследование уверенности

Команда психологов под руководством Клары Коломбатто разработала эксперимент, в ходе которого добровольцы наблюдали за тем, как человек или искусственный интеллект принимают решения, а затем оценивали, насколько, по их мнению, агент уверен в выборе. Участникам не сообщали заранее, кто делает выбор — живой человек или алгоритм, и не давали подсказок о степени уверенности агента.

Анализ собранных данных показал, что на оценку уверенности влияют несколько факторов. Их список включает в себя ключевые признаки, по которым пользователи судят о надежности ответа:

  • быстрое время формирования ответа системой;
  • простота задачи для алгоритма или человека;
  • убежденность пользователя в превосходстве машины над человеком.

Последний пункт оказался особенно значимым: даже если у пользователя не было доказательств того, что искусственный интеллект точнее человека, он все равно приписывал алгоритму более высокую уверенность.

 

Ошибочные оценки возможностей алгоритмов

Участники эксперимента часто исходили из собственных установок о том, насколько хорошо искусственный интеллект справляется с той или иной задачей, а не из реальной точности ответов. Если доброволец считал, что алгоритм лучше подходит для решения математических задач, он приписывал ему больше уверенности в ответе на пример, даже если ответ был неверным.

Результаты экспериментов подтвердили, что пользователи часто полагаются на ложные установки, считая искусственный интеллект заведомо более точным, что создает опасную иллюзию уверенности в ответах системы, даже когда она допускает ошибки. Авторы работы назвали это явление «иллюзией уверенности»: пользователь видит ответ, который кажется ему правильным, и автоматически наделяет алгоритм высокой степенью уверенности, хотя система может выдавать результат наугад.

 

Отличия общения с людьми и машинами

При взаимодействии с живыми людьми мы считываем десятки невербальных сигналов, которые помогают оценить уверенность собеседника. Эти сигналы отсутствуют у большинства современных цифровых систем, что заставляет пользователей опираться на другие, менее надежные признаки.

Основные невербальные маркеры, которые люди используют при общении с себе подобными, включают:

  1. интонацию и громкость голоса говорящего;
  2. мимику и жесты человека;
  3. позу и темп речи собеседника.

Чат-боты, у которых нет физического тела или живого голоса, не могут передавать эти сигналы. Даже системы с синтезированной речью часто имеют монотонный голос, который не позволяет понять, сомневается ли алгоритм в ответе.

 

Как улучшить доверие к системам

Авторы исследования подчеркивают, что разработчикам стоит внедрять в алгоритмы функции прямого сообщения степени уверенности. Это может быть текстовая пометка, звуковой сигнал или шкала, которая показывает, насколько система уверена в результате.

«Если алгоритм не сообщает напрямую, насколько он уверен в ответе, пользователь достраивает эту уверенность самостоятельно. Это приводит к избыточному доверию к рекомендациям, даже когда система допускает ошибки или не уверена в результате», — поясняют авторы исследования.

Сейчас команда Коломбатто планирует новые эксперименты, которые помогут понять, какие способы передачи уверенности будут наиболее понятными и прозрачными для пользователей. Исследователи хотят найти баланс между информативностью и отсутствием перегрузки интерфейса лишними данными.

Ошибка восприятия уверенности искусственного интеллекта может приводить к серьезным последствиям: люди могут следовать неверным медицинским или финансовым советам, полагая, что система уверена в их правильности. Внедрение прозрачных маркеров уверенности в работу алгоритмов поможет снизить риски, связанные с избыточным доверием к машинам. Любой ответ чат-бота — это вероятностный результат, и уверенность, которую пользователь приписывает системе, часто не имеет под собой реальных оснований.

Добавить комментарий: