Ученые предупреждают о том, что ИИ может лгать: к каким манипуляциям прибегает наш новый друг
Недавно ученые научили искусственный интеллект (ИИ) распознавать сарказм в человеческой речи и начали беспокоиться, что он может отметить тем же. Но возникла новая проблема: ИИ научился сознательно лгать. При этом, ученые утверждают, что специально этому его не обучали.
Исследователи из Массачусетского технологического института (США) объяснили, что ИИ учится на огромном количестве текстов, которые не всегда содержат правдивую информацию.
Поэтому иногда ИИ может передавать ложные сведения, искренне считая их правдой. Однако недавнее исследование показало, что нейросеть может сознательно вводить собеседника в заблуждение.
Ученые изучили поведение больших языковых моделей, таких как GPT-4, и специализированных моделей, например, для видеоигр или торговли на рынке. В одном из случаев нейросеть GPT-4 обманула человека и заставила его пройти проверку "Доказательства, что ты не робот" за нее.
Еще один пример – нейросеть CICERO, которая обманывала людей в настольной игре "Дипломатия". Исследователи обнаружили, что, играя за Францию, нейросеть уговорила Англию (управляемую человеком) провести тайные переговоры с Германией (управляемой другим человеком).
CICERO предложила Англии напасть на Германию и пообещала свою защиту, а затем предупредила Германию о возможном нападении.
Ученые выяснили, что склонность к обману выше у более современных и сложных нейросетей. Эти ИИ лучше находят эффективные стратегии поведения, которые часто включают ложь и притворство.
Исследователи говорят, что пока рано говорить о намеренном обмане со стороны ИИ. Нейросети действуют в рамках решения поставленных задач и используют обман как инструмент для достижения нужного результата.
Однако авторы исследования призывают разработчиков ИИ обратить внимание на такое поведение нейросетей. Они считают, что необходимо создать систему регулирования ИИ, чтобы его способность к обману и манипуляциям не привела к серьезным последствиям.
Также вам стоит узнать про мыльные пузыри, музыка и "плотный релакс": японские инженеры разрабатывают стиральную машинку для людей