Стоит ли говорить нейросетям «пожалуйста» и «спасибо»? Этот вопрос давно вызывает споры среди пользователей ИИ. Одни считают, что хорошие манеры помогают получать более качественные ответы, другие уверены, что алгоритмам безразличен тон общения. Исследователи из Делийского технологического университета решили проверить это экспериментально и проанализировали 22 500 диалогов с несколькими популярными языковыми моделями.
В исследовании участвовали GPT-4o Mini, Claude 3.7 Sonnet, Gemini Pro, DeepSeek и Llama 3. Учёные тестировали модели на английском, испанском и хинди, сравнивая ответы при разных стилях общения - от подчеркнуто вежливого до откровенно грубого.
Универсального рецепта не существует
Главный вывод исследования оказался неожиданным для сторонников теории «волшебного пожалуйста». Авторы не обнаружили единого уровня вежливости, который одинаково улучшал бы ответы всех моделей.
Для английского языка лучшие результаты часто показывали прямые и понятные запросы без лишних вежливых оборотов. Для испанского языка хорошо работали более настойчивые формулировки. А вот при общении на хинди модели чаще демонстрировали лучшие результаты в ответ на уважительный и косвенный стиль общения.
По мнению исследователей, дело может быть в культурных особенностях языков и данных, на которых обучались нейросети. Иными словами, модели реагируют не столько на слово «пожалуйста», сколько на привычные для конкретного языка нормы коммуникации.
История диалога оказалась важнее отдельных слов
Самый интересный результат связан не с конкретными запросами, а с общей атмосферой общения.
Выяснилось, что модели нередко давали более качественные ответы после серии вежливых сообщений. В некоторых сценариях показатели качества оказывались примерно на 11 процентов выше по сравнению с диалогами, где использовался грубый или агрессивный тон.
При этом исследователи заметили любопытную закономерность. Если разговор начинался резко и конфликтно, последующий переход к вежливому стилю не всегда позволял полностью восстановить качество ответов.
Авторы предполагают, что модели учитывают накопленный контекст беседы и продолжают ориентироваться на характер предыдущих сообщений.
Одни модели реагируют сильнее других
Наиболее чувствительной к изменениям тона общения оказалась Llama 3. Для неё разница между лучшими и худшими сценариями превышала 11 процентов.
GPT-4o Mini, напротив, показала большую устойчивость. Эта модель заметно слабее реагировала на изменения уровня вежливости и сохраняла относительно стабильное качество ответов независимо от стиля общения пользователя.
По словам авторов работы, такие различия могут быть связаны с особенностями обучения и внутренней архитектурой моделей.
У исследования есть важное ограничение
Результаты стоит трактовать осторожно. Качество ответов оценивали не живые пользователи, а система автоматических метрик. Алгоритмы анализировали связность текста, его глубину, релевантность, читаемость, естественность и другие характеристики.
Поэтому работа не доказывает, что люди обязательно сочтут более вежливые ответы лучшими. Скорее исследование показывает, что при определённых условиях сами модели генерируют тексты с более высокими формальными показателями качества.
Что это значит для пользователей
Исследование не подтверждает популярный миф о том, что нейросетям обязательно нужно говорить «спасибо» и «пожалуйста». Однако оно показывает, что стиль общения действительно способен влиять на результат.
При этом гораздо важнее оказывается не отдельное вежливое слово, а общий характер диалога. Спокойный, последовательный и понятный стиль общения помогает моделям лучше использовать контекст беседы и формировать более качественные ответы.
Так что хорошие манеры при разговоре с ИИ могут оказаться полезны. Но не потому, что нейросеть обижается на грубость, а потому, что качество общения часто влияет на качество результата.
