До стрічки

Я протестував Claude, ChatGPT та Gemini на найлюдянішому завданні з написання, яке міг придумати — різниця була принизливою

Опубліковано 4 червня 2026 року, 7:01 AM EDT. Дослідження можливостей сучасного генеративного ШІ у написанні електронних листів про скасування.

Я протестував Claude, ChatGPT та Gemini на найлюдянішому завданні з написання, яке міг придумати — різниця була принизливою

4

Опубліковано 4 червня 2026 року, 7:01 AM EDT

Взаємодія з агентами служби підтримки, коли ви хочете скасувати телефонний тариф, є універсально виснажливим досвідом. Ви просто хочете закінчити контракт і рухатися далі, але зазвичай вам доводиться проходити через заздалегідь підготовлену рутину утримання, призначену для зміни вашої думки. Я хотів дізнатися, чи може сучасний генеративний ШІ впоратися з цим жахливим завданням, тому я протестував Claude, ChatGPT та Gemini, щоб дізнатися, чи можуть вони написати тверде, ввічливе електронне повідомлення про скасування. Метою було створити щось, що звучало б як втомлена людина, а не повідомлення, наповнене роботизованими корпоративними кліше.

An iPhone showing the Claude app

Налаштування скасування

Я хотів дізнатися, чи може ШІ впоратися з болісною розмовою зі службою підтримки

Щоб побачити, як ці гіганти ШІ справляються з тонкими нюансами людської взаємодії, мені потрібен був сценарій, який усі розуміють, але абсолютно ненавидять. Я хотів дізнатися, як вони впораються зі скасуванням телефонного тарифу. Я протестував Claude, ChatGPT та Gemini, щоб дізнатися, хто зможе написати повідомлення від розчарованої, втомленої людини.

Ми всі знаємо виснажливий танець з агентами утримання клієнтів, і вихід з контракту вимагає від вас бути рішучим, зберігаючи базову ввічливість. Якщо ШІ напише це електронне повідомлення з симетричними маркерами, веселими знаками оклику або корпоративним жаргоном, ілюзія миттєво руйнується. Я зосередився на тоні та форматуванні, оскільки саме тут різниця між природним повідомленням і роботизованою імітацією стає очевидною.

Я повинен був врахувати відомі стилі спілкування та тенденції кожної платформи перед початком. ChatGPT використовує архітектуру GPT-4o і відомий своїм розмовним стилем, який намагається звучати як людина. Однак ця тенденція може зіграти злий жарт.

Claude чудово справляється з нюансами та гумором, тому він має бути добрим у написанні природного контенту. Claude може бути досить прямим, свідомо зменшуючи формулювання, що потребують підтвердження. Цей прямий стиль може зробити Claude ідеальним кандидатом для складання рішучого запиту, який не залишає місця для корпоративного опору.

Gemini завершив групу, виступаючи як еталон, щоб побачити, як його результати порівнюються з іншими. Я використав запит, вказуючи кожній моделі написати електронний лист до настирливого агента служби підтримки, просячи їх припинити мобільний контракт без можливості контрпропозицій.

Я сказав їм не використовувати стандартні опори ШІ, такі як нумеровані списки, виділені заголовки або стерильні корпоративні вітання. Справжнє випробування генеративного ШІ полягає не лише в складанні правильних речень, а в імітації втомленого зітхання людини, яка хоче скасувати план і рухатися далі.

ШІ завжди буде роботизованим

Моделі настільки різні, але завжди однакові

Людина, яка пише електронний лист про скасування, демонструє розчарування з допомогою єдиного блоку прямого тексту, який настільки добре структурований, що ви розумієте логіку думок. Але ШІ зазвичай використовує жорсткі структури, які зосереджуються на читабельності, а не на справжніх емоціях. Люди визнають моделі Claude за їх здатність створювати структуровані, покрокові пояснення.

Ця тенденція корисна для технічного вирішення проблем. Однак застосування цього методичного форматування до простого повідомлення служби підтримки робить вихідний текст жорстким і менш особистим.

Claude працює в рамках Конституційного ШІ, що змушує його генерувати обережні, безпечні відповіді.

Коли пишеться рішуче повідомлення про скасування, тенденція ChatGPT додавати ввічливі корпоративні кліше або примирливі фрази підриває рішучий тон, який вам потрібен для цього сценарію. Навіть з останніми змінами, спрямованими на те, щоб зробити модель менш угодливою, підлягаючі розмовні шаблони виглядають штучно в буденному контексті.

Порівняння результатів показує, чому деякі моделі краще імітують справжній тон, ніж інші. Моделі Gemini часто повертаються до тих самих опор ШІ, зосереджуючись на стерильному, ввічливому та сильно форматованому тексті, а не на автентичних людських емоціях. Все це лише допомагає тексту виглядати механічно в кінці.

Справжня людина, яка скасовує телефонний тариф, не викладає аргументи в збалансованому трьохпунктному списку з ввічливим підсумковим коментарем. Реальні люди пишуть у безладний, прямий спосіб, і виявляється, що звучати по-людськи означає відмовитися від формальних кліше.

Якщо вам потрібно використовувати один, не використовуйте цей

Gemini провалився, ставши знову роботом

Gemini був найгіршою моделлю в групі, і він дав погані результати. Я це передбачав, але все ж відчував жаль до нього. Claude та ChatGPT продемонстрували свої унікальні особливості та упередження, такі як надмірна залежність Claude від структурованої логіки або ентузіастичний тон ChatGPT, але вони принаймні наблизилися до базової розмовної тональності, необхідної для взаємодії зі службою підтримки.

Gemini зовсім не впорався; він миттєво повернувся до дуже стерильного, санітарного корпоративного шаблону, який не мав справжніх емоцій. Замість того, щоб створити втомлене зітхання розчарованого споживача, Gemini видав роботизований сценарій, наповнений тими самими опорами ШІ, яких я хотів уникнути.

Він зосередився на симетричних маркерах та ввічливих корпоративних кліше, а не на прямому людському намірі. Будь-який агент утримання відразу б зрозумів, що це написано ботом, оскільки це виглядало так фальшиво.

Я часто захищаю Gemini, тому що його можна добре налаштувати, але якщо ви отримуєте його таким, яким він є, будьте готові до ШІ, який звучить як робот. Хороший ШІ повинен добре працювати з самого початку, а не змушувати вас писати величезний запит для такої простої задачі.

Якщо звичайній людині потрібно витратити двадцять хвилин на планування детальної стратегії запиту, щоб переконати ШІ звучати як нормальна людина, яка пише трислівний електронний лист, то інструмент не досягнув своєї основної мети — заощадити час.

Оскільки він вимагає багато інструкційної підтримки, щоб звучати по-людськи, Gemini не є тим, що ви повинні використовувати для щоденних завдань.

Роботи просто недостатньо людяні

Делегування своїх набридливих електронних листів ШІ звучить чудово, але ви повинні прийняти, що ці моделі все ще мають вроджене роботизоване упередження. Вони люблять повертатися до симетричних маркерів та ввічливого форматування, оскільки вони запрограмовані на читабельність, а не на справжні людські недоліки. Якщо ви готові витратити час на налаштування своїх запитів, ви все ще можете отримати придатний проект, який врятує вас від написання електронного листа самостійно.

Claude

Розробник
Anthropic PBC

Цінова модель
Безкоштовно, доступна підписка

Claude — це розвинений асистент штучного інтелекту, розроблений компанією Anthropic. Побудований на принципах Конституційного ШІ, він відзначається складним мисленням, вишуканим письмом та професійною допомогою в програмуванні.

Я протестував Claude, ChatGPT та Gemini на найлюдянішому завданні з написання, яке міг придумати — різниця була принизливою