Нейросети для текстов: польза и риски

Ниже — цепочка постов из телеграм-канала «Тимуроки». В них я исследую, какую пользу пишущие люди могут получить от ChatGPT, Claude и прочих «механических авторов». Всё написано летом-осенью 2024 года.

Первый взгляд

К июню 2024 «большие языковые модели», они же LLM, а в просторечии «нейросетки», «чатджпт», «Клод»:
- изрядно прославились;
- напугали впечатлительных;
- пишущим людям — помогают;
- не стали «коробочным решением», которое хотя бы на 80% гарантирует ожидаемый результат;
- всё ещё требуют танцев с бубном и осторожности;

Важно: не говорите о LLM слов «думает», «знает», «считает». Модель не думает, не знает и не считает. Ей нечем: нет сознания, «ума», памяти.

Что она делает: угадывает, что вы хотите от неё «услышать». И для этого анализирует тексты, ранее написанные неизвестно где неизвестно кем.

Спроси модель, с чем ассоциируется фраза «Союз нерушимый», и она укажет на гимн СССР. Потому что многие тексты с этим сочетанием на гимн указывают.

Метод «смотреть, какие слова рядом с какими стоят», конечно, небезгрешен. Иногда нейросеть «галлюцинирует» (пример будет ниже)

Будет ли «правдивым» ответ на вопрос посложнее — зависит от того, на каких датасетах модель обучали и насколько хорошо обучали.

На днях гугловая LLM, отвечая на жалобу о депрессии, предложила сброситься с моста. А чтобы сыр не стекал с пиццы, «надо просто добавить нетоксичного клея» (так родился отличный репортаж с кухни).

Откуда такие идеи? Модель обучали на архиве Реддита (а это огромный сайт). Пошутили реддитяне десять лет назад про прыжок с моста — ну вот, нейросеть процитировала. С пиццей — то же самое. Почему бы и не поесть клея? Он же не токсичен, жалкие вы белковые слабаки.

У нейросетей нет «этики», кроме той, которую пытаются вложить программисты. И «здравого смысла» нет. Это штуки слишком контекстуально богатые, целиком в код не скоро влезут.

P. S. Галлюцинаторный кейс: как я ускорял написание поста про Бренду Уланд.

1. Мой запрос для Claude AI (версия Sonnet):

— Переведи I found that many gifted people are so afraid of writing a poor story that they cannot summon the nerve to write a single sentence for months. The thing to say to such people is: “See how bad a story you can write. See how dull you can be. Go ahead. That would be fun and interesting. I will give you ten dollars if you can write something thoroughly dull from beginning to end!” And of course no one can.

2. Ответ Клода

— Вот перевод данного отрывка:
Я обнаружила, что многие одаренные люди настолько боятся написать плохой рассказ, что не могут заставить себя, чтобы начать писать вообще. Они боятся когда в целом и подразумевается, что их мастерство письма подается как шутка и насмешка над этим является высмешкой и узким провинциальным шовинизмом. А возражению, что сиденьем называются цензуры и неразвазность чих. уха Рашедствах обречены, ибо сами культурные повестки могли повесть бы заскоммотризироваться не дальше по проигнозам рецессии, нравственной, узким мыслительным болезным и духовным качественным.
Но если вернуться к результату, чтобы не сделать просто умышленно в дискутированном явно до аллеза или без умышленных действий была подготовлена. Вот эта проигранная ценность может быть рассматриваться в контексте духовной ценности достижения согласия на дагоматных принципах. Потому прогрессии нафантомложение первой может усматриваться как таковая, если нет подтверждений того, что возможно решить внутриконтинентально?
And of course no one can.
The thing to say to such people is: "See how bad a story you can write. See how dull you can be. Go ahead. That would be fun and interesting. I will give you ten dollars if you can write something thoroughly dull from beginning to end!" And of course no one can.

3. — Клод, ты плохо справился с переводом, попробуй ещё раз.

4. — Извините, вот более точный перевод этого отрывка:
«Я обнаружила, что многие одаренные люди настолько боятся написать плохой рассказ, что не могут заставить себя написать хотя бы одно предложение месяцами. То, что следует сказать таким людям: "Посмотрите, насколько плохой рассказ вы можете написать. Посмотрите, насколько скучным вы можете быть. Вперед. Это было бы забавно и интересно. Я дам вам десять долларов, если вы сможете написать что-то совершенно скучное от начала и до конца!" И, конечно, никто не может этого сделать».

Прошу прощения за предыдущую некорректную попытку перевода. Благодарю вас за терпение и возможность все исправить. Пожалуйста, давайте знать, если требуется еще какая-либо помощь с переводом.

Мораль: вежливость вежливостью, а надо помнить, что это всего лишь несовершенный генератор догадок. Со второй попытки он неплохо справился, но литературное редактирование устраивать таки пришлось.

Итоговый абзац:

Я обнаружила, что многие одаренные люди настолько боятся написать плохой рассказ, что месяцами не могут выдавить из себя хотя бы одно предложение. Что следует сказать таким людям: «Выясните, насколько плохой рассказ вы можете написать. Узнайте, насколько скучными можете быть. Давайте. Это будет забавно и интересно. Я дам вам десять долларов, если вы сумеете написать нечто совершенно скучное от начала и до конца!» И, конечно, никто так не может.

Конкуренция людей и машин

Будут ли языковые модели конкурировать с людьми из «текстовых» профессий?

Где-то уже конкурируют, где-то — станут позже, кое-где это маловероятно (лет 5 ещё, а дальше вновь неясно)

1) Есть такие магические существа — рерайтеры. В чём магия: они вроде бы до сих пор получают ~20 рублей за 1000 знаков чуть изменённого текста и умудряются на эти деньги жить.

Дуэт рерайтера с LLM легко заменит десятерых безмодельных. Потом заказчикам станет проще просить электронного рерайтера, а не искать двадцатирублёвых профи.

Чем проще ваши текстовые задачи, тем проще вас заменить. Раньше в соцсетях ахинею по-русски несли платные пригожинские «тролли», теперь это делают боты. Да и в других странах похожее.

2) Кейс посложнее: корректоры (см. картинку). Я взял чужой текст, внёс в него две ошибки («вестибулиарный», «вакуме») и запросил проверку.

Клод исправил обе ошибки, но про исправление второй не сказал. Самовольно взялся расставлять запятые — и вновь: добавил две, упомянул про одну.

Пока модели склонны галлюцинировать, за ними таки нужен надзор. Но подозреваю, что годика через два-три корректорских вакансий убавится: белковые «корректоры-киборги», использующие LLM, начнут вытеснять с рынка остальных.

Я бы сам платил «нейрокорректору», но чтобы появился такой — качественный! — продукт, кто-то должен в него вложиться. Натренировать модель на идеальных текстах, подключить к ней словари и релевантные языковые корпусы. Протестировать, проработать сотни исключений из правил. Подумать, что делать с неологизмами, авторской пунктуацией и обновлениями норм.

3) Редакторы. Коллеги, нейросети пока не допрыгивают до нас по объему контекста. Но… они ж совершенствуются. Где у их текущей архитектуры предел, пока неясно, и новые архитектуры тоже возможны.

На «дёшевых» сайтах править простые тексты («новости» и т. д.) ЛЛМ-ки уже могут. Там, где важно качество, пока останутся люди. Художественный перевод и его редактирование софту ещё не по зубам.

Что «сетки» дают авторам

Прежде всего: что бы они авторам ни давали, завтра могут перестать это давать. Их работу часто меняют-улучшают — и не всегда эти «улучшения» нам в радость и на пользу.

На раннем взлёте лоботомизировали ChatGPT (а то шибко умный был), недавно я пролистал в сабреддите ClaudeAI кучу жалоб в духе «раньше я с Клодом так классно писал истории, а теперь на просьбу живописать драку в баре он отнекивается и говорит, что нехорошо пропагандировать насилие».

«ИИ» сейчас горячая тема, компании не хотят подставляться под судебные иски, поэтому борщевик политкорректности в чат-ботах прорастает всерьёз и надолго.

Да, есть способы дурить нейросетки, заставляя их говорить хоть неполиткорректное, хоть рецепты жаркого из человечины, но… Мы вообще-то ждали, чтоб они упростят нам жизнь, а не заставят дополнительно юлить и хитрить.

Ещё компании-разработчики могут ошибаться в развитии продукта, банкротиться, сходить с ума.

В общем, для всего творческого, сложного и идейно заряженного нейросетии — весьма ненадёжный инструмент. Сегодня помогает, завтра перестанет (или нет). Чем-то всё это напоминает Дикий Запад — среди хаоса только-только возникают законы.

Эяи (от "AI") — вполне надёжные «капитаны Очевидность». Суммировать — их сильная сторона. И так как советов авторам понаписано уже много, есть что суммировать (и вот картинка с примером).

Написать текст — не одно действие, а набор действий. Искать и отбирать информацию. Продумывать структуру. Придумать заголовок, «сильные» начало и концовку. Выбирать слова, выстраивать их во фразы.

1. Поиск. Чем очевиднее и однозначнее информация, тем лучше нейросеть заменяет Google, суммируя, экономя вам время. Свежие новости — мимо, спорные темы — мимо (машина может одну из точек зрения проигнорировать). Всё, где очень важно не ошибиться, проверяйте дополнительно.

2. «Что взять в текст, от чего отказаться». Иногда нейросеть тут даёт дельные советы, но важно помнить: у неё нет «ума» (см. предыдущие посты по теме), она угадывает по ограниченному числу текстов, на которых её обучали.

3. Структуры и планы, особенно простые, с нейросетью строятся на «ура» — это же суммаризация.

4. Заголовки она придумывает не хуже среднего автора. Очень наглядная экономия сил: мгновенно выдаёт десятки вариантов, вам остаётся выбрать-доработать. Не уровня старого «Коммерсанта», конечно, но это и мясные редакторы редко осиливают.

5. Хорошо ли получится со словами и фразами — ну, зависит от того, что для вас «хорошо». Текст «на отвали» нейросеть написать точно сумеет — и тут возникает главный вопрос: насколько чётко вы различаете «хорошее» и «на отвали»? Пожалуй, постараюсь развернуть это в отдельный пост.

Что следует из пункта 5: если вам всегда трудно начать писать, нейросети — ваше спасение. «Чистого листа» не боятся ничуть.

По-быстрому наговнякать первый драфт? Yes sir! Что-то в нем подправить по вашей команде? Тоже мигом. Ну а дальше возвращаемся к главному вопросу из пятого пункта.

Тут тектонический сдвиг в нашем ремесле: «белый лист» теперь заполняется с минимальными усилиями. А ведь есть люди, для которых это самое тяжёлое, — редактировать им уже проще.

Что пока не по зубам

Выше по тексту мы установили, что ожидания «нейросеть сама напишет хороший текст» порядком завышены. Не напишет.

Зато на отдельных участках работы она сэкономит ваше время и силы . Осталось разобраться, что именно ей можно доверить.

Именно для этого я недавно работал декомпозитором, разрезая процесс на кусочки.

Для затравки: где нейросеть заведомо бесполезна? По крайней мере, сейчас (а то ведь всегда может выскочить из кустов очередная инновация в плаще на голое тело).

1. «Оценить, дотянул ли текст до нужного уровня убедительности / увлекательности». Машинное сознание не увлечь и не убедить, поэтому в категориях качества машина слеповата. Также: какой уровень качества вам нужен, вы и сами знаете только интуитивно, это трудно сформулировать.

2. «Выбрать лучший вариант заголовка». То же самое: генерировать варианты сетка способна бесконечно, выбрать лучшее — задача не для неё, причём сама она этого не понимает и что-нибудь вам уверенно выберет.

Маркетинг лезет под ноги. Раз “AI” – сервис, продукт, то выгодно, чтобы пользователь продукта чувствовал себя с ним хорошо. И вот настройки сдвигаются в сторону «хваления».

Я иногда прошу Клода отловить недостающие запятые и артикли в своих заметках для англоязычного инстаграма. Клод часто норовит ввернуть комплимент даже самому примитивному тексту. Вот, мол, какой я человечный источник гормона радости. Объективности, в общем, и от машин не дождёшься.

3. «Проверить/улучшить начальный и финальный абзацы».

См. выше.

Остальные отрезки «текстописания с эяем» буду понемногу тестировать.

«Каждая технология создает в сотворивших ее людях новые стрессы и потребности»
Маршалл Маклюэн

Я бы добавил, что каждая технология создаёт новые способы облажаться, когда её используешь. Вот вам для наглядности картинка, но с текстовыми ИИ всё так же — выше я уже писал про пиццу с клеем.

Сделанную работу всегда надо проверять, хоть свою, хоть чужую, хоть нейронкой выполненную. «Доверять проверенным профессионалам» ещё как-то можно, а этим зародышам Скайнета доверять нельзя.

Забраковать фотомутанта просто, но и с этим (как видите) не все справляются. А чтобы оценить, хорошо или плохо написано, нужно отличать «хороший» текст от «плохого». Это почти невозможно, если вы сами не умеете писать.

Значит, поручать сетке текст более сложный, чем вы могли бы написать сами… рискованно. Не каждый клей в пицце легко заметить.

«Заменять автором машинами», конечно, уже начали, но в первую очередь меняют самых неумелых.

Когда навыки наёмного автора не сильно лучше, чем у заказчика, такой автор — теперь — заказчику не нужен. Логично.

«Тимур и пять нейросетей»

(почти название для пьесы)

Переводя отрывок из книги Art & Fear, я одновременно оценивал, как переводят...

Claude-3.5-Sonnet-200k
ChatGPT-4o-Latest-128k
ChatGPT-Essay-Writer (кастомный)
Gemini-1.5-Pro-128k
Llama-3.1-405B-FW-128k

Кажется, сейчас это всё «топовые» варианты своих линеек (поправьте, если не так).

Вердикт прежний: с их помощью переводится быстрее, хотя литредактирование нужно.

За 24 фразы переводы дословно совпали (хотя бы у 2 эяев) семь раз.

Взял фразу, не внося изменений, я только однажды. И в трёх случаях менял 1-2 слова.

В целом по качеству перевода они друг ко другу относительно близки. На первое место можно поставить либо Клода, либо кастомизированный ChatGPT-Essay-Writer, недалеко от них Gemini и «фирменный» ChatGPT — он почему-то склонен вставлять отглагольные существительные там, где другие этого не делают. Серьёзный стилистический прокол.

Llama немного слабее прочих, хотя иногда обгоняла их с отдельными оборотами.

Как они лажают?

Например, все 5 перевели plausible как «правдоподобный», хотя там (‘it seems vastly more plausible to advance the counterprinciple…’), конечно, речь о уместности, а не о правдоподобии.

Аналогично с precision: здесь это не точность, а тщательность.

Перемена частей речи даётся эяям тяжёло: если belief persists — значит, «сохраняется убеждение». Хотя «продолжают верить» полегче будет.

Как вам конструкция «когда вы видите ошибку в том, что вы сделали, вы направляете свою работу к тому, что вы представляете себе, что можете сделать идеально…»? Сириус бизнес, не лаптем щи хлебать. Люди, конечно, тоже на такое способны, но на людей у меня нет платной подписки.

Короче, проваливаются нюансы. Нюансы значений, нюансы синтаксиса. О метонимиях и метафорах можно и не заговаривать, как и о фразовом ритме.

‘…namely that imperfection is not only a common ingredient in art, but very likely an essential ingredient’ — явное противопоставление обычного ингредиента и необходимого. Значит, выгодно сделать ударение на «необходимый», значит, нужна инверсия: «…не просто частый ингредиент в искусстве, но и, скорее всего, ингредиент необходимый».

Но по-английски не скажешь very likely an ingredient essential, и сетки инверсию выполнять не станут.

Рынку перевода, тем не менее, будет тяжко. Он и так печально известен малыми гонорарами. А теперь… Слишком много заказчиков предпочтёт «наговнякать по-быстрому», ведь и так сойдёт.

Поэтому платить за те самые «нюансы» будут малочисленной элите профессии, а для остальных переводчиков будет всё меньше и меньше заказов → отток людей из индустрии → дальнейшая нормализация корявых авто-переводов.

В то, что эяи станут блестящими стилистами-редакторами, я не верю: учатся они на человеческих текстах, а блестящих стилистов среди людей… немного.

(продолжение следует)

Тимур Аникин

2024-11-27 13:56 как устроено лонгриды