Contents

Введение

Хотя мы, возможно, не полностью осознаем это, искусственный интеллект становится все ближе к нам. Мы уже упоминали об этом в тексте о генетических алгоритмах, а также есть несколько примеров, показывающих, где в нашей повседневной жизни мы встречаемся с ИИ.

В этой статье мы сосредоточимся на одном аспекте ИИ, а именно на способности генерировать текст с использованием языковой модели.

Мы рассмотрим, как при помощи ИИ работает написание текста и какие преимущества он приносит. Мы также рассмотрим, достаточно ли уже развит ИИ в этой области, чтобы заменить человека, и каковы прогнозы на будущее в плане его развития. И, конечно же, мы проверим, как генерация текста может помочь в контент-маркетинге.

AI generacia teksta

Что такое NLG?

NLG (Natural language generation) это процесс обработки компьютерных данных, результатом которого является получение естественного языка. Чтобы легче понять, как работает NLG, мы можем представить, что это похоже на ситуацию, когда мы стараемся превратить мысли в письмо. Множество факторов способствует тому, что мы создали связное и логичное изложение. Аналогично работают алгоритмы: из огромной базы текстов они выбирают и анализируют на основе схожести наиболее оптимальный набор слов, который затем располагают в лингвистическом порядке (в зависимости от языка контента, который мы хотим получить) .

Вот как это создается NLG:  обучая статистическую модель с помощью машинного обучения, как правило, на огромном количестве текста, доступного из открытых баз в интернете. Решения, позволяющие использовать NLG, набирают все большую популярность, а генерация текста находит применение в различных отраслях, связанных с созданием текстов.  Мы можем выделить несколько моделей, связанных с генерацией текста: модель Megatron, за которую несут ответственность Microsoft и Nvidia, именуемую крупнейшей искусственной сетью нейронов в мире, китайскую модель Wu Dao, а также самую известную на сегодня время модель NLG, т.е. GPT-3 разработанную исследователями компании OpenAI.

Что такое GPT-3 и почему он так популярен?

GPT-3 (Generative Pre-trained Transformer 3) — это языковая модель, созданная OpenAI, соучредителем которой является Илон Маск. Тридцать исследователей в течение года работали над созданием последней версии. Основная задача модели — генерировать текстовый контент, а точнее: цель GPT-3 — предвидеть следующее слово в тексте с сохранением логического хода. Последняя модель, DaVinci, была «обучена» на 570 гигабайтах текста (выбранных исследователями OpenAI из 45 терабайт данных!), что действительно является огромным объемом информации.

В состав  текстов включены данные из коллекции Common Crawl (около 60%), а также миллионы доменов, выбранных OpenAI, таких как Reddit, BBC и Wikipedia. Именно этот огромный объем данных позволяет GPT-3 понимать наш язык. С точки зрения параметров, задействован самый большой движок, который можно использовать, DaVinci, имеет целых 175 миллиардов соединений нейронной сети (предыдущая модель, GPT-2, имела 1,5 миллиарда таких соединений), что позволяет модели распознавать текстовый контекст и лучше понять наши запросы.

generowanie tekstu przyklad 1

Какие модели использует GPT-3?

Двигатели или иначе модели GPT-3 могут генерировать и понимать естественный язык. В настоящее время доступны четыре двигателя: DaVinci, Curie, Babbage и Ada. Двигатели различаются по уровню развития и мощности, а значит, их можно использовать для разных задач. DaVinci является наиболее проработанным и дает наилучшие результаты при работе с текстом, но Ada является самым быстрым и требует меньших затрат, чем другие движки. Все зависит от того, для каких целей мы хотим использовать модели, предлагаемые OpenAI.

«Обучение» и самосовершенствование GPT-3

GPT-3 — это авторегрессионная модель, поэтому она может самосовершенствоваться с помощью статистического прогнозирования. Также стоит добавить, что процесс «обучения», т.е. анализа данных на основе статистической схожести, OpenAI не контролировал. Поэтому компания не ввела никаких фильтров, которые как-то ограничивали бы или направляли обучение через алгоритмы. У этого решения есть свои преимущества (модель учится понимать мир как человек) и недостатки (большая часть контента, доступного в Интернете, вредна и не будет способствовать развитию модели), но помните, что в конечном итоге все зависит от нам, как мы будем использовать возможность генерации текстов.

Каковы возможности GPT-3?

В основном речь идет о создании всего, что имеет лингвистическую структуру. В настоящее время модель лучше всего работает с английским языком, но вполне вероятно, что в будущем пользователи других языков смогут более свободно пользоваться преимуществами OpenAI. Таким образом, GPT-3 может отвечать на вопросы, обобщать более длинные тексты, писать статьи на любые темы, посты в блогах и даже стихи. Более того: он может даже создавать компьютерный код, необходимый для написания приложения или веб-сайта, или генерировать аккорды и мелодии в песне. Все, что вам нужно сделать, это ввести команду в окно, а алгоритмы сделают все остальное за вас.

Каково качество эффектов GPT-3? Как сказал сам президент OpenAI Сэм Альтман: «Шумиха вокруг GPT-3 слишком велика. ИИ изменит мир, но GPT-3 — это всего лишь тизер». Поэтому генерация текста с помощью технологии OpenAI сегодня впечатляет, ведь благодаря GPT-3 мы реально можем написать статью, которая мало чем будет отличаться от текста, созданного публицистом или журналистом (так было, когда Guardian опубликовала статью, полностью написанную с использованием GPT-3 , редакция которой ничем не отличалась от редактирования текста редактора). Помните, однако, что возможности, предлагаемые GPT-3, по-прежнему требуют контроля со стороны человека.

AI coding scaled

Ilya Pavlov, Unsplash.com

Может ли GPT-3 заменить человека?

Ну а пока журналисты, копирайтеры, писатели или программисты могут спать спокойно: GPT-3 еще недостаточно продвинутая технология, чтобы заменить всех тех, кто работает с текстом в одночасье. Конечно, все мы знаем, как быстро идет прогресс в этой области, и мы знаем такие ситуации, когда Microsoft увольняет большую группу сотрудников (50 человек в США и около 30 человек в Великобритании), ответственных за отдел новостей. , и доверили свои задачи искусственному интеллекту. Но даже в этом случае кто-то постоянно следил за последствиями работы ИИ. Без такого контроля по-прежнему невозможно эффективно использовать возможность генерации текстов.

Будущее покажет, будут ли машины писать тексты и полностью возьмут на себя роль журналистов или копирайтеров. Одно можно сказать наверняка: искусственный интеллект определенно изменит еще больше (потому что он постоянно меняется) мир, который мы знаем сегодня. Возьмем, к примеру, языковые модели. GPT-3 уже умеет делать потрясающе много, а такие модели, как Megatron разработки Microsoft и Nvidia с 530 миллиардами параметров (для сравнения, у GPT-3 175 миллиардов параметров) или китайский Wu Dao 2.0, созданный под руководством  Пекинской академии искусственного интеллекта с невообразимым количеством 1,75 трлн параметров! К сожалению, ни одна из этих моделей не может заменить полностью работу человека в данный момент, но есть все признаки того, что будущее за искусственным интеллектом.

Повлияет ли GPT-3 на SEO и контент-маркетинг?

Как обычно, когда речь заходит о будущем, сложно дать однозначный ответ. Однако трудно поверить, что генерация текста в ближайшем будущем не коснется сферы контент-маркетинга. Следующий год может показать направление движения рынка, но нет сомнений, что такие инструменты, как GPT-3 или DALL·E (еще одна модель OpenAI, которая создает фотографии с использованием текстовых описаний), будут учитываться, когда речь идет о развитии отрасли.

Вполне возможно, что в ближайшие годы генерация контента, соответствующего принципам семантического SEO, станет нормой и никого это не удивит. Однако сегодня, когда мы только вступаем в эру искусственного интеллекта, это не совсем очевидно.

Однако со временем использование GPT-3 и других языковых моделей в различных отраслях станет более распространенным, и только тогда можно будет оценить, насколько новые технологии изменили работу с текстом и весь мир контент-маркетинга. Именно поэтому сегодня стоит обеспечить доступ к новейшим языковым моделям, чтобы не проспать, когда начнется революция. Мы уже можем использовать возможности GPT-3 в CONTADU. Ниже мы представим, как мы можем быстро создать текст, который затем можно использовать в стратегии контент-маркетинга.

Создание текста с использованием GPT-3 в CONTADU

Прежде всего, следует отметить, что метод генерации текстов все еще является экспериментальным. Что это означает? Например, он далек от совершенства: даже если текст выглядит грамматически правильным, он может содержать неточности, логические или фактические ошибки. Мы, пользователи, должны решить, удовлетворит ли нас полученный текст. Для этого нужны соответствующие подсказки, которые позволят GPT-3 наилучшим образом оправдать наши ожидания.

CONTADU уже работает над созданием черновика, с помощью которых запросы пользователя будет легче передать генератору текстов. Также планируется работа над возможностью автоматизации редакции генерируемых текстов, чтобы в конечном итоге только окончательно сосредоточиться на SEO-оптимизации. И давайте также помнить, что OpenAI вводит ограничения на объем генерируемого контента, чтобы убедиться, что каждый текст по-прежнему создается с участием человека. Давайте попробуем сгенерировать текст!

Краткое руководство по созданию текста в CONTADU

Начнем с ассистента генератора текста, который можно найти в модуле Content Writer. Затем в окне введите текстовый фрагмент, на основе которого алгоритмы сформируют следующую часть текста.

01 przykladowy tekst

Однако в CONTADU, благодаря продвинутому машинному переводу, мы можем генерировать тексты более чем на 120 языках, включая русский. Поэтому мы можем создавать контент на русском языке. Попробуем это сделать и посмотрим, какой будет результат.

02 jak wygenerować

По клику алгоритмы подготавливают текст, который мы можем добавить в нашу статью. В этом примере нам удалось получить следующий отрывок:

03 wygenerowany tekst

Теперь, когда текст сгенерирован, мы можем либо добавить его в нашу статью (нажав на зеленую кнопку «Use text» — Использовать текст), либо, если это не то, что мы хотели увидеть, мы можем попробовать еще раз. Предположим, что текст нам понравился, поэтому добавим его в наш черновик. Мы также можем внести изменения (например, заменить слово «дни» на «месяцы»).

Теперь попробуем расширить текстовый фрагмент. Например, мы хотим добавить несколько преимуществ использования искусственного интеллекта в контент-маркетинге:

04 drugi tekst

Итак, мы выделяем текст, выбираем опцию «[All] Expand»…

05 opcja

 и мы формируем остальную часть списка.

06 expand rezultat

Также стоит обратить внимание на «температуру» генерируемого текста. Мы можем установить его, когда нажимаем на термометр при создании или расширении текста. Чем ниже температура, тем лучше текст, но он также намного короче и менее уникален. Если температура выше, то текст также длиннее и уникальнее, но может содержать больше неточностей. Так что от нас зависит, какой текст мы хотим получить.

07 temperatura

После создания текста с помощью ассистента генерации текстов мы должны оптимизировать его в соответствии с правилами SEO, чтобы текст мог получить отличные результаты в Google. В модуле Content Writer с этим проблем быть не должно.

Ну, это все, что нам нужно знать о генерации текста на данный момент. Если вы хотите создавать отраслевые статьи, сообщения в блогах или описания продуктов для интернет-магазина с помощью GPT-3, мы приглашаем вас протестировать это в CONTADU.