В этой статье мы обсудим технические вопросы, связанные с возможностями генетических алгоритмов в сочетании с семантическими моделями и статистикой. Мы покажем вам, как вы можете использовать генетический алгоритм для получения списка тем и типов контента, которые соответствуют определенным требованиям, благодаря чему мы можем получить преимущество в поисковых системах.

Как спланировать эффективную стратегию контент-маркетинга?

Без хорошей стратегии контент-маркетинга невозможно достичь намеченных целей и получить прибыль в бизнесе. Вот почему так важно подготовить эффективный план действий в этой сфере. Когда мы начинаем планировать контент-стратегию, мы вместе с командой определяем основные метрики, определяющие ее успех (продажи, просмотры). Наиболее важным из них является то, на кого должна быть направлена коммуникация, какова ее цель и как эта цель должна быть эффективно измерена. В дополнение к определению вашей целевой аудитории, также неплохо определить, как и с помощью каких типов контента вы будете к ней обращаться.

Genetyczeskie algoritmy

Поэтому мы можем выделить несколько моментов, которые важны для планирования стратегии контент-маркетинга:

  • Определение KPI (определение измеримых целей, параметризация)
  • Определение нашей аудитории (с учетом специфики страны, языка, внутренних словарей)
  • Ресурсы/анализ ресурсов (какие данные мы можем использовать)
  • Аналитика (чем мы измеряем эффекты, как мы измеряем, как мы представляем данные)
  • План публикации, дистрибуция, линкбилдинг (следующие шаги после определения стратегии)
  • Бюджет (определяет, сколько и какого рода контента мы можем получить)

Типичные проблемы при планировании контента

  • правильно ли расходуются средства на контент, 
  • почему у нас много контента, который не ранжируется, 
  • выдача средств на дублирующий контент
  • мы не знаем, есть ли у нас уже тексты на определенную тематику, или тексты с подобной тематикой и т.д.
  • создаем ли мы авторитет с помощью контента
  • отвечаем ли мы на запросы пользователей правильными типами контента

Почему семантика так важна?

При планировании стратегии контент-маркетинга нельзя игнорировать растущее влияние big-data и то, как это отражается в семантических моделях (NLP).
 Важность семантики растет по нескольким причинам:


Изменения, влияющие на алгоритмы оценки:


  • машины лучше понимают естественный язык и способны очень точно отображать взаимосвязи («knowledge graph») для большинства слов, включая новые слова
  • 
пользователи предоставляют огромные объемы данных, включая голосовые данные (voice -> text)

  • Google тестирует новые решения (passage indexing, title change)

Какие данные должны быть приняты во внимание?

Основные элементы, принимающие активное участие в разработке на основе NLP, основаны на статистических моделях и семантических связях. Как правило, они связаны с параметрами самого контента и его размещением в результатах конкурентной борьбы. Используя эти данные, языковые модели и качественную информацию из внешних источников данных, мы можем построить собственные системы оценки контента на основе сравнения и согласования с алгоритмом Google. Сюда входят такие данные, как:

  • Параметры контента (ключевые слова, длина, насыщенность и т.д.)
  • SERPs (тип контента, конкуренция, понимание темы и т.д.).
  • Языковые модели, их развитие и связи (например, Knowledge Graph vs. B.E.R.T.)
  • Внешние источники данных (Keyword Planner, базы данных ключевых слов, мониторинг и т.д.)

Как вы используете данные в своей стратегии контент-маркетинга?

Что нужно для построения эффективной кампании контент-маркетинга? Мы обязательно должны убедиться в подходящей тематике для нашей группы аудитории. Затем заполните тематическое окружение, чтобы наш контент максимально отвечал запросам пользователей. Для этого стоит использовать выдачу, представленную в результатах Google, анализ заголовков, описаний и метаданных отдельных подстраниц, которые там появляются.

Анализируя эту статистическую информацию мы получаем наборы ключевых слов, релевантных данной теме. Имея ключевые слова, мы можем сгруппировать их, и на этой основе мы сможем сделать оптимальный набор тем, который должен предоставить нам максимальный объем и стоимость трафика, широкое покрытие (максимальное количество ключевых слов) и другие, более сложные условия. Однако это все теория, а как это сделать на практике?

Большой объем данных, сложность и влияние количественных факторов заставляют использовать автоматизацию этих процессов. Автоматизация в настоящее время является прерогативой разработчиков, но ее также могут реализовать команды, создающие стратегию контент-маркетинга. Однако для этого вам понадобится соответствующий инструмент, который поможет в планировании и управлении контентом, а также умеет проводить семантический анализ.

Примером такого инструмента может быть CONTADU. Эта платформа Content Intelligence это определенно облегчит процесс создания стратегии контент-маркетинга благодаря использованию генетических алгоритмов. Здесь стоит объяснить, что это за алгоритмы и как они работают.

klastry 2

Что такое генетические алгоритмы и как он связаны с генетической эволюцией?

Генетический алгоритм — это разновидность эвристики. Это означает, что это гарантирует не идеальное решение, а решение, наиболее близкое к идеальному из всех доступных вариантов. Если алгоритм, который идеально подходит для данной проблемы, не существует, слишком сложен для реализации или слишком ресурсоемкий, генетический алгоритм найдет лучшую и наиболее оптимальную альтернативу. История генетического алгоритма восходит к 1950-м годам, а его создателем является американский профессор Джон Генри Холланд. Вдохновением для создания генетического алгоритма послужила биологическая эволюция.

В естественной среде существует определенная популяция, в которой каждый человек имеет определенный набор генетической информации (генотип), наблюдаемый набор признаков (фенотип), который позволяет адаптироваться к окружающим условиям и увеличивает шансы на выживание и размножение. Эти особенности могут передаваться из поколения в поколение. Люди с особенностями, которые позволяют им доминировать над конкурентами, с большей вероятностью передадут свои особенности следующему поколению, чем организмы с особенностями, которые не гарантируют таких преимуществ. Кроме того, мы можем наблюдать мутации, то есть скачкообразные изменения в генетическом материале.

Как работает генетический алгоритм?


Работа генетических алгоритмов очень похожа. Типичная реализация генетического алгоритма начинается с создания начальной популяции из определенного числа особей. У каждого человека есть случайно выбранный генотип (определенный набор информации), который является основой для производства фенотипа (наблюдаемых признаков). Затем выполняем последующие итерации алгоритма. Каждую итерацию можно назвать поколением. Последующие поколения людей подвергаются оценке адаптации к окружающей среде.

Говоря упрощенно, можно сказать, что они подлежат оценке адаптации к достижению выбранной нами цели. Выбираются и воспроизводятся наиболее приспособленные. Наиболее адаптированные особи будут скрещиваться с образованием особей нового поколения, состоящих из фрагментов генетического кода родителей. Кроме того, с определенной вероятностью могут быть мутации, то есть незначительные случайные изменения генетического кода.

Последующие итерации происходят до тех пор, пока мы не достигнем состояния остановки (т.е. индивидуума, мера адаптации которого соответствует нашим ожиданиям) или когда мы потеряем терпение (определенное количество итераций).

Пример того, как работает генетический алгоритм

Популярной демонстрацией работы генетических алгоритмов является создание среды в виде полосы препятствий (с реализованной базовой физикой), которую преодолевают люди, являющиеся простыми транспортными средствами. Это могут быть автомобили или двухколесные велосипеды. Учитываем минимальное количество параметров.

W naszej symulacji parametry opisujące genotyp osobników to:


  • диаметр колеса (каждое в отдельности)
  • плотность колеса
  • их положение и расстояние
  • восемь вершин, определяющих геометрию рамы
  • плотность кадра

przykladowe osobniki

Мерой адаптации к окружающей среде будет то, насколько далеко может зайти конструкция. Наша среда — это полоса препятствий. Мы протестируем в нем каждое поколение, наблюдая, какие структуры (индивиды) способны продвинуться дальше всех. Лучшее идет на размножение. Наиболее подходящие особи пересекаются, т.е. в этом случае они обмениваются расчетными параметрами. Потомство будет иметь несколько генов каждого родителя.

Приведет ли само скрещивание к оптимальному решению? Часто нет. Существует риск выхода на локальный оптимум, и в нашей популяции не будет людей, которые могут предоставить гены, которые позволят ей развиваться на более высокий уровень. Чтобы справиться с этим, мы вводим механизм мутации. Как и в природе, можно предположить, что мутации происходят с определенной вероятностью. Таким образом, в нашем моделировании вы можете «бросить кости» и таким образом решить, произойдет ли случайное изменение генотипа выбранного человека. Если такое изменение происходит и дает преимущество перед другими людьми, мы можем предположить, что гены этого человека войдут в следующие поколения.

 

Генетический алгоритм находит решение, наиболее близкое к оптимальному.

После десятка или около того итераций вы можете увидеть, что в нашем эксперименте появляются некоторые закономерности. На трассе хорошо себя чувствуют люди с большими колесами, высокой подвеской и относительно низким центром тяжести. Для простоты дорожка закреплена. Для поиска «универсального» транспортного средства его можно было менять в процессе эксперимента или суммировать расстояния, пройденные на нескольких типах трасс.

Генетика в контент-маркетинге

Техническое применение генетического алгоритма в контент-маркетинге

Теперь перейдем к применению генетического алгоритма в вашей стратегии контент-маркетинга. Предположим, что с определенным бюджетом мы можем написать 20 статей. Какие статьи мы должны писать, чтобы они содержали наибольшее количество ключевых слов? Напомним, что на раннем этапе анализа мы собирали ТОП-100 результатов поиска по каждому из анализируемых слов.

Мы предполагаем, что наш конкурент может занять место в ТОП-5 в данной статье (мы также можем принять другое значение, например, Топ-10) результатов поиска по заданному ключевому слову, это достижимо, и набор слов, для которых его ранжирование семантически непротиворечиво (с точки зрения Google).


Мы пытаемся создать наиболее адаптированного человека, и такой человек, с точки зрения наиболее важной части стратегии контент-маркетинга, может быть лучшим набором из 20 статей, которые мы хотим написать. Лучшее, т. е. позволяющее ранжироваться по наибольшему количеству ключевых слов.

Таким образом, мы установили, что индивидуум — это определенный набор статей. Хороший, средний или совершенно неубедительный (например, темы сильно каннибализируются и не очень хорошо охватывают остальные). Как мы оцениваем адаптацию данного человека? Мы знаем позиции отдельных статей по анализируемым ключевым словам. Для каждой статьи из набора мы определяем, по каким ключевым словам она входит в ТОП-5 результатов, а по каким нет. Сумма всех ключевых слов ТОП-5 для данного набора статей является мерой качества данного набора.

Мы будем скрещивать лучшие наборы между собой (объединять фрагменты текста, чтобы получить новую статью). Кроме того, произойдут мутации (т.е. замена одного из двадцати предметов в наборе случайным). Мы можем подытожить все это так:

  • особь (и ее генотип) = определенный набор из 20 статей
  • мера адаптации к среде = по скольким из всех ключевых слов хотя бы одна статья из набора входит в ТОП 5
  • скрещивание = обмен генами, т.е. в данном случае статьями между наборами (особями)
  • мутация = обмен одного статьи на другую, случайным способом

Начните создавать стратегию контент-маркетинга

osobnik a

Начнем с создания или рисования первого поколения из 100 человек. Каждая особь описывается генотипом из 20 генов. Каждый из генов представляет собой одну случайно выбранную статью из пула всех, которые появлялись в результатах поиска по исследуемым нами словам (почти 600 слов). Имея информацию о ключевых словах и позициях, в которых видны указанные URL-адреса, мы можем сказать, какой набор ключевых слов мы охватываем этими статьями. Это дает оценку 94 из 584 ключевых слов. Так что это значительный охват, но далеко не идеальный.

Теперь перейдем к следующим итерациям алгоритма. На каждой итерации мы оцениваем всех людей в данном поколении. Каждый из них оценивается степенью адаптации. Лучше всего идут на размножение — обменивают статьи в наборе. Кроме того, с определенной вероятностью происходят и мутации, т.е. случайные замены одной из статей в наборе на другую, случайную.

Вот краткое изложение нескольких избранных поколений. Вы можете увидеть сильное начальное повышение качества и более медленную оптимизацию в сторону лучшего решения. Мы также должны помнить, что потребуется больше статей, чтобы охватить всю тему.

porównanie pokoleń

Давайте посмотрим на лучших представителей каждого поколения. Из-за большого количества слов их трудно представить иначе, как в пикселях. Мы видим, что лучший человек из первого поколения набирает очки, используя только 3 статьи из 20.

generacja 1

Сотое поколение — вполне достойное прикрытие для пространства ключевых слов.

generacja 2

Переходя к следующим поколениям, становится ясно, что определенные закономерности сохраняются. Их определяют по «лучшим» статьям.

generacja 3

Поколение 10 000 близко к лучшему решению.

generacja 4

Следующие поколения вносят лишь минимальные улучшения.

 

generacja 5

У нашего лучшей особи есть показатель адаптации 434 из 584 слов. Вроде бы много. Посмотрим подробнее.

osobnik b

Наша особь B состоит из 20 статей. Некоторые из них соответствуют наиболее популярным категориям товаров, другие — вдохновению или советам. Стоит отметить, что темы имеют минимальное перекрытие. Это было одним из основных предложений.

Следующие шаги в создании контентной стратегии

tabelka z tematami

На основе сформированного набора строим план публикации. Мы создаем контент, публикуем его (конечно, также заботимся о распространении). Мы анализируем эффекты и можем перейти к следующей итерации. Стоит отметить, что в следующей итерации мы можем легко учесть использование пространства ключевых слов текущим набором статей или даже использовать информацию о видимости нашего контента. Таким образом, на следующей итерации алгоритм будет учитывать уже имеющиеся ресурсы, благодаря чему мы продолжим хорошо расходовать бюджет и избегать дублирования.

Что можно поменять? На самом деле мы ограничены только нашим воображением. Мы можем определить любую степень адаптации, которая позволит оценить решения даже с точки зрения самых сложных требований. В частности, мы можем, например, искать хорошие темы, не вдаваясь в те, которые слишком сложны (например, оценивая сложность ключевого слова или даже, в качестве приблизительного значения, ценность конкуренции в рекламе).

Резюме

Используя генетический алгоритм:

  • реализовали автоматический подбор лучших тем
  • мы рассмотрели возможность поиска решений с разными целями
  • благодаря функциям оценки мы можем учесть ресурсы, которые у нас уже есть
  • мы заметили, что таким образом можно оценить минимальный бюджет, необходимый для покрытия предметной темы