Марковские цепи


Марковские цепи


Марковские цепи – это математическое понятие, названное так в честь русского математика Андрея Маркова-старшего, который его и описал. Цепью Маркова называют последовательность случайных событий, у которых есть конечное число вероятных исходов. Причем, конечный результат находится в зависимости от текущего состояния и не зависит от прошлого.

В математике цепи Маркова описываются рядом формул, в сфере же SEO они применяются для создания текстов с условной грамотностью, связностью и определенным набором ключевых слов. Такое использование математических формул для генерации текстов возможно, потому как любое предложение можно приравнять к Марковской цепи первого порядка, в которой каждое последующее слово будет зависеть от предыдущего.

Впервые цепи Маркова придумали применять для генерации текстов дорвейщики, так как большое количество дорвеев требовало большого количества текстового контента с минимальным уровнем грамотности. Да, такой текст не особо читабелен для реального человека, но поисковые роботы распознают Марковские цепи далеко не сразу. Но, конечно, как правило использование Марковских цепей относят к черной оптимизации.

Пример математической Марковской цепи с двумя состояниями:



Принцип работы

Генераторы псевдоосмсыленных текстов на основе цепей Маркова работают в два этапа. Для начала необходимо создать словарную базу на основе достаточно большого текста. Текст разбивается на отдельные слова, для каждого из которых определяются другие слова, чаще всего после него встречающиеся. На основе такой базы и будут выстраиваться предложения – собственно, Марковские цепи, где в качестве дискретных значений выступают слова.

Первое слово отбирается случайным образом. Второе – из списка тех, которые чаще всего встречаются после первого. Третье – из числа слов, возможных после второго. И так далее. Смысла в таком тексте, конечно, не много, однако простейшую проверку роботами на связность такой текст может пройти. Следовательно, страница будет проиндексирована поисковой машиной.

Изначально можно задать как общее количество слов в генерируемом тексте, так и число слов в каждом отдельном предложении. Исходный словарь для генерации текстов на основе цепей Маркова должен быть размером хотя бы в килобайт, иначе сгенерированный текст будет иметь очень низкую уникальность.

Пример использования

Для наглядности можно рассмотреть пример использования Марковских цепей для генерации текста на основе заданных слов на примере одного предложения. Допустим, «SEO форум cy-pr.com – лучший форум рунета на тему SEO и продвижения сайтов». Теперь необходимо составить словарную базу, подбирая все возможные слова к каждому последующему. Для данного примера она будет выглядеть так:

SEO – форум, и (т.к. в предложении после SEO использовались слова «форум» и «и»)
Форум – cy-pr.com, рунета
cy-pr.com – лучший
лучший – форум
рунета – на
на – тему
тему – SEO
и – продвижения
продвижения – сайтов
сайтов – SEO

Получился замкнутый цикл из всех слов данного предложения, так как в словарной базе для генерации текстов после последнего слова будет снова использоваться первое. Теперь начинает собственно создание текста, причем, первое слово выбирается случайным образом и на его основе формируется цепочка. Например, это будет cy-pr.com. В результате получается:

cy-pr.com – лучший форум рунета на тему SEO и продвижения сайтов.

Безусловно, в данном примере текст не особо отличается от исходного, но причина лишь в малом количестве заданных слов. Ключевые же слова получились вполне ходовые – «лучший форум», например.

Плюсы и минусы текстов на основе Марковских цепей

У текста, сгенерированного с помощью Марковских цепей, безусловно нет никакой литературной ценности и пользователям он не интересен. Однако, в качестве технического решения может вполне использоваться.

Плюсы:

- абсолютная техническая уникальность;
- связность слов;
- малые трудозатраты (по сравнению с трудозатратами при реальном написании текстов);
- конкретное количество слов, которое можно задать изначально;
- наличие необходимых ключевых слов в необходимом количестве.

Минусы:

- необходимость задавать большой исходный текст;
- сложности при создании словарной базы (подбор вариантов соответствующих слов к каждому отдельному слову);
- высокие требования к ресурсам памяти;
- большая нагрузка на процессор;
- относительно низкая скорость генерации;
- при маленьком заданном тексте уникальность сгенерированного текста будет низкой;
- потенциальная возможность распознавания сгенерированного текста поисковым роботом, и как следствие – бан.

Кроме того, есть мнение, что Google научился достаточно быстро распознавать псевдотексты, сгенерированные с помощью Марковских цепей, поэтому использовать ли этот явно не совсем белый метод оптимизации или нет, решать стоит отдельно в каждом конкретном случае, исходя из поставленной задачи, временных рамок и материальных возможностей.



Новые темыОбъявленияСвободное общение
21:55 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 
14:10 3snet - гемблинг, беттинг, форекс, бинарные опционы, майнинг 
11:52 Партнерская программа Xoffers с прямыми офферами в вертикалях форекс, крипта и бинарные опционы. 
22:22 DreamCash.tl - заработок на онлайн-видео. До 95% отчислений, отличный конверт! 
20:00 Самозанятые смогут зарабатывать в рекламной сети VK 
19:24 XEvil - софт для разгадывания капчи. Бесплатная демо-версия. Привязка к SEO/SMM-софту. 
18:02 SharkBoss - партнёрская программа для монетизации ЛЮБЫХ видов трафика (включая спам). 
22:58 Продам обменник криптовалюты, а также новый обменник под ключ с обучением. Скидки на скрипты обменника 
17:22 Coin Click.cc - Быстрый и надежный обмен электронных валют в два клика 
14:44 Восстановление сайтов из Вебархива на Wordpress 
12:01 BestChange – обменивать электронную валюту можно быстро и выгодно 
20:59 Продам базу данных Банки/физы/миксы/БАДы 
20:23 ⭐Прием любых платежей для HIGH RISK проектов⭐ 
18:14 A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc 
21:27 Точные прогнозы на футбол 
15:43 Заказать телефонный флуд. 
12:05 Ням-ням! - 8 деликатесов, которые когда-то ели только бедные люди 
11:25 Флуд звонками 
11:40 Кто сделает прогон для адалт сайта? 
09:25 Добро пожаловать в цифровой мир... 
10:31 Видимо, похороны СУПРа уже прошли как-то по-тихому