Как яндекс определяет, что текст синонимизирован и нечетабелен?
Страницы: Пред. 1 2
Как яндекс определяет, что текст синонимизирован и нечетабелен?
Vlad Straychenko,  яша тестирует что-то новое. Кто их знает? Что они там придумал? Зачем рисковать?
Не подписываюсь на темы, так что не слежу за вопросами, которые вы оставляете в топике после меня. Если нужно получить ответ, пишите в ЛС с указанием ссылки на мой комментарий.
То что яша плохо относиться к скрытому тексту или текст прописывается очень мелко, и тому подобное много статей где концовка у всех одна - сайт вылетает с индекса, по поводу сином...ера, конечно не напрягая мозг получать уник все хотят я первый куплю прогу если есть такая, ведь не обязательно генерировать по максимуму, да конечно уникум и 100% поднять можно но понятно текст будет просто белеберда (мягко говоря), при изменение текста до 50% текст очень даже читаем и прятать не чё не надо - скромно и мозг на месте.
Ок я понял, а если скажем сделать так в макет сайта ниже новости написать статью разбавляя ее выводом из доп полей или тегами пример: 
Спасибо вас, что вы посетили наш сайт и просмотрели новость {title}, которая находится в жанре:  {link-category}. Так же мы советуем к просмотру интересные новости: {related-news} (шаблон меняем на строчное перечисление через запятую). Также вы можете скачать музыку  [xfvalue_year] года. И изучить биографию певца:  [xfvalue_dir].
Уникальность будет около 30-60% для каждой новой новости.?? Как считаете такое можно использовать??
Что синонимизировать теперь тоже нельзя (((
Цитата
Vlad Straychenko пишет:
Слышал, что при синонимизации текста он получается на 90% уникальным, но читать такое невозможно, он становится нечитабельным. Интересно как Яндекс вычилсяет такие тексты. И возможно при помощи их придать уникальности краденной статьи?
Синонимы определяют контекст слова, т.е. указывают на него. Для каждого контекста существует свое применение, специализация, скажем так. Поэтому существуют разные словари в которых один и тот же термин трактуется и означает разное. Если термин из другого контекста применить в несвойственном ему (а это и видит яндекс), то текст получается кривой.
Существуют тематики, где игра контекстами составляет бизнес-процесс, он является рабочим инструментом у юристов, к примеру. Их хлеб в использовании синонимов таким образом, чтобы обязательства по тому или иному договору можно было использовать с точностью до наоборот. Вы прочитаете документ, где де факто вы отдали деньги и вам должны, а де юро вы сам должником окажетесь smile:)

Синонимайз, где контексты близки слишком сильно и человек не обращает внимания на мелкие искажения (смысл текста сохраняется, хотя и лишается красок) Яндекс может воспринимать как совершенно уникальный текст, чем и пользуется СЕО индустрия и говнокопирайтеры в частности. Однако прогресс не стоит на месте и Яндекс учится отличать синонимизированные документы и определять, является ли очередной текст повторением смысла уже имеющихся в коллекции. Т.е. критерием является наличие или отсутствие идентичного смыслового содержания.
Т.е. синонимайз, как таковой не определяется, определяется повторение смысла содержимого и последовательности его изложения.
Смысл любого документа представляется яндексом как набор измеренных взаимосвязей между ключевыми фразами о которых яндекс знает. Т.е. любой документ представляет собой некоторую конструкцию из них, где каждый ключ связан с другим отрезками, длина которых показывает степень родства одного ключа с другим. Чем больше степень этого родства, тем отрезок в этой конструкции, связывающий 2 ключа меньше. Степень родства или как ее еще называют, степень логической близости, находится из статистики частот применимости одного ключа с другим. К примеру, любой ВЧ потому и ВЧ, что имеет очень большое число совместной встречаемости в других ключах.
Вот вся эта конструкция и вычисленные для ВСЕХ известных яндексу ключевых слов степень их логического родства или близости, называется частотным ЗАПРОСНЫМ ГРАФОМ. Именно она обновляется при каждом апе и именно из нее вам выводят в вордстате статистику, которая обновляется несколько реже.
Вот этот частотный граф, в его форме и содержании, заключен СМЫСЛ всех понятий. И при семантическом разборе любого документа, яндекс для каждого формирует на базе общего запросного графа образ смысла этого документа, высчитывает принадлежность к той или иной тематике (путем оценки его логической близости ко всем категориям в ЯК), смотрит на сколько точно соответствует этот образ эталонному, отвечающий на поисковой запрос наиболее релевантно по нескольким поисковым целям в соответствии с классификатором по целям. В общих чертах, именно так происходит семантический анализ и ранжирование.
Яндекс уже очень давно различает текст и легко определяет работу синонимайзера. Морфология текста ему по зубам...
Ок я понял, но тогда как обьяснить сайты которые с успехом пользуются такими текстами к примеру тут: www.cinemaplayer.ru и обратите внимание на сцетчик посещений 20 тыс трафа в день! Не похоже что сайт под фильтрами)
Цитата
Vlad Straychenko пишет:
Интересно как Яндекс вычилсяет такие тексты.
да какая разница как? поверь определяет на ура, хочешь, можешь проверить, только время потратишь...
В любом случае первый визит (если траф попрет - он будет обязателно) любого из "смотрителей яндекса" повлечет налоение фильтра за недлялюдейный текст smile:)
Мы не можем похвастаться мудростью глаз
И умелыми жестами рук,
Нам не нужно все это, чтобы друг друга понять.
Сигареты в руках, чай на столе - так замыкается круг,
И вдруг нам становится страшно что-то менять.
Страницы: Пред. 1 2
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
08:50 "Осталось 5 дн. до НГ" АПдейт Яндекс выдача 
08:48 Стоит ли добавлять сайт в Rambler топ 100? 
08:46 С наступающим Новым годом! АП Яндекс ИКС 23.12.2025 
08:36 25.12.25 Апдейт Яндекс выдача 
08:36 Супер-партнерка PayV: избранные офферы в топовых нишах 
08:33 Ссылки с сайтов РБ 
08:11 Волна банов за ПФ под Новый год? Кого еще зацепило? 
10:06 CryptoGraph — Анонимный обмен криптовалют без KYC и AML 
08:53 Размещение статей, ссылок и постовых на качественных ресурсах 
08:22 Мониторинг обменников Сrypto-scout.io 
04:17 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
03:54 TELEGRAM EXPERT — Многоцелевой комбайн по работе с Telegram 
19:18 Oblaka.in — Обмен криптовалюты быстро, выгодно и безопасно 
15:32 Продам аккаунты Gmail USA IP | Gmail MIX IP | Outlook Old 
11:18 Стряхнуть обыденность - об Агасфере 
08:42 Ням-ням! - 8 деликатесов, которые когда-то ели только бедные люди 
23:08 Физические сим-карты 
22:52 37 противникам прививок от COVID грозят уголовные дела 
21:44 С юмором по жизни! 
13:34 Компьютерная мышь 
13:13 Куплю проигрышные букмекерские аккаунты