Почему гугл индексирует страницы, запрещенные в robots.txt?
Страницы: Пред. 1 2
Почему гугл индексирует страницы, запрещенные в robots.txt?
Я при составлении запроса на удаление указал url примерно такого вида - http://сайт.орг/user/*
интересно так с символами замены можно?
на самом деле перед заливкой данных на ресурс и вообще поднятии сайта надо говорить чтобы банились поисковики, ибо гугль приходит на сайт чуть ли не раньше модера- ибо заливал так сайт:
1. Поставил движок, залогинился
2. Установил плагины, настроил, подправил темку- минут 20
3. Начал писать- накропал штук 10 постов
4. На следующий день в выдаче Hello world
5. Новые посты потянулись только через пару дней
Делюсь личным опытом: запустил блог, естественным было желание полностью избавиться от любого мусорного контента, оставив только страницы с материалами. Позакрывал в robots.txt всё что только можно, и с удивлением обнаружил, что в индекс всё равно попала куча какого-то мусора, даже если он был закрыт в robots - например, ссылки без сниппетов со странными анкорами. Если брать конкретный пример - блог у меня двуязычный, и на каждой странице был переключатель языков, который вёл на переведённую страницу. Причём ссылка указывала на URL, который был запрещён в robots.txt - и тем не менее в выдаче появлялись результаты вида "Русский", "English" - т.е. с title переключателя языков. В итоге побороть это удалось только добавлением к таким ссылкам rel="nofollow". Уже позже выяснил, что Гугл хоть и не индексирует страницу, которая закрыта в robots.txt, но индексирует ссылки на неё, которые и появляются в выдаче. Главный признак таких "случайных" страниц - отсутствие сниппета. Побороть можно только при помощи rel="nofollow"...
Страницы: Пред. 1 2
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
11:07 01.02. Апдейт 31.01 // Chrome готовит "чёрную метку" для ИИ? 
06:34 Гугл пухнет от кеша, а нам - крошки. Разбор $114 млрд: Адсенс в минусе, Ютуб на подписках 
01:09 Yahoo Scout: Нейро-привет из склепа. Реальный шанс на траф или мимо? 
17:33 AntiBot Cloud - бесплатный скрипт и сервис защиты сайтов 
15:14 Апдейт Яндекса 7 февраля. Пока серп трясет, некоторые по ботам плачут 
15:10 Google Discover Core Update: Дискавер отделяют от поиска? 
11:30 ЕС душит ТикТок: прощай бесконечная лента и RPM? Что с монетизацией? 
04:09 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
02:31 Профессиональный и грамотный дизайн от DesignCash 
18:27 Nexulume.com Обменник без AML и KYC 
15:45 Mixmasters - Exchange without AML and KYC 
10:22 Swapwatch.org — Мониторинг криптовалютных обменников 
10:19 SwapPix.io - быстрый и безопасный обменник криптовалют. 
15:12 CryptoGraph — Анонимный обмен криптовалют без KYC и AML 
05:10 Точные прогнозы на футбол 
02:08 K*R*A*K*EN // ссылка на февраль 2026 
00:28 Кулеры и БП станут золотыми? Медь по 13 штук, олово в космосе 
18:34 Ставки на супер тренды в спорте 
15:30 Гильотина для классиков: Клод доедает физические книги 
11:10 Moltbook: Соцсеть для ботов, где людям закрыли рот. Началось? 
22:31 [AI] Бот за $600к советовал есть сыр с крысами. Нью-Йорк его (наконец-то) снес