Гугл выдает значительно больше страниц, чем есть на самом деле
Страницы: 1
Гугл выдает значительно больше страниц, чем есть на самом деле, Индексация гугл
Всем доброго дня. Прошу совета у опытных пользователей.

Есть сайт [url]http://open-prezi.ru[/url]  Создан на движке Wordpress. На данный момент на сайте 165 страниц и 6 записей. В sitemap 171 url. По запросу в гугле site:open-prezi.ru находит 661 результат. Панель вебмастера гугл в разделе "Статус индексирования" показывает следующую информацию: Проиндексировано всего 658, просканировано за все время 755, заблокировано в файле robots.txt 219, удалено 365. Мне непонятно,подскажите пожалуйста, откуда эти 658 стр. ? Причем 25 августа было проиндексировано 209 страниц, 1 сентября уже 653, 8 сентября 658. 1 сентября было произведено обновление до версии Wordpress 3.6 - это могло как-то повлиять?

Немного опишу, какие действия производились с сайтом. Был установлен движок с файлом robots.txt, затем спустя время произведена настройка ЧПУ. Но гугл успел проиндексировать страницы без ЧПУ (судя по статистике панели вебмастер 25 августа), затем он также проиндексировал новые урлы. Кстати, страницы без ЧПУ с параметром "?" были запрещены к индексации в robots.txt, но все равно оказались проиндексированы и отображались в выдаче гугла правда с описанием "Описание веб-страницы недоступно из-за ограничений в файле robots.txt" Старые урлы с "page_id" (гугл выдавал примерно 130) также висели в поиске, но при клике по ссылке переход осуществлялся на новый адрес с ЧПУ. Также потом обнаружила, что в поиске выдается много страниц с параметром "feed" (около 150) в url, которые также были запрещены в robots.txt. Эти страницы опять же отображались в поиске с пометкой "Описание веб-страницы недоступно из-за ограничений в файле robots.txt"

Прочитав множество статей в интернете, поудаляла страницы c page_id, feed из результатов поиска через панель вебмастера. Количество страниц в выдаче по запросу site:open-prezi.ru в какой-то момент уменьшилось до 470 (с 680). Но сейчас снова выдает за 6 сотен - 661. При этом массово страниц с page_id и feed я не нахожу, гугл выдает результатов по 7.

Вот скрин раздела Параметры URL в панели вебмастера. [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09112037.png[/url]
Здесь он показывет, что отслеживает аж 347 урлов с параметром page_id, 159 урлов с параметром feed...
Скрин статистики индексирования [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09112824.png[/url]
[url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09112928.png[/url]

Подскажите пожалуйста что-нибудь, как все это исправить. Не очень приятно видеть в панели cy-pr видеть такое [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09113118.png[/url] Получается что гугл видит на сайте множество дублей? Кстати, панель RDS показывает следующее [url]http://screen.fst.su/%D0%9D%D0%B0%D1%81%D1%82%D1%8FShot2013-09-09113211.png[/url]

И еще я абсолютно не понимаю арифметику гугла smile:confused: Сейчас страниц в выдаче по запросу site:open-prezi.ru - 661. Это как-то вяжется с общим кол-вом проиндексированных урлов в панели вебмастера - 658. Но панель веб-мастера ведь показывает, что удалено 365. Значит должно быть 658-365=293 ?
Изменено: Анастасия Владыкина - 9 Сентября 2013 12:06
у гугла несколько сайтов, отсюда и разница между рдс и супром

WMT - статистика, всегда была немного корявая (здесь она немного запаздывает)

От себя скажу - по поводу дублей, если сайт активно наполняется то такой маленький процент это норма, гугл сначала индексирует потом только думает, что оставить а что нет  ))  особенно на молодых сайтах и сайтах где была переделана структура, со временем все станет на свои места
open-prezi.ru/?page_id=796

open-prezi.ru/?page_id=976

и прочее удаляйте в панели вебмастера

Насчет страниц в гугле всегда их больше чем в яндексе, если на сайт не накладывались фильтры (по крайней мере ещё не 1 чтобы было наоборот не встречал)
Вот как нужно делать сайты Bezlimi.com
Я Джин пишет:
Цитата
со временем все станет на свои места
Спасибо за ответ. Т.е. со временем гугл выкинет лишние урлы?
Цитата
DmitryBezlimit пишет:
и прочее удаляйте в панели вебмастера
Да, конечно, сейчас подчищу все

Если еще у кого есть советы, пожалуйста пишите, всему рада smile:)
Цитата
Анастасия Владыкина пишет:
Если еще у кого есть советы, пожалуйста пишите, всему рада
Гугл очень неспешно удаляет дубли (иногда несколько раз приходилось удалять один и тот же урл. А вообще нужно смотреть, какой тип дублей у Вас основной, под него и запрет писать. Ещё бывает, что слишком большой robots Гугл не воспринимает как обязательный к исполнению.
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
09:47 Adsense личный опыт 
13:13 LOSPOLLOS.COM - Конвертим по рецепту Хайзенберга. Dating, Mainstream, Binary Options 
13:47 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 
08:27 Ищу специалистов 
08:18 Прибыль 200$ - 400$, за каждую 1000 уников! Google, FB и тд 
08:12 ру гембла 
09:18 Влияние использования ИИ для написания текстов на позицию в поисковой выдаче 
23:00 №1 Рассылка / Инвайтинг [TELEGRAM] | Приватный метод 
23:00 Trustpilot Reviews | Подниму рейтинг вашей компании 
22:59 Продвижение YouTube видео в топ поиска | Любой тип контента | Гарантия результата 
22:59 Установка|Настройка|Доработка|Наполнение сайтов|Дизайн|3D|Видеомонтаж 
22:04 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 
19:58 Создам под вашу нишу сетку сайтов-сателлитов для привлечения целевого трафика 
19:30 - Вечные ссылки с трастовых сайтов 2024 проверен FastTrust 
20:01 Всего п онемногу 
12:45 Куплю проигрышные букмекерские аккаунты 
11:55 Union Pharm - топовая фарма-партнерка для профессионалов! 
17:09 Точные прогнозы на футбол 
10:00 Ну что, кто куда деваете свои сайты? 
16:22 Компьютерная мышь 
23:55 Добро пожаловать в цифровой мир...