"Страница проиндексирована, но ее нет в файле Sitemap" - а она там есть!
Страницы: 1 2 След.
"Страница проиндексирована, но ее нет в файле Sitemap" - а она там есть!, Новые записи не попадают в выдачу, при этом Google выдает некорректное об
Здравствуйте!
Проблема: новые записи не попадают в выдачу Google.

Регулярно замечаю, что после публикации новой записи (gadgets-news.ru/sebestoimost-iphone-xs-otsenili-v-395/) проверка URL выдает Страница проиндексирована, но ее нет в файле Sitemap. В действительности она там есть (gadgets-news.ru/post-sitemap4.xml), а в фильтре по этому статусу в Google Search Console данный URL, наоборот, отсутствует (т.е. Google противоречит сам себе).

В других случаях (gadgets-news.ru/bionic-a12-perehod-10-nm-na-7-nm/) Google Search Console пишет Страница отправлена и проиндексирована, но в выдаче Google этого URL тоже нет.

Раньше новые публикации там появлялись в течение считанных минут после публикации.


Текущая статистика по сайту такая:

> записей в блоге ~3200
> страница отправлена и проиндексирована ~2800
> страница проиндексирована, но ее нет в файле Sitemap ~500

При этом:

> эти 500 проиндексированных, но отсутствующих в Sitemap ссылок - какой-то мусор (ссылки на реальные страницы сайта, но через ссылки давно удаленного форума), я сделал по ним запрос Удалить URL-адреса

> согласно этой статистике существует ~400 (3200 минус 2800) нормальных записей, которых нет ни в Страница отправлена и проиндексирована, ни в Страница проиндексирована, но ее нет в файле Sitemap. ~400 при условии, что Страница отправлена и проиндексирована соответствует действительности (на втором примере видим, что это ни разу не так)

> site:gadgets-news.ru выдает ~3700 ссылок.

Что можно предпринять?
Изменено: t1gran - 26 Сентября 2018 15:30
Цитата
t1gran пишет:
Страница отправлена и проиндексирована , но в выдаче Google этого URL тоже нет.
Мож так выдача от индексации отстает.
Чуть подождать
Серёжка,
У меня тоже есть подозрение, что теперь вместо прежних минут на индексацию уходят дни. Вопрос в следующем:
1) почему такой регресс (деградация движка Google, или принудительная задержка индексации непопулярных сайтов)?
2) почему Google Search Console врет про статус (говорил бы прямо, что страница не проиндексирована, без сказок про Sitemap или индексацию)
3) как мне отфильтровать де-факто непроиндексированные страницы.


Еще хотелось бы понять откуда взялись эти 500 мусорных ссылок со статусом Страница проиндексирована, но ее нет в файле Sitemap. Вид у них такой: gadgets-news.ru/page/178/?topic=правила-размещения-объявлений, gadgets-news.ru/page/212/?topic=uroki-matematiki-i-fiziki, gadgets-news.ru/page/316/?forum=forum. Это явно остатки форума 4-5-летней давности, который забился огромным числом спама - пришлось удалять этот форум через базу данных. Причем эти ссылки почему-то ведут на вполне реальные страницы сайта. Google постоянно эти ссылки откуда-то находит и якобы индексирует. Как бы удалить эти остатки из блога, или хотя бы закрыть их от индексации?
Цитата
t1gran пишет:
как мне отфильтровать де-факто непроиндексированные страницы.
А зачем? Ну и хрен с ними.



Цитата
t1gran пишет:
Google постоянно эти ссылки откуда-то находит и якобы индексирует.
Индексирует, индексирует...
Подозреваю, что он идёт по ссылке, не находит страницу, но где то у него мкнет, что страница быть должно. Начинает искать, собирать инфу. И находит же)))
Цитата
Серёжка пишет:
Подозреваю, что он идёт по ссылке
По какой ссылке, где он её берет?
Цитата
t1gran пишет:
Цитата
Серёжка пишет:
Подозреваю, что он идёт по ссылке
По какой ссылке, где он её берет?
В принципе весь интернет состоит из ссылок, только ими живет.
А где же поисковик берет ссылку как не в интернете.Вы уже могли и забыть, что где то, когда то в профиле ссыль поставили.
А тут через пять-семь лет на форуме эти ссылки в профилях к индексации открыли. По ошибке, случайно, не важно.
И из баз данных крупных компаний утечки бывают.
А там что? Правильно упоминания - ссылки)
Серёжка,
Я точно этих ссылок не оставлял. В свое время имел неосторожность поставить плагин с форумом, а спустя несколько недель обнаружил, что боты забили его сотнями тысяч спамных тем и сообщений. Также непонятно, как эти форумные ссылки ведут на реальные страницы сайта. ИМХО какой-то мусор остался в самом блоге.

По поводу индексации, которая вместо прежних минут теперь занимает дни - думаете ничего нельзя предпринять? smile:confused:
Цитата
t1gran пишет:
думаете ничего нельзя предпринять?
Это уже давно придумано - подсунуть ссылку или ссылку на ссылку
Серёжка,
Имеете в виду покупку ссылок? Раньше тоже не покупал, но в выдаче новые публикации оказывались через минуты. Что я делал не так? smile:confused:

P.S. Начинаю подозревать, что эти мусорные форумные ссылки ведут на страницы, где присутствует запись с битой ссылкой (на картинку).
у меня вообще гугл отказывается с 28го марта  кушать сайтмап  и в выдачу попадают страницы пагинации с тегом каноникал на главную -и гугл пишет проиндексировано несмотря на запрет в робот ТХТ )))
Цитата
t1gran пишет:
или принудительная задержка индексации непопулярных сайтов)?
тоже заметил и скорее вот это
Обнаружил в Google Search Console группу параметров URL, которые сам не создавал - подозреваю, что они завелись автоматически после установки форума (плагина) несколько лет назад. Форум тогда быстро забился сотнями тысяч спама, пришлось удалять его из базы данных вручную - а параметры похоже остались и ведут на реальные страницы сайта. Вопросы:
1) Надо ли и возможно ли их удалить, и если да, то как?
2) Надо ли в Google Search Console поменять все эти параметры с "На усмотрение робота Googlebot" на "Нет, параметр не влияет на содержание страницы"?
3) Надо ли что-то прописать в robots.txt - например, запретить индексирование URL с этими параметрами, или хотя бы прописать канонические адреса?
Цитата
t1gran пишет:
Обнаружил в Google Search Console группу параметров URL, которые сам не создавал - подозреваю, что они завелись автоматически после установки форума (плагина) несколько лет назад. Форум тогда быстро забился сотнями тысяч спама, пришлось удалять его из базы данных вручную - а параметры похоже остались и ведут на реальные страницы сайта. Вопросы:
1) Надо ли и возможно ли их удалить, и если да, то как?
2) Надо ли в Google Search Console поменять все эти параметры с "На усмотрение робота Googlebot" на "Нет, параметр не влияет на содержание страницы"?
3) Надо ли что-то прописать в robots.txt - например, запретить индексирование URL с этими параметрами, или хотя бы прописать канонические адреса?


t1gran, вы можете сказать, что это негативно влияет на работу сайта?
Проблем с работой сайта не наблюдаю - но меня интересует его индексация ПС.
Цитата
Серёжка пишет:
В принципе весь интернет состоит из ссылок, только ими живет.
А где же поисковик берет ссылку как не в интернете.Вы уже могли и забыть, что где то, когда то в профиле ссыль поставили.
А тут через пять-семь лет на форуме эти ссылки в профилях к индексации открыли. По ошибке, случайно, не важно.
И из баз данных крупных компаний утечки бывают.
А там что? Правильно упоминания - ссылки)
Теоретик-неформал? Думается, что Вы здесь не для праздных бла-бла постов, истинная цель у Вас отрекламить что-то, вот и фигачите пока посты ни о чём, а потом вывалите ссыль на что-нить или представителем кого-то будете подтверждённым. Эх, оскомина уже от Вас. Рекамьтесь по нормальному, крауд - сторона нищебродов. smile:confused:
Изменено: Eye - 30 Сентября 2018 03:45
Мы не можем похвастаться мудростью глаз
И умелыми жестами рук,
Нам не нужно все это, чтобы друг друга понять.
Сигареты в руках, чай на столе - так замыкается круг,
И вдруг нам становится страшно что-то менять.
Страницы: 1 2 След.
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
17:55 Dao.AD: Монетизация и покупка Push/Pops/Inpage и Video трафика! 
17:04 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 
15:43 Adtrafico - Правильная партнёрская сеть под бурж трафик 
12:50 Партнерская программа OWNR WALLET 
01:46 Настроить поставщиков в программе E-Trade PriceList Importer 
15:26 Найти элемент в коде 
11:51 Bropush - твой бро в монетизации сайта push-уведомлениями 
18:17 Восстановление сайтов из Вебархива на Wordpress 
17:59 Мобильные и Резидентные Прокси Для Соц Сетей | 3 Гб Бесплатно 
16:46 Ural-obmen.ru — выгодный сервис обмена 
16:40 Obama.ru - безопасный обмен криптовалют и электронных денежных средств 
13:54 Coin Click.cc - Быстрый и надежный обмен электронных валют в два клика 
11:40 Высококачественные и надежные прокси-серверы и 5G 
11:37 Google Voice - OLD аккаунты "SMS и звонки" 
20:16 Точные прогнозы на футбол 
19:49 Видимо, похороны СУПРа уже прошли как-то по-тихому 
12:48 Каспкрски ОС 
11:21 Ням-ням! - 8 деликатесов, которые когда-то ели только бедные люди 
14:41 Бесплатный мини-аудит юзабилити и конверсии + технический SEO-аудит в подарок 
15:24 Добро пожаловать в цифровой мир... 
22:58 У меня дикая просадка по РСЯ за последние 3 суток