"Страница проиндексирована, но ее нет в файле Sitemap" - а она там есть!
Страницы: 1 2 След.
"Страница проиндексирована, но ее нет в файле Sitemap" - а она там есть!, Новые записи не попадают в выдачу, при этом Google выдает некорректное об
Здравствуйте!
Проблема: новые записи не попадают в выдачу Google.

Регулярно замечаю, что после публикации новой записи (gadgets-news.ru/sebestoimost-iphone-xs-otsenili-v-395/) проверка URL выдает Страница проиндексирована, но ее нет в файле Sitemap. В действительности она там есть (gadgets-news.ru/post-sitemap4.xml), а в фильтре по этому статусу в Google Search Console данный URL, наоборот, отсутствует (т.е. Google противоречит сам себе).

В других случаях (gadgets-news.ru/bionic-a12-perehod-10-nm-na-7-nm/) Google Search Console пишет Страница отправлена и проиндексирована, но в выдаче Google этого URL тоже нет.

Раньше новые публикации там появлялись в течение считанных минут после публикации.


Текущая статистика по сайту такая:

> записей в блоге ~3200
> страница отправлена и проиндексирована ~2800
> страница проиндексирована, но ее нет в файле Sitemap ~500

При этом:

> эти 500 проиндексированных, но отсутствующих в Sitemap ссылок - какой-то мусор (ссылки на реальные страницы сайта, но через ссылки давно удаленного форума), я сделал по ним запрос Удалить URL-адреса

> согласно этой статистике существует ~400 (3200 минус 2800) нормальных записей, которых нет ни в Страница отправлена и проиндексирована, ни в Страница проиндексирована, но ее нет в файле Sitemap. ~400 при условии, что Страница отправлена и проиндексирована соответствует действительности (на втором примере видим, что это ни разу не так)

> site:gadgets-news.ru выдает ~3700 ссылок.

Что можно предпринять?
Изменено: t1gran - 26 Сентября 2018 15:30

Бесплатная контекстная реклама

Цитата
t1gran пишет:
Страница отправлена и проиндексирована , но в выдаче Google этого URL тоже нет.
Мож так выдача от индексации отстает.
Чуть подождать
Серёжка,
У меня тоже есть подозрение, что теперь вместо прежних минут на индексацию уходят дни. Вопрос в следующем:
1) почему такой регресс (деградация движка Google, или принудительная задержка индексации непопулярных сайтов)?
2) почему Google Search Console врет про статус (говорил бы прямо, что страница не проиндексирована, без сказок про Sitemap или индексацию)
3) как мне отфильтровать де-факто непроиндексированные страницы.


Еще хотелось бы понять откуда взялись эти 500 мусорных ссылок со статусом Страница проиндексирована, но ее нет в файле Sitemap. Вид у них такой: gadgets-news.ru/page/178/?topic=правила-размещения-объявлений, gadgets-news.ru/page/212/?topic=uroki-matematiki-i-fiziki, gadgets-news.ru/page/316/?forum=forum. Это явно остатки форума 4-5-летней давности, который забился огромным числом спама - пришлось удалять этот форум через базу данных. Причем эти ссылки почему-то ведут на вполне реальные страницы сайта. Google постоянно эти ссылки откуда-то находит и якобы индексирует. Как бы удалить эти остатки из блога, или хотя бы закрыть их от индексации?
Цитата
t1gran пишет:
как мне отфильтровать де-факто непроиндексированные страницы.
А зачем? Ну и хрен с ними.



Цитата
t1gran пишет:
Google постоянно эти ссылки откуда-то находит и якобы индексирует.
Индексирует, индексирует...
Подозреваю, что он идёт по ссылке, не находит страницу, но где то у него мкнет, что страница быть должно. Начинает искать, собирать инфу. И находит же)))
Цитата
Серёжка пишет:
Подозреваю, что он идёт по ссылке
По какой ссылке, где он её берет?
Цитата
t1gran пишет:
Цитата
Серёжка пишет:
Подозреваю, что он идёт по ссылке
По какой ссылке, где он её берет?
В принципе весь интернет состоит из ссылок, только ими живет.
А где же поисковик берет ссылку как не в интернете.Вы уже могли и забыть, что где то, когда то в профиле ссыль поставили.
А тут через пять-семь лет на форуме эти ссылки в профилях к индексации открыли. По ошибке, случайно, не важно.
И из баз данных крупных компаний утечки бывают.
А там что? Правильно упоминания - ссылки)
Серёжка,
Я точно этих ссылок не оставлял. В свое время имел неосторожность поставить плагин с форумом, а спустя несколько недель обнаружил, что боты забили его сотнями тысяч спамных тем и сообщений. Также непонятно, как эти форумные ссылки ведут на реальные страницы сайта. ИМХО какой-то мусор остался в самом блоге.

По поводу индексации, которая вместо прежних минут теперь занимает дни - думаете ничего нельзя предпринять? smile:confused:
Цитата
t1gran пишет:
думаете ничего нельзя предпринять?
Это уже давно придумано - подсунуть ссылку или ссылку на ссылку
Серёжка,
Имеете в виду покупку ссылок? Раньше тоже не покупал, но в выдаче новые публикации оказывались через минуты. Что я делал не так? smile:confused:

P.S. Начинаю подозревать, что эти мусорные форумные ссылки ведут на страницы, где присутствует запись с битой ссылкой (на картинку).
у меня вообще гугл отказывается с 28го марта  кушать сайтмап  и в выдачу попадают страницы пагинации с тегом каноникал на главную -и гугл пишет проиндексировано несмотря на запрет в робот ТХТ )))
Цитата
t1gran пишет:
или принудительная задержка индексации непопулярных сайтов)?
тоже заметил и скорее вот это
Обнаружил в Google Search Console группу параметров URL, которые сам не создавал - подозреваю, что они завелись автоматически после установки форума (плагина) несколько лет назад. Форум тогда быстро забился сотнями тысяч спама, пришлось удалять его из базы данных вручную - а параметры похоже остались и ведут на реальные страницы сайта. Вопросы:
1) Надо ли и возможно ли их удалить, и если да, то как?
2) Надо ли в Google Search Console поменять все эти параметры с "На усмотрение робота Googlebot" на "Нет, параметр не влияет на содержание страницы"?
3) Надо ли что-то прописать в robots.txt - например, запретить индексирование URL с этими параметрами, или хотя бы прописать канонические адреса?
Цитата
t1gran пишет:
Обнаружил в Google Search Console группу параметров URL, которые сам не создавал - подозреваю, что они завелись автоматически после установки форума (плагина) несколько лет назад. Форум тогда быстро забился сотнями тысяч спама, пришлось удалять его из базы данных вручную - а параметры похоже остались и ведут на реальные страницы сайта. Вопросы:
1) Надо ли и возможно ли их удалить, и если да, то как?
2) Надо ли в Google Search Console поменять все эти параметры с "На усмотрение робота Googlebot" на "Нет, параметр не влияет на содержание страницы"?
3) Надо ли что-то прописать в robots.txt - например, запретить индексирование URL с этими параметрами, или хотя бы прописать канонические адреса?


t1gran, вы можете сказать, что это негативно влияет на работу сайта?
Проблем с работой сайта не наблюдаю - но меня интересует его индексация ПС.
Цитата
Серёжка пишет:
В принципе весь интернет состоит из ссылок, только ими живет.
А где же поисковик берет ссылку как не в интернете.Вы уже могли и забыть, что где то, когда то в профиле ссыль поставили.
А тут через пять-семь лет на форуме эти ссылки в профилях к индексации открыли. По ошибке, случайно, не важно.
И из баз данных крупных компаний утечки бывают.
А там что? Правильно упоминания - ссылки)
Теоретик-неформал? Думается, что Вы здесь не для праздных бла-бла постов, истинная цель у Вас отрекламить что-то, вот и фигачите пока посты ни о чём, а потом вывалите ссыль на что-нить или представителем кого-то будете подтверждённым. Эх, оскомина уже от Вас. Рекамьтесь по нормальному, крауд - сторона нищебродов. smile:confused:
Изменено: Eye - 30 Сентября 2018 03:45
But you see,
it's not me,
it's not my
family
In your head,
in your head
they are fighting
Страницы: 1 2 След.
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
17:59 Купить шаблон 
17:55 Супер-партнерка PayV: избранные офферы в топовых нишах 
16:42 Биржи ссылок и статей 2020 
15:31 3snet - гемблинг, беттинг, форекс, бинарные опционы, майнинг 
15:03 Adtrafico - Правильная партнёрская сеть под бурж трафик 
13:30 CPA-PRIVATE.BIZ - премиальная товарная программа. Только ТОП ставки! 
13:08 LOSPOLLOS.COM - Конвертим по рецепту Хайзенберга. Dating, Mainstream, Binary Options 
17:26 Автоматизированная схема с прибылью от 1500 - 2000 руб. сутки 
15:27 продам google AdWords 
12:12 Litex.pro обмен валюты с минимальной комиссией 
12:02 Легендарный Forex4You. Как работать с ПП, альтернативы. 
10:29 Majento PositionMeter - Быстрое сканирование Яндекс и Google 
08:28 Современный скрипт обменника электронных валют 
07:18 За сколько можно толкнуть этот сайт? 
17:06 Чехия высылает 18 российских дипломатов 
17:04 Госдума запретила госслужащим и военным иметь иностранные гражданства 
16:58 Moscow News: Новая Зеландия намерена стать первой страной в мире, почти полностью свободной от табакокурения 
23:14 Яндекс Диск +20ГБ 
19:22 Пассивный доход с Oborot.net 
19:07 Google пообещала удалить нарушающий российские законы контент 
09:18 РБК: Создатель биткоина вошел в топ-20 самых богатых людей мира