"Страница проиндексирована, но ее нет в файле Sitemap" - а она там есть!
Страницы: 1 2 След.
"Страница проиндексирована, но ее нет в файле Sitemap" - а она там есть!, Новые записи не попадают в выдачу, при этом Google выдает некорректное об
Здравствуйте!
Проблема: новые записи не попадают в выдачу Google.

Регулярно замечаю, что после публикации новой записи (gadgets-news.ru/sebestoimost-iphone-xs-otsenili-v-395/) проверка URL выдает Страница проиндексирована, но ее нет в файле Sitemap. В действительности она там есть (gadgets-news.ru/post-sitemap4.xml), а в фильтре по этому статусу в Google Search Console данный URL, наоборот, отсутствует (т.е. Google противоречит сам себе).

В других случаях (gadgets-news.ru/bionic-a12-perehod-10-nm-na-7-nm/) Google Search Console пишет Страница отправлена и проиндексирована, но в выдаче Google этого URL тоже нет.

Раньше новые публикации там появлялись в течение считанных минут после публикации.


Текущая статистика по сайту такая:

> записей в блоге ~3200
> страница отправлена и проиндексирована ~2800
> страница проиндексирована, но ее нет в файле Sitemap ~500

При этом:

> эти 500 проиндексированных, но отсутствующих в Sitemap ссылок - какой-то мусор (ссылки на реальные страницы сайта, но через ссылки давно удаленного форума), я сделал по ним запрос Удалить URL-адреса

> согласно этой статистике существует ~400 (3200 минус 2800) нормальных записей, которых нет ни в Страница отправлена и проиндексирована, ни в Страница проиндексирована, но ее нет в файле Sitemap. ~400 при условии, что Страница отправлена и проиндексирована соответствует действительности (на втором примере видим, что это ни разу не так)

> site:gadgets-news.ru выдает ~3700 ссылок.

Что можно предпринять?
Изменено: t1gran - 26 Сентября 2018 15:30

Бесплатная контекстная реклама

Цитата
t1gran пишет:
Страница отправлена и проиндексирована , но в выдаче Google этого URL тоже нет.
Мож так выдача от индексации отстает.
Чуть подождать
Серёжка,
У меня тоже есть подозрение, что теперь вместо прежних минут на индексацию уходят дни. Вопрос в следующем:
1) почему такой регресс (деградация движка Google, или принудительная задержка индексации непопулярных сайтов)?
2) почему Google Search Console врет про статус (говорил бы прямо, что страница не проиндексирована, без сказок про Sitemap или индексацию)
3) как мне отфильтровать де-факто непроиндексированные страницы.


Еще хотелось бы понять откуда взялись эти 500 мусорных ссылок со статусом Страница проиндексирована, но ее нет в файле Sitemap. Вид у них такой: gadgets-news.ru/page/178/?topic=правила-размещения-объявлений, gadgets-news.ru/page/212/?topic=uroki-matematiki-i-fiziki, gadgets-news.ru/page/316/?forum=forum. Это явно остатки форума 4-5-летней давности, который забился огромным числом спама - пришлось удалять этот форум через базу данных. Причем эти ссылки почему-то ведут на вполне реальные страницы сайта. Google постоянно эти ссылки откуда-то находит и якобы индексирует. Как бы удалить эти остатки из блога, или хотя бы закрыть их от индексации?
Цитата
t1gran пишет:
как мне отфильтровать де-факто непроиндексированные страницы.
А зачем? Ну и хрен с ними.



Цитата
t1gran пишет:
Google постоянно эти ссылки откуда-то находит и якобы индексирует.
Индексирует, индексирует...
Подозреваю, что он идёт по ссылке, не находит страницу, но где то у него мкнет, что страница быть должно. Начинает искать, собирать инфу. И находит же)))
Цитата
Серёжка пишет:
Подозреваю, что он идёт по ссылке
По какой ссылке, где он её берет?
Цитата
t1gran пишет:
Цитата
Серёжка пишет:
Подозреваю, что он идёт по ссылке
По какой ссылке, где он её берет?
В принципе весь интернет состоит из ссылок, только ими живет.
А где же поисковик берет ссылку как не в интернете.Вы уже могли и забыть, что где то, когда то в профиле ссыль поставили.
А тут через пять-семь лет на форуме эти ссылки в профилях к индексации открыли. По ошибке, случайно, не важно.
И из баз данных крупных компаний утечки бывают.
А там что? Правильно упоминания - ссылки)
Серёжка,
Я точно этих ссылок не оставлял. В свое время имел неосторожность поставить плагин с форумом, а спустя несколько недель обнаружил, что боты забили его сотнями тысяч спамных тем и сообщений. Также непонятно, как эти форумные ссылки ведут на реальные страницы сайта. ИМХО какой-то мусор остался в самом блоге.

По поводу индексации, которая вместо прежних минут теперь занимает дни - думаете ничего нельзя предпринять? smile:confused:
Цитата
t1gran пишет:
думаете ничего нельзя предпринять?
Это уже давно придумано - подсунуть ссылку или ссылку на ссылку
Серёжка,
Имеете в виду покупку ссылок? Раньше тоже не покупал, но в выдаче новые публикации оказывались через минуты. Что я делал не так? smile:confused:

P.S. Начинаю подозревать, что эти мусорные форумные ссылки ведут на страницы, где присутствует запись с битой ссылкой (на картинку).
у меня вообще гугл отказывается с 28го марта  кушать сайтмап  и в выдачу попадают страницы пагинации с тегом каноникал на главную -и гугл пишет проиндексировано несмотря на запрет в робот ТХТ )))
Цитата
t1gran пишет:
или принудительная задержка индексации непопулярных сайтов)?
тоже заметил и скорее вот это
Обнаружил в Google Search Console группу параметров URL, которые сам не создавал - подозреваю, что они завелись автоматически после установки форума (плагина) несколько лет назад. Форум тогда быстро забился сотнями тысяч спама, пришлось удалять его из базы данных вручную - а параметры похоже остались и ведут на реальные страницы сайта. Вопросы:
1) Надо ли и возможно ли их удалить, и если да, то как?
2) Надо ли в Google Search Console поменять все эти параметры с "На усмотрение робота Googlebot" на "Нет, параметр не влияет на содержание страницы"?
3) Надо ли что-то прописать в robots.txt - например, запретить индексирование URL с этими параметрами, или хотя бы прописать канонические адреса?
Цитата
t1gran пишет:
Обнаружил в Google Search Console группу параметров URL, которые сам не создавал - подозреваю, что они завелись автоматически после установки форума (плагина) несколько лет назад. Форум тогда быстро забился сотнями тысяч спама, пришлось удалять его из базы данных вручную - а параметры похоже остались и ведут на реальные страницы сайта. Вопросы:
1) Надо ли и возможно ли их удалить, и если да, то как?
2) Надо ли в Google Search Console поменять все эти параметры с "На усмотрение робота Googlebot" на "Нет, параметр не влияет на содержание страницы"?
3) Надо ли что-то прописать в robots.txt - например, запретить индексирование URL с этими параметрами, или хотя бы прописать канонические адреса?


t1gran, вы можете сказать, что это негативно влияет на работу сайта?
Проблем с работой сайта не наблюдаю - но меня интересует его индексация ПС.
Цитата
Серёжка пишет:
В принципе весь интернет состоит из ссылок, только ими живет.
А где же поисковик берет ссылку как не в интернете.Вы уже могли и забыть, что где то, когда то в профиле ссыль поставили.
А тут через пять-семь лет на форуме эти ссылки в профилях к индексации открыли. По ошибке, случайно, не важно.
И из баз данных крупных компаний утечки бывают.
А там что? Правильно упоминания - ссылки)
Теоретик-неформал? Думается, что Вы здесь не для праздных бла-бла постов, истинная цель у Вас отрекламить что-то, вот и фигачите пока посты ни о чём, а потом вывалите ссыль на что-нить или представителем кого-то будете подтверждённым. Эх, оскомина уже от Вас. Рекамьтесь по нормальному, крауд - сторона нищебродов. smile:confused:
Изменено: Eye - 30 Сентября 2018 03:45
Кому-нибудь другому очень просто рассказать, как надо жить и что делать. Я бы любому все объяснил. И даже показал бы, к каким огням лететь и как. А если то же самое надо делать самому, сидишь на месте или летишь совсем в другую сторону. © В. П.
Страницы: 1 2 След.
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
03:24 Апдейт ИКС 24.05.19 
01:17 Как Яндекс.Директ блокирует аккаунт сразу после пополнения счёта... 
00:00 Quick Sender - одна из лучших программ для работы с "ВКонтакте" 
23:51 Новый сайт без продвижения 
22:27 Рекламная сеть яндекса личный опыт 
18:59 Помогите пожалуйста советом по оптимизации 
18:50 Вопрос по поводу текстов 
00:11 Софт на заказ 
19:50 Семантическое ядро по новой технологии + LSI с ручной группировкой 
18:37 Сервис по раскрутке в соц сетях 
16:44 Продажа быстрых SSH туннелей. Любые страны с гарантией! 
16:24 Продвину сайт качественными ссылками. Рост посещаемости, позиций и ИКС. Крауд ссылки недорого + скидки. 
15:30 200 открытых анкорных ссылок всего за 100 рублей 
13:33 17 ссылок для продвижения в Google 
20:27 Партнерка по торговле акциями КАНнАБИСа, получай кеш с любой сделки. 
20:26 Наши машинки 
19:06 На какую тему создать сайт? 
18:36 Как восстановить удаленные файлы на компьютере? 
12:58 Кому пришла выплата с AdSense? 
09:39 Акции, облигации, банковский депозит? 
13:21 Топик поднятия настроения. Приколы, картинки, видео и пр.