Вопрос по дате изменения страницы
Страницы: 1
Вопрос по дате изменения страницы
А как поисковые машины определяют дату изменения страницы?
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

И как поисковые машины определяют время изменения динамических страниц в отсутствие файла sitemap?
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.

Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.

Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом
Изменено: Joker - 27 Июля 2010 18:59
Цитата
Joker пишет:
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.



Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?


х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.



Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом


Не объясните что такое разница в весе документа раннего и позднего взвешивания?
И про RSS? как его использовать?
Грубо говоря вариантов несколько.

Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....

Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).

Другие ....

RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).

p.s.: а зачем вам рыть так глубоко? )
Изменено: Joker - 28 Июля 2010 12:13
Цитата
Joker пишет:
Грубо говоря вариантов несколько.



Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....



Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).



Другие ....



RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).



p.s.: а зачем вам рыть так глубоко? )


Да глубоко рыть не хочется - но есть вопросы. Сделал самостоятельно скрипт который составляет sitemap, так как программы которые использовал все с недостатками(кто перебирает медленно, кто с исключениями не работает). Дату lastmodify вношу в скрипт вручную, ставлю текущую. В панели вэбмастера яндекса и в robots.txt карту добавил(яндекс говорит ок, без ошибок). Теперь при количестве ссылок в sitemap около 4800, количество проиндексированных страниц в яндексе скачет постоянно от 2000 до 5000. Получается что sitemap Яндекс не пользуется.
Цитата
smmik пишет:
Получается что sitemap Яндекс не пользуется.


Я лично не видел, чтоб он туда стучался, как и рамблер.
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
19:27 Стоит ли заморачиваться с мейл ру ? 
17:17 как оплатить claude и gpt-5 из рф в 2026 чтобы не забанили через три дня 
12:12 Robots txt 
15:01 Раскрутка форума 
08:42 Трафик в минус, соцсети в топе - Завершено февральское обновление Google Discover 
20:08 че по ПФ щас реально работает?? (кроме старья) 
16:52 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 
10:46 Мониторинг обменников Сrypto-scout.io 
08:50 Monitex: Мониторинг с кэшбэком 80% в USDT 
22:52 Mixmasters - Exchange without AML and KYC 
19:36 [Comcash.io] Анонимный обмен и чистка крипты без AML/KYC 
19:34 Swapwatch.org — Мониторинг криптовалютных обменников 
19:08 Nexulume.com Обменник без AML и KYC 
15:29 [UPDATE] CryptoMonitor — обмен BTC, USDT, XMR | актуальная тема сервиса 
12:34 блокировка youtube 2026: ркн начинает «выдавливание». кто уже пробовал вк видео? 
10:34 Панель Кнопки соцсетей 
22:25 Ставки на супер тренды в спорте 
21:13 Точные прогнозы на футбол 
17:31 молодильные яблоки и живая вода 
12:37 8 марта: желаю аптайма 99.9% и e-e-a-t без локов 
19:50 Добро пожаловать в цифровой мир...