Вопрос по дате изменения страницы
Страницы: 1
Вопрос по дате изменения страницы
А как поисковые машины определяют дату изменения страницы?
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

И как поисковые машины определяют время изменения динамических страниц в отсутствие файла sitemap?
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.

Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.

Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом
Изменено: Joker - 27 Июля 2010 18:59
Цитата
Joker пишет:
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.



Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?


х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.



Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом


Не объясните что такое разница в весе документа раннего и позднего взвешивания?
И про RSS? как его использовать?
Грубо говоря вариантов несколько.

Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....

Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).

Другие ....

RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).

p.s.: а зачем вам рыть так глубоко? )
Изменено: Joker - 28 Июля 2010 12:13
Цитата
Joker пишет:
Грубо говоря вариантов несколько.



Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....



Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).



Другие ....



RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).



p.s.: а зачем вам рыть так глубоко? )


Да глубоко рыть не хочется - но есть вопросы. Сделал самостоятельно скрипт который составляет sitemap, так как программы которые использовал все с недостатками(кто перебирает медленно, кто с исключениями не работает). Дату lastmodify вношу в скрипт вручную, ставлю текущую. В панели вэбмастера яндекса и в robots.txt карту добавил(яндекс говорит ок, без ошибок). Теперь при количестве ссылок в sitemap около 4800, количество проиндексированных страниц в яндексе скачет постоянно от 2000 до 5000. Получается что sitemap Яндекс не пользуется.
Цитата
smmik пишет:
Получается что sitemap Яндекс не пользуется.


Я лично не видел, чтоб он туда стучался, как и рамблер.
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
00:02 Как безопасно купить Гугл почту? 
23:28 че по ПФ щас реально работает?? (кроме старья) 
23:26 [AI] Qwen3-Max Thinking: Алибаба подвинула DeepSeek и Gemini? 
22:47 29.01. Апдейт: Шторм // Вчера отдали 3% с оборота? 
22:46 Продвижение-2022: Гугл все? Нет – Гугл не все! 
10:40 Дзен окончательно всё? Или у кого-то еще «стреляет» белый контент? 
07:58 Нашел скрины выплат с Сапы за 2010 год. Пошел плакать 
23:03 SOCKS5 приватные прокси на 30 дней для PayPal 
23:02 Google Voice аккаунты для бесплатных SMS и звонков 
23:02 PayPal аккаунты для любых целей 
16:44 CryptoMonitor.info - ваш надеждный обменник BTC USDT XMR (без KYC) 
14:38 CryptoGraph — Анонимный обмен криптовалют без KYC и AML 
13:32 Мониторинг обменников Сrypto-scout.io 
13:16 Скрипт обменника валют 
23:24 Осталось 3-5 месяцев до блокировки YouTube в России, — заявил Клименко 
22:57 Gartner обещал смерть SEO к 2026 году. Открываем метрику и проверяем 
06:57 блокировка youtube 2026: ркн начинает «выдавливание». кто уже пробовал вк видео? 
15:18 Win 10: Три месяца без обновлений. Как полёт? // Переезд на Win 11 или Linux 
16:25 Подтягиваем физкультурку 
08:18 Тренера "Сочи" обвинили, что он рулил через ChatGPT. Игрокам предложили не спать 28 часов 
08:09 Владельцы "китайцев" 3-леток, признавайтесь честно — сгнили или едут?