Вопрос по дате изменения страницы
Страницы: 1
Вопрос по дате изменения страницы
А как поисковые машины определяют дату изменения страницы?
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

И как поисковые машины определяют время изменения динамических страниц в отсутствие файла sitemap?
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.

Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.

Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом
Изменено: Joker - 27 Июля 2010 18:59
Цитата
Joker пишет:
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.



Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?


х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.



Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом


Не объясните что такое разница в весе документа раннего и позднего взвешивания?
И про RSS? как его использовать?
Грубо говоря вариантов несколько.

Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....

Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).

Другие ....

RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).

p.s.: а зачем вам рыть так глубоко? )
Изменено: Joker - 28 Июля 2010 12:13
Цитата
Joker пишет:
Грубо говоря вариантов несколько.



Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....



Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).



Другие ....



RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).



p.s.: а зачем вам рыть так глубоко? )


Да глубоко рыть не хочется - но есть вопросы. Сделал самостоятельно скрипт который составляет sitemap, так как программы которые использовал все с недостатками(кто перебирает медленно, кто с исключениями не работает). Дату lastmodify вношу в скрипт вручную, ставлю текущую. В панели вэбмастера яндекса и в robots.txt карту добавил(яндекс говорит ок, без ошибок). Теперь при количестве ссылок в sitemap около 4800, количество проиндексированных страниц в яндексе скачет постоянно от 2000 до 5000. Получается что sitemap Яндекс не пользуется.
Цитата
smmik пишет:
Получается что sitemap Яндекс не пользуется.


Я лично не видел, чтоб он туда стучался, как и рамблер.
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
10:03 Как продвигать сайт с неуникальным контентом 
08:58 Стоит ли добавлять сайт в Rambler топ 100? 
08:57 Absence в Армении 
19:29 Dao.AD: Монетизация и покупка Push/Pops/Inpage и Video трафика! 
14:50 Индексация страниц 
12:36 У кого новостник, дайте пару советов плиз 
13:53 AviTool - мощный инструмент для автоматизации работы с Avito 
12:01 PonyBit.ru - обменный пункт PonyBit.ru (Понибит.ру) 
05:17 Продам копию сайта. 
04:11 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
01:31 Скрипт обменника валют 
21:44 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 
17:24 A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc 
14:01 Продам аккаунты Gmail USA IP | Gmail MIX IP | Outlook Old 
11:07 Ну что, кто куда деваете свои сайты? 
22:09 Добро пожаловать в цифровой мир... 
19:42 Топ-5 способов использовать мобильные прокси для бизнеса: подробный обзор 
22:08 Накрутка поисковых подсказок 
05:04 Точные прогнозы на футбол 
14:01 Union Pharm - топовая фарма-партнерка для профессионалов! 
10:59 Ням-ням! - 8 деликатесов, которые когда-то ели только бедные люди