Вопрос по дате изменения страницы
Страницы: 1
Вопрос по дате изменения страницы
А как поисковые машины определяют дату изменения страницы?
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

И как поисковые машины определяют время изменения динамических страниц в отсутствие файла sitemap?
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.

Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?

х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.

Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом
Изменено: Joker - 27 Июля 2010 18:59
Цитата
Joker пишет:
заголовок сервера Last-Modified. при его отсутствии учитывается разница в весе документа раннего и позднего взвешивания. т.е. снова заголовки или тупое взвешивание.



Цитата
Если время изменения файла страницы одно, а в файле sitemap другое. Что поисковые машины будут считать за истинное?


х.з. ... поидее мэп должен приоритет иметь по тегам
Код
<lastmod>date</lastmod>
т.к. есть такое понятие, как кэш.



Еще есть RSS, думаю при его наличии приоритет будет за ним для блого-ботов, бурнеров и прочих примочек. Скорее всего они взаимодействуют как-то с основным индексом


Не объясните что такое разница в весе документа раннего и позднего взвешивания?
И про RSS? как его использовать?
Грубо говоря вариантов несколько.

Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....

Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).

Другие ....

RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).

p.s.: а зачем вам рыть так глубоко? )
Изменено: Joker - 28 Июля 2010 12:13
Цитата
Joker пишет:
Грубо говоря вариантов несколько.



Первый: робот самостоятельно(сам выбирает когда ему ) забирает странички и определяет не изменилось ли содержимое отталкиваясь от заголовков. Т.е. есть какой-то интервал прохода по адресам, например, раз в 20 минут. Скажем бот грабит главную страницу каждые 20 минут, проверяет её содержимое, дальше переходит по новым ссылкам(если они появились).....



Второй: пинг сообщает о том, что содержимое(например карты сайта) изменилось, чем заставляет робота посетить определённые url или ставит их в очередь на проверку(зависит от характера ПС). Дальше бот тупо ходит оп прочитанным адресам из карты(как вариант).



Другие ....



RSS -- гуглите сами. Как и sitemap, по сути, только содержит еще и какое-то кол-во контента и другую сопутствующую информацию(анонсы например).



p.s.: а зачем вам рыть так глубоко? )


Да глубоко рыть не хочется - но есть вопросы. Сделал самостоятельно скрипт который составляет sitemap, так как программы которые использовал все с недостатками(кто перебирает медленно, кто с исключениями не работает). Дату lastmodify вношу в скрипт вручную, ставлю текущую. В панели вэбмастера яндекса и в robots.txt карту добавил(яндекс говорит ок, без ошибок). Теперь при количестве ссылок в sitemap около 4800, количество проиндексированных страниц в яндексе скачет постоянно от 2000 до 5000. Получается что sitemap Яндекс не пользуется.
Цитата
smmik пишет:
Получается что sitemap Яндекс не пользуется.


Я лично не видел, чтоб он туда стучался, как и рамблер.
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
15:44 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 
09:57 3snet - гемблинг, беттинг, форекс, бинарные опционы, майнинг 
19:33 LOSPOLLOS.COM - Конвертим по рецепту Хайзенберга. Dating, Mainstream, Binary Options 
15:12 Несколько статей хорошо выдаются в Гугле, но отвратительно в Яндексе 
13:40 Dao.AD: Монетизация и покупка Push/Pops/Inpage и Video трафика! 
11:41 2Index - быстрая индексация страниц сайта и обратных ссылок 
23:00 Продвижение по ключам 
17:10 AllCharge.online. Современный, быстрый и надёжный обменник 
15:24 Продам аккаунты Gmail USA IP | Gmail MIX IP | Outlook Old 
14:48 AlwaysMoney - платформа для обмена криптовалют 
14:11 №1 Рассылка / Инвайтинг [TELEGRAM] | Приватный метод 
14:10 Trustpilot Reviews | Подниму рейтинг вашей компании 
14:10 Продвижение YouTube видео в топ поиска | Любой тип контента | Гарантия результата 
14:10 Установка|Настройка|Доработка|Наполнение сайтов|Дизайн|3D|Видеомонтаж 
16:49 monetizer.agency – рекламная сеть для взрослого и развлекательного трафика. 100$ новому вебмастеру 
20:43 Добро пожаловать в цифровой мир... 
15:59 Про мясо 
23:09 ПП от PMS remote.team - 200$ за команду 
13:28 Компьютерная мышь 
22:55 Ну что, кто куда деваете свои сайты? 
22:34 Используете беспроводные наушники?