Автор контента: Яблоко
Использование протокола Sitemaps позволяет вебмастеру информировать поисковые системы о страницах веб-сайта, которые доступны и подлежат индексации. Sitemap представляет собой XML-файл, где перечислены URL (урлы - адреса страниц) сайта. В карте сайта вебмастер может указать дополнительную информацию о каждой странице: когда она обновлялась, как часто меняется, и насколько важна по отношению к другим URL. Благодаря этому поисковые системы могут более осмысленно индексировать сайт. Важно понимать, что применение данного протокола не гарантирует индексацию веб-страниц поисковыми системами. XML-карта сайта – это дополнительная помощь поисковой машине для более тщательного сканирования ресурса.
При создании Sitemap используются XML-теги и кодировка UTF-8. Файлов Sitemap может быть сколько угодно, но один файл должен содержать не более 50000 урлов и не превышать объем 10,5 Мб (уменьшить размеры файла поможет архиватор gzip). Создавая несколько файлов Sitemap, важно перечислить каждый из них в файле индекса Sitemap (Sitemap index). Проверить карту сайта можно в том же Яндекс.Вебмастере или Google Webmasters Tools.
Карту сайта рекомендуется размещать в его корне (пример: http://вашсайт.ru/sitemap.xml). Все перечисленные в карте ссылки должны находиться в одном домене, указывать на страницы из одного каталога (или подкаталога), а также использовать один протокол (например, HTTP), по которому файл Sitemap доступен.
После создания и размещения карты на сервере, следует сообщить поисковым системам о ее местоположении. Это можно сделать при помощи интерфейса поисковой системы, файлом robots.txt (добавить в него строку вида: «Sitemap: http://вашсайт.ru/sitemap.xml») или же выслать HTTP-запрос (для Яндекса, для Google).
Приверженцы кропотливой работы могут потратить несколько часов и создать XML-карту вручную. Все остальные, как правило, отдают предпочтения бесплатным онлайн-сервисам, генераторам (sitemap generator). Сегодня достаточно легко найти подходящий Sitemap-модуль. Главное, убедиться, что правильно указаны частота обновления страниц (changefreq) и их приоритет (priority).