Прошу оценить robots.txt
Страницы: 1 2 След.
Прошу оценить robots.txt, Не уверен в правильности составления
Доброго дня! Прошу помочь в составлении robots.txt на свой блог. После установки плагина XML Sitemap & Google News feeds сверстал нечто подобное (добавлял нужное/ убирал лишнее).

Код
# XML Sitemap & Google News Feeds version 4.3.2 - http://status301.net/wordpress-plugins/xml-sitemap-feed/
Sitemap: http://fpatrol.ru/sitemap.xml
Sitemap: http://fpatrol.ru/sitemap-news.xml

User-agent: *
Disallow: /wp-admin/
Disallow: */xmlrpc.php
Disallow: */wp-*.php
Disallow: */trackback/
Disallow: *?wptheme=
Disallow: *?replytocom
Disallow: */comment-page-
Disallow: *?s=
Disallow: /webstat/
Disallow: /wp-content/plugins 
Disallow: /wp-content/themes 
Disallow: */downloads
Allow: */wp-content/uploads/

User-agent: Yandex 
Disallow: /wp-admin/
Disallow: */xmlrpc.php
Disallow: */wp-*.php
Disallow: */trackback/
Disallow: *?wptheme=
Disallow: *?replytocom
Disallow: */comment-page-
Disallow: *?s=
Disallow: /webstat/
Disallow: /wp-content/plugins 
Disallow: /wp-content/themes 
Disallow: */downloads
Allow: */wp-content/uploads/
Host: fpatrol.ru 

Интересует строка, которую я убрал
Код
Disallow: /wp-content/
Я так понимаю, что она закрывает весь уникальный контент сайта. Убрал также 

Код
 Disallow: */comment

Комментарии, наверное, пригодятся...
Может что лишнее прописано или наоборот не хватает для закрытия от поисковиков. Прошу подсказать.
В Яндекс.Вебмастере мануал есть. Сайт лучше прописать начав с http (особенно если есть зеркало на www).
Появилась проблема - появился дубль строк User-agent: *
Disallow: /wp-admin/


При том, что в плагине все нормально, а яндекс валидатор показывает повторение этих строк и дважды путь к сайтмап (показан сверху и снизу, где собственноручно прописал).Как это исправить?
Решил проблему, установив плагин All In One SEO Pack. Все стало в норме и без ошибок. Посмотрим, как скоро блог залетит в поисковики...
Судя по гуглу-вебмастеру, проблема какая то присутствует. На данный момент robot.txt содержит следующее:
Код
 User-agent: *
Disallow: /wp-admin/
Disallow: */xmlrpc.php
Disallow: */wp-*.php
Disallow: */trackback/
Disallow: *?wptheme=
Disallow: *?replytocom
Disallow: */comment-page-
Disallow: *?s=
Disallow: /webstat/
Disallow: /wp-content/plugins 
Disallow: /wp-content/themes 
Disallow: /downloads

User-agent: Yandex 
Disallow: /wp-admin/
Disallow: */xmlrpc.php
Disallow: */wp-*.php
Disallow: */trackback/
Disallow: *?wptheme=
Disallow: *?replytocom
Disallow: */comment-page-
Disallow: *?s=
Disallow: /webstat/
Disallow: /wp-content/plugins 
Disallow: /wp-content/themes 
Disallow: /downloads
Host: www.fpatrol.ru

Sitemap: http://fpatrol.ru/sitemap.xml
Sitemap: <a href=\"http://fpatrol.ru/sitemap.xml.gz\" target=\"_blank\">http://fpatrol.ru/sitemap.xml.gz</a>


Но в гугле прописано, что разделы sitemap.xls заблокированы в robot.txt. Вот мой sitemap.xml А вот что пишет гугл 

Или я зря кипишую, надо подождать, пока роботы прочешут все?
Цитата
Алексей пишет:
User-agent: *
Disallow: /wp-admin/
Disallow: */xmlrpc.php
Disallow: */wp-*.php
Disallow: */trackback/
Disallow: *?wptheme=
Disallow: *?replytocom
Disallow: */comment-page-
Disallow: *?s=
Disallow: /webstat/
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /downloads

User-agent: Yandex
Disallow: /wp-admin/
Disallow: */xmlrpc.php
Disallow: */wp-*.php
Disallow: */trackback/
Disallow: *?wptheme=
Disallow: *?replytocom
Disallow: */comment-page-
Disallow: *?s=
Disallow: /webstat/
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /downloads
Host: www.fpatrol.ru
Зачем вы дважды написали указания для Яндекс-бота, и для остальных ботов.

Достаточно одного раза, этого:


Код
User-agent: *
Disallow: /wp-admin/
Disallow: */xmlrpc.php
Disallow: */wp-*.php
Disallow: */trackback/
Disallow: *?wptheme=
Disallow: *?replytocom
Disallow: */comment-page-
Disallow: *?s=
Disallow: /webstat/
Disallow: /wp-content/plugins 
Disallow: /wp-content/themes 
Disallow: /downloads
Host: http://fpatrol.ru

Адрес с www - у вас указан в яндекс.вебмастере - зеркалом? Если нет - укажите там. И укажите http - главным зеркалом. И в хтаксесс сделайте редирект 3-1 с www на без www.
Остальное можно тут прочитать: http://help.yandex.ru/webmaster/controlling-robot/robots-txt.xml
Изменено: sharkson - 18 Октября 2014 04:11
Лучше в роботсе поставить запрет для ботов, которые вам даром не нужны. Это спорный прием, кто говорит, что помогает, кто-то говорит что нет, но я прописал запрет для всяких говеных ботов и они ко мне не заходят судя по логам.

Это что за хрень?:


Код
Sitemap: <a href=\"http://fpatrol.ru/sitemap.xml.gz\" target=\"_blank\"><a href=\"http://fpatrol.ru/sitemap.xml.gz</a>\" target=\"_blank\">http://fpatrol.ru/sitemap.xml.gz</a></a>

Удалите.
Изменено: sharkson - 18 Октября 2014 04:15
Цитата
sharkson пишет:
Зачем вы дважды написали указания для Яндекс-бота, и для остальных ботов.
Ну так везде вроде советуют для яши отдельно прописать.
Яндекс валидатор вот что написал. к чему бы это...
Цитата
Алексей пишет:
Ну так везде вроде советуют для яши отдельно прописать.
Нет.

Если файлов сайтмэп несколько, прописываете так:



Код
Sitemap: http://mysite.ru/site_structure/my_sitemaps1.xml Sitemap: <a href=\"http://mysite.ru/site_structure/my_sitemaps2.xml\" target=\"_blank\">http://mysite.ru/site_structure/my_sitemaps2.xml</a>
На конце должна стоять .xml
Цитата
sharkson пишет:
Sitemap: <a href=\"http://fpatrol.ru/sitemap.xml.gz\" target=\"_blank\"><a href=\"http://fpatrol.ru/sitemap.xml.gz</a>\" target=\"_blank\">http://fpatrol.ru/sitemap.xml.gz</a></a>
а где это такое?
Цитата
Алексей пишет:
Цитата
sharkson пишет:
Sitemap: <a href=\"http://fpatrol.ru/sitemap.xml.gz\ (http://\"http://fpatrol.ru/sitemap.xml.gz\\")" target=\"_blank\"><a href=\"http://fpatrol.ru/sitemap.xml.gz</a>\ (http://\"http://fpatrol.ru/sitemap.xml.gz</a>\\")" target=\"_blank\">http://fpatrol.ru/sitemap.xml.gz</a></a> (http://\"http://fpatrol.ru/sitemap.xml.gz</a></a>\")
а где это такое?
странно. такого нет в файле роботса
У вас в цитате.

Правильно так:
Sitemap: http://mysite.ru/site_structure/my_sitemaps1.xml
Sitemap: http://mysite.ru/site_structure/my_sitemaps2.xml
Цитата
sharkson пишет:
У вас в цитате.

Правильно так:
Sitemap: http://mysite.ru/site_structure/my_sitemaps1.xml
Sitemap: http://mysite.ru/site_structure/my_sitemaps2.xml

Не понятно. А такой вариант не правильный Http://fpatrol.ru/sitemap.xml? Если прописать другой путь, будет ошибка же...
Я написал образец http://блабла.ру/sitemap.xml http://блабла.ру/sitemap2.xml и т. д.
Страницы: 1 2 След.
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
12:44 РСЯ и тормоза сайта: Яндекс начал штрафовать за плохой PageSpeed? 
12:42 01.02. Апдейт 31.01 // Chrome готовит "чёрную метку" для ИИ? 
23:09 Как безопасно купить Гугл почту? 
13:45 Какой движок выбрать для форума? 
13:43 Нашел скрины выплат с Сапы за 2010 год. Пошел плакать 
09:26 Трафик пробил дно? Худший январь за 10 лет и внезапный рост продаж с Bing 
19:27 Плагин ответа 
12:36 Nexulume.com Обменник без AML и KYC 
09:12 Swapwatch.org — Мониторинг криптовалютных обменников 
09:07 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
23:25 SOCKS5 приватные прокси на 30 дней для PayPal 
23:24 Google Voice аккаунты для бесплатных SMS и звонков 
23:23 PayPal аккаунты для любых целей 
23:02 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 
12:41 Moltbook: Соцсеть для ботов, где людям закрыли рот. Началось? 
06:26 Ставки на супер тренды в спорте 
22:31 [AI] Бот за $600к советовал есть сыр с крысами. Нью-Йорк его (наконец-то) снес 
22:30 Точные прогнозы на футбол 
13:38 Осталось 3-5 месяцев до блокировки YouTube в России, — заявил Клименко 
07:11 Список обновленных тем пуст... 
17:02 Gartner обещал смерть SEO к 2026 году. Открываем метрику и проверяем