Помогите с непонятной индексацией сайта на DLE

Сообщений: 35 Регистрация: Авг 2015

24 Августа 2015 19:11

Здравствуйте все. У меня небольшой сайт на DLE, и столкнулась с такой проблемой, решить которую не могу уже пару недель. Пыталась исправить ошибки, которые выдает гугл вебмастер, но с каждым обновлением их количество только увеличивается.
Страницы с повторяющимся метаописанием - там идут страницы каждой из категорий, у каждой из которых одинаковый дескрипшен - закрыла в роботс /page/ и удалила вручную ссылки на дубли из индекса. Но с каждым новым обновлением они туда залетают вновь.

А вот это мне вообще непонятно, что за страницы такие - moisait.ru/?k=abrakadabra ?

Закрыла в роботс /?k= , удалила все из индекса, а они вновь лезут и лезут в индекс, что это за чудо такое? Почему гугл игнорирует запреты в роботсе? Хотя в site:moisait.ru все эти page вроде как исчезли.

Кто-то может оказаться так добр, что подскажет?

Прикрепленные файлы

Clip2net_150824185205.jpg (61.62 КБ) [ Скачать ]

Clip2net_150824185836.jpg (199.12 КБ) [ Скачать ]

Большая поклонница Скарлетт Йоханссон, заглядываю на сайт о кино. Рекомендую отличный хостинг от 99 руб/мес, VPS от 250 руб/мес.

sharkson

Сообщений: 5425 Регистрация: Янв 2014

24 Августа 2015 19:51

Stasia87, напишите какой командой вы закрыли папки и страницы, которые не нужны.

И напишите какие именно страницы и папки вам надо закрыть.

Обратите внимание, что на конце ссылки с /?k написано depositfiles - я думаю так быть не должно по дефолту.

Изменено: sharkson - 24 Августа 2015 19:54

НАДЕЖНЫЙ И НЕДОРОГОЙ ХОСТИНГ ТУТ
НЕДОРОГОЙ ХОСТИНГ
ПРОДАМ БЛОГ ЖЖ
СОЗДАНИЕ И НАСТРОЙКА MediaWiki и phpbb3

Антип Замкадов

Сообщений: 796 Регистрация: Май 2010

24 Августа 2015 20:36

http://alaev.info/blog/post/3900 поможет исправить индексацию, что касается

"что за страницы такие - moisait.ru/?k=abrakadabra" - на шелл сильно похоже. Закрыть в robots можно так:

Код
User-agent: * Disallow: /*?

(при условии что ссылки с ЧПУ)

и поискать примерно тут: /engine/editor/css/web

Изменено: Антип Замкадов - 24 Августа 2015 20:37

Stasia87

Сообщений: 35 Регистрация: Авг 2015

24 Августа 2015 20:38

Цитата

sharkson пишет:
Stasia87, напишите какой командой вы закрыли папки и страницы, которые не нужны.

И напишите какие именно страницы и папки вам надо закрыть.

Обратите внимание, что на конце ссылки с /?k написано depositfiles - я думаю так быть не должно по дефолту.

Ну, вот так закрыла в robots.txt

Disallow: /*/page/
Disallow: /?k=

Мне не нужно сканирование вообще никаких страниц категорий, кроме самой первой.

По поводу депозитфайлза скажу, что сайт предназначен для загрузок, поэтому ссылок на различные обменники на нем присутствуют в большом количестве. Но вот что это такое /?k= я вообще без понятия, удалила около сотни подобных ссылок, и они все равно появились новые в индексе.

ArsenЖига -_-

Сообщений: 201 Регистрация: Авг 2014

24 Августа 2015 20:41

[COLOR=#881280]На страницах page пропишите данный тег [/COLOR]<meta name="robots" content="noindex, follow"/>

Stasia87

Сообщений: 35 Регистрация: Авг 2015

24 Августа 2015 20:52

Цитата

Антип Замкадов пишет:
alaev.info/blog/post/3900 поможет исправить индексацию, что касается

"что за страницы такие - moisait.ru/?k=abrakadabra" - на шелл сильно похоже. Закрыть в robots можно так:

Код
User-agent: * Disallow: /*?

(при условии что ссылки с ЧПУ)

и поискать примерно тут: /https://n2.tcphost.net/ispmgr?func=file&plid=www/mastyk.ru&elid=engine]engine/https://n2.tcphost.net/ispmgr?func=file&plid=www/mastyk.ru/engine&elid=editor]editor/https://n2.tcphost.net/ispmgr?func=file&plid=www/mastyk.ru/engine/editor&elid=css]css/web

Изучаю статью, пока больше вопросов, чем ответов)

Цитата
ArsenЖига -_- пишет: [COLOR=#881280]На страницах page пропишите данный тег [/COLOR]<meta name="robots" content="noindex, follow"/>

А вы не подскажете, как именно это сделать на страницах page?

sharkson

Сообщений: 5425 Регистрация: Янв 2014

24 Августа 2015 21:11

Цитата
Stasia87 пишет: Disallow: /*/page/ Disallow: /?k=

Закройте так:

Disallow: /page/
Disallow: /?k=*

После этого очистите кэш сайта. Потом укажите Гуглу и Яндексе новый роботс - добавив его через аддурилку.

Stasia87

Сообщений: 35 Регистрация: Авг 2015

24 Августа 2015 21:29

Цитата

sharkson пишет:

Цитата
Stasia87 пишет: Disallow: /*/page/ Disallow: /?k=

Сделала. Но что-то есть опасения, что не поможет)
Может, есть смысл попробовать закрыть страницы через <meta name="robots" content="noindex,follow" />, как предложили люди выше ? А вот в статье alaev.info/blog/post/3900 автор предлагает noindex,nofollow - как будет лучше?

И, может быть, кто-то сталкивался с этим противным /?k= ? Хотя бы понять, какова природа этого неведомого зверя? Может, это проиндексированный тег? Или что-то подобное? Откуда эта гадость берется, еще и в таких количествах?

sharkson

Сообщений: 5425 Регистрация: Янв 2014

24 Августа 2015 21:42

Цитата
Stasia87 пишет: Может, есть смысл попробовать закрыть страницы через <meta name="robots" content="noindex,follow" />, как предложили люди выше ? А вот в статье alaev.info/blog/post/3900 автор предлагает noindex,nofollow - как будет лучше?

А вы сделайте и запретом в роботсе и через мета.

Похожие темы:

13.01.2019 15:55	Помогите найти чат для DLE 13
11.12.2018 09:00	Помогите настроить rss grabber для dle
13.09.2018 20:28	Помогите оптимизировать в шаблоне раздел fullstory
02.06.2018 17:32	Помогите с редиректом
08.04.2018 03:11	Помогите с кнопкой

Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)

Новые темы	Объявления	Свободное общение
21:03 Продвижение по ключам 15:44 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 09:57 3snet - гемблинг, беттинг, форекс, бинарные опционы, майнинг 19:33 LOSPOLLOS.COM - Конвертим по рецепту Хайзенберга. Dating, Mainstream, Binary Options 15:12 Несколько статей хорошо выдаются в Гугле, но отвратительно в Яндексе 13:40 Dao.AD: Монетизация и покупка Push/Pops/Inpage и Video трафика! 11:41 2Index - быстрая индексация страниц сайта и обратных ссылок	20:39 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 17:10 AllCharge.online. Современный, быстрый и надёжный обменник 15:24 Продам аккаунты Gmail USA IP \| Gmail MIX IP \| Outlook Old 14:48 AlwaysMoney - платформа для обмена криптовалют 14:11 №1 Рассылка / Инвайтинг [TELEGRAM] \| Приватный метод 14:10 Trustpilot Reviews \| Подниму рейтинг вашей компании 14:10 Продвижение YouTube видео в топ поиска \| Любой тип контента \| Гарантия результата	16:49 monetizer.agency – рекламная сеть для взрослого и развлекательного трафика. 100$ новому вебмастеру 20:43 Добро пожаловать в цифровой мир... 15:59 Про мясо 23:09 ПП от PMS remote.team - 200$ за команду 13:28 Компьютерная мышь 22:55 Ну что, кто куда деваете свои сайты? 22:34 Используете беспроводные наушники?