Правила употребления словоформ для Яндекса и Google
Поисковым системам приходится заново перерабатывать правила русского языка, чтобы сделать корректными поисковую выдачу. Какие "тонкости восприятия" Яндекс и Google нужно знать, чтобы грамотно оптимизировать посадочную страницу?
Все началось со словаря
Для формирования электронных морфологических баз на серверах их создатели разбивали слова с одинаковыми окончаниями на группы, которые нумеровались. Так поддерживался порядок и свободное место на сервере.
Как считает Яндекс
Морфологические базы Яндекса создавались около 10 лет назад на основе словаря А. Зализняка, который и ввел использование морфологических групп. Поэтому у Яндекса есть свои особенности поисковой выдачи. Так, глагол, его причастие и деепричастие — это одна словоформа: сделать, сделавший, сделав. Но однокоренные глаголы разных видов — это две разные словоформы: сделать и делать. Исключения составляют глаголы "купить" и "покупать", "выщипать" и "выщипывать", "отправлять" и "отправить". Яндекс относит их к одной словоформе. Кроме этого, Яндекс использует базу синонимов, как бы заранее "прочитывая мысли" пользователя.
Как считает Google
Создатели морфологической базы Google не использовали группировку слов по окончаниям. Поэтому Google можно назвать "неграмотным". К примеру, "сделать" и "делать" для него суть одна словоформа. А троицу из глагола, причастия, деепричастия Google и вовсе считает разными словами. Такого же мнения он о прилагательном и его превосходной степени. Но успех морфологической оптимизации не всегда заключен в безупречной грамотности машины.
Консенсус Яндекса и Google
Есть пункты, по которым Яндекс и Google солидарны. Во-первых, разные части речи не могут быть словоформами. Например, "осень" и "осенний" — это разные слова. Во-вторых, словоформы существительных могут быть только одного рода: "волк" и "волчица" — два разных слова. В-третьих, Яндекс и Google сходятся во мнении, что прилагательное и его сравнительная степень — словоформы. Например, "просторный" и "просторнее". За исключением слова "лучше", которое Google считает самостоятельным словом, а не словоформой.