Собственная поисковая система как новый способ привлечения посетителей на сайт.
Страницы: 1
Собственная поисковая система как новый способ привлечения посетителей на сайт., Софт для создания собственной поисковой системы
Всем привет!
Проблема поиска по сайту является сложнорешаемой и не всегда реализуемой в рамках тех бюджетов, с которыми сталкиваются вебмастера. А если попытаться организовать поиск  по собственной сетке сайтов, это становится совсем нерентабельным предприятием. Например, у такого сервиса как elastic за поиск только по одному домену до 5К страниц необходимо будет заплатить $79/month, а если вам нужен поиск по большему количеству сайтов и страниц, то это уже $199/month + $30 за каждый сайт и столько же за каждые дополнительные 5К страниц.

Да, есть бесплатные решения у того же Elastic и Sphinx, но они требуют подключения к базе данных сайтов и тонкой настройки для каждого сайта (в каких полях искать, какой вес должен быть у найденной информации, как ранжировать). Для создания небольшой поисковой системы необходимо создать свои краулеры, разработать стратегию сканирования, сохранить полученную информацию в свою базу и там уже применить бесплатные решения Elastic или Sphinx. Но такой путь очень длинный и может дать не совсем тот результат, который мы ожидаем. Например, банальный поисковый запрос «саженцы абрикосов» дает 0 результатов, в то время как на запрос «саженеЦ абрикосА» поисковый движок выдаст множество результатов.

Учитывая вышесказанное, можно сделать вывод, что в мире сайтостроения не хватает простого, быстрого и максимально дешевого решения для организации поиска по сайтам, что позволило бы создавать небольшие поисковые системы.

Приглашаю всех желающих протестировать движок поисковой системы, которую можно легко установить на  VPS сервере или на обычном ПК для поиска по одному сайту или по группе сайтов. С помощью Kavunka 2.1 вы можете создать маленькую поисковую систему по тематическим сайтам: интернет-магазины, продажа недвижимости, авто-мото и.т.д. Также Вы сможете настроить выдачу таким образом, что пользователь сразу будет видеть картинку, цену, рейтинг товара или услуги.

Kavunka написана на Си и работает под управлением ContOS 7 (с помощью VMware Workstation можно использовать в Windows), легко масштабируется (от VPS 1 Core 1GB RAM  до высокопроизводительного сервера). Управление и настройка поисковой системой производится через веб-интерфейс. Kavunka распознает язык текста (ru, en, it, fr, pt, es, pl, uk), может исправлять ошибки в запросах пользователя и делать подсказки во время ввода поискового запроса, реализован стемминг. Kavunka автоматически собирает ключи и определяет уникальность текста, может пошагово пропускать HTML-код страницы скандируемого сайта через регулярные выражения и отдельно сохранять результат вебскрепинга в виде JSON-строки, тем самым давая возможность получать данные в виде отчета. Присутствует возможность сканировать не весь сайт, а только страницы с определенными ключевыми словами или urlами, которые содержат определенные признаки. Так же стоит упомянуть об интеграции с технологией Selenium (взаимодействие с реальным браузером Firefox) и возможности использовать proxy. Это делает данный софт еще и мощным парсером.

Демонстрацию возможностей  Kavunka 2.1 вы можете увидеть на примере созданной мною агропоисковой системы - https://kavunka.com.ua/draw.php?filerequest=saghenciy-abryikosov-abryikos-1

Как видите, у слова абрикос и саженец есть много словоформ. Выдача приобретает совсем другой вид, если выводить: цену, рейтинг и картинку. На момент написания этого поста в индексе данной поисковой системы присутствует всего 43 сайта, общее количество страниц составляет 31 317. Это далеко не предел, так как в предыдущей версии Kavunka 2.0 в индексе было 1200+ сайтов с общим количеством страниц около миллиона, но из-за того, что были изменены алгоритмы сканирования и парсинга, всю информации пришлось удалить.

Ознакомиться и установить поисковую систему - https://kavunka.biz/started.php

Со своей стороны гарантирую поддержку и маленькие бонусы в виде годичных лицензий первым десяти установившим Kavunka 2.1, а на период бета-тестирования лицензии будут продлеваться бесплатно по запросу в службу поддержки.
К чему такой огромный текст?
Цитата
WGN пишет:
К чему такой огромный текст?
 у меня то же не хватило терпения и до середины дочитать)
Шаблоны сайтов - Теперь всё бесплатно!
Как будто машинный перевод
Страницы: 1
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
20:18 ЕС душит ТикТок: прощай бесконечная лента и RPM? Что с монетизацией? 
20:14 Гугл пухнет от кеша, а нам - крошки. Разбор $114 млрд: Адсенс в минусе, Ютуб на подписках 
20:11 01.02. Апдейт 31.01 // Chrome готовит "чёрную метку" для ИИ? 
18:53 Кнопки "скрыть" и "пожаловаться" в рекламе яндекса 
15:29 OpenAI и шейхи: Цензура на продажу и "гибкие" идеалы амеров 
13:26 Как безопасно купить Гугл почту? 
10:59 WB и Ozon - новые "русские поисковики"? Яндекс теряет коммерческую выдачу 
04:13 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
00:01 E-currency.exchange — ваш помощник в мире обменов 
23:40 Monitex: Мониторинг с кэшбэком 80% в USDT 
22:35 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 
18:41 Веривикация Авито 
17:37 Продам аккаунты Gmail USA IP | Gmail MIX IP | Outlook Old 
16:31 JustProxy.Biz - Резидентные прокси без ограничения по трафику 
03:45 Гильотина для классиков: Клод доедает физические книги 
01:24 Точные прогнозы на футбол 
21:04 Кулеры и БП станут золотыми? Медь по 13 штук, олово в космосе 
19:29 FIFA и Assassin’s Creed воруют пароли: В репаки зашили лютый стиллер. Чекаем логи 
19:24 Туалетные секреты: Замурчательная тема 
19:15 Сайты Рунета 
15:15 ИИ-театр для инвесторов: почему виральные посты в Moltbook писали люди и в чем подвох OpenClaw