Datacol - web-data-extractor.net
Приобрел чуть больше месяца назад. Качество на высоте
О работе:
Вполне доступный каждому и обучаемый под любые задачи парсер. Клиент оффлайн, но страшного в этом ничего нет. Нужно прокси для прохода вставить - пожалуйста, тайминг - нет проблем, подключить переводчик или синонимайзер - легко. Все доступно и понятно. Если заморочек не нужно, а просто сделать копипаст - сутки непрерывной работы парсера и 30к страниц ваши. Есть строенный браузер, который помогает выделить нужный код и с помощью регулярных выражений создать правило сбора информации. Можно файлы к себе на сервер загружать (видео, mp3, картинки и т.п.) - можно просто линки на них ставить. Спарсить можно любой сайт, от самого легкого до самого навороченного, вопрос во времени настройки парсера.
В Датаколе можно выбирать как и каким образом парсер будет проходить сайт-жертву (какие то определенные ссылки, рубрики, весь сайт и т.п.) При настройке того или иного поля для сбора информации можно делать тесты, что бы не запуская парсера посмотреть насколько верно выполнена настройка требуемого поля (к примеру, парсим описание, вставляем ссылку в "тест" от сайта-источника и видим результат - ту информацию, который парсер будет забирать)
В датаколе функций много, можно не только сайты парсить, можно поисковую выдачу собирать, можно базы для аллсаба/хрумера собирать, можно интернет-магазин наполнять и т.п. и т.д.
О технической поддержке:
На сайте производителя есть множество обучающих доступных видео роликов для настройки парсера под те или иные задачи. Есть готовые решения (скрипт парсинга aliexpress к примеру). Есть справочная информация о регулярных выражениях. Создатель парсера всегда доступен для связи. За отдельную плату может написать настройке по тех заданию, может провести обучение всего за 10$ в час. Адекватный и отзывчивый человек. Постоянно происходят обновление программного обеспечения
Из личного опыта:
Кроме парсинга контента, другие функции испробовать не успел. За ночь собрал авто сайт с 3к контента, который был проведен через синонимайзер. За пару ночей собрал сайт торрент-трекер с 30к страниц (копипаст), с легкостью собрал качественную базу для аллсаба. В данный момент собирается сложный проект трекера, который прогоняет контент через синонимайзер, не публикует дубликаты, собирает инфу с разных источников
Оценка: 8 из 10.
Доволен практически всем на 100%, 10 поставить не могу, т.к. не испытал другие возможность и для меня есть сложность вникания в регулярные выражения, а так, даже новичок в этом деле сможет за пару дней изучить принцип работы датакола и сделать себе сателит (которые, кстати продают по 1000 руб тут же на СуПРе) в котором будет и отсрочка публикации и материл различного рода содержания (комменты, блоги, форумы)
p.s. на сайте, ссылка которого есть вверху можно и купить и почитать отзывы и найти все описания