BatchURLScraper - Извлечение данных методами XPath, CSSPath, XQuery и RegExp
Страницы: 1
BatchURLScraper - Извлечение данных методами XPath, CSSPath, XQuery и RegExp
Всем привет!

Представляю вашему вниманию бесплатную программу BatchURLScraper, предназначенную для извлечения данных со страниц сайтов используя XPath, CSS-селекторы, XQuery и RegExp.

Рисунок


Рисунок


Рисунок


Возможности программы BatchURLScraper:
- парсинг и извлечение данных по списку URL
- гибкая настройка парсинга используя XPath, CSSPath, XQuery и RegExp
- модуль для тестирования правил парсинга
- экспорт отчетов в Excel (CSV-формат)

Страница скачивания (5 Мб): https://site-analyzer.ru/soft/batch-url-scraper/

Буду рад любым отзывам и пожеланиям по работе программы.

Комплексное SEO продвижение в поисковых системах Яндекс, Google

Новая версия BatchURLScraper 1.3

Рисунок


Рисунок


Рисунок


Что нового:
- расширено число страниц для парсинга с 1000 до 5000 URL
- добавлена возможность скрапинга через HTML templates
- добавлена возможность извлечения данных через атрибуты CSS
- добавлена возможность скрапинга через внешний и внутренний HTML
- добавлена возможность использования списков Proxy
- исправлен баг некорректного сохранения User-Agent

Страница скачивания: https://site-analyzer.ru/soft/batch-url-scraper/
Новая версия BatchURLScraper 1.4 (build 27), 08.12.2020:
- исправлена ошибка с валидацией HTML-темплейтов
- оптимизирована работа с регулярными выражениями
- добавлена возможность неучета повторений при скрейпинге
- исправлена проблема с учетом пауз между запросами
- диапазон пауз между запросами расширен до полутора минут
- доработан и улучшен перевод программы
- устранены утечки памяти
Страницы: 1
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
12:49 РСЯ ужесточает приём сайтов? 
11:06 СЕОшник за 20000 руб составил мне title, description, keywords. Отлично составил 
04:57 Самому блоки располагать, или положится на гугл 
04:50 Груповухи для души 
00:13 Биржи ссылок и статей 2020 
23:13 Можно ли еще заработать в Sape 
23:09 Ссылочная биржа TrustLink 
11:58 Легко! Качественно! Доступно! Профессионально пишу и размножаю тексты 
11:07 Todex.io - Быстрый и надежный обменник 
19:50 Качественный прогон Хрумером, Zennoposterом всего 10 WMZ, Большой опыт работы. Статьи, комментарии, профиля, гостевые. 
21:26 ISMM.STORE - Оптовый сервис накрутки в социальные сети 
17:43 Мастер шаблона размножения статей + Ручной синонимизатор-рерайтер 
17:41 Размножение статей качественно 
14:19 World-Bases.com - Списки сайтов и доменов на различных CMS: WordPress, Joomla, Magento, Drupal etc. 
12:56 Для чего надо учиться? 
13:06 Instagram и Facebook возможно что-то поняли и, не теряя времени, разблокировали аккаунты Трампа 
10:19 Украинцы не любят использовать банковские карты для оплаты в Интернете 
09:42 Великая Америка! 
22:25 $270 млн выброшено на помойку 
22:20 Обещанный снеговик 
15:50 СМИ: сторонники Трампа готовят вооруженный мятеж с помощью Telegram