BatchURLScraper - Извлечение данных методами XPath, CSSPath, XQuery и RegExp
Страницы: 1
BatchURLScraper - Извлечение данных методами XPath, CSSPath, XQuery и RegExp
Всем привет!

Представляю вашему вниманию бесплатную программу BatchURLScraper, предназначенную для извлечения данных со страниц сайтов используя XPath, CSS-селекторы, XQuery и RegExp.

Рисунок


Рисунок


Рисунок


Возможности программы BatchURLScraper:
- парсинг и извлечение данных по списку URL
- гибкая настройка парсинга используя XPath, CSSPath, XQuery и RegExp
- модуль для тестирования правил парсинга
- экспорт отчетов в Excel (CSV-формат)

Страница скачивания (5 Мб): https://site-analyzer.ru/soft/batch-url-scraper/

Буду рад любым отзывам и пожеланиям по работе программы.
Новая версия BatchURLScraper 1.3

Рисунок


Рисунок


Рисунок


Что нового:
- расширено число страниц для парсинга с 1000 до 5000 URL
- добавлена возможность скрапинга через HTML templates
- добавлена возможность извлечения данных через атрибуты CSS
- добавлена возможность скрапинга через внешний и внутренний HTML
- добавлена возможность использования списков Proxy
- исправлен баг некорректного сохранения User-Agent

Страница скачивания: https://site-analyzer.ru/soft/batch-url-scraper/
Новая версия BatchURLScraper 1.4 (build 27), 08.12.2020:
- исправлена ошибка с валидацией HTML-темплейтов
- оптимизирована работа с регулярными выражениями
- добавлена возможность неучета повторений при скрейпинге
- исправлена проблема с учетом пауз между запросами
- диапазон пауз между запросами расширен до полутора минут
- доработан и улучшен перевод программы
- устранены утечки памяти
Страницы: 1
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
01:59 Яндекс-ап 20 марта и похороны ChatGPT, Claude и Gemini. Считаем убытки 
10:16 Бесплатное расширение для Chrome — проверка ссылок прямо на странице 
10:15 ИКС Яндекс АПдейт 1 апреля 2026. Обновлён алгоритм расчёта 
10:12 Gmail разрешил менять основной адрес - теперь можно убрать старые ники без переноса аккаунта 
18:01 Раскрутка форума 
13:23 Рост эффективности моего интернет‑магазина 
21:08 Adsense личный опыт 
22:58 SOCKS5 приватные прокси на 30 дней для PayPal 
22:57 Google Voice аккаунты для бесплатных SMS и звонков 
22:57 PayPal аккаунты для любых целей 
21:16 Crypto Mixer ↔ Bitcoin Mixer ↔ Cryptocurrency tumbler ↔ No-AML 
18:54 Продам топовый аккаунт Kwork 
17:35 Русские народные сказки - оцените! 
15:59 Продам сайт Домен РУ RU РФ c доменом www.доменру.рф 
00:06 Точные прогнозы на футбол 
20:44 Огородники 
19:47 молодильные яблоки и живая вода 
16:25 8 марта: желаю аптайма 99.9% и e-e-a-t без локов 
22:45 С юмором по жизни! 
15:42 Голландцы влепили Grok по яйцам - теперь нельзя раздевать реальных людей, штраф 100к евро в день 
07:17 Почему не обновляется счетчик ИКС (индекса качества сайта)