1.2.1549 - новый парсер CoinMarketCap, полностью переписаны 9 парсеров и новые опции в существующих
Улучшения
* Добавлен новый парсер CoinMarketCap::LastPrice
* Парсер SE::Yandex::Register полностью переписан, восстановлена возможность регистрировать аккаунты
* Парсеры SE::Yandex::WordStat, SE::Yandex::WordStat::ByDate и SE::Yandex::WordStat::ByRegion полностью переписаны, добавлен новый функционал (выбор способа авторизации, регистрация аккаунтов "на лету", сессии...), полный список изменений здесь
* HTML::EmailExtractor полностью переписан, благодаря использованию в качестве основы HTML::LinkExtractor кроме собственно парсинга почт, стали доступными множество возможностей: сбор ссылок, парсинг в глубину, использование Chrome и т.д.
* Все парсеры Instagram переписаны на JS APIv2, а также адаптированы к изменениям на источнике, больше информации здесь
* Увеличено максимальное кол-во страниц в SE::Google до 100
* Добавлен сбор даты со сниппета в парсерах Google
* В парсере SE::Bing добавлена опция Fix pagination bug, устраняющая баг в поиске Bing, из-за которого отдаются пустые 2-я и последующие страницы
* В парсере Shop::Wildberries::ProductInfo добавлен сбор данных о продавце и возможность определять наличие товара
* В парсере SE::Startpage добавлена опция Links per page и обновлен список доступных вариантов в существующих опциях
* В SE::DuckDuckGo добавлено опцию Use HTTP/2
* Net::HTTP: добавлена опция Ban Proxy Code RegEx
* Добавлена возможность задавать произвольный уровень для подзапросов (query.add)
* Добавлена опция needResults для this.parser.request
Исправления в связи с изменениями в выдаче
* Адаптация к изменениям в верстке Google и Yandex
* Восстановлена работа с рекаптчами в SE::Google, детальная информация об изменениях здесь
* Исправлен парсинг $title в Shop::Wildberries::ProductInfo
* SE::Google::TrustCheck, SE::Google::Images, Shop::Yandex::Market, Shop::Wildberries::ProductsList, SE::Dogpile, SE::Startpage
Исправления
* Исправлена работа HTTP keep-alive, в некоторых случаях сокет закрывался раньше времени
* Исправлена ошибка в опции Follow common redirects
* Redis API: исправлена работа некоторых парсеров, проблема возникала с парсерами, использующими оптимизацию результатов
Улучшения
* Добавлен новый парсер CoinMarketCap::LastPrice
* Парсер SE::Yandex::Register полностью переписан, восстановлена возможность регистрировать аккаунты
* Парсеры SE::Yandex::WordStat, SE::Yandex::WordStat::ByDate и SE::Yandex::WordStat::ByRegion полностью переписаны, добавлен новый функционал (выбор способа авторизации, регистрация аккаунтов "на лету", сессии...), полный список изменений здесь
* HTML::EmailExtractor полностью переписан, благодаря использованию в качестве основы HTML::LinkExtractor кроме собственно парсинга почт, стали доступными множество возможностей: сбор ссылок, парсинг в глубину, использование Chrome и т.д.
* Все парсеры Instagram переписаны на JS APIv2, а также адаптированы к изменениям на источнике, больше информации здесь
* Увеличено максимальное кол-во страниц в SE::Google до 100
* Добавлен сбор даты со сниппета в парсерах Google
* В парсере SE::Bing добавлена опция Fix pagination bug, устраняющая баг в поиске Bing, из-за которого отдаются пустые 2-я и последующие страницы
* В парсере Shop::Wildberries::ProductInfo добавлен сбор данных о продавце и возможность определять наличие товара
* В парсере SE::Startpage добавлена опция Links per page и обновлен список доступных вариантов в существующих опциях
* В SE::DuckDuckGo добавлено опцию Use HTTP/2
* Net::HTTP: добавлена опция Ban Proxy Code RegEx
* Добавлена возможность задавать произвольный уровень для подзапросов (query.add)
* Добавлена опция needResults для this.parser.request
Исправления в связи с изменениями в выдаче
* Адаптация к изменениям в верстке Google и Yandex
* Восстановлена работа с рекаптчами в SE::Google, детальная информация об изменениях здесь
* Исправлен парсинг $title в Shop::Wildberries::ProductInfo
* SE::Google::TrustCheck, SE::Google::Images, Shop::Yandex::Market, Shop::Wildberries::ProductsList, SE::Dogpile, SE::Startpage
Исправления
* Исправлена работа HTTP keep-alive, в некоторых случаях сокет закрывался раньше времени
* Исправлена ошибка в опции Follow common redirects
* Redis API: исправлена работа некоторых парсеров, проблема возникала с парсерами, использующими оптимизацию результатов