A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc
Страницы: Пред. 1 2
A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc
Сборник рецептов #22: проверка индексации в нескольких ПС, многоуровневый парсинг и поиск сабдоменов ( https://a-parser.com/threads/4405/ )

22-й сборник рецептов. В нем мы разберемся, как проверять индексацию всех страниц сайта одновременно в нескольких поисковиках, научимся парсить данные по ссылкам из выдачи одним заданием и будем искать сабдомены на сайтах. Поехали!

Получение страниц сайта и проверка индексации в Google и Яндекс ( https://a-parser.com/resources/250/ )
Данный пресет позволяет спарсить ссылки на все страницы сайта и одновременно проверить их на предмет индексации поисковиками (в примере Google и Яндекс, можно по аналогии добавить другие ПС). Готовый пресет и описание по ссылке выше.
Рисунок


Парсим title и description для TOP10 поисковой выдачи по ключевому слову ( https://a-parser.com/resources/263/ )
Пример использования tools.query.add в JavaScript парсерах. Данный парсер получает ссылки из выдачи, после чего собирает из каждой страницы title и description. И все это одним заданием с максимальной производительностью, благодаря многопоточному парсингу. Парсер с описанием доступны по ссылке выше.
Рисунок


Поиск сабдоменов сайта ( https://a-parser.com/resources/272/ )
Небольшой пример, который демонстрирует, как собрать поддомены одного или нескольких сайтов. Используется Рисунок
HTML::LinkExtractor ( https://a-parser.com/wiki/html-linkextractor/ ) и Parse to level для прохода вглубь по страницам сайта. При этом Конструктором результатов извлекаются из внутренних ссылок домены и выводятся с уникализацией по строке. Готовый пресет - по ссылке выше.
Рисунок


Кроме этого:

* Работа с SQLite из JavaScript парсеров ( https://a-parser.com/resources/272/ ) - показаны все базовые возможности нового функционала по работе с SQLite


Еще больше различных рецептов в нашем обновленном Каталоге ( https://a-parser.com/resources/ )!
Предлагайте ваши идеи для новых парсеров здесь ( https://a-parser.com/threads/3464/ ), лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube ( https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw ) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter ( https://twitter.com/a_parser ).


* Сборник рецептов #1: Определяем CMS, оцениваем частотность ключевых слов и парсим Вконтакте ( a-parser.com/threads/1250/ )
* Сборник рецептов #2: собираем форумы для XRumer, парсим email со страниц контактов ( a-parser.com/threads/1328/ )
* Сборник рецептов #3: мобильные сайты, несколько парсеров, позиции ключевых слов ( a-parser.com/threads/1660/ )
* Сборник рецептов #4: поиск в выдаче, парсинг интернет-магазина и скачиваем файлы ( a-parser.com/threads/1674/ )
* Сборник рецептов #5: ссылки из JS, паблик прокси и карта сайта ( a-parser.com/threads/1705/ )
* Сборник рецептов #6: парсим базу номеров телефонов и сохраняем результаты красиво ( a-parser.com/threads/1737/ )
* Сборник рецептов #7: парсим RSS, качаем картинки и фильтруем результат по заголовкам ( a-parser.com/threads/1778/ )
* Сборник рецептов #8: парсим 2GIS, Google translate и подсказки Youtube ( a-parser.com/threads/1809/ )
* Сборник рецептов #9: проверяем сезонность ключевых слов и их полезность ( a-parser.com/threads/1830/ )
* Сборник рецептов #10: пишем кастомный парсер поисковика и парсим дерево категорий ( a-parser.com/threads/1881/ )
* Сборник рецептов #11: парсим Авито, работаем с JavaScript, анализируем тексты и участвуем в акции! ( a-parser.com/threads/1938/ )
* Сборник рецептов #12: парсим Instagram, собираем статистику и делаем свои парсеры подсказок ( a-parser.com/threads/2240/ )
* Сборник рецептов #13: сохраняем результат в файл дампа SQL и знакомимся с $tools.query ( a-parser.com/threads/2460/ )
* Сборник рецептов #14: используем XPath, анализируем сайты и создаем комбинированные пресеты ( a-parser.com/threads/2613/ )
* Сборник рецептов #15: анализируем скорость и юзабилити сайтов, парсим Яндекс.Картинки и Baidu ( a-parser.com/threads/2712/ )
* Сборник рецептов #16: парсинг OpenSiteExplorer с авторизацией, Яндекс.Каталога и Яндекс.Новостей ( https://a-parser.com/threads/2808/ )
* Сборник рецептов #17: картинки из Flickr, язык ключевых слов, список лайков в ВК ( https://a-parser.com/threads/3544/ )
* Сборник рецептов #18: скриншоты сайтов, lite выдача Яндекса и проверка сайтов ( https://a-parser.com/threads/3862/ )
* Сборник рецептов #19: публикация сообщений в Wordpress, парсинг Chrome Webstore и AliExpress ( https://a-parser.com/threads/3910/ )
* Сборник рецептов #20: автообновление цен в ИМ, анализ текстов и регистрация аккаунтов ( https://a-parser.com/threads/4074/ )
* Сборник рецептов #21: уведомления в Telegram из A-Parser, мультифильтр и парсинг IMDb ( https://a-parser.com/threads/4318/ )

Сборники статей:
* Сборник статей #1: A-Parser для маркетологов, SEO-специалистов и реальный опыт работы ( https://a-parser.com/threads/4009/ )
* Сборник статей #2: цикл статей-уроков по созданию JS парсеров ( https://a-parser.com/threads/4142/ )

Прогон по твиттеру, постинг в 1500 аккунтов
Постинг в твиттер аккаунты, для ускорения индексации ваших сайтов, сателлитов, дорвеев.

Сборник статей #3: пагинация, переменные и БД SQLite ( https://a-parser.com/threads/4442/ )

В этом сборнике статей мы рассмотрим все возможные варианты решения задачи прохода по пагинации на сайтах, очень детально изучим работу с переменными в JavaScript парсерах, а также попробуем работать с базами данных SQLite на примере парсера курсов валют. Поехали!

Обзор вариантов прохода по пагинации ( https://a-parser.com/resources/277/ )
В A-Parser существует несколько способов, с помощью которых можно реализовать проход по пагинации. В связи с их разнообразием, становится актуальным вопрос выбора нужного алгоритма, который позволит максимально эффективно переходить по страницам в процессе парсинга. В этой статье мы постараемся разобраться с каждым из способов максимально подробно. Также будут показаны реальные примеры и даны рекомендации по оптимизации многостраничного парсинга. Статья - по ссылке выше.
Рисунок


Переменные в парсерах JavaScript ( https://a-parser.com/resources/278/ )
JS парсеры в А-Парсере появились уже около года назад. Благодаря им стало возможным решать очень сложные задачи по парсингу, реализовывая практически любую логику. В этой статье мы максимально подробно изучим работу с разными типами переменных, а также узнаем, как можно оптимизировать работу сложных парсеров. Все это - в статье по ссылке выше.
Рисунок


Разработка JS парсера с сохранением результата в SQLite ( https://a-parser.com/resources/276/ )
Начиная с версии 1.2.152 в A-Parser появилась возможность работать с БД SQLite ( https://a-parser.com/resources/272/ ).
В данной статье мы рассмотрим разработку JavaScript парсера, который будет парсить курсы валют из сайта finance.i.ua и сохранять их в БД. В результате получится парсер, в котором продемонстрированы основные операции с базами данных. Подробности, а также готовый парсер - по ссылке выше.
Рисунок


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки smile:) ) - отписывайтесь здесь ( https://a-parser.com/threads/3464/ ).

Подписывайтесь на наш канал на Youtube ( https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw ) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter ( https://twitter.com/a_parser ).

Предыдущие сборники статей
* Сборник статей #1: A-Parser для маркетологов, SEO-специалистов и реальный опыт работы ( https://a-parser.com/threads/4009/ )
* Сборник статей #2: цикл статей-уроков по созданию JS парсеров ( https://a-parser.com/threads/4142/ )
1.2.185 - увеличение скорости в SE::Google::Modern, новые возможности Net:: DNS, множество улучшений [url=https://a-parser.com/threads/4471/]

Рисунок


Улучшения


[*] SE::Google::Modern [url=https://a-parser.com/wiki/se-google-modern/] - многократно увеличена скорость парсинга
[*]Множество улучшений в Net:: DNS [url=https://a-parser.com/wiki/net-dns/]:
      - Возможность указать несколько DNS и задать метод выбора
      - Бан нерабочих/плохих DNS по специальному эвристическому алгоритму
      - Возможность вывести в результат использованный DNS сервер при удачном запросе
[*]В SE::Google::Modern [url=https://a-parser.com/wiki/se-google-modern/] добавлена опция Use sessions
[*]В SE::Yandex::WordStat [url=https://a-parser.com/wiki/se-yandex-wordstat/] добавлена настройка пресета антигейта для логина
[*]Также в SE::Yandex::WordStat [url=https://a-parser.com/wiki/se-yandex-wordstat/] удалены настройки Use logins/Use sessions, теперь они включены всегда
[*]Добавлена возможность автоматического удаления задания из Завершенных
[*]В макросе подстановок {num} добавлена поддержка обратного отсчета
[*]В JavaScript парсерах добавлена возможность сохранения произвольных данных в сессии
[*]В JavaScript парсерах добавлена возможность прямого сохранения в файл
[*]В API методе oneRequest/bulkRequest добавлена возможность указать configPreset
[*]В связи с неактуальностью удалены парсеры SE::Google::Mobile и SE::Yandex::Catalog

Исправления в связи с изменениями в выдаче

[*]Исправлен парсинг сниппетов в SE::Yandex [url=https://a-parser.com/wiki/se-yandex/]
[*]В SE::Google::Modern [url=https://a-parser.com/wiki/se-google-modern/] исправлена пагинация в мобильной версии, а также парсинг сниппетов и рекламы в некоторых случаях
[*]Исправлен парсинг цен в GooglePlay::Apps [url=https://a-parser.com/wiki/googleplay-apps/]
[*]Исправлена работа функции Remove bad accounts в парсерах Wordstat
[*]Rank::MegaIndex [url=https://a-parser.com/wiki/rank-megaindex/], Rank::OpenSiteExplorer [url=https://a-parser.com/wiki/rank-opensiteexplorer/], Rank::OpenSiteExplorer::Extended [url=https://a-parser.com/wiki/rank-opensiteexplorer-extended/], SE:: DuckDuckGo [url=https://a-parser.com/wiki/se-duckduckgo/], SE::IxQuick [url=https://a-parser.com/wiki/se-ixquick/]

Исправления

[*]Количество неудачных больше не обнуляется при постановке на паузу
[*]Исправлена проблема с подключением Node.js модулей на Linux
[*]Исправлено падение парсера в редких ситуациях при использовании JS парсеров
[*]Решена проблема с подключением Node.js модулей lodash, sequelize
[*]Исправлена ошибка итератора при равных границах в макросе {num}
Разгадывание рекаптч в JS парсере

Очередное видео в цикле уроков по созданию JavaScript парсеров. Здесь показано, как реализовать разгадывание рекаптч в JS парсере.[https://www.youtube.com/watch?v=mFnseLvKkfE]

В уроке рассмотрено:

[*]Описание и настройка парсера [https://a-parser.com/wiki/util-recaptcha2/]
[*]Описание принципа работы ReCaptcha2
[*]Создание кастомного JavaScript парсера с поддержкой разгадывания рекаптч


Ссылки:

[*]Тестирование работы ReCaptcha2: [http.myjino.ru/recaptcha/test-get.php]
[*]Статья и готовый парсер: [https://a-parser.com/resources/259/]

Оставляйте комментарии и подписывайтесь на наш канал на YouTube! [https://www.youtube.com/c/AParser_channel]
https://a-parser.com/threads/4517/]Сборник рецептов #23: категории сайтов, парсинг в YML и преобразование дат

23-й сборник рецептов. В нем мы будем парсить категории сайтов из Google, научимся формировать файлы YML, а также разберемся, как парсить даты и преобразовывать их в единый формат. Поехали!

https://a-parser.com/resources/285/]Получение категорий сайтов из Google

Категоризация сайтов - довольно актуальная задача, но существует немного сервисов, которые могут ее решить. Поэтому, по ссылке выше можно взять небольшой парсер, который позволяет получать категории сайтов из Google.
Рисунок


https://a-parser.com/resources/284/]Выгрузка товаров в формате YML

YML - это стандарт, разработанный Яндексом для работы с Маркетом. По своей сути, это файлы, схожие с XML, в которых содержится информация о товарах в интернет-магазине. Данный формат обеспечивает регулярное автоматическое обновление каталога на Яндекс.Маркет и позволяет отражать все актуальные изменения (наличие, цена, появление новых товаров). Пример парсинга интернет-магазина и сохранения собранных данных в YML можно посмотреть по ссылке выше.
Рисунок


https://a-parser.com/resources/281/]Парсим Google новости с датой и преобразуем ее

В поисковой выдаче Google возле новостей публикуется дата. Как правило, это могут быть метки "10 ч. назад" или "26 мая 2018 г.". Иногда может возникнуть задача спарсить все даты и привести их к единому виду. Как именно это сделать, можно узнать по ссылке выше.
Рисунок


Кроме этого:
https://a-parser.com/resources/280/]Сохранение произвольных данных в сессиях - новый функционал по работе с сессиями
https://a-parser.com/resources/279/]Сохранение больших файлов напрямую на диск - возможность сохранять файлы в JS парсерах напрямую, минуя шаблонизатор

Еще больше различных рецептов в нашем https://a-parser.com/resources/]Каталоге!

Предлагайте ваши идеи для новых парсеров https://a-parser.com/threads/3464/]здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw]наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в https://twitter.com/a_parser]Twitter.

Предыдущие сборники рецептов:

a-parser.com/threads/1250/]Сборник рецептов #1: Определяем CMS, оцениваем частотность ключевых слов и парсим Вконтакте
a-parser.com/threads/1328/]Сборник рецептов #2: собираем форумы для XRumer, парсим email со страниц контактов
a-parser.com/threads/1660/]Сборник рецептов #3: мобильные сайты, несколько парсеров, позиции ключевых слов
a-parser.com/threads/1674/]Сборник рецептов #4: поиск в выдаче, парсинг интернет-магазина и скачиваем файлы
a-parser.com/threads/1705/]Сборник рецептов #5: ссылки из JS, паблик прокси и карта сайта
a-parser.com/threads/1737/]Сборник рецептов #6: парсим базу номеров телефонов и сохраняем результаты красиво
a-parser.com/threads/1778/]Сборник рецептов #7: парсим RSS, качаем картинки и фильтруем результат по заголовкам
a-parser.com/threads/1809/]Сборник рецептов #8: парсим 2GIS, Google translate и подсказки Youtube
a-parser.com/threads/1830/]Сборник рецептов #9: проверяем сезонность ключевых слов и их полезность
a-parser.com/threads/1881/]Сборник рецептов #10: пишем кастомный парсер поисковика и парсим дерево категорий
a-parser.com/threads/1938/]Сборник рецептов #11: парсим Авито, работаем с JavaScript, анализируем тексты и участвуем в акции!
a-parser.com/threads/2240/]Сборник рецептов #12: парсим Instagram, собираем статистику и делаем свои парсеры подсказок
a-parser.com/threads/2460/]Сборник рецептов #13: сохраняем результат в файл дампа SQL и знакомимся с $tools.query
a-parser.com/threads/2613/]Сборник рецептов #14: используем XPath, анализируем сайты и создаем комбинированные пресеты
a-parser.com/threads/2712/]Сборник рецептов #15: анализируем скорость и юзабилити сайтов, парсим Яндекс.Картинки и Baidu
https://a-parser.com/threads/2808/]Сборник рецептов #16: парсинг OpenSiteExplorer с авторизацией, Яндекс.Каталога и Яндекс.Новостей
https://a-parser.com/threads/3544/]Сборник рецептов #17: картинки из Flickr, язык ключевых слов, список лайков в ВК
https://a-parser.com/threads/3862/]Сборник рецептов #18: скриншоты сайтов, lite выдача Яндекса и проверка сайтов
https://a-parser.com/threads/3910/]Сборник рецептов #19: публикация сообщений в Wordpress, парсинг Chrome Webstore и AliExpress
https://a-parser.com/threads/4074/]Сборник рецептов #20: автообновление цен в ИМ, анализ текстов и регистрация аккаунтов
https://a-parser.com/threads/4318/]Сборник рецептов #21: уведомления в Telegram из A-Parser, мультифильтр и парсинг IMDb
https://a-parser.com/threads/4405/]Сборник рецептов #22: проверка индексации в нескольких ПС, многоуровневый парсинг и поиск сабдоменов
https://a-parser.com/threads/4563/]1.2.216 - улучшения в SE::Google::Modern и JS парсерах, а также множество других

Рисунок


Улучшения
[*]Зависимая задача в Цепочке заданий теперь запускается только когда файл результатов не пустой
[*]Добавлен повтор без смены прокси при неудачной отправке рекаптчи в https://a-parser.com/wiki/se-google-modern/]SE::Google::Modern
[*]Добавлен бан прокси при получении 403 кода ответа в https://a-parser.com/wiki/se-google-modern/]SE::Google::Modern
[*]Процент неудачных запросов теперь отображается относительно числа выполненных запросов
[*]Добавлена возможность вызвать URL после выполнения задания
[*]Улучшен обзор каталогов при выборе файлов запросов
[*]Добавлена поддержка setInterval в JavaScript парсерах
[*]Уменьшено Wait between get status и улучшено логгирование в https://a-parser.com/wiki/util-recaptcha2/]Util::ReCaptcha2
[*]Улучшена обработка редиректов
[*]Добавлена защита от бесконечного выполнения в JavaScript парсерах
[*]Значительно увеличены возможности check_content в JS парсерах
[*]В ответе API метода info добавлены параметры workingTasks, activeThreads, activeProxyCheckerThreads

Исправления в связи с изменениями в выдаче
[*]Исправлен парсинг рекламы в мобильной версии https://a-parser.com/wiki/se-google-modern/]SE::Google::Modern
[*]Исправлен парсинг количества результатов в https://a-parser.com/wiki/se-baidu/]SE::Baidu
[*]https://a-parser.com/wiki/rank-majesticseo/]Rank::MajesticSEO, https://a-parser.com/wiki/se-google-modern/]SE::Google::Modern, https://a-parser.com/wiki/se-google-trends/]SE::Google::Trends
Исправления
[*]Исправлено ведение лога при нескольких паузах задания
[*]Исправлена ошибка, из-за которой запрос считался неудачным при пустой выдаче в https://a-parser.com/wiki/se-google-modern/]SE::Google::Modern
[*]Исправлена работа с url, содержащими фрагмент # в https://a-parser.com/wiki/net-http/]Net::HTTP
[*]Исправлен парсинг ссылок в https://a-parser.com/wiki/html-linkextractor/]HTML::LinkExtractor
[*]Исправлена работа опции Pages count в https://a-parser.com/wiki/se-yandex/]SE::Yandex
[*]Исправлен выбор файлов запросов на Windows 10
[*]Исправлена ошибка, из-за которой иногда нельзя было удалить файл с запросами
[*]Исправлено отображение проксичекера в конфиге потоков
[*]Исправлена кодировка некоторых результатов в https://a-parser.com/wiki/se-google-suggest/]SE::Google::Suggest
[*]Исправлена ситуация, когда не читались настройки из config.txt
https://a-parser.com/threads/4591/]Сборник рецептов #24: уведомление в Telegram об экспайре доменов, чекер РКН и работа с SQLite

24-й сборник рецептов. В нем мы научимся мониторить окончание срока регистрации доменов с уведомлением в Телеграм, сделаем альтернативный чекер сайтов в базе РКН, а также на простом примере парсера курсов валют изучим работу с базами данных. Поехали!

https://a-parser.com/resources/287/]Получаем уведомления в Telegram об окончании срока регистрации доменов

Мониторинг сроков регистрации доменов - это довольно распространенная задача. A-Parser позволяет легко автоматизировать этот процесс. Более того, можно настроить получение прямо в Телеграм уведомлений о доменах, срок регистрации которых скоро закончится. Готовое решение для автоматической проверки с уведомлением - по ссылке выше.
Рисунок


https://a-parser.com/resources/286/]Проверка блокировки РосКомНадзора через GitHub

В А-Парсере есть стандартный парсер https://a-parser.com/wiki/check-roskomnadzor/]Check::RosKomNadzor[/URL], который позволяет проверять наличие сайтов в базе РКН. Данные получаются напрямую из официального сервиса, для работы обязательно нужно подключать антигейт. Кроме того, официальный сервис РКН часто подвергается атакам, в связи с чем может быть недоступен. Но существуют альтернативные источники данных, доступность которых значительно выше и к тому же не требующие проверки в виде каптчи. Парсинг одного из таких источников и реализован в пресете по ссылке выше.
Рисунок


https://a-parser.com/resources/275/]Простой парсер обменника с записью в БД SQLite

Как известно, в A-Parser есть возможность чтения/записи данных в БД SQLite. В этом рецепте показано использование этого функционала на примере парсинга курсов валют. Готовый парсер доступен по ссылке выше.
Рисунок


Еще больше различных рецептов в нашем https://a-parser.com/resources/]Каталоге!

Предлагайте ваши идеи для новых парсеров https://a-parser.com/threads/3464/]здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw]наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в https://twitter.com/a_parser]Twitter.

Предыдущие сборники рецептов:
a-parser.com/threads/1250/]Сборник рецептов #1: Определяем CMS, оцениваем частотность ключевых слов и парсим Вконтакте
a-parser.com/threads/1328/]Сборник рецептов #2: собираем форумы для XRumer, парсим email со страниц контактов
a-parser.com/threads/1660/]Сборник рецептов #3: мобильные сайты, несколько парсеров, позиции ключевых слов
a-parser.com/threads/1674/]Сборник рецептов #4: поиск в выдаче, парсинг интернет-магазина и скачиваем файлы
a-parser.com/threads/1705/]Сборник рецептов #5: ссылки из JS, паблик прокси и карта сайта
a-parser.com/threads/1737/]Сборник рецептов #6: парсим базу номеров телефонов и сохраняем результаты красиво
a-parser.com/threads/1778/]Сборник рецептов #7: парсим RSS, качаем картинки и фильтруем результат по заголовкам
a-parser.com/threads/1809/]Сборник рецептов #8: парсим 2GIS, Google translate и подсказки Youtube
a-parser.com/threads/1830/]Сборник рецептов #9: проверяем сезонность ключевых слов и их полезность
a-parser.com/threads/1881/]Сборник рецептов #10: пишем кастомный парсер поисковика и парсим дерево категорий
a-parser.com/threads/1938/]Сборник рецептов #11: парсим Авито, работаем с JavaScript, анализируем тексты и участвуем в акции!
a-parser.com/threads/2240/]Сборник рецептов #12: парсим Instagram, собираем статистику и делаем свои парсеры подсказок
a-parser.com/threads/2460/]Сборник рецептов #13: сохраняем результат в файл дампа SQL и знакомимся с $tools.query
a-parser.com/threads/2613/]Сборник рецептов #14: используем XPath, анализируем сайты и создаем комбинированные пресеты
a-parser.com/threads/2712/]Сборник рецептов #15: анализируем скорость и юзабилити сайтов, парсим Яндекс.Картинки и Baidu
https://a-parser.com/threads/2808/]Сборник рецептов #16: парсинг OpenSiteExplorer с авторизацией, Яндекс.Каталога и Яндекс.Новостей
https://a-parser.com/threads/3544/]Сборник рецептов #17: картинки из Flickr, язык ключевых слов, список лайков в ВК
https://a-parser.com/threads/3862/]Сборник рецептов #18: скриншоты сайтов, lite выдача Яндекса и проверка сайтов
https://a-parser.com/threads/3910/]Сборник рецептов #19: публикация сообщений в Wordpress, парсинг Chrome Webstore и AliExpress
https://a-parser.com/threads/4074/]Сборник рецептов #20: автообновление цен в ИМ, анализ текстов и регистрация аккаунтов
https://a-parser.com/threads/4318/]Сборник рецептов #21: уведомления в Telegram из A-Parser, мультифильтр и парсинг IMDb
https://a-parser.com/threads/4405/]Сборник рецептов #22: проверка индексации в нескольких ПС, многоуровневый парсинг и поиск сабдоменов
https://a-parser.com/threads/4517/]Сборник рецептов #23: категории сайтов, парсинг в YML и преобразование дат
1.2.246 - обновление базы Rank::CMS и новые функции в парсерах Baidu и MajesticSEO ( https://a-parser.com/threads/4614/ )

Рисунок

Улучшения
* В Rank::CMS ( https://a-parser.com/wiki/rank-cms/ ) обновлена база определяемых движков, теперь поддерживается одновременно старый и новый формат apps.json (при обновлении рекомендуется также обновить apps.json)
* SE::Baidu ( https://a-parser.com/wiki/se-baidu/ ) полностью переписан:

- добавлен парсинг related keywords
- убран $cachedate из $serp, т.к. его похоже больше нет в выдаче
- добавлена опция Get full link, преобразующая обрезанные ссылки в полные
- исправлены некоторые регулярные выражения и баг с двойным http в ссылках
* Изменения в Rank::MajesticSEO ( https://a-parser.com/wiki/rank-majesticseo/ ):
- Добавлен параметр Check type, позволяет выбрать тип проверки: Root Domain/Subdomin/URL
- Убран параметр Extract domain
- Исправлена работа в некоторых случаях
* Улучшена отзывчивость в редакторе JavaScript парсеров
* Улучшена работа HTML::EmailExtractor ( https://a-parser.com/wiki/html-emailextractor/ ), устранены зависания, которые возникали на определенных страницах
* Обновлен список регионов в парсерах Яндекс
* Пустой результат в SE::Google::Trends ( https://a-parser.com/wiki/se-google-trends/ ) больше не считается неудачным запросом
* Улучшена работа с сессиями в SE::Yandex::WordStat ( https://a-parser.com/wiki/se-yandex-wordstat/ )[/LIST]
Исправления в связи с изменениями в выдаче
* Исправлен парсинг рекламы в SE::Yandex ( https://a-parser.com/wiki/se-yandex/ )
* Исправлена работа, а также улучшен алгоритм парсинга в SE::DuckDuckGo ( https://a-parser.com/wiki/se-duckduckgo/ )
* Исправлено указание региона в парсерах Яндекс
* Исправлен парсинг $ads.$i.visiblelink в SE::Google::Modern ( https://a-parser.com/wiki/se-google-modern/ )
* Исправлен парсинг $totalcount в SE::Yandex::Direct ( https://a-parser.com/wiki/se-yandex-direct/ )
Исправления
* Исправлена ошибка, из-за которой процент обработанных запросов мог быть больше 100
* Исправлены ошибки, из-за которых парсинг мог зависать при снятии с паузы, а также сбивался перебор в макросах подстановок
* Исправлено отображение кириллицы в $headers в Net::HTTP ( https://a-parser.com/wiki/net-http/ )
* Исправлена ошибка в Конструкторе результатов, из-за которой в редких случаях парсер мог падать
* Устранена проблема с кодировкой при работе с SQLite
* Исправлена ошибка со сменой прокси в JavaScript парсерах
Изменено: A-Parser Support - 3 Июля 2018 10:41
Сборник статей #4: добавление товаров в OpenCart и парсинг JSON ( https://a-parser.com/threads/4647/ )

В 4-м сборнике статей будет рассмотрено добавление товаров в OpenCart, а также описано создание универсального парсера JSON. В каждой статье приложены готовые JS парсеры, используя которые, можно на реальных примерах изучить описанные методы и поэксперементировать с ними. Поехали!

Работаем с OpenCart. Часть 1. Вступление. ( https://a-parser.com/resources/291/ )

Данная статья начинает цикл об одной из наиболее часто запрашиваемых возможностей - заливке товаров в интернет-магазин. A-Parser - это универсальный инструмент, который кроме прочего может решать и такие задачи. Для тестов выбран движок OpenCart, в 1-й статье будет рассмотрена авторизация, получение списка товаров и добавление товара. Подробности, а также пример парсера - по ссылке выше.

Рисунок


Парсинг JSON ответов и работа с их содержимым ( https://a-parser.com/resources/289/ )

JSON - это довольно популярный способ предоставления данных, который, например, часто используется при работе с API различных сервисов. В А-Парсере есть встроенные инструменты для работы с ним, но не всегда их применение может быть простым, иногда требуется дополнительно писать сложные шаблоны, используя шаблонизатор. Поэтому в статье по ссылке выше будет рассказано, как написать простой универсальный парсер JSON.

Рисунок


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки smile:) ) - отписывайтесь здесь ( https://a-parser.com/threads/3464/ ).

Подписывайтесь на наш канал на Youtube ( www.youtube.com/c/AParser_channel ) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter ( www.youtube.com/c/AParser_channel ).

Предыдущие сборники статей
* Сборник статей #1: A-Parser для маркетологов, SEO-специалистов и реальный опыт работы ( https://a-parser.com/threads/4009/ )
* Сборник статей #2: цикл статей-уроков по созданию JS парсеров ( https://a-parser.com/threads/4142/ )
* Сборник статей #3: пагинация, переменные и БД SQLite ( https://a-parser.com/threads/4442/ )
Страницы: Пред. 1 2
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
21:56 Молодой сайт, никто не заходит 
18:47 Bodyclick.net - рекламная партнерская сеть. 
17:54 WelcomePartners – ведущая гемблинг партнерка рунета! 
13:52 CleverAff - умные зарабатывают с нами 
13:43 Подскажите плагин фиксированного липкого объявления - баннера внизу сайта (футер) 
13:04 АПдейт 16.07 
12:35 Случилось резкое увеличение трафика с закладок 
22:14 Продаю каналы Яндекс Дзен 
22:13 Продам молодые каналы Яндекс Дзен на выбор 
22:12 Каналы Яндекс Дзен на выбор Распродажа новых! 
20:10 Вечные ссылки с ТОПОВЫХ ресурсов! Размещение вечных трастовых ссылок с тИЦ от + 1000 до +45000 
20:05 Готовый сайт и ютуб канал. 
19:24 Качественный рерайтинг, копирайтинг 
17:00 Интернет-магазины, лендинги, сайты-визитки от 10000 руб на MODx 
21:27 Что вы делаете когда наступает "депресуха" 
21:20 антиПЛАГ - повышение уникальности текста в один клик онлайн. 
21:11 признание и символические 5 000 руб. | кто на форуме в последнее время больше всех с полезной активностью 
19:58 Переключение между хостингами 
15:53 Несложная работа (дополнительный заработок) 
12:52 15.07.18 СУПР "15 мин." 
09:14 Как перенести сайт на другой домен?