A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc
Страницы: Пред. 1 2 3 4 След.
A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc
Видео урок: Массовое добавление товаров в OpenCart
Данный парсер является примером для разработки парсера работающего с OpenCart. Решение демонстрирует возможность сбора данных о товарах из стороннего сайта и заливку их на собственный сайт на базе OpenCart через API.
Рисунок

В этом уроке рассмотрены:
* парсинг товаров из интернет-магазина
* авторизация в OpenCart
* работа с API OpenCart для публикации товаров

Статья и готовый пресет опубликованы в нашем Каталоге: https://a-parser.com/resources/302/

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

Бесплатная контекстная реклама

1.2.319 - новый парсер подсказок Youtube, поддержка модуля MySQL2, множество улучшений и оптимизаций
Рисунок

Улучшения
* Добавлен новый парсер SE::Youtube::Suggest
* Добавлена совместимость с модулем mysql2 в JavaScript парсерах
* В Util::ReCaptcha2 добавлена поддержка сервиса R.I.P.captcha
* В SE::Bing::Suggest добавлена возможность выбора страны
* Уменьшено потребление оперативной памяти, а также оптимизирована начальная загрузка, интерфейс теперь открывается быстрее
* База регионов в SE::Yandex обновлена и значительно увеличена
* Для всех стандартных парсеров, кроме тех, которые работают на основе Net::HTTP, из настроек убраны Max body size и Use gzip
* Улучшен Shop::Amazon

Исправления в связи с изменениями в выдаче

* Исправлен парсинг рекламы в SE::Google::Modern
* Исправлен парсинг в SE::Yandex для регионов, отличных от российских
* Полностью обновлен Rank::SEMrush
* Исправлена проблема с загрузкой каптчи в SE::Yandex, SE::Yandex::Wordstat
* Исправлен парсинг количества результатов в SE::Yahoo
* SE::Dogpile, SE::DuckDuckGo
Исправления
* Исправлена работа с прокси при получении каптчи в SE::Yandex::Register
* В очень редких случаях в SE::Yandex могла возникать ошибка Content mismatch
* Исправлен Net::Whois при работе с .eu доменами
Видео урок: Полноценный Telegram канал на базе A-Parser
Это видео демонстрирует возможность создания полноценного Telegram канала на базе A-Parser. Парсер периодически и без вмешательства пользователя будет собирать контент и публиковать его на канале.
Рисунок

В уроке рассмотрены:
* Регистрация и настройка канала в Телеграм.
* Последовательное выполнение нескольких заданий.
* Сохранение промежуточных данных в базу SQLite с последующим чтением.
* Настройка пресета для постинга сообщений в Telegram-канал.
Статья с подробным описанием процесса создания: https://a-parser.com/resources/300/
Ссылки на готовые пресеты:
https://a-parser.com/resources/38/
https://a-parser.com/resources/298/
https://a-parser.com/resources/299/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
Сборник рецептов #26: мобильные версии сайтов, список регионов Яндекса и упоминания домена в индексе
26-й сборник рецептов. В нем будут показаны: проверка наличия мобильной версии сайта через Bing, парсинг полного списка регионов Яндекса и способ поиска упоминаний домена в индексе поисковой системы. Также показан пример работы с Node.js модулем mysql2, который позволяет работать с MySQL базами данных. Поехали!

Проверка наличия мобильной версии через Bing
На сегодняшний день наличие мобильной версии является одним из важнейших критериев качества сайта. По данным различных организаций доля мобильного трафика уже давно превышает десктопный. Именно поэтому мобильная версия сайта позволяет увеличить посещаемость сайта, ведь большинство крупных поисковиков отдают предпочтение в выдаче сайтам, имеющим полноценную мобильную версию. Проверить наличие и соответствие стандартам можно с помощью небольшого пресета по ссылке выше.
Рисунок


Получение полного списка регионов Яндекса
Яндекс не публикует в открытом виде полного списка всех регионов, используемых в поиске. И как оказалось, найти полную и актуальную базу в интернете практически невозможно. Поэтому мы исправляем это и по ссылке выше публикуем JavaScript парсер, который позволяет собрать свежую и максимально полную базу регионов Яндекса.
Рисунок


Проверка упоминаний домена в индексе Гугла
Иногда возникает задача по поиску упоминаний домена в индексе поисковой системы. Именно с такой задачей к нам обратился один из пользователей A-Parser. Поэтому по ссылке выше мы публикуем пресет, решающий данную задачу.
Рисунок


Кроме этого:
[LIST]
[*]Пример работы с модулем mysql2
[/LIST]
Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
1.2.335 - новые парсеры картинок, оптимизации в JS парсерах, общие улучшения работы
Рисунок

Улучшения
* Добавлено 2 новых парсера:
- SE::DuckDuckGo::Images - парсер картинок из DuckDuckGo
- SE::Dogpile::Images - парсер картинок из Dogpile
* Полностью переписаны 2 парсера:
- Рисунок
SE::Google::Images - добавлены региональные настройки, поддержка рекаптчи, возможность задавать различные фильтры поиска и сбор анкоров, ссылок на страницу, ссылок на превью, а также типов изображений
-SE::Yandex::Images - добавлен сбор ссылок на превью
* Улучшена работа SE::AOL, а также увеличено максимальное количество страниц в настройках
* Улучшена работа SE::Ask, а также добавлена возможность парсить связанные ключевые слова
* JS парсеры: оптимизирован вызов конструктора и init()
* JS парсеры: добавлена поддержка async init()
Исправления в связи с изменениями в выдаче
* Исправлен парсинг анкоров в SE::Google::Modern
* Исправлено указание региона в SE::Yandex
* В Shop::AliExpress исправлен проход по страницам
* SE::Bing::Images, SE::Dogpile, SE::DuckDuckGo, SE::Google::ByImage
Исправления
* Исправлена утечка памяти при большом количестве попыток
* Исправлена ошибка, при которой в Тестовом парсинге при работе с некоторыми ссылками не завершался запрос
* Исправлен парсинг различных параметров в Net::Whois
* Исправлено отображение русского языка (проблема появилась в предыдущей версии)
* Исправлено зависание при работе SE::Yandex::Images с антигейтом
* JS парсеры: исправлена работа check_content
* JS парсеры: исправлена работа с сессиями (проблема появилась в одной из предыдущих версий)
Видео урок: Массовое добавление товаров в OpenCart, часть 2

Это вторая часть из цикла видео уроков о парсинге товаров из стороннего сайта и заливке их на собственный сайт на базе OpenCart через API.

Загрузка плеера


В этом уроке показано:

* краткое содержание предыдущей части
* запуск созданного пресета
* демонстрация результатов работы

Первая часть: https://a-parser.com/threads/4798/
Статья и готовый пресет опубликованы в нашем Каталоге: https://a-parser.com/resources/302/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
Сборник рецептов #27: парсинг HH, сбор списка user-agent и парсинг Авито с записью в MySQL(https://a-parser.com/threads/4971/)


27-й сборник рецептов. В нем собраны рецепты для парсинга списка соискателей на hh.ru, сбора списка юзерагентов и парсинга Авито с записью результатов в MySQL базу данных. Также показан пример отправки файлов в POST запросе. Поехали!

Сбор списка соискателей на HeadHunter
HeadHunter - это один из самых популярных ресурсов для поиска работы. Соответственно, сбор списка соискателей может быть интересен рекрутерам для более эффективного анализа потенциальных кандидатов. Готовое решение для парсинга доступно по ссылке выше.



Рисунок


Получение списка user-agent
Сейчас существует много различных браузеров, которые работают на разных платформах. Многие сайты ограничивают работу со старыми браузерами, а некоторые не отдают контент даже при запросе с юзерагентом относительно нового браузера. В A-Parser можно задавать user-agent для запросов, также существует специальный инструмент, который позволяет при каждом запросе выбирать рандомный из заранее подготовленного списка. Пресет для парсинга таких списков, с возможностью фильтрации по различным параметрам, доступен по ссылке выше.


Парсер Avito с записью в MySQL
Предыдущий пресет для парсинга Авито пользуется большой популярностью. Также наши пользователи часто спрашивают о возможности записи собранных результатов напрямую в базу данных. Поэтому мы подготовили JS парсер, который решает эту задачу. Как обычно, он доступен по ссылке выше.
https://files.a-parser.com/img/lvi3y_181127232540.png

Кроме этого:

* Отправка файлов в POST запрос(https://a-parser.com/resources/310/) - пример решения задачи по отправке файлов в POST запросах.


Еще больше различных рецептов в нашем Каталоге(https://a-parser.com/resources/)!

Предлагайте ваши идеи для новых парсеров здесь(https://a-parser.com/threads/3464/), лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube(https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw) - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter(https://twitter.com/a_parser).
Видео урок: Разбираем методы для работы с API используя Postman
В данном видео будет сделан краткий обзор некоторых методов API.
Загрузка плеера

В этом уроке рассмотрены:
* обзор методов
* составление JSON для методов ping,info и oneRequest
* работа с API используя Postman
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
1.2.360 - поддержка https/tls в Node.js модулях, парсинг мобильной выдачи Яндекса, 2 новых парсера
Рисунок

уходящем году одним из приоритетных направлений стало развитие JavaScript парсеров и функционала по работе с Node.js. Одним из финальных этапов стал данный релиз, в котором была реализована долгожданная поддержка https/tls в Node.js модулях. Также усилия были сосредоточены на повышении стабильности и производительности. В результате этого было сделано множество наработок, которые уже в первой половине 2019 года планируется выпустить в виде нового A-Parser 2.0, где будет много новых и крутых возможностей.
Команда A-Parser поздравляет всех с Новым годом и Рождеством! Мы желаем вам успехов в делах, прибыльных проектов и ярких идей. Пускай Новый 2019 год будет годом новых возможностей, все задуманное сбывается, а работа приносит удовольствие!
Спасибо что Вы с нами!!!
В новогоднем релизе, кроме снеговикаsmile:), было сделано следующее:
Улучшения
* Добавлена поддержка https/tls в Node.js модулях, что позволяет использовать все модули, которые работают с API по https, а также по TLSSocket (smtp и т.п.)
* Полностью переписан и обновлен SE::Yandex, добавлена возможность парсить мобильную выдачу, а также значительно увеличена производительность
* Добавлен парсер позиций в Bing: SE::Bing::Position
* Добавлен парсер Util::YandexRecognize, позволяющий разгадывать каптчи без использования сторонних сервисов
* Улучшен сбор почт в HTML::EmailExtractor
* Улучшена работа опции Dynamic threads limit
* В SE::Yandex использование прокси для загрузки картинки каптчи теперь определяется параметром Use proxy парсера Яндекса
* В связи с неактуальностью удалены SE::Bing::AddURL, Rank::OpenSiteExplorer и Rank::OpenSiteExplorer::Extended

Исправления в связи с изменениями в выдаче

* В SE::Google::Modern исправлено определение опечатки в запросе
* В GooglePlay::Apps исправлен проход по страницам
* SE:: Dogpile, SE:: Dogpile::Images , SE:: DuckDuckGo

Исправления

* Исправлен Safe search в SE:: DuckDuckGo::Images
* Исправлены падения при работе с SE:: DuckDuckGo::Images
* Исправлена ошибка при работе с модулем mysql2 версии более 1.5.3
* Исправлен парсинг количества результатов в SE::Yandex
Сборник статей #6: работа с API, сохранение в YML и мануал по подключению Node.js модулей
Это 6-й сборник статей, и в нем мы разберемся, как подключать к парсеру Node.js модули, научимся сохранять собранные данные в формате YML, а также изучим работу с API на реальном примере с созданием простого приложения. Поехали!
Работаем с API, часть 1
В этой статье на реальном примере будет показана работа с A-Parser через API. В результате будет создано простое приложение, которое будет получать позицию сайта по ключу в Гугл или Яндекс. Все подробности - по ссылке выше.
Рисунок


Выгрузка товаров для Я.Маркета в формате YML
YML (Yandex Market Language) - это стандарт представления данных, который используется для загрузки/выгрузки информации о товарах в Яндекс.Маркете. Используя А-Парсер, можно спарсить товары с различных сайтов и сохранить их в данном формате для дальнейшего импорта в Маркет. О том, как это сделать, можно почитать в статье по ссылке выше.
Рисунок


Подключение пакетов Node.js в A-Parser
Как известно, в A-Parser можно использовать Node.js модули для более эффективного парсинга. Поэтому, по ссылке выше мы опубликовали небольшой мануал по их установке и использованию.
Рисунок


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки smile:) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей

* Сборник статей #1: A-Parser для маркетологов, SEO-специалистов и реальный опыт работы
* Сборник статей #2: цикл статей-уроков по созданию JS парсеров
* Сборник статей #3: пагинация, переменные и БД SQLite
* Сборник статей #4: добавление товаров в OpenCart и парсинг JSON
* Сборник статей #5: собственный канал в Telegram и массовое добавление товаров в OpenCart
Сборник рецептов #28: скидки в Google Play, автоматизация парсинга WordStat и типы Яндекс подсказок
28-й сборник рецептов. В нем будет показан способ автоматизации парсинга данных из Wordstat, пример парсинга информации о приложениях со скидками в Google Play, а также готовое решение для сбора подсказок из Яндекс вместе с их типами. Поехали!

Парсинг приложений со скидками в Google Play
Периодически в Google Play разработчики предлагают скидки на приложения, иногда на короткий срок платные становятся полностью бесплатными. С помощью A-Parser можно искать подобные предложения. Кроме этого, в этом парсере собирается множество дополнительных данных и используется сохранение в sqlite базу данных, поэтому его можно рассматривать как еще один пример работы с базами данных в А-Парсере. Готовое решение доступно в каталоге по ссылке выше.
Рисунок


Парсер поисковых подсказок Яндекс
В A-Parser есть стандартный парсер Яндекс подсказок, который по заданным ключевым словам собирает подсказки. Но Яндекс классифицирует подсказки по различным типам, которые в свою очередь позволяют использовать их более рационально, применяя соответствующие фильтры. Стандартный парсер подсказок не возвращает типы, поэтому по ссылке выше опубликован JS парсер для сбора подсказок вместе с их типами.
Рисунок


Автоматизация парсинга Wordstat
В этом парсере реализован автоматический сбор данных из WordStat. При этом, парсер проверяет наличие необходимых для данной задачи аккаунтов, и если требуется - то автоматически регистрирует их. Такое решение может быть полезно для организации периодического парсинга WordStat в автоматическом режиме. Готовое решение - по ссылке выше.
Рисунок


Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
1.2.387 - улучшенный Просмотр логов, новый парсер Яндекс SafeBrowsing, улучшения в JS парсерах
Рисунок

Улучшения

* Улучшение Просмотра логов:
- Фильтр по неудачным/выполняющимся задачам
- Сортировка по времени выполнения
- Поддержка пагинации и поиска по логам
- Отображение парсера и запроса
* Добавлен новый инструмент tools.memory - key/value хранилище в памяти
* Добавлен новый парсер SE::Yandex::SafeBrowsing, который позволяет проверить сайт в блэклисте Яндекса
* В SE::Google::Trends реализована возможность сравнивать данные по ключевым словам
* Улучшения в логике Shop::Amazon
* Улучшена стабильность JavaScript парсеров (движка v8)
* JS парсеры: добавлен метод .addElement, который позволяет заполнять массивы в results более удобным способом
* JS парсеры: добавлена опция resultArraysWithObjects для this.parser.request, которая позволяет возвращать массив объектов в результатах при вызове другого парсера
* JS парсеры: добавлено кэширование DNS ответов

Исправления в связи с изменениями в выдаче

* Исправлен парсинг мобильной выдачи в SE::Google::Modern
* Исправлен SE:: DuckDuckGo::Images при работе с некоторыми видами запросов
* Исправлен парсинг при 1-м результате в SE::Yandex
* SE::IxQuick, SE:: DuckDuckGo, SE::Yandex::Translate, SE::Bing::Suggest

Исправления

* Исправлена обработка пустых запросов в JavaScript парсерах
* Исправлен вывод картинок в лог, проблема появилась в одной из предыдущих версий
* Исправлена работа с некоторыми видами прокси
* Исправлена работа опции Stop when found в SE::Yandex::Position
* В SE::Yandex при получении ошибки от антигейта не менялись прокси
* Исправлен парсинг ссылок на потенциально опасные сайты в SE::Yandex
* JS парсеры: исправлена работа check_content с регулярными выражениями, в которых содержится кириллица
* JS парсеры: исправлено зависание потоков при использование tls
* JS парсеры: множественные исправления в работе сокетов
Сборник рецептов #29: язык ключевых слов, нормализация запросов и сбор тайтлов в глубину
29-й сборник рецептов, в котором опубликован JS парсер для определения языка ключевых слов, предложен вариант решения для нормализации запросов, а также показано, как парсить карту сайту и одновременно собирать тайтлы страниц. Поехали!

Определение языка ключевого слова через Яндекс Переводчик
В A-Parser есть несколько встроенных парсеров для определения языка страницы. Но иногда возникают задачи отфильтровать список ключевых слов по одному или нескольким языкам. Определять язык текстовой строки довольно неплохо умеют различные переводчики, поэтому для решения задачи был выбран Яндекс Переводчик, и по ссылке выше доступен JavaScript парсер, реализующий определение языка ключевого слова.
Рисунок


Нормализатор запросов
При сборе семантического ядра часто возникает вопрос - какая форма запроса является наиболее частотной, например: "купить диван" или "диван купить". Если запрос 3-х или 4-хсловный, то вариантов становится еще больше. Решение такой задачи на базе парсера WordStat доступно в нашем Каталоге по ссылке выше.
Рисунок


Карта сайта и заголовки
Сбор карты сайта - это довольно простая задача для А-Парсера, которая решается встроенным парсером ссылок. Но иногда, кроме простого сбора ссылок, нужно еще и собрать тайтлы. И это можно делать параллельно с проходом по ссылкам в глубину. Готовый пресет доступен по ссылке выше.
Рисунок


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
Видео урок: Создание JS парсеров. Использование Node.js модулей
Продолжение цикла уроков по созданию JavaScript парсеров. В этом уроке показано как использовать Node.js модули при написании собственных парсеров.
Загрузка плеера

В уроке рассмотрено:
* Работа с Node.js и Node package manager (npm)
* Первый запуск npm, установка модулей (пакетов)
* Использование модулей при создании JS парсера
* Ресурсы для работы с npm
Ссылки:
* https://npmjs.com/
* https://learn.javascript.ru/screencast/nodejs
* https://nodejs.org/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
Сборник рецептов #30: оценка страниц, форматирование дат и парсинг дропов
30-й сборник рецептов, в котором опубликован пресет для оценки сайтов с помощью open source инструмента Lighthouse, рассмотрен способ форматирования дат в парсере SE::Google::Trends SE::Google::Trends, а также показан способ поиска удаленных доменов. Поехали!

Оценка страниц с использованием Lighthouse
Еще один сервис по оценке сайтов, на этот раз от Google. С его помощью можно оценить веб-страницу по 4-м критериям: Performance, Accessibility, Best Practices и SEO. Пресет доступен в нашем Каталоге по ссылке выше.
Рисунок


Форматирование даты в парсере SE::Google::Trends
В A-Parser есть парсер, который позволяет собирать данные из Google Trends. Но даты в этом парсере возвращаются в формате Unixtime, что немного усложняет анализ получаемых данных. По ссылке выше показан простой способ преобразования дат к более удобному виду.
Рисунок


Парсер expired domains
Пресет для поиска и сбора дропов, а также их характеристик с сайта expireddomains.net. В качестве запросов нужно указывать ключевые слова, которые должны быть в доменном имени.
Рисунок


Еще больше различных рецептов в нашем Каталоге!
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
Страницы: Пред. 1 2 3 4 След.
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
17:57 Черновик записи Вордпресс перестал сохранять 
16:19 после переноса не работает Форум 
14:31 CPA-сеть MyLead - глобальная монетизация трафика! 
12:25 Кто может помочь составить правильную RSS? 
23:59 Даёшь новый Апдейт! Яндекс выдача 21.03.2019 
23:04 Продвижения страниц с символами ? и = в url 
22:13 22 марта 2019 | Текстовый апдейт: выложен индекс по 18 марта 2019 
20:46 Требуется сбор СЯ на англ.языке 
20:43 Ищу помощника по группировке СЯ и ТЗ для копирайтеров 
18:39 Дизайн / вертка / программирование / модули DLE 
18:33 Раскрутка вашего сайта белыми методами | Крауд, доски, статьи, соц. сети и пр. 
13:51 Прогон по личной базе, больше 1000 трастовых сайтов! Продвижение СЧ и НЧ запросов + рост показателей! Гарантии! 
10:30 Копирайтинг RU/EN, переводы высокого уровня (рус/англ/укр), SEO-оптимизированные тексты под ключ для выхода в Топ (2000+ отзывов) 
21:30 Сервис услуг в YouTube, Вконтакте, Instagram, Twitter, Facebook, Одноклассники, Google+ 
22:32 БЕСПЛАТНО предлагаю статьи для гостевого постинга 
15:21 Правообладатели - как закрыть доступ 
12:34 23 марта - всемирный день метеорологии 
04:08 Finaff становится открытой партнёркой! 
22:00 Бесплатно за отзыв можем сделать 1 услугу в соц сетях 
13:06 НУЖЕН фотошопер для создание 2х картинок для ВК 
23:41 Детство и спорт