Помогите настроить парсер (я новенький в этом)
Страницы: 1
Помогите настроить парсер (я новенький в этом), Настроить парсер, он должен идти по базе данных , находить необходимое слово на первой странице и если нашел его скинуть в отдельную базу этот сайт
Парсер должен зайти на сайт( из базы ) найти на главной странице нужное слово и если нашел его скинуть адрес сайта в отдельную базу
настроить или написать? если у вас уже есть то, что вы хотите настраивать то кидайте код сюда smile;)
Если нету, то это уже: работа по написанию парсера, а любая работа должна быть оплачена.
Вы же задавали аналогичный вопрос - http://www.cy-pr.com/forum/f15/t85312/m905776
Вам кодер дал исчерпывающие ответы.
Видимо про правильно заданный вопрос Вы не подумали:
1) Что за парсер? - Это софт, php/python/perl/etc скрипт/фреймворк
2) Структура базы? База данный/файл txt/css//etc
3) Что Вы хотите от Супровцев: совет (задайте полный вопрос и Вам ответят) - решение (это в платный раздел)

PS Не стоит забывать, что навык гадания и телепатии по интернету не у всех оптимизаторов присутствует
Рисунок
«Превращаю день в ночь, сына в дочь, а ХЗ в ТЗ»
Python(Flask, Scrapy) - my way.
Признаю что плохо соображаю в этом , но и заплатить нету денег за эту работу(если быть честным). База сайтов на битрикс вот пример их
SUSPICION.RU ( suspicion.ru/ )
OTKROVENNOE.RU ( otkrovennoe.ru/ )
odenrebenka.com/ ( odenrebenka.com/ )
HARTMANN-SHOP.RU ( hartmann-shop.ru/ )
STUDY-UKCPOISK.RU ( study-ukcpoisk.ru/ )
TRADICIYA-RVO.RU ( tradiciya-rvo.ru/ )
MISHENI.RU ( misheni.ru/ )
NEWAIRCOSMETICS.RU ( newaircosmetics.ru/ )
UGRA-LEASING.RU ( ugra-leasing.ru/ )
KIACARENS.RU ( kiacarens.ru/ )
PODOLSKF1.RU ( podolskf1.ru/ )
KOSTROMA-CREDIT.RU ( kostroma-credit.ru/ )
GRANSTONE.RU ( granstone.ru/ )
PBINVENTA.RU ( pbinventa.ru/ )
mebelelit.com/ ( mebelelit.com/ )
PODSLUSHIVANIE.RU ( podslushivanie.ru/ )
GROMADA-MEBEL.RU ( gromada-mebel.ru/ )
TELEOFIS.RU ( teleofis.ru/ )
KARPOVKA10.RU ( karpovka10.ru/ )
IMLIGHTNN.RU ( imlightnn.ru/ )

Мне на них нужно найти регистрацию,  я думаю по 7 словам ( регистрация, авторизация, войти и т.п)   Где найдет регистрацию , отправить адраес этого сайта в блокнот .    Сколько вы оцените такую работу?  Может у кого уже есть похожий парсер?
Вы сообщение прочитали полностью?
Цитата
Константин Нейтро пишет:
1) Что за парсер? - Это софт, php/python/perl/etc скрипт/фреймворк
2) Структура базы? База данный/файл txt/css//etc
Ваш вопрос похож на сколько стоит дом? В Москве или в деревне Розовые пупсики?
Размер Вашей базы - сколько сайтов вам нужно проверить?
Какое ПО вы используете?

В конце концов - это Вам нужно: так и изложите задачу полностью, а догадываться и допытывать как то неправильно с моей стороны)))
Константин Нейтро, у вас в подписи «Превращаю ....  ХЗ в ТЗ». Ни сколько не оправдываю ТС, но может превратите его ХЗ в ТЗ smile:D

По сабже: с парсингом именно битрикса без спец. софта могут быть проблемы. CMS из коробки определяет ботов и не всегда дает парсить средствами PHP/Perl/питон.
Цитата
Константин Нейтро пишет:
сына в ночь
очепятка
Вот зачем человеку база сайтов на битрикс, с отбором по авторизации, кроме как потом спамить.
Цитата
Jaguar пишет:
Цитата
Константин Нейтро пишет:
сына в ночь
очепятка
О спасибо, исправил очепятку)
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
18:09 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 
15:06 Влияние ссылок буржнете 
10:53 SharkBoss - партнёрская программа для монетизации ЛЮБЫХ видов трафика (включая спам). 
08:36 Обновления интерфейса яндекс метрики 
15:13 Рапида умерла. Куда выводить с AdSense? 
15:05 Чем заменили ТИЦ? 
15:01 Profit Pixels - In-House Форекс, Крипто, Трейдинг CPA Офферы | Еженедельные Выплаты | CPA до $950 
15:49 Проверка на индекс в Telegram боте @SpeedyIndexbot 
13:47 HidMark.com - естественные ссылки от 1.5$ Естественные ссылки. Крауд-маркетинг. 
12:05 USMobileSMSBot - 
11:16 4G/LTE Mobile Proxy 30+ geo  
15:34 «Взрываем языковые преграды» – переводим любые тексты 
15:31 Доходные сайты под бурж 
15:06 Вечные ссылки с ТОПОВЫХ ресурсов! Размещение вечных трастовых ссылок с тИЦ от + 1000 до +45000 
19:49 Текст.ру преподнёс "подарок" 
18:12 Подтягиваем физкультурку 
13:45 В России снизили беспошлинный порог для онлайн-покупок 
13:30 Тренды заработка 2024-2025 
13:12 Суд постановил заблокировать Telegram 
11:10 150+ хакерских поисковых систем и инструментов 
02:58 Точные прогнозы на футбол