Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

[Поддержка] Парсер-менеджер товаров с торговых площадок


igyan

Recommended Posts

Хороший модуль. Но вот что хотелось бы еще:

1. Возможно ли сделать поиск не только по названию и модели, а еще по полю UPC? Дело в том, что по названию у меня не ищется так как оно слишком длинное и включает в себя характеристики товара, а в поле модель у меня артикулы так как оно зарезервировано для другого модуля.

2. Возможно ли сделать парсинг по расписанию? Настроить чтоб с периодичностью, например, обновлялись цены и только у тех товаров у которых уже есть ссылки.

3. При изменении настроек модуля слетает фильтр в карточке товаров что не удобно.

Надіслати
Поділитися на інших сайтах


upc используется довольно редко, придется много переделывать, смысла особо нет

единственное как можно сделать по расписанию это через cron, но тут проблема, что модули запускается через админку с проверкой логина и токена, может и есть решение этой проблемы, но мне не известно

да фильтр слетает, может исправлю в обновлениях

Надіслати
Поділитися на інших сайтах

Добрый вечер! Огромное спасибо автору модуля,пользуюсь данным парсер-менеджером, все отлично. Но у меня есть к автору просьба по доработке данного модуля.

Парсер отличный, все делает так как нужно, но прайс-агрегатор в моем случае hotline с которого парсится информация время от времени меняет структуру строк в описании. На выходе мы получаем, что строки одних и тех же атрибутов не совпадают, что влечет за собой дубли. Это заметно при сравнении товаров, при выводе фильтров. Как вариант решения данной проблемы я бы предложил в данном модуле сделать функционал который позволяет выгрузить все атрибуты, поправить,а потом загрузить в нормальном виде.

Возможно я по дилетантски описал решение, прошу сильно не пинать, так как в программировании не силен.

Повторюсь: АВТОРУ ОГРОМНОЕ СПАСИБО ЗА МОДУЛЬ!!!

Надіслати
Поділитися на інших сайтах


upc используется довольно редко, придется много переделывать, смысла особо нет

единственное как можно сделать по расписанию это через cron, но тут проблема, что модули запускается через админку с проверкой логина и токена, может и есть решение этой проблемы, но мне не известно

да фильтр слетает, может исправлю в обновлениях

1. Согласен. Наверно это только мне нужно. Тогда не надо. Что-нибудь придумаю.

2. Если это сложно реализовать то не надо. Можно ли хотя бы сделать так, чтоб можно было отфильтровать только те товары у которых проставлены ссылки и вручную из админки запустить парсинг. Или добавить возможность запускать парсинг всех товаров со ссылками без необходимости выделения их галочками.

3. Отлично.

Есть еще пару вопросов:

4. Не для всех товаров на маркете есть своя страница. Иногда бывает что по названию выдается страница с предложениями от нескольких магазинов. Можно ли сделать парсинг с такой страницы? Например чтоб проставлялась минимальная цена.

5. Есть товары со статусом "Нет в продаже" Можно ли им выставлять цену 0 и количество 0.

Надіслати
Поділитися на інших сайтах


Добрый вечер! Огромное спасибо автору модуля,пользуюсь данным парсер-менеджером, все отлично. Но у меня есть к автору просьба по доработке данного модуля.

Парсер отличный, все делает так как нужно, но прайс-агрегатор в моем случае hotline с которого парсится информация время от времени меняет структуру строк в описании. На выходе мы получаем, что строки одних и тех же атрибутов не совпадают, что влечет за собой дубли. Это заметно при сравнении товаров, при выводе фильтров. Как вариант решения данной проблемы я бы предложил в данном модуле сделать функционал который позволяет выгрузить все атрибуты, поправить,а потом загрузить в нормальном виде.

Возможно я по дилетантски описал решение, прошу сильно не пинать, так как в программировании не силен.

Повторюсь: АВТОРУ ОГРОМНОЕ СПАСИБО ЗА МОДУЛЬ!!!

Здравствуйте, спасибо за отзыв,

 модуль сделан в первую очередь для парсинга, посмотрите в дополнениях есть множество модулей для экспорта/импорта, есть модуль пакетного изменения товаров, возможно он вам подойдет

Надіслати
Поділитися на інших сайтах

1. Согласен. Наверно это только мне нужно. Тогда не надо. Что-нибудь придумаю.

2. Если это сложно реализовать то не надо. Можно ли хотя бы сделать так, чтоб можно было отфильтровать только те товары у которых проставлены ссылки и вручную из админки запустить парсинг. Или добавить возможность запускать парсинг всех товаров со ссылками без необходимости выделения их галочками.

3. Отлично.

Есть еще пару вопросов:

4. Не для всех товаров на маркете есть своя страница. Иногда бывает что по названию выдается страница с предложениями от нескольких магазинов. Можно ли сделать парсинг с такой страницы? Например чтоб проставлялась минимальная цена.

5. Есть товары со статусом "Нет в продаже" Можно ли им выставлять цену 0 и количество 0.

При парсинге с яндекса нередко банят, выкидывают капчу  и тд., поэтому, по-моему нужен контроль. Если не хотите часто ставить галочку, сделайте настройку по выводу товаров 100-200-300 и делайте парсинг большого количества.  С других доноров проще, но представьте, если сразу несколько человек запустит парсинг всех товаров, это будет сродни DDOS атаки. Так что лучше давайте оставим так как есть

Насчет товаров без страниц, сам процесс парсинга состоит в разборе верстки донора, в парсере три донора, с других сайтов парсить не будет.

по последнему пункту попробую что-нибудь сделать

Надіслати
Поділитися на інших сайтах

Еще заметил что при поиске ссылок и при парсинге очиень сильно начинает тормозить сайт с которого идет парсинг. При этом другие сайты на этом же хостинге работают нормально. Хостинг не дешевый. Ресурсов достаточно. Можно ли оптимизировать производительность, чтоб сайтом можно было пользоваться. А то иногда совсем перестают страницы загружаться.

И еще вопрос по прокси. Как именно организована работа через список? Если IP прокси Яндекс заблокирует, то автоматом начнется работа через другой прокси в списке? Или проверка идет на уровне доступен прокси или нет?

Надіслати
Поділитися на інших сайтах


При парсинге большая нагрузка по http и на базу данных, поэтому и зависания. Если парсите через прокси, то плюс еще время ответа от прокси. Если использовать бесплатные прокси, которые могут не работать в момент парсинга, то скрипт будет ожидать таймаут ответа от прокси.

Работа через прокси- лист: парсер пытается достучаться до сайта через прокси, если получена страница с товаром, то идет работа с данными,

если получен бан, то выкинет капчу или должен браться следующий прокси.

хуже если нет ответа от прокси, парсер будет ждать 15 сек, только потом перейдет к следующему прокси

прокси при парсинге не удаляются, поэтому при следующем парсинге будут опять использоваться и нерабочие прокси, удаляются прокси только если нажать "проверка прокси"

Надіслати
Поділитися на інших сайтах

При парсинге большая нагрузка по http и на базу данных, поэтому и зависания.

Можно ли как то уменьшить нагрузку на базу? Может как-нибудь разграничить работу скрипта и сайта? Пусть скрипт будет работать дольше. Мне главное чтоб сайт открывался в процессе парсинга.

Надіслати
Поділитися на інших сайтах


Можно ли как то уменьшить нагрузку на базу? Может как-нибудь разграничить работу скрипта и сайта? Пусть скрипт будет работать дольше. Мне главное чтоб сайт открывался в процессе парсинга.

Разделить  не получится, вернее в таком варианте, когда парсер запущен как модуль. Надо делать отдельное приложение.

Большие объемы лучше парсить в моменты наименьших нагрузок на сервер. 

Надіслати
Поділитися на інших сайтах

Надо делать отдельное приложение.

при адекватной цене думаю спрос будет приличный

 

Большие объемы лучше парсить в моменты наименьших нагрузок на сервер. 

или парсить на локалке, а потом синхронизировать с сервером

Надіслати
Поділитися на інших сайтах


Большие объемы лучше парсить в моменты наименьших нагрузок на сервер.

Так дело в том, что во время работы парсера нагрузка на сервер со стороны посетителей минимальная. Сайт просто перестает открываться.

 

Еще заметил такую вещь. Если нажимаю ссылку искать, то в процессе поиска сайт не открывается. Но после поиска может вылететь сообщение, что товар не найден. По идее должно быть только одно обращение к базе данных в момент запроса названия товара. Почему тогда во время поиска такая большая нагрузка на базу? Может как-то можно оптимизировать работу?

 

Разделить  не получится, вернее в таком варианте, когда парсер запущен как модуль. Надо делать отдельное приложение.

Сколько времени потребуется для написания такого приложения?

Надіслати
Поділитися на інших сайтах


Если парсите через прокси, то прибавьте время ответа от самого прокси

По времени не могу сказать, смотря с какого донора.

Надіслати
Поділитися на інших сайтах

с яндексом я бы не стал связываться, много проблем

с остальных, думаю за неделю можно справиться, но желания и времени заниматься нет

Надіслати
Поділитися на інших сайтах

Спарсил большое количество товаров, спасибо, но есть такое замечание. Например товар в Яндекс.маркете кондиционер Самсунг блаблабла, парсим и получаем итог самсунг блаблабла, т.е. товар без названия самого вида техники.

Дело в том,что затрудняется поиск по сайту. Может быть можно решить другим способом?

Надіслати
Поділитися на інших сайтах


Спарсил большое количество товаров, спасибо, но есть такое замечание. Например товар в Яндекс.маркете кондиционер Самсунг блаблабла, парсим и получаем итог самсунг блаблабла, т.е. товар без названия самого вида техники.

Дело в том,что затрудняется поиск по сайту. Может быть можно решить другим способом?

Некоторые пользователи наоборот просили убрать название техники, оно вставляется  ,например, при парсинге с онлайнера. Можно добавить поле,   если вам нужно.

Надіслати
Поділитися на інших сайтах

Для яндекса  

в файл

admin\view\template\module\parsermanager.tpl строка 623 после строки

<form id="form_parsing" action="" method="POST">

добавьте

<input type="text" name="prefix" value="" size="50" placeholder="название товара">

на экране должно появиться поле

в файл строка 623

admin\controller\module\parsermanager.php

перед строкой 1377

MCurl::addMessage("Название товара: ".$product['title']);

добавьте

if(isset($this->request->post['prefix']) AND !empty($this->request->post['prefix'])){
  $product['title'] = $this->request->post['prefix'].' '.$product['title'];    
}

 

Надіслати
Поділитися на інших сайтах

Благодарю, видимо яндекс теперь не отдает название техники. а пишет сразу брендо-модель. 

Вот пример http://market.yandex.ru/product/6905922/?hid=4954975&text=Moulinex%20CE4000&srnum=1

Все таки лучше с хотлайна и онлайнера, если есть возможность :)

Надіслати
Поділитися на інших сайтах


Я написал вам как сделать, чтобы вы могли написать название вручную, у вас должно появится поле для ввода названия, попробуйте.

Надіслати
Поділитися на інших сайтах

Добрый день. Спасибо за отличный плагин.

Есть ли возможность указать парсеру на каком языке забирать данные с Hotline (рус./укр.)? Через кукисы например?

Здравствуйте, импортируйте куки с хотлайна с включенным украинским и загрузите в парсер. Как импортировать описано в приложении к парсеру, можно любым средством в браузере. Название файла должно быть cookie.txt. Я попробовал на лампах, получилось вставить.

Надіслати
Поділитися на інших сайтах

Приветствую. У меня перестал парситься Онлайнер. Там поиск изменился, может это связано ?

 

02-04-2015 11:00:23: Начало парсинга
02-04-2015 11:00:23: Cookie включены.
02-04-2015 11:00:23: Запрос: http://catalog.onliner.by/search?query=FMT-A750&charset=utf-8
02-04-2015 11:00:23: Удачный ответ от сервера
02-04-2015 11:00:23: Получено 6480 байт
02-04-2015 11:00:23: Конец парсинга

 

вот лог

Надіслати
Поділитися на інших сайтах


Створіть аккаунт або увійдіть для коментування

Ви повинні бути користувачем, щоб залишити коментар

Створити обліковий запис

Зареєструйтеся для отримання облікового запису. Це просто!

Зареєструвати аккаунт

Вхід

Уже зареєстровані? Увійдіть тут.

Вхід зараз
×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.