Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Recommended Posts

Добрый вечер! Подскажите , парсю изображение и оно парсится, но не ставится главным фото , а уходит в дополнительные и его приходится выставлять вручную.Что это может быть? версия модуля v3.4.2

 

 

  Показати вміст

 

Змінено користувачем hippvik
Надіслати
Поділитися на інших сайтах


  В 17.07.2020 в 19:34, hippvik сказав:

Добрый вечер! Подскажите , парсю изображение и оно парсится, но не ставится главным фото , а уходит в дополнительные и его приходится выставлять вручную.Что это может быть? версия модуля v3.4.2

Expand  

стоит посмотреть логи модуля. что там написано по поводу фото.

Надіслати
Поділитися на інших сайтах

  В 17.07.2020 в 23:25, Rassol2 сказав:

стоит посмотреть логи модуля. что там написано по поводу фото.

Expand  
  Показати вміст

Вот что в логах.

Надіслати
Поділитися на інших сайтах


@hippvik пока что мне не понятно что это, может дать доступ к админке и фтп. Я посмотрю у вас.
Так же напишите в каком проекте запустить что бы посмотреть на результат.

Надіслати
Поділитися на інших сайтах

Покажу что уже сделал по поводу нового инструмента по работе с ссылками.
Будет отдельная страница и выглядеть она будет так.
P8p0Cxn.png

 

будет доступна возможность фильтровать ссылки, и сразуже переходить по ним.
Либо открывать пред просмотр Настройки парсинга, Парсинг в ИМ, парсинг в CSV , ну это было и в версии страницы которая называлась кеш.

Дальше можно будет отфильтровывать по списками.
По типу ошибки которую получил модуль при попытке парсить страницу.

В действиях пока думаю сделать следующие фунции.
1. Редактировать ссылки, массово. К примеру вырезать что то из ссылки.
2. Добавить в конец ссылки. Бывают сайты где описание доступно только если в ссылке есть добавленных хвостик как #desc И это функция поможет быстро создать дубли ссылок да так что бы эти дубли содержали в конце #desc и вам не приходилось это делать как то вручную. :eek:
3. Перемещение ссылок в разные списки. Одна ссылка может находится только в одном списке.
4. Обнулять пометку об ошибках определенных ссылок.
5. Очищать кеш ссылок.

Дальше будет так же вкладчика по создания списков. Нужно же сперва их создать что бы туда что то положить. :wink:
Ну и вкладка где можно по старинке запустить парсинга в кеш, если вы хотите просто закешировать страницы без каких либо действий.

Понятное дело что при парсинга на всех вкладках где запускается парсинг будет доступен выбор парсинга ссылок из определенного списка, или ссылки только с ошибками. И так далее.

Все сейчас я ухожу до вечера, если кто прочтет, и у него родится еше какая то идея в этом ключе можете писать, пока не закончил все сделать внесу коррективы.
Если идея будет в ключе, и ну прям не заставит меня опять все с нуля делать :oops:

  • +1 2
Надіслати
Поділитися на інших сайтах

Может кто подскажет можно ли спарсить изображения со страницы, если они не видны в коде страницы, когда парсер пробегает

Вот пример страницы https://store.danfoss.com/ru/ru/Холодильная-техника/Клапаны/4-ходовые-реверсивные-клапаны/4-ходовой-реверсивный-клапан%2C-STF/p/061L1146

 

Как видит парсер:

  Показати вміст

 

Как подгружается для пользователя в браузере:

  Показати вміст

 

Надіслати
Поділитися на інших сайтах


@xshader если оно есть в коде да.
Только нужно искать его.

К примеру я вижу что в коде есть.
 

  Показати вміст

Просто не там где вы смотрите.

Надіслати
Поділитися на інших сайтах

модуль может спарсить то что есть в коде страницы.
К примеру тут я вижу что какие то фото подгружаются из вне.
 

  Показати вміст

То есть после загрузи страницы происходят доп запросы на получение информации. Вот такое уже не получится это не реализовано.

Надіслати
Поділитися на інших сайтах

@Rassol2 точно, спасибо, получается главное фото есть в коде в виде https://assets.danfoss.com/images/preview/IMG106637557137/IMG106637557137_preview.jpg?w=96&h=96

Обрезаю ?w=96&h=96 и получаю фото нормального размера. А вот второстепенные фото уже подгружаются из внешнего ресурса:( 

Ну ладно, с главным фото уже тоже отлично.

Надіслати
Поділитися на інших сайтах


 

  В 22.07.2020 в 07:32, xshader сказав:

точно, спасибо, получается главное фото есть в коде в виде https://assets.danfoss.com/images/preview/IMG106637557137/IMG106637557137_preview.jpg?w=96&h=96

Обрезаю ?w=96&h=96 и получаю фото нормального размера. А вот второстепенные фото уже подгружаются из внешнего ресурса:( 

Expand  

да именно.
 

Надіслати
Поділитися на інших сайтах

Подскажите, могу ли я в окне настроек сбора ссылок указать только 2 и 4 уровень (без третьего)? и какой разделитель использовать? В ваших видео нашел только диапазоны.

Спасибо!

Змінено користувачем radosti
Надіслати
Поділитися на інших сайтах


  В 22.07.2020 в 14:11, radosti сказав:

Подскажите, могу ли я в окне настроек сбора ссылок указать только 2 и 4 уровень (без третьего)? и какой разделитель использовать? В ваших видео нашел только диапазоны.

Спасибо!

Expand  

нет можно указать конкретный уровень, и указать диапазон.
Но так как вы написали нет. Укажите 2-4 используйте другие настройки фильтров.

Надіслати
Поділитися на інших сайтах

  В 22.07.2020 в 14:18, Rassol2 сказав:

нет можно указать конкретный уровень, и указать диапазон.
Но так как вы написали нет. Укажите 2-4 используйте другие настройки фильтров.

Expand  

К сожалению, так скорее всего не получится. Потому как 2 и 4 - это категория и страницы (/page/4/), а 3 это страницы фильтров, у которых нет ничего общего и не за что зацепиться. Уже более 200к страниц насобиралось (много товаров), и сервер уже не вывозит :( 

Надіслати
Поділитися на інших сайтах


  В 22.07.2020 в 15:36, radosti сказав:

К сожалению, так скорее всего не получится. Потому как 2 и 4 - это категория и страницы (/page/4/), а 3 это страницы фильтров, у которых нет ничего общего и не за что зацепиться. Уже более 200к страниц насобиралось (много товаров), и сервер уже не вывозит :( 

Expand  

Парсите ссылки на категории. И все.
А затем выставляете парсинг ссылок которые содержат /page/
И все у вас есть и все категории нужные вам и все страницы каждой категории.

Ну либо используйте область.

  Показати вміст


То есть собирайте ссылки только с определенного куска страниц.
Есть старое видео по этому вопросу.

  Показати вміст


 

Надіслати
Поділитися на інших сайтах

  В 22.07.2020 в 15:56, Rassol2 сказав:

Парсите ссылки на категории. И все.
А затем выставляете парсинг ссылок которые содержат /page/
И все у вас есть и все категории нужные вам и все страницы каждой категории.

Ну либо используйте область.

  Показати вміст


То есть собирайте ссылки только с определенного куска страниц.
Есть старое видео по этому вопросу.

  Показати вміст


 

Expand  

Да, все видео просматриваю перед походом в эту ветку. Спасибо! Ждем новые видео :)

Надіслати
Поділитися на інших сайтах


  В 23.07.2020 в 07:33, radosti сказав:

Парсите ссылки на категории. И все.
А затем выставляете парсинг ссылок которые содержат /page/

Expand  

Вы имеете ввиду спарсить категории, сохранить ссылки товаров, и потом в этом же проекте поменять настройки сбора первичных ссылок на /page/ ?

 

Надіслати
Поділитися на інших сайтах


  В 23.07.2020 в 07:34, radosti сказав:

Вы имеете ввиду спарсить категории, сохранить ссылки товаров, и потом в этом же проекте поменять настройки сбора первичных ссылок на /page/ ?

 

Expand  

Да, можно так.
Или вообще собрать ссылки при помощи sitemap.xml

Надіслати
Поділитися на інших сайтах

Здравствуйте
Подскажите как при помощи регулярного выражения удалить все после первого пробела?
Т.е. есть например "слово1 слово2 слово3" а нужно чтобы осталось только "слово1"
В место "слово1" может быть что угодна и буквы и цифры и символы.

Пробовал такой вариант reg{[#\s.*#]} - не работает

Надіслати
Поділитися на інших сайтах


  В 23.07.2020 в 08:38, paseek сказав:

Здравствуйте
Подскажите как при помощи регулярного выражения удалить все после первого пробела?
Т.е. есть например "слово1 слово2 слово3" а нужно чтобы осталось только "слово1"
В место "слово1" может быть что угодна и буквы и цифры и символы.

Пробовал такой вариант reg{[#\s.*#]} - не работает

Expand  

Все гораздо проще.
{reg[# (.*)#]}|

 

  Показати вміст

 

Надіслати
Поділитися на інших сайтах

  В 23.07.2020 в 08:38, paseek сказав:

Пробовал такой вариант reg{[#\s.*#]} - не работает

Expand  

Кстати ваш вариант тоже рабочий.
Только вам нужно прочитать как правильно записывать регулярные выражения.
Здесь - https://simplepars.top/index.php?page=note&note_id=9

Надіслати
Поділитися на інших сайтах

  В 23.07.2020 в 14:04, Deniiisss сказав:

кто может сделать настройки в SimplePars на сайт с товарами?

Expand  

Я могу, можете скинуть ТЗ мне в личку посмотрю что можно сделать.

  • +1 1
Надіслати
Поділитися на інших сайтах


  В 24.07.2020 в 10:39, arthurborsuk сказав:

Можно ли как-то научить этот парсер парсить цену из Google Таблицы?

Expand  

Здравствуйте.
нет, это вам нужен загрузчик прайс листов по типу АОП 

Надіслати
Поділитися на інших сайтах

Створіть аккаунт або увійдіть для коментування

Ви повинні бути користувачем, щоб залишити коментар

Створити обліковий запис

Зареєструйтеся для отримання облікового запису. Це просто!

Зареєструвати аккаунт

Вхід

Уже зареєстровані? Увійдіть тут.

Вхід зараз

×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.