Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Recommended Posts

1 минуту назад, kostya242 сказал:

В атрибуты где-то что-то записалось некорректно. Подскажите как исправить можно (едет верстка)

Ищите в последнем атрибуте перед тем как съезжает верстка.

В вашем случаи где то здесь
 

Спойлер

pduWn2O.png

 

  • +1 1
Надіслати
Поділитися на інших сайтах

Вопрос решен, действительно из тысячи товаров поставщика у одного были лишние указания html кода с указанием width :) Видно там прогеры или верстальщики тоже что-то химичили..

Надіслати
Поділитися на інших сайтах


1 минуту назад, kostya242 сказал:

Вопрос решен, действительно из тысячи товаров поставщика у одного были лишние указания html кода с указанием width :) Видно там прогеры или верстальщики тоже что-то химичили..

вы можете после всех правил формирования последним указать
<{skip}>|
что бы если после всех преобразований останется еше какой то html, что бы модуль его вырезал.

Надіслати
Поділитися на інших сайтах

491278588_-3.thumb.jpg.6e829c75aba1260f4d7f133e9676859d.jpg

Доброго времени суток, подскажите пожалуйста, как через поиск и замену можно объединить Характеристики?

На сайте, с которого парсю товар, Характеристики указаны в таблице через 3 пары <td>значение</td>

Как объеденить последние 2 пары <td>значение</td> в 1?

 

 

Надіслати
Поділитися на інших сайтах


1 минуту назад, Rassol2 сказал:

что бы если после всех преобразований останется еше какой то html, что бы модуль его вырезал.

 

К сожалению, не поможет конструкция <{skip}>| избавиться от проблем вида table width = xxx и т.п. (т.е. не явно прописанный <html> а его остатки)

Надіслати
Поділитися на інших сайтах


@vit2001 здравствуйте.
1. Дайте ссылку на страницу я покручу и дам вам решение.
2. Пожалуйста прячьте скриншоты под спойлер.
 

Спойлер

g37UGVI.png


так удобнее читать, я часто отвечаю с телефона. Да и читаемость ветки по выше будет.

Надіслати
Поділитися на інших сайтах

2 минуты назад, kostya242 сказал:

 

К сожалению, не поможет конструкция <{skip}>| избавиться от проблем вида table width = xxx и т.п. (т.е. не явно прописанный <html> а его остатки)

тогда нужно найти эту страницу, и посмотреть что за остаток, и придумать как указать правило которое будет действовать и в обычном режиме. И в исключении.
Но я так на всякий случай написал что иногда это помогает.

  • +1 1
Надіслати
Поділитися на інших сайтах

5 minutes ago, Rassol2 said:

@vit2001 здравствуйте.
1. Дайте ссылку на страницу я покручу и дам вам решение.
2. Пожалуйста прячьте скриншоты под спойлер.
 

  Reveal hidden contents

g37UGVI.png


так удобнее читать, я часто отвечаю с телефона. Да и читаемость ветки по выше будет.

Прошу прощения, случайно. Ссылка на страницу https://shop.frico.net/ru-RU/pa2220ce10yd--vozdushnaya--zavesa/p100481

Надіслати
Поділитися на інших сайтах


@vit2001 Ок сейчас посмотрю подумаю и отпишусь вам.

Надіслати
Поділитися на інших сайтах

Может найдется хоть один человек, кто сможет подсказать, как спарсить главное изображение товара с этого сайта: https://webshop-ua.intercars.eu/tovary/C13FB6-bosch-zariadnoe-ustroistvo-0-189-999-03m  ?  Специально для этой задачи купил модуль... - и никак..

 

Spoiler

Screenshot_1.thumb.jpg.744e7a5da064157aaa8658a87fb75552.jpg

 

Надіслати
Поділитися на інших сайтах


2 минуты назад, nebo сказал:

Может найдется хоть один человек, кто сможет подсказать, как спарсить главное изображение товара с этого сайта: https://webshop-ua.intercars.eu/tovary/C13FB6-bosch-zariadnoe-ustroistvo-0-189-999-03m  ?  Специально для этой задачи купил модуль... - и никак..

 

  Показать контент

Screenshot_1.thumb.jpg.744e7a5da064157aaa8658a87fb75552.jpg

 

Текст начала и конца парсинга выделен красным.
 

Спойлер

ovqDUv2.png

 

Надіслати
Поділитися на інших сайтах

5 minutes ago, Rassol2 said:

Текст начала и конца парсинга выделен красным.
 

  Reveal hidden contents

ovqDUv2.png

 

Не работает. Получается битая ссылка. Попробуйте открыть ссылку (которая в границе парсинга) в инкогнито браузера.

Надіслати
Поділитися на інших сайтах


1 минуту назад, nebo сказал:

Не работает. Получается битая ссылка. Попробуйте открыть ссылку (которая в границе парсинга) в инкогнито браузера.

Тогда нужно смотреть что это за система и подумать как ее обойти. Но на вскидку не подскажу тогда.

Надіслати
Поділитися на інших сайтах

2 minutes ago, Rassol2 said:

Тогда нужно смотреть что это за система и подумать как ее обойти. Но на вскидку не подскажу тогда.

 

Модуль не видит фото товара. И с куками пробовал и менял юзер-агентов - ничего...

Spoiler

Screenshot_2.thumb.jpg.04c612cce1088d68cdc96b7daddfde8b.jpg

 

Змінено користувачем nebo
Надіслати
Поділитися на інших сайтах


1 минуту назад, nebo сказал:

Модуль не видит фото товара.

То что вы видите в окне пред просмотра это делает не модуль а ваш браузер.
Это называется iframe
И как бы странно не звучало, но на данном скриншоте это ваш браузер не видит.
https://simplepars.top/tools/test_pre_view.php

Вот такое же iframe окно вне модуля.

Надіслати
Поділитися на інших сайтах

3 minutes ago, Rassol2 said:

То что вы видите в окне пред просмотра это делает не модуль а ваш браузер.
Это называется iframe
И как бы странно не звучало, но на данном скриншоте это ваш браузер не видит.
https://simplepars.top/tools/test_pre_view.php

Вот такое же iframe окно вне модуля.

 

Если сможете понять как спарсить эти главные фото товара - пожалуйста сообщите. Не хочется верить, что это невозможно. 

Надіслати
Поділитися на інших сайтах


Только что, nebo сказал:

 

Если сможете понять как спарсить эти главные фото товара - пожалуйста сообщите. Не хочется верить, что это невозможно. 

Позже посмотрю, сейчас уже занят поиском решения атрибутов.

  • +1 1
Надіслати
Поділитися на інших сайтах

@vit2001 Нашел решение готовьте кофе, пошел расписывать. Будет не просто.

Надіслати
Поділитися на інших сайтах

55 минут назад, vit2001 сказал:

Прошу прощения, случайно. Ссылка на страницу https://shop.frico.net/ru-RU/pa2220ce10yd--vozdushnaya--zavesa/p100481

Собственно решение достойно нобелевской премии. Может я конечно перемутрил, но если кто хочет пишите свои варианты решения этой задачи.
Я смог только так, но рад буду увидеть другие подходы и решения.

Создаем границу парисига, в которую помешаем весь блок с атрибутами.
 

Спойлер

VWQYf8K.png


Внутри этого блока запускаем повторяющиеся границы парсинга.
 

Спойлер

aicql96.png

Как можно заметить первое и четвертое повторения паразитные. Это типо групп атрибутов.
Идем в границу парсинга внутри которой крутится повторяющаяся и до того как запустить повторение вырезаем паразитные блоки.
 

Спойлер

mkKTXeP.png

Соответственно вырезав этот блок перед повторяющейся границей парсинга, в повторение он не попадет :wink:

Далее переходим к настройке самой повторяющейся границы париснга.
 

Спойлер

eU0aaqY.png

Как видно повторение начинается с нужного блока.

 

Далее правила.

Удалит все переносы строк.

{br}|

 

А теперь делаем выборку регулярных выражений, три группы. И заменяем всю строку только на то что попало в три группы, и делаем {csvnc} только между первой и второй группой. Таким образом склеиваем вторую и третию группу.

{reg[#<td>(.+?)<\/td><td>(.+?)<\/td><td>(.*)<\/td>#]}|$1{csvnc}$2$3


А так как мы работаем в повторяющихся границах парсинга модуль сам дорисует {csvnc} после каждого отдельного атрибута. :eek:

Результат.
 

Спойлер

OVq9OIY.png



Внесите нобелевскую премию. 8-)

А серьезно если кто может предложить более простое решение пишите, будет интересно посмотреть кто как решил эту задачу.

  • +1 2
Надіслати
Поділитися на інших сайтах

8 минут назад, vit2001 сказал:

Круто, жду, спасибо :)

Думаю решение будет далеко не прозрачное :grin:

Надіслати
Поділитися на інших сайтах

@vit2001

Не за что.

А если в значение атрибутов вы хотите вставить пробел между значением и единицами измерения то вставьте этот пробел тут.
 

Спойлер

XvtgHiA.png

 

Надіслати
Поділитися на інших сайтах

13 minutes ago, Rassol2 said:

Собственно решение достойно нобелевской премии. Может я конечно перемутрил, но если кто хочет пишите свои варианты решения этой задачи.
Я смог только так, но рад буду увидеть другие подходы и решения.

Создаем границу парисига, в которую помешаем весь блок с атрибутами.
 

  Hide contents

VWQYf8K.png


Внутри этого блока запускаем повторяющиеся границы парсинга.
 

  Hide contents

aicql96.png

Как можно заметить первое и четвертое повторения паразитные. Это типо групп атрибутов.
Идем в границу парсинга внутри которой крутится повторяющаяся и до того как запустить повторение вырезаем паразитные блоки.
 

  Hide contents

mkKTXeP.png

Соответственно вырезав этот блок перед повторяющейся границей парсинга, в повторение он не попадет :wink:

Далее переходим к настройке самой повторяющейся границы париснга.
 

  Hide contents

eU0aaqY.png

Как видно повторение начинается с нужного блока.

 

Далее правила.

Удалит все переносы строк.

{br}|

 

А теперь делаем выборку регулярных выражений, три группы. И заменяем всю строку только на то что попало в три группы, и делаем {csvnc} только между первой и второй группой. Таким образом склеиваем вторую и третию группу.

{reg[#<td>(.+?)<\/td><td>(.+?)<\/td><td>(.*)<\/td>#]}|$1{csvnc}$2$3


А так как мы работаем в повторяющихся границах парсинга модуль сам дорисует {csvnc} после каждого отдельного атрибута. :eek:

Результат.
 

  Hide contents

OVq9OIY.png



Внесите нобелевскую премию. 8-)

А серьезно если кто может предложить более простое решение пишите, будет интересно посмотреть кто как решил эту задачу.

Сделал, другого решения не надо, это супер крутое и супер понятное решение! Спасибо за поддержку!

  • +1 1
Надіслати
Поділитися на інших сайтах


1 минуту назад, vit2001 сказал:

Сделал, другого решения не надо, это супер крутое и супер понятное решение! Спасибо за поддержку!

Не за что.
Ну я не для вас, а так для разминки мозгов вдруг сейчас кто то залетит и скажет что можно было проще и покажет как. Я был бы рад увидеть еше решения.

  • +1 1
Надіслати
Поділитися на інших сайтах

Створіть аккаунт або увійдіть для коментування

Ви повинні бути користувачем, щоб залишити коментар

Створити обліковий запис

Зареєструйтеся для отримання облікового запису. Це просто!

Зареєструвати аккаунт

Вхід

Уже зареєстровані? Увійдіть тут.

Вхід зараз
×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.