Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Recommended Posts

1 минуту назад, Mixxxa163 сказал:

заметил опечатку http://prntscr.com/1v4uhr3

Да спасибо, поправлю.

  • +1 1
Надіслати
Поділитися на інших сайтах

19 минут назад, Mixxxa163 сказал:

заметил опечатку http://prntscr.com/1v4uhr3

Опечаток много. На скорость и качество парсинга не влияет :eek:

  • +1 2
Надіслати
Поділитися на інших сайтах


Только что, partshez сказал:

Опечаток много. На скорость и качество парсинга не влияет :eek:

О да ))

Надіслати
Поділитися на інших сайтах

58 минут назад, partshez сказал:

Опечаток много. На скорость и качество парсинга не влияет :eek:

..только на рассмотрение автору, в рамках улучшения юзабилити и так отличного продукта)

Надіслати
Поділитися на інших сайтах


Не могу спарсить категории  https://bereg.ua/ru/silikon-daiwa-bait-junkie-3-2-minnow.html

В коде страницы все вижу https://prnt.sc/1v5kmqy   В модуле только Главная  https://prnt.sc/1v5kujv

Как решить вопрос?

Надіслати
Поділитися на інших сайтах


35 хвилин назад, partshez сказав:

Как решить вопрос?

Скорее всего там хлебные крошки формирует JS, поэтому никак

  • +1 1
Надіслати
Поділитися на інших сайтах

1 час назад, partshez сказал:

Не могу спарсить категории  https://bereg.ua/ru/silikon-daiwa-bait-junkie-3-2-minnow.html

В коде страницы все вижу https://prnt.sc/1v5kmqy   В модуле только Главная  https://prnt.sc/1v5kujv

Как решить вопрос?

Всегда смотрите в коде модуля а не в браузере.
В браузере могут подставляться данные которых нет изначально на странице.

Надіслати
Поділитися на інших сайтах

26 минут назад, Rassol2 сказал:

Всегда смотрите в коде модуля а не в браузере.
В браузере могут подставляться данные которых нет изначально на странице.

Это ясно. Так и делаю всегда. Отказал человеку. Категории не получается вытащить, к сожалению.

Надіслати
Поділитися на інших сайтах


Не могу спарсить атрибуты, весь день пытаюсь...( Никак. Дело в том, что есть такие атрибуты, маркированным списком -   http://prntscr.com/1v5yte5 и у них нет разделителя...разделитель у меня запятая. Такой исходный код http://prntscr.com/1v5zllw. Получается вот так http://prntscr.com/1v5zovu Может кто подскажет - поможет?

Надіслати
Поділитися на інших сайтах


54 минуты назад, Mixxxa163 сказал:

Не могу спарсить атрибуты, весь день пытаюсь...( Никак. Дело в том, что есть такие атрибуты, маркированным списком -   http://prntscr.com/1v5yte5 и у них нет разделителя...разделитель у меня запятая. Такой исходный код http://prntscr.com/1v5zllw. Получается вот так http://prntscr.com/1v5zovu Может кто подскажет - поможет?

Разделителем можно взять диаметр, но не факт, что он идёт разделителем для всех атрибутов.

Как вариант, можно сделать замену диаметра на ": Ø"

Ø|: Ø

и потом

::|:

на тот случай, если два двоеточия получится где-то

Змінено користувачем Axelenz
  • +1 1
Надіслати
Поділитися на інших сайтах


4 минуты назад, Axelenz сказал:

Разделителем можно взять диаметр, но не факт, что он идёт разделителем для всех атрибутов.

Как вариант, можно сделать замену диаметра на ": " + диаметр, а потом через замену

::|:

на тот случай, если два получится где-то

Разделитель для всех атрибутов у меня запятая. Думаю нужно регулярное выражение, которое в конец текста этих границ <div class="characteristic-value"> </div> добавит запятую..диаметр не у всех атрибутов, далее есть например такой http://prntscr.com/1v67eqf

 

 

Надіслати
Поділитися на інших сайтах


2 минуты назад, Mixxxa163 сказал:

Разделитель для всех атрибутов у меня запятая. Думаю нужно регулярное выражение, которое в конец текста этих границ <div class="characteristic-value"> </div> добавит запятую..диаметр не у всех атрибутов, далее есть например такой http://prntscr.com/1v67eqf

Да, к сожалению далеко не все сайты наполняют информацией сайты так, что можно легко это спарсить... Отсутствие симметричности и логики в размещении атрибутов намекает на дальнейшую доработку вручную... сам такое не люблю...

Надіслати
Поділитися на інших сайтах


5 минут назад, Mixxxa163 сказал:

Разделитель для всех атрибутов у меня запятая. Думаю нужно регулярное выражение, которое в конец текста этих границ <div class="characteristic-value"> </div> добавит запятую..диаметр не у всех атрибутов, далее есть например такой http://prntscr.com/1v67eqf

 

 

Материалы в контакте со средой это атрибут а остальное - значения, все по такому принципу...

Надіслати
Поділитися на інших сайтах


7 минут назад, Mixxxa163 сказал:

Материалы в контакте со средой это атрибут а остальное - значения, все по такому принципу...

Если у Вас всё, что в title идёт, как Название атрибута, а в value соответственно, как его значение и так везде, то можно спарсить атрибуты. У Вас только получится, что в value они должны идти или списком или через разделитель. Т.е. это разные значения одного Атрибута фактически...

Но это не кусочками нужно видеть, как Вы даёте... не хватает общей картины, что там ещё есть под капотом... Ссылка на сайт есть вместо картинки ? )

Змінено користувачем Axelenz
  • +1 1
Надіслати
Поділитися на інших сайтах


12 минут назад, Mixxxa163 сказал:

Материалы в контакте со средой это атрибут а остальное - значения, все по такому принципу...

Лучше скиньте проект, там всё будет видно... Если дело только в запятой, поставлю.

Надіслати
Поділитися на інших сайтах


8 минут назад, Axelenz сказал:

Если у Вас всё, что в title идёт, как Название атрибута, а в value соответственно, как его значение и так везде, то можно спарсить атрибуты. У Вас только получится, что в value они должны идти или списком или через разделитель. Т.е. это разные значения одного Атрибута фактически...

Но это не кусочками нужно видеть, как Вы даёте... не хватает общей картины, что там ещё есть под капотом... Ссылка на сайт есть вместо картинки ? )

есть конечно)..https://www.vega.com/ru/products/product-catalog/interface/guided-wave-radar/vegaflex-81 Наименование раскрывающихся списков не нужны:
Технические данные, Сертификаты, Индикация и настройка. Нужны только сами атрибуты, и их значения. Пример http://prntscr.com/1v6atzu. И после как подсказал @Rassol2 применить регулярку для замены запятой в дробях на точку, не меняя ее в значениях (словах)..{reg[#(\d)\040?,\040?(\d)#]}|$1.$2 http://prntscr.com/1v6bohl

 

Надіслати
Поділитися на інших сайтах


И Вы хотите парсить такие не простые атрибуты без использования повторяющихся границ ???

Надіслати
Поділитися на інших сайтах


16 минут назад, Axelenz сказал:

И Вы хотите парсить такие не простые атрибуты без использования повторяющихся границ ???

не принципиально, я рассматриваю этот метод тоже..

Надіслати
Поділитися на інших сайтах


9 минут назад, Mixxxa163 сказал:

не принципиально, я рассматриваю этот метод тоже..

characteristic-title">|
<div class="characteristic-values{skip}>|{csvnc}
[{skip}]|
{reg[#\s+</div>\s+<div class="characteristic-value">\s+#mu]}|,
<{skip}>|
{reg[#\v#]}|
{reg[#\h{2,}#]}| 
{reg[#\s+?{csvnc}\s+?#]}|{csvnc}

В повторяющихся границах вставьте, может где подправьте...

 

 

SPsetting-91.json

Надіслати
Поділитися на інших сайтах


28 минут назад, Axelenz сказал:

characteristic-title">|
<div class="characteristic-values{skip}>|{csvnc}
[{skip}]|
{reg[#\s+</div>\s+<div class="characteristic-value">\s+#mu]}|,
<{skip}>|
{reg[#\v#]}|
{reg[#\h{2,}#]}| 
{reg[#\s+?{csvnc}\s+?#]}|{csvnc}

В повторяющихся границах вставьте, может где подправьте...

 

 

SPsetting-91.json 4 \u043a\u0411 · 1 download

Благодарствую Боярин!) работает, но не разберусь, пропала буква х http://prntscr.com/1v6vuxw и может быть в этой связи некоторые атрибуты остались пустыми без значений, а некоторые вообще не попали на предпросмотр, хотя в поиск-замене они есть http://prntscr.com/1v6w06q..?

Надіслати
Поділитися на інших сайтах


9 минут назад, Mixxxa163 сказал:

Благодарствую Боярин!) работает, но не разберусь, пропала буква х http://prntscr.com/1v6vuxw и может быть в этой связи некоторые атрибуты остались пустыми без значений, а некоторые вообще не попали на предпросмотр, хотя в поиск-замене они есть http://prntscr.com/1v6w06q..?

Скиньте в личку этот новый проект, посмотрю, поправлю...

То, что работает я и сам удивлён )

Змінено користувачем Axelenz
Надіслати
Поділитися на інших сайтах


11 часов назад, Axelenz сказал:

Скиньте в личку этот новый проект, посмотрю, поправлю...

То, что работает я и сам удивлён )

Благодарю за помощь, по итогу все работает отлично!)..

Надіслати
Поділитися на інших сайтах


день добрый может кто сталкивался с проблемой зависания сайта и всего впс сервера во время парсинга когда парсер попадает на пустую страницу или страницу категории где нет товара это происходит во время парсинга по крону

во время парсинга не по крону происходит 1 зависание и парсинг останавливается

Змінено користувачем dmitriy2506
Надіслати
Поділитися на інших сайтах


Как сохранять форматирование текста (абзацы, табы, маркированные списки) с донора при парсинге? Сейчас всё сливается в одну кучу:

 

Спойлер

image.png.29f6803a6ffa263dc9bf6b1ac83597c1.png

 

Надіслати
Поділитися на інших сайтах


Створіть аккаунт або увійдіть для коментування

Ви повинні бути користувачем, щоб залишити коментар

Створити обліковий запис

Зареєструйтеся для отримання облікового запису. Це просто!

Зареєструвати аккаунт

Вхід

Уже зареєстровані? Увійдіть тут.

Вхід зараз
×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.