Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Axelenz

Користувачі
  
  • Публікації

    742
  • З нами

  • Відвідування

7 підписників

Про Axelenz

  • День народження 21.09.66

Технічна підтримка

  • Статус
    Работаю
  • Інше
    telegram:Axelenz Парсинг сложных сайтов, регулярные выражения, настройка модулей SimplePars и АОП

Інформація

  • Стать
    Мужчина
  • Місто:
    Все буде Україна!
  • Інтереси
    freelance

Відвідувачі профілю

11 810 переглядів профілю

Axelenz's Achievements

Mentor

Mentor (12/14)

  • Posting Machine Rare
  • Dedicated Rare
  • First Post
  • Collaborator
  • Reacting Well Rare

Recent Badges

344

Репутація

  1. Да... к сожалению не работает для всех xml... поэтому придётся через поиск/замену... А сначала сделать замену через поиск/замену в простой границе один раз, а потом данные получать уже без CDATA в повторяющихся границах есть смысл или тоже нет никакого выиграша ? Я про те случаи, когда CDATA стоит не только в desc а во многих местах...
  2. @Rassol2 Подскажите, пожалуйста. Насколько правильный такой подход очистки xml от CDATA при условии, что большинство проектов реализовано именно через фиды поставщиков. Или через поиск/замену более правильно ? Благодарю. Проверил, как работает, в некоторых xml удаляет, а в некоторых не удаляет...
  3. Лучше один раз увидеть, чем сто раз услышать... приложите скрин настроек в планировщике и главное: что за хостинг ? На дешёвых хостингах есть такое, что планировщик нельзя настроить на ежеминутное срабатывание... Или предлагают переходить на более дорогие тарифы или на другие хостинги...
  4. {reg[#\A\s*(.{0,10})(.*?)(\v.*?)+\z#u]}|$1 потому, что тут указано обязательное наличие вертикального пробельного символа \v: (\v.*?)+ {reg[#(.{0,10})(.*)#]}|$1 Этот вариант я так же не рекомендовал бы к использованию... это один из частных случаев со сходной задачей. {reg[#^(.{160}).*?$#u]}|$1 А если это интерпретировать на понятный язык, то звучит примерно так: Пропускаем текст длиной менее 160 символов, а если длина более, то захватываем с начала (^) 160 символов, если есть текст далее до конца, то его не учитываем...
  5. Если делать правильно и не думать, что будет когда артикул исчезнет или наоборот добавится что-то с похожим Артикулом, то лучше вот так: {reg[#^W-IT-2147W$#]}|mp1035803 {reg[#^W-IT-2147WT$#]}|mp1587822 и так далее... Подразумевается, что у Вас "чистые" артикулы и нет символов ни до ни после... Тут порядок строк уже не имеет значения, разве что для удобства поиска артикулов.
  6. Все "чудеса" в работе модуля SimplePars заканчиваются, как правило, после вдумчивого прочтения мануала по модулю и просмотра видео... Это далеко не тот модуль, в котором возможно сделать что-то реальное привычным методом "научного тыка". А регулярные выражения это вообще отдельная тема... граната в руках вождя племени мумба-юмба...
  7. А как у Вас латинская "x" становится вдруг "х" с раскладки кирилицы ? В подобной ссылке кириллических символов не должно быть в принципе... В коде такого нет: g5r02u9fssd1gukhхkcaхzqykzm5afr7 http://view-source:https://mebelart.by/product/stol_kompyuternyy_signal_b_216_chernyy/ Вы случайно регулярными выражениями не игрались ?
×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.