Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

Axelenz

Users
  
  • Posts

    736
  • Joined

  • Last visited

7 Followers

About Axelenz

  • Birthday 09/21/1966

Technical support

  • Status
    Работаю
  • Other
    telegram:Axelenz Парсинг сложных сайтов, регулярные выражения, настройка модулей SimplePars и АОП

Information

  • Gender
    Мужчина
  • City:
    Все буде Україна!
  • Interests
    freelance

Recent Profile Visitors

11,743 profile views

Axelenz's Achievements

Mentor

Mentor (12/14)

  • Posting Machine Rare
  • Dedicated Rare
  • First Post
  • Collaborator
  • Reacting Well Rare

Recent Badges

342

Reputation

  1. {reg[#\A\s*(.{0,10})(.*?)(\v.*?)+\z#u]}|$1 потому, что тут указано обязательное наличие вертикального пробельного символа \v: (\v.*?)+ {reg[#(.{0,10})(.*)#]}|$1 Этот вариант я так же не рекомендовал бы к использованию... это один из частных случаев со сходной задачей. {reg[#^(.{160}).*?$#u]}|$1 А если это интерпретировать на понятный язык, то звучит примерно так: Пропускаем текст длиной менее 160 символов, а если длина более, то захватываем с начала (^) 160 символов, если есть текст далее до конца, то его не учитываем...
  2. Если делать правильно и не думать, что будет когда артикул исчезнет или наоборот добавится что-то с похожим Артикулом, то лучше вот так: {reg[#^W-IT-2147W$#]}|mp1035803 {reg[#^W-IT-2147WT$#]}|mp1587822 и так далее... Подразумевается, что у Вас "чистые" артикулы и нет символов ни до ни после... Тут порядок строк уже не имеет значения, разве что для удобства поиска артикулов.
  3. Все "чудеса" в работе модуля SimplePars заканчиваются, как правило, после вдумчивого прочтения мануала по модулю и просмотра видео... Это далеко не тот модуль, в котором возможно сделать что-то реальное привычным методом "научного тыка". А регулярные выражения это вообще отдельная тема... граната в руках вождя племени мумба-юмба...
  4. А как у Вас латинская "x" становится вдруг "х" с раскладки кирилицы ? В подобной ссылке кириллических символов не должно быть в принципе... В коде такого нет: g5r02u9fssd1gukhхkcaхzqykzm5afr7 http://view-source:https://mebelart.by/product/stol_kompyuternyy_signal_b_216_chernyy/ Вы случайно регулярными выражениями не игрались ?
  5. Лучше один раз увидеть... Дайте мне 154 и 138, посмотрю, что не нужное можно отсечь... Но бывает так, что лучше соблюсти разумную достаточность и не делать сложные и не предсказуемые на будущее регулярки, если, например, эти 16 Артикулов всегда можно отсечь при желании в поиске/замене или в настройках допуска...
  6. Так оно и будет... пока Вы наконец не скажите доходчиво, а что именно Вы хотите получить ??? Второй раз задаю вопрос... Вот Вам 2 ответа на Вашу задачу... смотря что Вам нужно уже методом тыка выберите нужный {reg[#A25-1131A.+$#u]} {reg[#A25-1131A$#u]}
  7. Попробуйте убрать границу слова \b И не понятно, а какая конкретно задача стоит. Вы написали только что делаете и написали результат этих действий...
  8. Спарсить свой сайт... а зачем такие сложности ? Спарсить можете другие сайты с помощью SimplePars, а вот на маркетплейсы выгрузить с помощью отличного модуля SimplePars - Универсальный парсер для ИМ UniXML - модуль выгрузки в XML формате
×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.