-
Публікації
740 -
З нами
-
Відвідування
Тип публікації
Профілі
Форум
Маркетплейс
Статті
FAQ
Наші новини
Магазин
Блоги
module__dplus_manager
Усі публікації користувача Axelenz
-
В экспорте настроек не хватает для удобства кнопки "Полная очистка проекта". По типу, как у очистки ссылок, чтобы задавался вопрос "А Вы уверены, а может не надо...". Или подскажите, как можно получить из старого проекта (не удаляя его), девственно чистый проект, ну и чтобы это было не очень суетно... Зачем это нужно. Это только для тех, кто занимается парсингом не для себя... Накапливается множество проектов, а иногда удобно делать проекты одного и того же магазина подряд друг за другом, например, когда это проект только обновления цены и наличия ну или пр. Ну и может можно сделать экспорт не одного проекта, а всех проектов сразу, чтобы по отдельности их не экспортировать и не переименовывать ( Ещё можно было бы добавить по принципу полной очистки: "Очистить все кеши" "Очистить все cookies" ... Ну это хотелки их разряда удобства эксплуатации модуля и к функциональности не относятся, но всё же...
-
А тут пробовали ? Заметки по регулярным выражениям
-
В мануал разработчика не пробовали заходить ? {reg[#[^0-9]#]}| - Удалит из текста все кроме цифр.
- 13 413 відповіді
-
- 1
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
Эта регулярка добавляет при парсинге товара в конец существующего у донора текста любой свой.
-
{reg[#^#]}|Любой текст - Добавить в начало текста что то.{reg[#$#]}|Любой текст - Добавить в конец текста что то.{reg[#$#m]}|Любой текст - Добавить любой текст в начало каждой строки.{reg[#^#m]}|Любой текст - Добавить любой текст в конец каждой строки. (Обратит внимание что конец строки идет после символа перехода на новую строку.) Читайте мануал по модулю и хотелок будет меньше. И почему это делать нужно именно "что делать при обновлении" ? В АОП есть подобная возможность "Соединить с описанием:" и "добавить сверху", "добавить снизу", но... SKU с разных источников далеко не всегде одинаковы... Или как вариант искать, может совпадает по альтернативному SKU...
-
Что-то типа такого Вам может помочь: {reg[#(.{1,220}(?=\s))(.*)#]}|$1 Слова не будет обрезать, будет искать последний пробел, который входит в заданный диапазон...
- 13 413 відповіді
-
- 1
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
{reg[#(^|(\.[ ]+))а#]}|$1А
- 13 413 відповіді
-
- 2
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
Да, есть такое. Постоянно парсю подобный сайт. Парсинг около 10,000 товаров занимает около 3 часов, а жизнь cookies при этом составляет 5 минут и потом слетает регистрация, т.е. парсится всё то же самое, но цены уже только розничные, а мне нужны розничные и оптовые, доступ к которым только через личный кабинет... Поэтому решение было найдено такое: пишется скрипт, который запускается на ночь, управляет и браузером и модулем. Каждые 5 минут останавливает парсинг, выходит из личного кабинета, снова заходит, регистрируется, записывает новые cookies и запускает модуль, записывает всё в логи... Если упрощённо, то как-то так... Другими словами, для модуля необходим робот-администратор...
-
Так это уже что-то... подтянете ещё якоря, кванторы, утверждения и пр. и будет эльфийский regex от Rassol2 ))) Благодарю.
-
Да, я делаю из набора слов текст уже пригодный для чтения. Поисковики всё же предпочитают слова, написанные правильно... А ещё часто приходится из текста удалять разнообразные варианты написания названия магазина донора... даже тут с ошибками умудряются накалякать.
-
Пока нет, не было такого заказа ( Но если будет, то я Вам напишу, поделим гонорар...
-
Вот ещё задача, которую можно решить только с помощью одиночной замены символа: Например, в тексте есть множество исковерканных вариантов написания простого слова ИНДУСТРИАЛИЗАЦИЯ. Необходимо всё свести к правильному написанию слова. индустреалезацея индустреализацея индустриалезацея индустреализация индустриалезация индустриализацея индустр{.}ал{.}зац{.}я|индустриализация Задача решается в одну строку, если иметь инструмент {.} Мне, например, часто приходится исправлять в тексте Описания подобные ошибки, но сейчас это несколько неудобно...
-
Нет, тот пример решаем... Вот пример, который не возможно решить с помощью {skip}, где имеется ввиду любое количество символов. БАР{skip}Н|БАРАН Пример текста: Бла-бла-бла БАРОН, а БАРИН блю-блю-блю, а БАРАН бле-бле-бле, но БАРАБАН бан-бан-бан... Вот в выделенных словах №1 и №2 сделана ошибка, нужно их исправить на БАРАН, как в слове №3. Но слово БАРАБАН правильно написано и его исправлять не нужно. Вот это можно решить с помощью единичной символьной замены...
-
Да... потому, что попробуйте в тексте, где многа букав и есть, например, несколько дат для замены: бла-бла-бла дата:04/02/21 бла-бла-бла 19/02/21 бла-бла-бла заменить их вот так: {skip}/02/21|$1 февраля 2021 года не... это получилось заменить... не могу пока найти пример.
-
Нужно обратить внимание на указанный диапазон глубины ссылок 5-6... При указании глубины 4-6 уже берёт указанную ссылку. Не должно быть в ссылках на товар: не "/#" а "#" лучше укажите.
- 13 413 відповіді
-
- 2
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
Из хотелок... Не хватает среди основных операторов в поиск замене, например, вот такого: {.} Что означало бы "любой одиночный символ" В регулярных выражениях используют: "." В Excel используют: "?" Можно и регулярками это заменить, но ведь можно было бы и нужно бы проще, например, если нужно заменить такую конструкцию: </h1><|</h1>{br}< </h2><|</h2>{br}< </h3><|</h3>{br}< </h4><|</h4>{br}< </h5><|</h5>{br}< </h6><|</h6>{br}< Выглядело бы намного проще вот так: </h{.}><|</h{$1}>{br}< А справа в замене после вертикальной черты (пайп), можно по аналогии с регулярными выражениями, возвращать через $1, например, реальное значение слева от вертикальной черты... Что скажете ? Можно расписать, имея такой инструмент, очень много чего: дни, месяцы, годы... Например: {.}{.}.02.21г.|{$1}{$2} февраля 2021 года
-
Модуль может парсить количество, которое указано в опции, но не может подсчитать количество самих опций. Можно решить разве что с помощью регулярок, подсчитать сколько там чего-то... А поскольку регулярки тоже не складывают вот так просто, то можно с помощью замены. Т.е., например: <div> = 1 <div><div> = 2 и так далее, думаю смысл понятен... "пробовал в настройках парсинга ставить разделители "+" и {+}" + - это сложение, а не разделитель. А если значения есть, то сложить их можно так: {gran_3}{+}{gran_2}{+}{gran_3}...
-
Вам бы сначала изучить, что есть что... Прописные
-
Ну могу предложить более сложный, но зато более действенный вариант с проверкой на Заглавные буквы после точки: {reg[#(?=(^а))а#]}|А {reg[#(\.[ ]+)(?=(а))а#]}|$1А смысл, я думаю, понятен, прописываем все буквы русского алфавита... ну разве что кроме "Ь" и "Ъ"... не помню слов, чтобы начинались на них... {reg[#((?=(^а))|(\.[ ]+)(?=(а)))а#]}|$1А Даже так работает ))) Минимизировал до такого: {reg[#(^|(\.[ ]+))а#]}|$1А
-
{reg[#((Женский\h+)+)\1*#]}| Правильная формула очевидно будет так выглядеть... Если одна строка, то используем \h, если много таких строк, то используем \s.
- 13 413 відповіді
-
- 1
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
А чем и как Вы их заменяете ? Сама по себе Ваша картинка ни о чём не говорит, не говорит о том, что Вы всё правильно сделали, а в модуле ошибки...
-
А если необходимо, например, загрузить данные на Prom или другой маркетплейс, то там нет АОП...
- 13 413 відповіді
-
- 1
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
Да, всё правильно. Результат ведь получили. /resize_cache/ так же удаляйте. Одной регуляркой почистить: {reg[#(\/upload\/)(resize_cache\/)(iblock\/.+\/)(.+\/)(.+\.jpg)#]}|$1$3$5
- 13 413 відповіді
-
- 1
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
Чтобы https://aksamit.by/upload/iblock/2c7/1200_800_10c990030dff24c9f070e61a1af594648/2c7f9884a76635c49b8fdd59888f1266.jpg привести к виду https://aksamit.by/upload/iblock/2c7/2c7f9884a76635c49b8fdd59888f1266.jpg можно использовать примерно такую регулярку: {reg[#(https:\/\/aksamit\.by\/upload\/iblock\/.+\/)(.+\/)(.+\.jpg)#]}|$1$3
- 13 413 відповіді
-
- 1
-
- simplepars
- парсинг товаров opencart
- (і ще %d)
-
Да, конечно, при неумелом обращении с регулярками в том числе, можно удалить и нужные данные... Так что сначала необходимо изучить матчасть, а потом уже парсить )