-
Posts
744 -
Joined
-
Last visited
Content Type
Profiles
Forums
Marketplace
Articles
FAQ
Our New
Store
Blogs
module__dplus_manager
Everything posted by Axelenz
-
А если необходимо, например, загрузить данные на Prom или другой маркетплейс, то там нет АОП...
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Да, всё правильно. Результат ведь получили. /resize_cache/ так же удаляйте. Одной регуляркой почистить: {reg[#(\/upload\/)(resize_cache\/)(iblock\/.+\/)(.+\/)(.+\.jpg)#]}|$1$3$5
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Чтобы https://aksamit.by/upload/iblock/2c7/1200_800_10c990030dff24c9f070e61a1af594648/2c7f9884a76635c49b8fdd59888f1266.jpg привести к виду https://aksamit.by/upload/iblock/2c7/2c7f9884a76635c49b8fdd59888f1266.jpg можно использовать примерно такую регулярку: {reg[#(https:\/\/aksamit\.by\/upload\/iblock\/.+\/)(.+\/)(.+\.jpg)#]}|$1$3
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Да, конечно, при неумелом обращении с регулярками в том числе, можно удалить и нужные данные... Так что сначала необходимо изучить матчасть, а потом уже парсить )
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Да, но если случай совсем тяжкий, например: тогда используем более сложный вариант предыдущего регулярного выражения: {reg[#(\s*\<br\>\s*(?!=\r\n))+#]}|<br> Казалось бы зачем придумывать, если есть регулярное выражение {reg[#^(.*?)\s+?^(?=.*^\1$)#m]}| - Удалит две Идентичные строки друг за другом. Но это чистильщик, который необходимо использовать только тем, кто знаком хоть немного с html... А что, если у Вас в описании будут: </div> </div>
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
{reg[#(\<br\>\r\n)+#]}|<br> - один из самых простых способов превратить любое количество повторяющихся <br> в один.
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Из хотелок... Хочется указывать сразу при парсинге в csv, например, "Дату начала" и "Дату окончания" акции. Можно ли как-то в столбце Значение {...} указать Дату "сегодня" а в следующей строке, например, "сегодня" + 7 дней ? Чтобы в прайсе вывело в одном и следующем столбце даты с разницей в эти 7 дней ??? Формат Даты желательно вида: ДД.ММ.ГГГГ
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Ну и не забывайте о тех, кому интересен парсинг в CSV... хочется видеть развитие и в этой ветке модуля )
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
1С:Битрикс движок...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Но если уж так сильно нужно, то можно и выдернуть остальные изображения, только из самого браузера путём сбора ссылок фото по каждой ссылке товара. Ссылки на страницы товара будут собраны самим модулем, а дальше, например, используем плагин поиска ссылок фото на странице в связке со скриптом. Лично я так собирал информацию с альбомов ВК. Управляющий скриптик + куча доп. плагинов для браузера и можно закрыть 99% любых хотелок...
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Вот разработчик модуля пишет про многопоточность... читайте... https://opencartforum.com/topic/123017-podderzhka-simplepars-universalnyy-parser-dlya-im/?page=85&tab=comments#comment-1519570 https://opencartforum.com/topic/123017-podderzhka-simplepars-universalnyy-parser-dlya-im/?page=29&tab=comments#comment-1365304
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Это width=100% может дописываться только в том случае, если у Вас не правильно указана граница... Попробуйте вместо "> указать границу "
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Попробовал разные настройки, работает даже при таких "не рекомендованных" автором )
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Этот сайт парсится практически с любыми настройками...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Повторяющейся границы внутри обычной границы парсинга https://simplepars.top/index.php?page=note&n=8 Вот то, что Вам необходимо изучить.
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Вы явно не читали мануал уважаемого разработчика... То, что Вы хотите сделать Вам вообще ни к чему. Вам нужно лишь указать главную границу: Текст начала парсинга data-fit="contain" data-navposition="bottom"> Текст конца парсинга </a> и повторяющуюся границу: Текст начала парсинга href=" Текст конца парсинга " и картинка будет у Вас...
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
{reg[#^0#]}|
- 13,430 replies
-
- 2
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Регулярное выражение удалит из текста, например, 2+ (два и более) закрывающих тега </div> со всеми пробелами, табуляциями, переводами строки и пр. перед ними, между ними и после них. Удалит в начале текста, в конце текста, в начале и в конце текста или по всему тексту, в зависимости от выбранной формулы: {reg[#^(\s*</div>\s*){2,}#]}| - от 2-х и более, в начале текста {reg[#(\s*</div>\s*){2,}$#]}| - от 2-х и более, в конце текста {reg[#(\s*</div>\s*){2}$#]}| - только 2, в конце текста {reg[#^(\s*</div>\s*){2,}|(\s*</div>\s*){2,}$#]}| - от 2-х и более, в начале и в конце текста {reg[#(\s*</div>\s*){2,}#]}| - от 2-х и более, удаление по всему тексту {reg[#(\s*<br>\s*){2,}|(\s*<br />\s*){2,}#]}| - то же самое, только с <br>, по всему тексту дальше можно потренироваться с жадный/не жадный... Примерно так это удаляет на практике: удалив запятую в фигурных скобках - получим конкретное число удаляемых в конце тегов. Вместо </div> подставляем интересующие для удаления повторяющееся сочетания символов...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
{reg[#(\s*</div>\s*){2,}$#]}| удалит в конце текста, например, 2+ (два и более) закрывающих тега </div> со всеми пробелами, табуляциями, переводами строки и пр. в начале, между ними и в конце текста.
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Почитайте про этот модуль, может разрешит Вашу проблему... https://opencartforum.com/files/file/4572-image-compressor-watermark-webp-lazy-load-etc-by-sitecreator/
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Это имели ввиду ?
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Нет необходимости усложнять там, где это возможно: : | Но уважаемый разработчик не просто так спросил очевидно он хотел сказать, что Ваша основная задача разделить Наименование атрибута и Значение атрибута, а не бороться с пробелами...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
так Гугел говорит следующее: https://curl.haxx.se/libcurl/c/CURLOPT_HTTP_VERSION.html Attempt HTTP 2 requests. libcurl will fall back to HTTP 1.1 if HTTP 2 can't be negotiated with the server. (Added in 7.33.0) The alias CURL_HTTP_VERSION_2 was added in 7.43.0 to better reflect the actual protocol name. ---------------------------------------------------------------------------------------------------------------------------- Попытка выполнить запросы HTTP 2. libcurl вернется к HTTP 1.1, если HTTP 2 не может быть согласован с сервером. (Добавлено в 7.33.0) Псевдоним CURL_HTTP_VERSION_2 был добавлен в 7.43.0 для лучшего отражения фактического имени протокола. Попробуйте использовать другую версию PHP... или посмотрите, правильную ли версию PHP Вы установили себе ?
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Как минимум их можно удалить... class="disabled">{skip}</span>|>
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Неразрывный пробел в HTML ( |   | u+00a0) Для отображения символов, которых нет на клавиатуре, применяются специальные знаки, начинающиеся с амперсанда (&) и заканчивающиеся точкой с запятой (;).
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)