Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

Axelenz

Users
  
  • Posts

    744
  • Joined

  • Last visited

Everything posted by Axelenz

  1. Чтобы https://aksamit.by/upload/iblock/2c7/1200_800_10c990030dff24c9f070e61a1af594648/2c7f9884a76635c49b8fdd59888f1266.jpg привести к виду https://aksamit.by/upload/iblock/2c7/2c7f9884a76635c49b8fdd59888f1266.jpg можно использовать примерно такую регулярку: {reg[#(https:\/\/aksamit\.by\/upload\/iblock\/.+\/)(.+\/)(.+\.jpg)#]}|$1$3
  2. Да, конечно, при неумелом обращении с регулярками в том числе, можно удалить и нужные данные... Так что сначала необходимо изучить матчасть, а потом уже парсить )
  3. Да, но если случай совсем тяжкий, например: тогда используем более сложный вариант предыдущего регулярного выражения: {reg[#(\s*\<br\>\s*(?!=\r\n))+#]}|<br> Казалось бы зачем придумывать, если есть регулярное выражение {reg[#^(.*?)\s+?^(?=.*^\1$)#m]}| - Удалит две Идентичные строки друг за другом. Но это чистильщик, который необходимо использовать только тем, кто знаком хоть немного с html... А что, если у Вас в описании будут: </div> </div>
  4. Из хотелок... Хочется указывать сразу при парсинге в csv, например, "Дату начала" и "Дату окончания" акции. Можно ли как-то в столбце Значение {...} указать Дату "сегодня" а в следующей строке, например, "сегодня" + 7 дней ? Чтобы в прайсе вывело в одном и следующем столбце даты с разницей в эти 7 дней ??? Формат Даты желательно вида: ДД.ММ.ГГГГ
  5. Но если уж так сильно нужно, то можно и выдернуть остальные изображения, только из самого браузера путём сбора ссылок фото по каждой ссылке товара. Ссылки на страницы товара будут собраны самим модулем, а дальше, например, используем плагин поиска ссылок фото на странице в связке со скриптом. Лично я так собирал информацию с альбомов ВК. Управляющий скриптик + куча доп. плагинов для браузера и можно закрыть 99% любых хотелок...
  6. Вот разработчик модуля пишет про многопоточность... читайте... https://opencartforum.com/topic/123017-podderzhka-simplepars-universalnyy-parser-dlya-im/?page=85&tab=comments#comment-1519570 https://opencartforum.com/topic/123017-podderzhka-simplepars-universalnyy-parser-dlya-im/?page=29&tab=comments#comment-1365304
  7. Вы явно не читали мануал уважаемого разработчика... То, что Вы хотите сделать Вам вообще ни к чему. Вам нужно лишь указать главную границу: Текст начала парсинга data-fit="contain" data-navposition="bottom"> Текст конца парсинга </a> и повторяющуюся границу: Текст начала парсинга href=" Текст конца парсинга " и картинка будет у Вас...
  8. Регулярное выражение удалит из текста, например, 2+ (два и более) закрывающих тега </div> со всеми пробелами, табуляциями, переводами строки и пр. перед ними, между ними и после них. Удалит в начале текста, в конце текста, в начале и в конце текста или по всему тексту, в зависимости от выбранной формулы: {reg[#^(\s*</div>\s*){2,}#]}| - от 2-х и более, в начале текста {reg[#(\s*</div>\s*){2,}$#]}| - от 2-х и более, в конце текста {reg[#(\s*</div>\s*){2}$#]}| - только 2, в конце текста {reg[#^(\s*</div>\s*){2,}|(\s*</div>\s*){2,}$#]}| - от 2-х и более, в начале и в конце текста {reg[#(\s*</div>\s*){2,}#]}| - от 2-х и более, удаление по всему тексту {reg[#(\s*<br>\s*){2,}|(\s*<br />\s*){2,}#]}| - то же самое, только с <br>, по всему тексту дальше можно потренироваться с жадный/не жадный... Примерно так это удаляет на практике: удалив запятую в фигурных скобках - получим конкретное число удаляемых в конце тегов. Вместо </div> подставляем интересующие для удаления повторяющееся сочетания символов...
  9. {reg[#(\s*</div>\s*){2,}$#]}| удалит в конце текста, например, 2+ (два и более) закрывающих тега </div> со всеми пробелами, табуляциями, переводами строки и пр. в начале, между ними и в конце текста.
  10. Нет необходимости усложнять там, где это возможно: :&nbsp;&nbsp;| Но уважаемый разработчик не просто так спросил очевидно он хотел сказать, что Ваша основная задача разделить Наименование атрибута и Значение атрибута, а не бороться с пробелами...
  11. так Гугел говорит следующее: https://curl.haxx.se/libcurl/c/CURLOPT_HTTP_VERSION.html Attempt HTTP 2 requests. libcurl will fall back to HTTP 1.1 if HTTP 2 can't be negotiated with the server. (Added in 7.33.0) The alias CURL_HTTP_VERSION_2 was added in 7.43.0 to better reflect the actual protocol name. ---------------------------------------------------------------------------------------------------------------------------- Попытка выполнить запросы HTTP 2. libcurl вернется к HTTP 1.1, если HTTP 2 не может быть согласован с сервером. (Добавлено в 7.33.0) Псевдоним CURL_HTTP_VERSION_2 был добавлен в 7.43.0 для лучшего отражения фактического имени протокола. Попробуйте использовать другую версию PHP... или посмотрите, правильную ли версию PHP Вы установили себе ?
  12. Неразрывный пробел в HTML (&nbsp; | &#160; | u+00a0) Для отображения символов, которых нет на клавиатуре, применяются специальные знаки, начинающиеся с амперсанда (&) и заканчивающиеся точкой с запятой (;).
×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.