Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

Axelenz

Users
  
  • Posts

    744
  • Joined

  • Last visited

Everything posted by Axelenz

  1. Парсер выполняет свою задачу - парсит всю информацию о товаре, для чего он изначально и предназначен. Поэтому обвинять его в том, что что-то там не работает в самой CMS это всё равно, что обвинять Mercedes-Benz в том, что их автомобили плохо ездят на бензине, разбавленном ослиной мочой... Ну да, нет идеальных CMS, но никто и не заставляет выбирать именно Opencart... есть прекрасная поделка Wordpress )))
  2. У меня там никак не меньше разных правил... Поэтому не хочу все яйца класть в одно лукошко ) ---------------------------------------------------------------------- Из разряда хотелок... Иногда по ходу пьесы получается, что создаются разные границы в качестве вспомогательных или для опытов... а потом забывается, что реально задействовано и необходимо, а что уже можно удалить, чтобы не захламлять проект. Так вот было бы не плохо, если бы можно было визуально отличать границы, которые реально задействованы в проекте от тех, которые не используются (при парсинге в ИМ или CSV)... Да, если их десяток, то можно и так удалить, но если их сотня ? Может с помощью выделения или наклонным или меньшим шрифтом или в тумане... не знаю как, но чтобы было понятно, что эта граница нигде не используется в проекте и может быть при желании удалена или вообще кнопка типа "очистить проект от не задействованных границ", но это уже слишком... думаю, что это избыточно и может быть даже не желательно...
  3. И спасибо Вам за такую возможность. Раньше я всё это делал в Excel, но ручной труд это скучно, поэтому я всё по самому максимуму переношу в проект один раз и навсегда. Зачем делать повторяющиеся действия, если это можно сразу задать при парсинге. А количество большое потому, что у клиента такой запрос, фильтровать Наименование на наличие запрещённых слов... и список слов. Не загружать некоторые категории и список категорий из более 600 всего категорий на сайте-доноре. Поэтому меньше ну никак не получается... Но может и можно как-то это всё сделать так, чтобы группировать можно было ? Не говорю про текстовый файл, а именно, чтобы всё запустить в один столбец, построчно ?
  4. Не факт... ) У меня в одном постоянном проекте около полусотни проверок как по цифрам, так и по не нужным категориям, запрещённым словам в наименовании, которые находятся все в одном месте, а именно в "Настройки допуска к обработке страницы" и плюс клиент может сказать, что на этот раз граница не 100, а 10 или на этот раз пару категорий пропускаем... Поэтому лично мне вариант с разбрасыванием проверок по всему проекту ну никак... Я даже наоборот, выступаю за модульность. Чтобы всё что касается какой-то конкретной операции, например, проверки или замены, было максимально сфокусировано именно в этом блоке. Дабы избежать в дальнейшем не нужных вопросов: "почему у меня не работает" и "ой, а я то совсем забыл что оно у меня там стоит..." )
  5. Запишите, как у меня. Первое - до 10, второе условие - до 100. {reg[#\d{3,}#]} если на обычный язык перевести, то это означает, что проходят проверку только данные, которые состоят из цифр в количестве от 3-х шт. Т.е. больше 100 и 100 проходит проверку, а 99 уже не проходит...
  6. (.*?) - МОЖЕТ быть любой символ (не жадный) ([A-ZА-Я]{2,} - за которым должны следовать заглавные буквы англ. или рус. от двух и больше (.*?) - за которыми МОЖЕТ следовать любой символ ( |$)) - после которого идёт или пробел или конец текста (.*)- после которого МОЖЕТ быть любой символ #u - кодировка Unicode $2 - взять только то, что находится во вторых скобках... ([A-ZА-Я]{2,}(.*?)( |$)) *любой символ - кроме переноса строки \n *может быть - а может и не быть...
  7. Пожалуйста. Лично я выбираю всегда места, откуда это "выцарапать" по явному уже указанию, что эти цифры обозначают, например, в Вашем случае это может быть: itemprop="sku" content="36469" product_id="36469" 'PRODUCT_ID':'36469'
  8. Конечно же не то, потому, что в качестве артикула для дальнейших обновлений намного проще выбирать конкретные вещи, а не абстрактные. У Вас же есть product_id="36469" этого товара, разве этого не достаточно ? https://metall-zavod.ru/catalog/verstaki/elementy_verstakov_metall_zavod/36469/ И расскажите, как с помощью своего придуманного способа, Вы хотите получить артикулы с этих названий: SGR-V-Zn Стяжка балок-1000 Держатель 6 местный DM-75x63 Опора Верстака
  9. самое выражение {reg[#(.+)[ ]{1,}[А-ЯЁ]{1}[а-яё](.+)#u]}|$1 Но смысл поиска не такой, как Вы указали, а следующий: найти пробел один или несколько, за которым должна следовать буква прописная, за которой следуют строчные буквы... И взять только то, что находится до найденного. Но вообще то так задачи не ставятся... Потому, что возникает очень много дополнительных вопросов. А всегда ли порядок этого "артикула" будет в начале фразы, а встречаются ли пробелы в этом артикуле, а только ли русские слова могут быть после артикула и т.п. Поэтому, какой вопрос - такой и ответ...
  10. Это понимаю, а как практически приклеить {gran_000} в поиск/замене... Почему-то получаю в итоге текст {gran_000}, а не сами данные с указанной границы... Понятно... работает то, что мне необходимо только в бете... Сенкс...
  11. Подскажите, пожалуйста. Пытаюсь связанные опции спарсить и потом их разделить на отдельные товары... Вот как можно опцию цвета, в которой, например, есть 9 опций размеров, повторить столько же раз (9 раз) ? Просто делать по максимальному возможному количеству размеров, какие могут встречаться на сайте - не очень интересно... хотелось бы получить конкретное число.
  12. Не думаю, что вообще что-то нужно делать. Необходимо иметь хотя бы соответствующее образование... ну хотя бы в интернете почитать про основы html, сайтостроение и пр. А если "смертным" вдруг станет интересно, как работает атомная электростанция, как там оно всё устроено... ) Сначала необходимо изучать теорию, а лишь потом уже тыкать на красную кнопку... А так... можно любого разработчика нагнуть... пусть открывает курсы программирования с нуля )))
  13. Ну и матчасть посмотрите, в частности синтаксис того, с чем работаете: HTML <img src="URL" alt="альтернативный текст"> XHTML <img src="URL" alt="альтернативный текст" /> т.е. всё, что идёт после закрытия первой пары кавычек и до закрытия тега Вам не нужно. Вам нужно взять отсюда лишь URL (ссылку) где находится картинка. {reg[#\<img(.+)src="(.+)"(.*?)\>#]}| "+" - это значит, что хоть один символ, да стоит в этом месте "\" - экранирует, чтобы красиво было ) "?" - будет там что-то или нет... хз...
  14. Я бы посоветовал ещё попробовать убрать из описания все слои <div> и соответственно </div>. Без стилей всё равно от них проку мало. Ну и категории поставьте для товара.
  15. Читайте на форуме на 254, 263 странице, что пишет автор модуля... https://opencartforum.com/topic/123017-podderzhka-simplepars-universalnyy-parser-dlya-im/?page=254 https://opencartforum.com/topic/123017-podderzhka-simplepars-universalnyy-parser-dlya-im/?page=263
  16. Замечательно, на днях пришлось составлять построение таблицы сразу же на странице CSV/Парсинг, без допила в Excel. Выбираются опции и их значения, наличие и строится таблица для Prom. Всё получилось замечательно, а с новым функционалом, наверное будет ещё проще ) Реализуется тут и тут
×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.