-
Posts
744 -
Joined
-
Last visited
Content Type
Profiles
Forums
Marketplace
Articles
FAQ
Our New
Store
Blogs
module__dplus_manager
Everything posted by Axelenz
-
Если у Вас всё, что в title идёт, как Название атрибута, а в value соответственно, как его значение и так везде, то можно спарсить атрибуты. У Вас только получится, что в value они должны идти или списком или через разделитель. Т.е. это разные значения одного Атрибута фактически... Но это не кусочками нужно видеть, как Вы даёте... не хватает общей картины, что там ещё есть под капотом... Ссылка на сайт есть вместо картинки ? )
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Да, к сожалению далеко не все сайты наполняют информацией сайты так, что можно легко это спарсить... Отсутствие симметричности и логики в размещении атрибутов намекает на дальнейшую доработку вручную... сам такое не люблю...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Разделителем можно взять диаметр, но не факт, что он идёт разделителем для всех атрибутов. Как вариант, можно сделать замену диаметра на ": Ø" Ø|: Ø и потом ::|: на тот случай, если два двоеточия получится где-то
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
ПРИМЕРЫ РЕГУЛЯРНЫХ ВЫРАЖЕНИЙ. Для использования в модуле SimplePars. На самых простых примерах буду показывать тем, кто не имеет опыта работы с ними, как можно использовать регулярные выражения на вкладке Поиск/Замена. По мере своей загруженности постараюсь выкладывать подобные примеры, если это будет интересно и пригодится в работе ещё кому-то. Что такое регулярные выражения Вы можете почитать в интернете, в специальной литературе, а так же на странице разработчика модуля Заметки по регулярным выражениям Использование якорей: ^ - Начало строки. \A - Начало текста. Можете использовать это как образец. Строки с регулярными выражениями и комментариями к ним закомментированы с помощью "#". Уберите "#" и выражение начнёт работать... Далее идут примеры работы каждого регулярного выражения... Пример №1. Пример №2. Пример №3. Пример №4. Пример №5. Пример №6.
- 13,430 replies
-
- 3
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
{reg[#,$#]}| запятую вот этой регуляркой можно убрать в конце но если возможно после неё могут идти пробелы... то лучше этой: {reg[#,\s*?$#]}|
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
С помощью этого модуля или на крайний случай с помощью связки SimplePars + АОП приходится парсить любые сайты... Не попадалось ещё сайта, где не возможно спарсить информацию, хотя я занимаюсь парсингом сайтов постоянно... Даже удалось наконец разработать систему парсинга большого сайта, где имеются товары с 2-мя связанными опциями цвет+размер, товары с одной опцией цвета, товары с одной опцией размера, но уже с иным кодом, чем в предыдущем варианте, и с товарами вообще без опций... При этом использовать только стандартные возможности модуля без дополнительных скриптов... ну и плюс небольшие простыни регулярок ) Правда всё это возможно получить на выходе только в csv, а не сразу в магазин, но мне это всё равно для маркетплейса... Лично мне не хватает иногда только переменных... ) А так функционал позволяет решать весьма сложные задачи...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Отчасти я с Вами согласен, но... один из моих клиентов уже 2 недели добивается, чтобы я ему сказал, какую именно цифру необходимо поставить в Наценку, чтобы модуль добавлял 10% к цене... Я давал ему ссылки на примеры из школьной программы для 5-го класса, где учат %; давал ссылку на страницу Вашей справки, где это всё расписано; он знает что ему нужно накинуть 10%, он понимает куда это нужно вставить, но... не знает на что нужно умножить, чтобы получить +10%... А Вы говорите "функционал"... (
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Из области хотелок... И опять же вопрос не функциональности, а вопрос удобства в работе. Те, кто парсят в свой магазин и у кого 1-2 проекта не поймут, оценят те, кто занимается парсингом постоянно. На вкладке Настройки парсинга было бы очень удобно не набирать постоянно названия границ, а чтобы существовал выбор из готовых названий границ (рекомендую делать выборку из уже существующих названий, которые есть в Парсинг в ИМ, но не только на RU, а сразу же и для англоязычной аудитории на En). Тогда можем получить более-менее однотипные названия границ, в которых можно будет проще разобраться, открыв даже чужой проект. Да и вообще в наш век электроники и кибернетики набирать постоянно одно и тоже: Код товара, Артикул, Название... когда они уже и так прописаны на вкладке Парсинг в ИМ и будут использоваться там же... это совсем не камильфо ( Но это моё личное мнение и я не навязываю его автору, но форум для того и создан, чтобы модуль развивался в направлении хотелок сообщества, поскольку сам проект носит всё же коммерческий характер...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Согласен, что на функциональность модуля это никак не повлияет, но... Критерием оценки использования ПО является не только его функциональность, но также и удобство пользования. Поэтому кроме "наращивания мышц" необходимо ещё подтянуть и оценку пользователей модулем, насколько комфортно его использовать в своей работе... Мощный функционал будут использовать единицы, а вот его универсальность и удобство в использовании необходимо большинству...
- 13,430 replies
-
- 2
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Вкладка "Импорт/Экспорт Настроек" полупустая, а ведь не плохо было бы сделать поле для комментария по поводу проекта. Во-первых, если человек занимается парсингом и накопилось много разных проектов, то удобно иметь возможность для каждого проекта делать хотя бы какие-то заметки на полях, всё ведь со временем забывается... Во-вторых, если делаешь проект заказчику, то удобно не в переписке какие-то ньюансы рассказывать, а сразу же поместить это в проект, что бы не потерялось... Удобно ? Конечно же удобно!
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
{reg[#^(.*?)\h+(.*?)-(.*?)( |-)(.*?)$#u]}|$1 $2-$3 Держите, эта регулярка учитывает, что может быть несколько пробелов после ключевого слова, перед моделью. И учитывает, что второй может быть не только дефис, но и пробел может оказаться... {reg[#^(.*?)\h+(.*?)-(\d{1,})(.*?)$#u]}|$1 $2-$3 а эта будет обрезать не по второму тире, а по последней цифре... пробуйте... Ну и ещё не забывайте о том, что тире бывают разные ) Но далеко не все, кто вручную наполняет сайты догадываются об этом
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Как указали разделитель ";" так он и выводится... {csvnc} используйте
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Как по мне, то слишком много внимания арифметике... лично мне не хватает работы с логикой. Вот если бы ввели переменные. Например, в таком виде: {gran_a} {gran_b} {gran_c} ... {gran_x} {gran_y} {gran_z} Чтобы можно было в переменную помещать или свои данные или спарсенные с донора и использовать их в границах одного проекта. Вот это было бы уже интересно... К примеру я, ну очень редко использую все вот эти манипуляции с числами, округления, умножения и пр. Но зато постоянно приходится работать с текстами в Описании, в Наименовании, в Атрибутах, с опциями, со связанными опциями... и вот тут как раз переменные очень даже пришлись бы кстати...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Вы не озадачили, просто не всегда можно посоветовать, не видя всей картины целиком, а лишь выхваченную из контекста вещь, которую пользователь для себя считает самой важной...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Скиньте свой проект, скажите однозначно как видите это и я Вам сделаю, как нужно. А то Вы своими комментами заполонили весь форум )
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
я же Вам дал более расширенный вариант: {reg[#\v{2,}#]}|{br} {reg[#\h{2,}#]}| - тут пробел {reg[#^\s+|\s+$#]}|
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
А ещё лучше слушайте разработчика и может всё получится... Я также иногда использую краткие характеристики, если у донора ну совсем уже туго с фантазией и совсем нет Описания...
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
пробуйте регулярные выражения и возможно удача придёт к Вам... {reg[#\s{2,}#]}| - тут пробел {reg[#^\s+|\s+$#]}| или вариант {reg[#\s{2,}#m]}| - тут пробел {reg[#^\s+|\s+$#m]}| можете использовать более расширенную версию {reg[#\v{2,}#]}|{br} {reg[#\h{2,}#]}| - тут пробел {reg[#^\s+|\s+$#]}|
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
А мне кажется, что Вы повторяющиеся границы как-то странно используете... при правильном использовании там не должно быть по идее столько мусорного кода... В Вашем случае эти границы: href=" и " А я всё же советую сначала почитать: https://simplepars.top/index.php?page=note&n=8 А чтобы нормально подставлять доменное имя перед относительными ссылками на изображения, автор специально вверху добавил окошко. которое так и называется: Добавить в начало
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Я парсю подобное с помощью Вашего модуля. Как пример, один из последних спарсенных сайтов по матрасам, где связанные опции размер матраса + ткань чехла. Вот сам донор: kondor.by и на том же битриксе... Есть правда ньюансы... заливать в магазин напрямую с помощью этого модуля действительно не получится, поскольку сама схема парсинга слишком сложная и не всё так просто. Поэтому использую всеми любимую связку SimplePars + АОП )))
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Так а возможно добавить сообщение, которое при входе в форму, где логи превышают, например, 50 или сколько там метров, всплывало бы и предлагало почиститься ленивым ?
- 13,430 replies
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Вот приведу "для новичков" один из примеров использования всего, что описал автор в повседневной работе... В частности, этот поиск/замена приводит описание с донора, который судя по всему сам парсит с нескольких сайтов, к более приличному виду на сайте заказчика... У каждого свой подход... Я, к примеру, никогда не удаляю все теги <{skip}>| , а стараюсь максимально использовать всё, что есть у донора, но у учётом того, что у нас с ним могут быть разные CMS. Удаляю разве что явно паразитные теги, все стили потому, что они не "попадут" в Ваши стили в 99% случаев и пр. ньюансы... Просто всё максимально "причёсываю" под сайт заказчика, но за всё нужно платить... я, например, плачу сложностью использования операторов поиска/замены...
- 13,430 replies
-
- 2
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Именно в этой части кода правильно убрать html: <span class='attr__about{skip}='| '>| Тогда Вы получите "чистый" текст. Если использовать то Вы получите обрезок текста вот такой: Водонагреватели высокой мощности (от 3500 Вт) могут не комплектоваться шнуром питания и вилкой. Для подключения такого оборудования к электросети мы рекомендуем обращаться к специалистам.'>
- 13,430 replies
-
- 4
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
Добрый день. Я постоянно решаю именно такие задачи с помощью данного модуля, поскольку основной товар, с которым сейчас приходится много работать - это матрасы и пр. товары с опциями и даже связанными опциями.... Но это задача. которая разрешима только при определённом уровне знаний... а модуль лишь инструмент. Приобретение гоночного автомобиля не делает автоматически его владельца Шумахером... Поэтому вопрос нужно рассматривать не в плоскости "что умеет модуль", а в плоскости "что умею я"...
- 13,430 replies
-
- 1
-
- simplepars
- парсинг товаров opencart
- (and 15 more)
-
В ссылках, как правило, находится текст и иногда он нужен в Описании, чтобы сохранить смысл. Поэтому рекомендую использовать такой вариант: <a{skip}>| </a>| он удалит тег <a>, но оставит сам текст, который находится в ссылке. В нашей стране <a href="https://ru.wiktionary.org/wiki/%D1%81%D0%BB%D0%BE%D0%BD">слоны</a> живут только в зоопарке. Если убрать полностью тег <a> со всем содержимым, то текст может быть и про хомячков...
- 13,430 replies
-
- 2
-
- simplepars
- парсинг товаров opencart
- (and 15 more)