Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

Axelenz

Users
  
  • Posts

    744
  • Joined

  • Last visited

Everything posted by Axelenz

  1. Если у Вас всё, что в title идёт, как Название атрибута, а в value соответственно, как его значение и так везде, то можно спарсить атрибуты. У Вас только получится, что в value они должны идти или списком или через разделитель. Т.е. это разные значения одного Атрибута фактически... Но это не кусочками нужно видеть, как Вы даёте... не хватает общей картины, что там ещё есть под капотом... Ссылка на сайт есть вместо картинки ? )
  2. Да, к сожалению далеко не все сайты наполняют информацией сайты так, что можно легко это спарсить... Отсутствие симметричности и логики в размещении атрибутов намекает на дальнейшую доработку вручную... сам такое не люблю...
  3. Разделителем можно взять диаметр, но не факт, что он идёт разделителем для всех атрибутов. Как вариант, можно сделать замену диаметра на ": Ø" Ø|: Ø и потом ::|: на тот случай, если два двоеточия получится где-то
  4. ПРИМЕРЫ РЕГУЛЯРНЫХ ВЫРАЖЕНИЙ. Для использования в модуле SimplePars. На самых простых примерах буду показывать тем, кто не имеет опыта работы с ними, как можно использовать регулярные выражения на вкладке Поиск/Замена. По мере своей загруженности постараюсь выкладывать подобные примеры, если это будет интересно и пригодится в работе ещё кому-то. Что такое регулярные выражения Вы можете почитать в интернете, в специальной литературе, а так же на странице разработчика модуля Заметки по регулярным выражениям Использование якорей: ^ - Начало строки. \A - Начало текста. Можете использовать это как образец. Строки с регулярными выражениями и комментариями к ним закомментированы с помощью "#". Уберите "#" и выражение начнёт работать... Далее идут примеры работы каждого регулярного выражения... Пример №1. Пример №2. Пример №3. Пример №4. Пример №5. Пример №6.
  5. С помощью этого модуля или на крайний случай с помощью связки SimplePars + АОП приходится парсить любые сайты... Не попадалось ещё сайта, где не возможно спарсить информацию, хотя я занимаюсь парсингом сайтов постоянно... Даже удалось наконец разработать систему парсинга большого сайта, где имеются товары с 2-мя связанными опциями цвет+размер, товары с одной опцией цвета, товары с одной опцией размера, но уже с иным кодом, чем в предыдущем варианте, и с товарами вообще без опций... При этом использовать только стандартные возможности модуля без дополнительных скриптов... ну и плюс небольшие простыни регулярок ) Правда всё это возможно получить на выходе только в csv, а не сразу в магазин, но мне это всё равно для маркетплейса... Лично мне не хватает иногда только переменных... ) А так функционал позволяет решать весьма сложные задачи...
  6. Отчасти я с Вами согласен, но... один из моих клиентов уже 2 недели добивается, чтобы я ему сказал, какую именно цифру необходимо поставить в Наценку, чтобы модуль добавлял 10% к цене... Я давал ему ссылки на примеры из школьной программы для 5-го класса, где учат %; давал ссылку на страницу Вашей справки, где это всё расписано; он знает что ему нужно накинуть 10%, он понимает куда это нужно вставить, но... не знает на что нужно умножить, чтобы получить +10%... А Вы говорите "функционал"... (
  7. Из области хотелок... И опять же вопрос не функциональности, а вопрос удобства в работе. Те, кто парсят в свой магазин и у кого 1-2 проекта не поймут, оценят те, кто занимается парсингом постоянно. На вкладке Настройки парсинга было бы очень удобно не набирать постоянно названия границ, а чтобы существовал выбор из готовых названий границ (рекомендую делать выборку из уже существующих названий, которые есть в Парсинг в ИМ, но не только на RU, а сразу же и для англоязычной аудитории на En). Тогда можем получить более-менее однотипные названия границ, в которых можно будет проще разобраться, открыв даже чужой проект. Да и вообще в наш век электроники и кибернетики набирать постоянно одно и тоже: Код товара, Артикул, Название... когда они уже и так прописаны на вкладке Парсинг в ИМ и будут использоваться там же... это совсем не камильфо ( Но это моё личное мнение и я не навязываю его автору, но форум для того и создан, чтобы модуль развивался в направлении хотелок сообщества, поскольку сам проект носит всё же коммерческий характер...
  8. Согласен, что на функциональность модуля это никак не повлияет, но... Критерием оценки использования ПО является не только его функциональность, но также и удобство пользования. Поэтому кроме "наращивания мышц" необходимо ещё подтянуть и оценку пользователей модулем, насколько комфортно его использовать в своей работе... Мощный функционал будут использовать единицы, а вот его универсальность и удобство в использовании необходимо большинству...
  9. Вкладка "Импорт/Экспорт Настроек" полупустая, а ведь не плохо было бы сделать поле для комментария по поводу проекта. Во-первых, если человек занимается парсингом и накопилось много разных проектов, то удобно иметь возможность для каждого проекта делать хотя бы какие-то заметки на полях, всё ведь со временем забывается... Во-вторых, если делаешь проект заказчику, то удобно не в переписке какие-то ньюансы рассказывать, а сразу же поместить это в проект, что бы не потерялось... Удобно ? Конечно же удобно!
  10. {reg[#^(.*?)\h+(.*?)-(.*?)( |-)(.*?)$#u]}|$1 $2-$3 Держите, эта регулярка учитывает, что может быть несколько пробелов после ключевого слова, перед моделью. И учитывает, что второй может быть не только дефис, но и пробел может оказаться... {reg[#^(.*?)\h+(.*?)-(\d{1,})(.*?)$#u]}|$1 $2-$3 а эта будет обрезать не по второму тире, а по последней цифре... пробуйте... Ну и ещё не забывайте о том, что тире бывают разные ) Но далеко не все, кто вручную наполняет сайты догадываются об этом
  11. Как по мне, то слишком много внимания арифметике... лично мне не хватает работы с логикой. Вот если бы ввели переменные. Например, в таком виде: {gran_a} {gran_b} {gran_c} ... {gran_x} {gran_y} {gran_z} Чтобы можно было в переменную помещать или свои данные или спарсенные с донора и использовать их в границах одного проекта. Вот это было бы уже интересно... К примеру я, ну очень редко использую все вот эти манипуляции с числами, округления, умножения и пр. Но зато постоянно приходится работать с текстами в Описании, в Наименовании, в Атрибутах, с опциями, со связанными опциями... и вот тут как раз переменные очень даже пришлись бы кстати...
  12. Вы не озадачили, просто не всегда можно посоветовать, не видя всей картины целиком, а лишь выхваченную из контекста вещь, которую пользователь для себя считает самой важной...
  13. А ещё лучше слушайте разработчика и может всё получится... Я также иногда использую краткие характеристики, если у донора ну совсем уже туго с фантазией и совсем нет Описания...
  14. пробуйте регулярные выражения и возможно удача придёт к Вам... {reg[#\s{2,}#]}| - тут пробел {reg[#^\s+|\s+$#]}| или вариант {reg[#\s{2,}#m]}| - тут пробел {reg[#^\s+|\s+$#m]}| можете использовать более расширенную версию {reg[#\v{2,}#]}|{br} {reg[#\h{2,}#]}| - тут пробел {reg[#^\s+|\s+$#]}|
  15. А мне кажется, что Вы повторяющиеся границы как-то странно используете... при правильном использовании там не должно быть по идее столько мусорного кода... В Вашем случае эти границы: href=" и " А я всё же советую сначала почитать: https://simplepars.top/index.php?page=note&n=8 А чтобы нормально подставлять доменное имя перед относительными ссылками на изображения, автор специально вверху добавил окошко. которое так и называется: Добавить в начало
  16. Я парсю подобное с помощью Вашего модуля. Как пример, один из последних спарсенных сайтов по матрасам, где связанные опции размер матраса + ткань чехла. Вот сам донор: kondor.by и на том же битриксе... Есть правда ньюансы... заливать в магазин напрямую с помощью этого модуля действительно не получится, поскольку сама схема парсинга слишком сложная и не всё так просто. Поэтому использую всеми любимую связку SimplePars + АОП )))
  17. Так а возможно добавить сообщение, которое при входе в форму, где логи превышают, например, 50 или сколько там метров, всплывало бы и предлагало почиститься ленивым ?
  18. Вот приведу "для новичков" один из примеров использования всего, что описал автор в повседневной работе... В частности, этот поиск/замена приводит описание с донора, который судя по всему сам парсит с нескольких сайтов, к более приличному виду на сайте заказчика... У каждого свой подход... Я, к примеру, никогда не удаляю все теги <{skip}>| , а стараюсь максимально использовать всё, что есть у донора, но у учётом того, что у нас с ним могут быть разные CMS. Удаляю разве что явно паразитные теги, все стили потому, что они не "попадут" в Ваши стили в 99% случаев и пр. ньюансы... Просто всё максимально "причёсываю" под сайт заказчика, но за всё нужно платить... я, например, плачу сложностью использования операторов поиска/замены...
  19. Именно в этой части кода правильно убрать html: <span class='attr__about{skip}='| '>| Тогда Вы получите "чистый" текст. Если использовать то Вы получите обрезок текста вот такой: Водонагреватели высокой мощности (от 3500 Вт) могут не комплектоваться шнуром питания и вилкой. Для подключения такого оборудования к электросети мы рекомендуем обращаться к специалистам.'>
  20. Добрый день. Я постоянно решаю именно такие задачи с помощью данного модуля, поскольку основной товар, с которым сейчас приходится много работать - это матрасы и пр. товары с опциями и даже связанными опциями.... Но это задача. которая разрешима только при определённом уровне знаний... а модуль лишь инструмент. Приобретение гоночного автомобиля не делает автоматически его владельца Шумахером... Поэтому вопрос нужно рассматривать не в плоскости "что умеет модуль", а в плоскости "что умею я"...
  21. В ссылках, как правило, находится текст и иногда он нужен в Описании, чтобы сохранить смысл. Поэтому рекомендую использовать такой вариант: <a{skip}>| </a>| он удалит тег <a>, но оставит сам текст, который находится в ссылке. В нашей стране <a href="https://ru.wiktionary.org/wiki/%D1%81%D0%BB%D0%BE%D0%BD">слоны</a> живут только в зоопарке. Если убрать полностью тег <a> со всем содержимым, то текст может быть и про хомячков...
×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.