Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Axelenz

Користувачі
  
  • Публікації

    740
  • З нами

  • Відвідування

Усі публікації користувача Axelenz

  1. С помощью этого модуля или на крайний случай с помощью связки SimplePars + АОП приходится парсить любые сайты... Не попадалось ещё сайта, где не возможно спарсить информацию, хотя я занимаюсь парсингом сайтов постоянно... Даже удалось наконец разработать систему парсинга большого сайта, где имеются товары с 2-мя связанными опциями цвет+размер, товары с одной опцией цвета, товары с одной опцией размера, но уже с иным кодом, чем в предыдущем варианте, и с товарами вообще без опций... При этом использовать только стандартные возможности модуля без дополнительных скриптов... ну и плюс небольшие простыни регулярок ) Правда всё это возможно получить на выходе только в csv, а не сразу в магазин, но мне это всё равно для маркетплейса... Лично мне не хватает иногда только переменных... ) А так функционал позволяет решать весьма сложные задачи...
  2. Отчасти я с Вами согласен, но... один из моих клиентов уже 2 недели добивается, чтобы я ему сказал, какую именно цифру необходимо поставить в Наценку, чтобы модуль добавлял 10% к цене... Я давал ему ссылки на примеры из школьной программы для 5-го класса, где учат %; давал ссылку на страницу Вашей справки, где это всё расписано; он знает что ему нужно накинуть 10%, он понимает куда это нужно вставить, но... не знает на что нужно умножить, чтобы получить +10%... А Вы говорите "функционал"... (
  3. Из области хотелок... И опять же вопрос не функциональности, а вопрос удобства в работе. Те, кто парсят в свой магазин и у кого 1-2 проекта не поймут, оценят те, кто занимается парсингом постоянно. На вкладке Настройки парсинга было бы очень удобно не набирать постоянно названия границ, а чтобы существовал выбор из готовых названий границ (рекомендую делать выборку из уже существующих названий, которые есть в Парсинг в ИМ, но не только на RU, а сразу же и для англоязычной аудитории на En). Тогда можем получить более-менее однотипные названия границ, в которых можно будет проще разобраться, открыв даже чужой проект. Да и вообще в наш век электроники и кибернетики набирать постоянно одно и тоже: Код товара, Артикул, Название... когда они уже и так прописаны на вкладке Парсинг в ИМ и будут использоваться там же... это совсем не камильфо ( Но это моё личное мнение и я не навязываю его автору, но форум для того и создан, чтобы модуль развивался в направлении хотелок сообщества, поскольку сам проект носит всё же коммерческий характер...
  4. Согласен, что на функциональность модуля это никак не повлияет, но... Критерием оценки использования ПО является не только его функциональность, но также и удобство пользования. Поэтому кроме "наращивания мышц" необходимо ещё подтянуть и оценку пользователей модулем, насколько комфортно его использовать в своей работе... Мощный функционал будут использовать единицы, а вот его универсальность и удобство в использовании необходимо большинству...
  5. Вкладка "Импорт/Экспорт Настроек" полупустая, а ведь не плохо было бы сделать поле для комментария по поводу проекта. Во-первых, если человек занимается парсингом и накопилось много разных проектов, то удобно иметь возможность для каждого проекта делать хотя бы какие-то заметки на полях, всё ведь со временем забывается... Во-вторых, если делаешь проект заказчику, то удобно не в переписке какие-то ньюансы рассказывать, а сразу же поместить это в проект, что бы не потерялось... Удобно ? Конечно же удобно!
  6. {reg[#^(.*?)\h+(.*?)-(.*?)( |-)(.*?)$#u]}|$1 $2-$3 Держите, эта регулярка учитывает, что может быть несколько пробелов после ключевого слова, перед моделью. И учитывает, что второй может быть не только дефис, но и пробел может оказаться... {reg[#^(.*?)\h+(.*?)-(\d{1,})(.*?)$#u]}|$1 $2-$3 а эта будет обрезать не по второму тире, а по последней цифре... пробуйте... Ну и ещё не забывайте о том, что тире бывают разные ) Но далеко не все, кто вручную наполняет сайты догадываются об этом
  7. Как по мне, то слишком много внимания арифметике... лично мне не хватает работы с логикой. Вот если бы ввели переменные. Например, в таком виде: {gran_a} {gran_b} {gran_c} ... {gran_x} {gran_y} {gran_z} Чтобы можно было в переменную помещать или свои данные или спарсенные с донора и использовать их в границах одного проекта. Вот это было бы уже интересно... К примеру я, ну очень редко использую все вот эти манипуляции с числами, округления, умножения и пр. Но зато постоянно приходится работать с текстами в Описании, в Наименовании, в Атрибутах, с опциями, со связанными опциями... и вот тут как раз переменные очень даже пришлись бы кстати...
  8. Вы не озадачили, просто не всегда можно посоветовать, не видя всей картины целиком, а лишь выхваченную из контекста вещь, которую пользователь для себя считает самой важной...
  9. А ещё лучше слушайте разработчика и может всё получится... Я также иногда использую краткие характеристики, если у донора ну совсем уже туго с фантазией и совсем нет Описания...
  10. пробуйте регулярные выражения и возможно удача придёт к Вам... {reg[#\s{2,}#]}| - тут пробел {reg[#^\s+|\s+$#]}| или вариант {reg[#\s{2,}#m]}| - тут пробел {reg[#^\s+|\s+$#m]}| можете использовать более расширенную версию {reg[#\v{2,}#]}|{br} {reg[#\h{2,}#]}| - тут пробел {reg[#^\s+|\s+$#]}|
  11. А мне кажется, что Вы повторяющиеся границы как-то странно используете... при правильном использовании там не должно быть по идее столько мусорного кода... В Вашем случае эти границы: href=" и " А я всё же советую сначала почитать: https://simplepars.top/index.php?page=note&n=8 А чтобы нормально подставлять доменное имя перед относительными ссылками на изображения, автор специально вверху добавил окошко. которое так и называется: Добавить в начало
  12. Я парсю подобное с помощью Вашего модуля. Как пример, один из последних спарсенных сайтов по матрасам, где связанные опции размер матраса + ткань чехла. Вот сам донор: kondor.by и на том же битриксе... Есть правда ньюансы... заливать в магазин напрямую с помощью этого модуля действительно не получится, поскольку сама схема парсинга слишком сложная и не всё так просто. Поэтому использую всеми любимую связку SimplePars + АОП )))
  13. Так а возможно добавить сообщение, которое при входе в форму, где логи превышают, например, 50 или сколько там метров, всплывало бы и предлагало почиститься ленивым ?
  14. Вот приведу "для новичков" один из примеров использования всего, что описал автор в повседневной работе... В частности, этот поиск/замена приводит описание с донора, который судя по всему сам парсит с нескольких сайтов, к более приличному виду на сайте заказчика... У каждого свой подход... Я, к примеру, никогда не удаляю все теги <{skip}>| , а стараюсь максимально использовать всё, что есть у донора, но у учётом того, что у нас с ним могут быть разные CMS. Удаляю разве что явно паразитные теги, все стили потому, что они не "попадут" в Ваши стили в 99% случаев и пр. ньюансы... Просто всё максимально "причёсываю" под сайт заказчика, но за всё нужно платить... я, например, плачу сложностью использования операторов поиска/замены...
  15. Именно в этой части кода правильно убрать html: <span class='attr__about{skip}='| '>| Тогда Вы получите "чистый" текст. Если использовать то Вы получите обрезок текста вот такой: Водонагреватели высокой мощности (от 3500 Вт) могут не комплектоваться шнуром питания и вилкой. Для подключения такого оборудования к электросети мы рекомендуем обращаться к специалистам.'>
  16. Добрый день. Я постоянно решаю именно такие задачи с помощью данного модуля, поскольку основной товар, с которым сейчас приходится много работать - это матрасы и пр. товары с опциями и даже связанными опциями.... Но это задача. которая разрешима только при определённом уровне знаний... а модуль лишь инструмент. Приобретение гоночного автомобиля не делает автоматически его владельца Шумахером... Поэтому вопрос нужно рассматривать не в плоскости "что умеет модуль", а в плоскости "что умею я"...
  17. В ссылках, как правило, находится текст и иногда он нужен в Описании, чтобы сохранить смысл. Поэтому рекомендую использовать такой вариант: <a{skip}>| </a>| он удалит тег <a>, но оставит сам текст, который находится в ссылке. В нашей стране <a href="https://ru.wiktionary.org/wiki/%D1%81%D0%BB%D0%BE%D0%BD">слоны</a> живут только в зоопарке. Если убрать полностью тег <a> со всем содержимым, то текст может быть и про хомячков...
  18. Спарсить то группы атрибутов возможно точно так же, как и всё остальное, вот только это ничего не даст, потому, что модуль не сможет их залить на место. Как вариант, я игрался так... создать в магазине Группы атрибутов и каждый раз указывать модулю, какую именно группу атрибутов парсить каждый раз... Но сложность данного процесса не позволяет его рекомендовать в массы... Поэтому устанавливать связь атрибутов с группами вручную - это Ваш вариант...
  19. Ну попробуйте с одной картинкой, даже вручную через FTP. Тем более у Вас как минимум два инструмента есть: SimplePars и АОП. Но я, если честно, имею привычку ломиться в базу и там сразу подобное делать... в таблице product нужно смотреть, что там в поле с картинками творится... Насколько я понял из всего вышесказанного Вами, то картинки у Вас хранятся в нормальном виде с нормальным расширением .jpg но вот в базе пути к ним сохранились в полном виде, как у донора .png@jpg. Тогда необходимо в указанной мною выше таблице всё привести в порядок, чтобы ссылка и фото соответствовали...
  20. Ну если не хотите скачивать именно в .png (а это будет раз в 10 больше по размеру), то как вариант, можно скачать массово все фото .jpg и потом просто при парсинге подменить пути к фото с их сайта на своё хранилище... А почему IE не открывает ?
×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.