Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

Axelenz

Users
  
  • Posts

    736
  • Joined

  • Last visited

Everything posted by Axelenz

  1. http://joxi.ru/52a9DBJu0nEJO2 Регулярное выражение имеет такой вид (это по быстрому, чтобы особо не заморачиваться) {reg[#^(\d+?{csvnc})(\d+?({csvnc})?)(\d+?({csvnc})?)(\d+?({csvnc})?)(\d+?({csvnc})?)(\d+?({csvnc})?)(\d+?({csvnc})?)(\d+?({csvnc})?)(\d+?({csvnc})?)(\d+?({csvnc})?)$#]}|$1$4$8$12$16$20$24 {reg[#{csvnc}$#]}| Решение не идеальное и нужно подпилить под себя... сколько там максимально возможных вариантов будет и т.п.
  2. Проблема после парсинга, в основном у всех одна - не хватает места на хостинге с прежним тарифным планом... Бывает ещё, что по головотяпству где-то оставляют, например, непарный <div>(</div>) и вся разметка летит...
  3. Такая конструкция имеет недостаток. А что, если не во всех title встречается это ключевое слово ? Для этого необходимо сначала добавить ключевое слово, например, в начало текста, а потом уже удалять по нему...
  4. Что хотите вполне понятно, но Вы дали уже следствие Ваших действий, а нужно видеть изначальную страницу самого донора, а не её интерпретацию.
  5. При таких количествах использовать все 5 потоков с двух сайтов смысла нет. Есть пословица: «Тише едешь – дальше будешь»... Лучше всего эмпирическим путем найти золотую середину для каждого сайта, за сколько часов и во сколько потоков всё приемлемо спарсится, а не долбить донора по максимуму ) Да и свой хостинг нагружать... так себе перспектива...
  6. Вы же не пишете самого основного - количество товаров. И что это за действия ? Обновление цены и количества с догрузкой новых товаров ? Ну и понимать необходимо, что за донор... может это Prom или ещё что... Вы задаёте вопросы, но не говорите самых важных моментов... а именно в них - всё.
  7. Если у Вас есть 2 разных сайта и на обоих стоит модуль SimplePars, то можете парсить с одного или с разных доноров, без разницы. Только делать всё равно это необходимо осмысленно, чтобы не нагружать донора своей излишней активностью...
  8. Это реализовать не возможно, потому, что у Вас такой частный случай. А может кому-то нужно наоборот не сохранять, а удалять Fish, правило будет выглядеть по другому... А кто-то, так же не вникая в регулярные выражения, может подумать, что это всё работает только для слова Fish... и так получится целая книга... а смысла в этом нет, потому, что книг по регуляркам и так хватает...
  9. Если Вам нужно удалить всё, кроме этого слова Fish, то правило с цифрами, на которое Вы ссылаетесь это совершенно о другом... Вам что-то типа этого нужно: {reg[#^(.*?)Fish(.*?)$#]}|Fish
  10. Если Вы хотите сделать регулярку методом научного тыка, то это надолго... Придётся всё же почитать хотя бы минимум, что это такое и как оно работает... {reg[#(^Fish)#]}| как Вы указываете удалить, так оно правильно и удаляет... Вам сюда: https://simplepars.top/index.php?page=note&n=37
  11. У Вас типичный случай, когда Атрибуты выводятся через таблицу <table> и имеют ещё и группу Атрибутов. Лучше всего подобные конструкции выводить по классическому способу, с простыми и повторяющимися границами, как и писал @partshez Используйте сразу же в простой границе регулярки: &nbsp;| {reg[#\s{2,}#u]}| {reg[#\s+?</span>\s+?#u]}|{csvnc} А дальше - повторяющиеся границы.
  12. На сайте может быть кроме кода товара ещё и id товара, т.е. порядковый номер товара на сайте. Можно использовать его. Связываться с Названием товара в качестве Артикула (даже используя хеш) занятие так себе... а если там был лишний пробел в Названии и его потом увидели и исправили, то что тогда ?
  13. Поиск прекрасно находит ответы практически на любые подобные вопросы, например: https://opencartforum.com/topic/112004-resheno-pomogite-s-oshibkoy-division-by-zero-in/
  14. Можно так, а можно в поиск/замене все эти категории через регулярки заменить на одно число или слово и потом уже в настройке допуска указать фильтрацию одной строкой. Это зависит от удобства использования, как Вы планируете с этим дальше работать. Я использую оба варианта в зависимости от ситуации... В настройке допуска удобнее размещать то, что сегодня не нужно, а завтра может уже нужно и оно находится под рукой...
  15. Занимаюсь автоматизацией рутинной работы с помощью модулей АОП и SimplePars или в связке двух этих модулей одновременно. Пишите, уточняйте... Пример: http://joxi.ru/J2boQBJtMoPBnA
  16. Я постоянно занимаюсь парсингом, парсингом и ещё раз парсингом... и ничем более... утром, днём, вечером и ночью... Использую в своей деятельности модули SimplePars и АОП. Иногда один из них, а иногда и в связке два сразу, если проект того требует... Так вот для понятной аналогии хочу Вам сказать, когда человек покупает в хозяйственном магазине болты, шайбы, гайки, то только от него зависит, что он сможет скрутить с помощью этих метизов... Никакой документации априори не может быть на их использование. Подразумевается по умолчанию, что человек осознанно и спланировано покупает себе именно то, что ему необходимо в осуществлении задуманного... Парсинг - это не модуль... модуль - это гайки и болты. А парсинг - это схема в Вашей голове, как с помощью какого-то модуля возможно его осуществить... Вот кто-то может построить эту схему и реализовать на практике задуманное, а кому-то может лучше пойти, например, в музыканты или танцоры... P.S. Музыканты так же паразиты... используя всего 7 нот, придуманные не ими, используют их и получают за это огромные деньги... просто за определённую последовательность извлекаемых звуков... А если Вы хотите создать свой интернет-магазин, не являясь производителем, спарсить с чужого сайта всю информацию и получать с этого денежные знаки, то Вы кто ?
  17. Если Вы уверены на 100% в правильной настройке Планировщика задач на хостинге, то рекомендую поиграться со временем. Например: обходите стороной "0", "00", "24" и не делайте промежутка времени, чтобы полночь входила в него. Напишите лучше время с "1" до "21"... попробуйте ну и подождать немного нужно будет, сразу же не запустится. Ну и состояние, надеюсь, у Вас "Вкл." когда запускаете cron ?
×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.