Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

amd4

Users
  
  • Posts

    322
  • Joined

  • Last visited

Everything posted by amd4

  1. А что так можно было , в очередь сканирования ссылок , добавлять свои? Тогда теперь то мне стало более чем понятно, а то мне именно и не хватало одного поля для реализации . Спасибо вам за наглядный пример! Пошел колупаться .
  2. Да нужно чтоб парсились отдельно взятые категории указанные в верхнем поле "Шаблон ссылок очереди". (Не подкатегории, а категории.) Указана там одна, значит одна, две , значит две. Т.е. например /galogen , значит чтоб парсились товары с галогена вместе с подкатегориями. .
  3. Но если вверху я указываю вместо пагинаций главное меню категорий, ( он находит /galogen/). Вопросов тут нет. То внизу пагинации не работают. А если указать див-контейнер продуктов , находит 150 товаров (три категории по 50шт на страницу) . И глубина ссылок не хочет искать остальные страницы. При пустых нижних полях парсит с галогена все ссылки с авторизацией, корзиной и т.д. Что я делаю не так.
  4. Т.е. Верхний "Шаблон ссылок очереди" для этого не предназначен? Просто насколько я помню и понял по видео инструкции и текстовой инструкции оно как раз для этого и предназначено. И я понимал это так - что в первом случае, что во втором грузится страница категории https://svetavto.com.ua/galogen/ . Только различие в том, что в первом случае , ставиться принудительно в Стартовой ссылке одна категория, а во втором , в поле "Шаблон ссылок очереди" можно поставить их несколько и суть будет одна. Не так да?
  5. Доброго дня! Что то не могу понять, 1.Стартовая ссылка прописана с одной категорией . Например https://svetavto.com.ua/galogen/ 2.В верху, в полях сбора ссылок "Текст начала сбора" и "Текст конца сбора" прописано пагинация на все страницы. 3.Внизу, в полях фильтрация, В Тексте начала сбора и конца сбора привязан контейнер всех товаров на одной странице. Так одну категорию парсит. все хорошо. 1.Меняешь стартовую ссылку на главную https://svetavto.com.ua 2.В поле сбора ссылок, В "Шаблоне ссылок очереди" (где напротив И ИЛИ) , прописываешь эту категорию /galogen. 3.Пагинацию страниц и контейнер всех товаров. В "Текст начала сбора" и "Текст конца сбора" в верхнем и нижнем поле не трогаешь. Ничего не парсит, Вообще ничего. Убираешь внизу в фильтрации сылок, В "Текст начала сбора" и "Текст конца сбора" , блок всех товаров на одной странице, парсит абсолютно все ссылки в том числе авторизация и все категории не обращая внимания на /galogen. Так разве принудительно прописав нужные категории в поле сбора ссылок , спарсить нельзя ? Только создавать для каждой категории новый проект , так что ли ?
  6. Вот как....да, или это или это. Спасибо, запомним. А я думал немного по другому или это с этим или то с этим. Т.е. так можно в принципе (или это или это) составить выражение с километр с новой строки. А с начала строки это понятно, я и выводил границами только ссылку. Кстати вопрос по теме - так и должно быть - в поиск замена, если сохраняешься на каждом выражении и при каждом изменении , гуляя по границам парсинга (что в левом столбе) . То какой товар был сохранен , на тот он и возвращается? Я просто сейчас немного не понял , захожу в бренды проверить конкретно один товар, другое название, захожу в название оно верно. Захожу в фото , оно совсем другое , от третьего товара.
  7. То что оно не должно было заменять то что я хотел, это я понял уже тогда. Собственно я его читал немного по другому. Ваш 3 пункт я сейчас только стал понимать и то не до конца) пока . Я читал так : Строка начинается на http:// или ftp:// после которого идут большие , маленькие латинские буквы. цифры. или без http:// или ftp:// после слеша / после которого идут большие , маленькие латинские буквы. цифры в конце строки. )
  8. По идее должна была проверять адрес , начинается ли с http:// или https(я подставлял вместо ftp):// или после / не стоит ни единого символа, но должны стоять. Это с форума, вычитал, сейчас уже и не найду с какого. По описанию подходило под мои задачи, но бился как рыба об лед, ничего не получалось. Потом допетрил до простого выражения {reg[#(http|https)#]}|https , но тоже ничего не получалось, выводилось httpss , потом написал сюда , получил утвердительный ответ что всё правильно. Но у меня все равно ничего не выходило и только после этого понял причину и поставил первым https ))) Вот как то вот такая история той появившейся длинной регулярки ) Но зато сейчас я это выражение почти полностью понимаю , кроме \ для чего они.
  9. Так я именно так и делаю. На первых шагах ищу нужные выражения, читаю, дабы форумов много. Подставляю и большинство подставляющих выражений почему то не работает. И косые и тильды как вы рекомендуете заменял решетками. Не разу не срабатывало либо вылетало в ошибку. Даже в этой розовой памятке плюсиками отмечены не все выражения которые работают на всех языках. (отсюда кстати вопрос какой язык используете вы?) И то что привели выше, читал я это. Вот например взять тоже самое выражение - {reg[#^((http://)|(ftp://)[a-zA-Z0-9_\./]+)|(/[a-zA-Z0-9_\./]*)|$#]} Вот если брать косые черты. То начинаться должно с такой косой / и заканчиваться такой же / . И опять же сталкиваюсь с неизвестным - почему в том выражении стоят вот такие , обратные косые экранирующие \ и еще тем более в разных квадратных скобках ! .... Конечно это все надо освоить, я с этим согласен. И потихонечку осваивается. Я ведь не сразу вам пишу - помогите. Вот например из этого выражения что вы написали {reg[#(.*)_(\d*?)$#]}|$2 тоже для себя что то почерпнул. Это тоже как и с перфоратором) Не все читают его инструкцию , опытные показали как переключать на удар , как сверлить и новичек просверлив первые отверстия криво, постепенно научился.
  10. Спасибо за подсказку. Я честно пытаюсь выражения осваивать. Но первое что я не могу понять- это какие символы убирать и подставлять скобки { , хештег # и квадратные скобки [ , с которых начинаются выражения у вас. Потому как что я читаю, начинаются с круглых скобок и хештегов с квадратными скобками вовсе нет. Вот давайте тут тогда попутно задам вопрос - ^((http://)|(ftp://)[a-zA-Z0-9_\./]+)|(/[a-zA-Z0-9_\./]*)$ вот выражение которое я ранее гуглил и записал себе , когда тут задавал вопрос об http и htpps и из которого я пытался создать своё. Я правильно понимаю что это все выражение целиком я должен запихать в скобки { , хештег # и квадратные скобки [ ? {reg[#^((http://)|(ftp://)[a-zA-Z0-9_\./]+)|(/[a-zA-Z0-9_\./]*)$#]} Если не правильно, тогда как узнавать что и где необходимо подставлять и какие символы убирать? Вот была бы тогда какая то памятка что ли , шпаргалочка по этому поводу. Было бы конечно попроще. У меня вот например был опыт, до освоения opencartа, иметь дело с парсером ,надстройкой для ексель. т.е. при установке он встраивался в ексель как надстройка. Так там автор вписал сразу все значения, я понимаю , тут так сделать нельзя. Да и у него как я сейчас понимаю он был , скажем так полуавтоматический. Хотя может и нет. Но у меня в то время получилось спарсить этот же самый сайт по его видео за 50 минут. Просто у него при нажатии на поле где можно записывать его правила выпадал список со всеми этими правилами. Да. Не маленький список, поделенный на группы по функциям. По шагам. Я не говорю что ваш плохой. Наоборот, вижу что более функциональный. Но факт что там ничего не надо было осваивать, а в условиях нехватки времени, сами понимаете сидеть и осваивать книги под 600 страниц (вы упоминали в видео)...после завершения, да. Можно освоить. Да и к тому же я искал решение вырезать и вставить с конца последние нужные символы, мне и в голову даже не пришло ориентироваться по _ .
  11. У донора в каждом товаре , точнее в конце ссылки каждого товара уникальное значение, код товара. http;//сайтдонора/категория/название_продукта_12345 Вот какой формулой его вырезать и добавить, не могу понять? Вырезать то вырезаю, а как добавить ....
  12. Да фильтры то работают через запятую. С ними проблем нет. Вопросы к атрибутам. Как то реализовано в CMS непонятно. Вот например какую группу характеристик можно присвоить характеристики Возраст со значениями 25 лет, 30 лет, от 25 до 35 лет, от 35 до 40 лет...Кроме как возраст на ум больше и не приходит.
  13. Значит я правильно понимаю , если я отсеку название атрибута Вот например Группа характеристик : Тип кожи её Атрибуты : Жирная Комбинированная Нормальная Обезвоженная Проблемная Сухая Чувствительная , все её характеристики разобью на {csvnc} , он запишет их в названия , и потому вручную как посоветовали выше, проставить группу, так можно будет добиться желаемого результата ?
×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.