Jump to content
Search In
  • More options...
Find results that contain...
Find results in...

Axelenz

Users
  
  • Posts

    744
  • Joined

  • Last visited

Everything posted by Axelenz

  1. Почитайте про Повторяющиеся границы парсинга... Как я только не пробовал, как не менял границу - а оно парсит и парсит картинку и без всяких водяных знаков... Тут самая простая задача - ничего гениального...
  2. Нет там никаких заморочек... Я провозился с Вашими настройками, думал, что там всё нормально и действительно нельзя стянуть фото, а потом просто посмотрел... и сделал всё правильно.
  3. Ну наверное притвориться Firefox-ом... Ищите Список User-Agent Firefox Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/62.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:52.0) Gecko/20100101 Firefox/52.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:57.0) Gecko/20100101 Firefox/57.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:71.0) Gecko/20100101 Firefox/71.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:72.0) Gecko/20100101 Firefox/72.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:73.0) Gecko/20100101 Firefox/73.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:78.0) Gecko/20100101 Firefox/78.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:85.0) Gecko/20100101 Firefox/85.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0 Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:87.0) Gecko/20100101 Firefox/87.0 Попробуйте, отпишитесь, интересно...
  4. Присоединяюсь... Не хватает для удобства возможности перемещения уже заполненных строк выше/ниже или хотя бы вставки пустых строк между существующими...
  5. А почему нельзя по такому же принципу сделать сопоставление атрибутов для мультиязычного ? Например, парсятся атрибуты на русском. Заливаются на сайт. Теперь с базы вытягиваются эти спарсенные атрибуты, а также вытягивается их attribute_id и language_id. Дальше парсятся с донора атрибуты на другом языке, например, на украинском. Теперь в скрипте путём выбора делаем соответствие атрибутов с донора на обеих языках. А поскольку на первые атрибуты имеем сразу же их attribute_id, то остаётся только указать в какой именно language_id должны попадать вторые атрибуты... Наверное можно будет связать Наименования атрибутов со Значением атрибутов ? Ну это я себе так теоретически представляю )))
  6. Не так давно делал на заказ парсинг двуязычного сайта и пришлось полистать интернет... Вот то же самое описывают на форуме: https://opencartforum.com/topic/16297-podderzhka-avtomaticheskaya-obrabotka-prays-listov/?page=1857&tab=comments#comment-1692398 https://opencartforum.com/topic/16297-podderzhka-avtomaticheskaya-obrabotka-prays-listov/?page=1856&tab=comments#comment-1690421 Поэтому я спарсил человеку на разных языках то, что возможно использовать на сайте Opencart, а атрибуты он сам уже переводил...
  7. Сами по себе регулярные выражения ничего не значат. Значит то, насколько правильная логика выбрана и в то ли место эти выражения вставлены... Я часто использую, например, при очистке Описания с донора десятки строк с регулярными выражениями, которые что-то удаляют, заменяют, проверяют... и приходится вставлять чистку от лишних пробелов по нескольку раз в разных местах...
  8. Из хотелок... На вкладке "CSV/Парсинг" в "Настройки допуска к обработке страницы" имеем, например, вариант загрузить если "Не содержит %значение%". Возьмём Наименование товара со словами, которые не должны быть спарсены, например: Маска для лица МАСКА от пыли Комплект маска и ласты Костюм маскарадный Маскарадные костюмы Очки-полумаска для плавания ну и т.д. Сейчас выбор фильтрации идёт по строгому соответствию слова, выбрав "маска" мы отфильтруем наименования, в которых присутствует слово с таким написанием. Я предлагаю расширить возможности фильтра и сделать как "жёсткую" привязку к слову, так и более "расширенную", если можно так выразиться. Т.е. оставить то, что уже есть, но и добавить вариант: "Не содержит все варианты %значение%" И этот фильтр убирает не только слова "маска", но и слова "Маска", "МАСКА" и пр., т.е. строчное/прописное написание слов игнорируется... Осталось только разобраться с вариантами, когда слово может быть, как часть более длинного слова... маскарадный, например... думаю, что такие варианты не должны рассматриваться, только в границах слова... Есть, конечно, регулярки, но всё же... Ну и аналогично расширить "Содержит %значение%". Это нужно для того, чтобы не тянуть длинные "простыни", где нужно учесть и расписать всевозможные варианты написания слов.
  9. Хотелка по удобству работы с модулем... Вкладка "CSV/Парсинг". Я нажимаю очередную "волшебную" кнопку и автоматически заполняются "Название колонки в прайс листе CSV", например, наименованиями по порядку, как они идут в АОП... Красота ? Лишнее всегда можно удалить, но каждый раз заполнять одно и то же... ( Не лишним так же была бы возможность перемещения полей вверх-вниз... Иногда приходится реализовывать нудные проекты, число столбцов в которых превышает 500 ((( под дальнейший допил в Excel... Зато начинающим не нужно будет голову ломать, а что там писать и куда оно и зачем оно... Автозаполнение это наше всё, это то, что делает работу удобной и комфортной, убирает рутину.
  10. {reg[#^(.*?);(.*?)$#]}|$1 оставить текст до знака ";" и удалить всё после него (и его так же). {reg[#^(.*?);(.*?)$#]}|$2 удалить текст до знака ";" (и его так же) и сохранить всё после него. {reg[#^(.*?);.*;(.*?)$#]}|$1$2 вырезать текст между символами ";"
  11. Всё настроил... работает, подхватывает куки и url с донора... Благодарю. Вот бы ещё сюда прерывания в работе запихнуть. Например: через каждые X минут/часов или сотен/тысяч спасенных товаров перерыв в работе на Y минут... или лучше рандомный выбор от ... до ... минут/часов. Чтобы никого не напрягать. Я обычно так на ночь ставлю, с прерыванием.
  12. Пришлось читать... Настроил, парсит, но через 5 минут выбрасывает из кабинета... нужно снова вводить логин и пароль, поэтому я использовал скрипт, который делает то же самое, только автоматически.
  13. При таких настройках вообще ничего с сайта не парсит... Парсит только, когда язаливаю куки в файл, ставлю ";" и блокирую файл от записи... но цену оптовую с кабинета так и не берёт... а 4.1-3 берёт всё без проблем...
  14. Есть сложный донор, со сменой cookie через каждые 5 минут парсинга. Я разработал схему, как его парсить и она работала на всех версиях и на версии SimplePars v4.1-3_stable и сейчас работает, но... на последующий бетах модуль уже не может спарсить оптовую цену, которая есть только после регистрации в кабинете... ((( Откатываюсь на стабильную версию SimplePars v4.1-3_stable...
×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.