Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Reanimaster

Користувачі
  
  • Публікації

    564
  • З нами

  • Відвідування

Усі публікації користувача Reanimaster

  1. 1) Построение индексов достаточно быстрое. Да. Но тут же и пересоздать индексы. Я говорю о той части, когда ссылки уже спаршены и нужно с ними работать. А по поводу ошибок или не ошибок. Ну вот смотрите. Вот как понять что и почему не спарсилось?
  2. Я понимаю. Но получается что парсер бессилен в случае редиректов и это никак нельзя отловить. В таком случае, как насчет того, что бы добавить еще один пункт Уведомления или Предупреждения, и писать туда не ошибки, а все что не 200?
  3. Я имею ввиду что можно ведь сделать в таблице со ссылками доп поле с первичным ключом ID и ID проекта и после сбора ссылок создавать индексы. Далее в массив ссылок брать не только URL но и ID. Так можно будет привязаться к конкретным ссылкам. А поскольку будут созданы индексы - это будет быстро. Ну и соответственно даст больший контроль над ссылками. А что бы ссылки не менялись по первому пчиху - добавить команду на чистку/создание индексов по той же схеме, если ссылки меняются. Не уверен насколько я прав, просто мое видение.
  4. Я имею ввиду, что хочу понимать что не спарсилось. Вот смотрите. Предположим я загнал 50к ссылок на парсинг. Загрузилось 48к товара. Я смогу отфильтровать способом выше ссылки, которые по той или иной причине не спарсились, предположим ошибка или редирект?
  5. Есть еще одно пожелание. Сделать возможность указать номер начала парсинга. Есть старт и перезапуск. Но порой нужно указать с какой позиции стартовать. Особенно актуально для фидов 100+к товара. Бывает такое что что-то пошло не так. Крон сбоит. Или случайно нажал перезапуск, а уже половина спаршена и БЯДА. А так в лог добавить нумерацию ссылок. И можно будет глянуть, какая была последней, и начать с нее или на парочку меньше. Так же было бы здорово где нибудь видеть, в логах может, но не листая а просто нумерацию, сколько успешно обработано, сколько не обработано и отфильтровать в логе неуспешно обработанные, взять ссылки и более пристально посмотреть, почему же там не обработано. Еще я думаю было бы не плохо включить защиту от "дурака". Если N ссылок не спаршено из-за блокировки например - остановить парсинг принудительно. Спасибо. Критика приветствуется.
  6. Еще одна хотелка небольшая. И думаю пригодится. В менеджере ссылок добавить возможность фильтровать не только ошибки но и редиректы. Донор попался. Который отдает 301 на некоторые товары. И редиректит на категории, но при этом в коде находится SKU и он создает мне пустой товар((
  7. Прошу прощения. Но косяк найден)) В коде что вы мне дали нет foreach на языки))) Вот в оригинале. Я как то и проглядел этот момент) Все равно спасибо большое за уделенное время. P.S. Сейчас вот сижу и думаю. Лучше бы мля я это время потратил на написание скрипта)))
  8. Да и сам понимаю что не может. Тем более что запрос статический же. Чертовщина какая то.... Причем даже если я закомментирую строку с удалением - все равно как то мляха удаляет((

×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.