Перейти к публикации
Поиск в
  • Дополнительно...
Искать результаты, содержащие...
Искать результаты в...

Избавиться от дублей товаров


 Поделиться

Рекомендованные сообщения

От двух разных поставщиков парсятся одинаковые товары, допустим 2 стиральные машины (Indesit IWSB-50851BY).

 

Посоветуйте оптимальный способ, как победить такие дубли. На ум приходит настройка 301 редиректа, с одного товара на другой, но какой модуль для этого подойдет, не руками же прописывать.

 

Или может есть более изящный способ?

 

image.png.e7a0b5526511d2f38ab5de38b931f90e.png

Ссылка на комментарий
Поделиться на других сайтах


А как вы определяете одинаковость товаров? По названию? По артикулу? По модели?

От чего можно было бы отталкиваться, чтобы скрипт понимал, что товары одинаковые?

Ссылка на комментарий
Поделиться на других сайтах


1 час назад, openprice сказал:

А как вы определяете одинаковость товаров? По названию? По артикулу? По модели?

ну да. можно приклеить поставщика. тут же пофиг уткого купят - ТС все равно получает процент.

Ссылка на комментарий
Поделиться на других сайтах

Загонять в базу дубли, чтобы потом с ними мудохаться - странное решение. Лучше в процессе парсинга решать вопрос или сразу после, но никак не с 301 морочиться.

Ссылка на комментарий
Поделиться на других сайтах


4 часа назад, kostya242 сказал:

От двух разных поставщиков парсятся одинаковые товары, допустим 2 стиральные машины (Indesit IWSB-50851BY).

 

Посоветуйте оптимальный способ, как победить такие дубли. На ум приходит настройка 301 редиректа, с одного товара на другой, но какой модуль для этого подойдет, не руками же прописывать.

 

Или может есть более изящный способ?

 

image.png.e7a0b5526511d2f38ab5de38b931f90e.png

Определять в момент парсинга или импорта парсинга в магазин, некую общую сущность в виде одинакового названия, модели, артикула итп и не плодить дубли, а добавлять один вариант товара....

  • +1 1
Ссылка на комментарий
Поделиться на других сайтах

11 минут назад, Tom сказал:

Определять в момент парсинга или импорта парсинга в магазин, некую общую сущность в виде одинакового названия, модели, артикула итп и не плодить дубли, а добавлять один вариант товара....

Имеется ввиду что - вы проверяете во время импорта данных допустим модель(она идентичная у 2х поставщиков) - запросом в базе проверяем ее наличие - если делаем такой то процесс, если нету, добавляем товар в базу. Но идентификатор должен совпадать у 2х поставщиков.

Ссылка на комментарий
Поделиться на других сайтах

3 минуты назад, invays сказал:

Имеется ввиду что - вы проверяете во время импорта данных допустим модель(она идентичная у 2х поставщиков) - запросом в базе проверяем ее наличие - если делаем такой то процесс, если нету, добавляем товар в базу. Но идентификатор должен совпадать у 2х поставщиков.

Проблема в том, что у поставщиков не единая номенклатура, привязаться к единому атрибуту, одинаковому для двоих поставщиков одного товара невозможно. Отсюда и вопрос возник. То что можно было бы решать на этапе парсинга и отсекать дубли - это понятно, но проблема то остается.

Ссылка на комментарий
Поделиться на других сайтах


30 минут назад, Tom сказал:

Определять в момент парсинга или импорта парсинга в магазин, некую общую сущность в виде одинакового названия, модели, артикула итп и не плодить дубли, а добавлять один вариант товара....

согласен был пациент который жаловался на дубли бренда товаров
все от того что поставщики косячили место русского с добавляют англ

то артикул меняют как вздумается

  • +1 1
Ссылка на комментарий
Поделиться на других сайтах

14 минут назад, kostya242 сказал:

Проблема в том, что у поставщиков не единая номенклатура, привязаться к единому атрибуту, одинаковому для двоих поставщиков одного товара невозможно. Отсюда и вопрос возник. То что можно было бы решать на этапе парсинга и отсекать дубли - это понятно, но проблема то остается.

 

ну так и ответьте на главный ключевой вопрос, который был в самом начале

как можно определить, что два товара одинаковые?

Ссылка на комментарий
Поделиться на других сайтах


можно попытаться прогонтяь
через алгоритмы(методы) схожести
 

soundex

levenshtein
similar_text

Тут все зависит от длин самих строк

+ возможно совмещение или написание собственных методов

  • +1 1
Ссылка на комментарий
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас
 Поделиться

×
×
  • Создать...

Важная информация

На нашем сайте используются файлы cookie и происходит обработка некоторых персональных данных пользователей, чтобы улучшить пользовательский интерфейс. Чтобы узнать для чего и какие персональные данные мы обрабатываем перейдите по ссылке. Если Вы нажмете «Я даю согласие», это означает, что Вы понимаете и принимаете все условия, указанные в этом Уведомлении о Конфиденциальности.