Я уже писал на форуме что такое rel="canonical" и с чем его едят.
Искать ссылки времени нет, поэтому всё излагаю своими словами и могут быть некоторые неточности/неоднозначности.
Все прекрасно знают как поисковики относятся к уникальному контенту и не любят дублей. Вся эта "любовь" поисковиков имеет десятилетнюю историю. В былые времена продвигали сайты до безобразия незатейливо - брали одну страницу и дублировали несколько сотен раз по разным URL, получая соответствующий профит.... Поисковикам такой расклад не понравился и они начали вводить алгоритмы для борьбы с таким маразмом. Этот маразм побороли, но вылез побочный эффект - некоторые страницы на сайтах имели разные URL и это не всегда связано с желанием обмануть поисковик, но поисковики жестко относились к таким моментам и страницы либо вылетали из индекса либо понижались как страницы с не уникальным контентом. В начале 2009-го года (кажется в феврале) Гугл объявил о поддержке rel="canonical". Гугл рекомендовал использовать этот атрибут как крайнюю меру, когда другими способами не удаётся избавиться от разных URL. Этот атрибут не является директивой, что-бы умники не пытались злоупотреблять... Гугл сверяет контент страниц и если признаёт их одинаковыми или близкими по контенту, то принимая решение какой URL включать в индекс, может учесть атрибут rel="canonical". На практике - если страницы идентичны то в индекс попадёт каноническая ссылка. Не хочу сейчас обсуждать заявления о том что надо привести все URL товаров к виду /product и будет счастье. Это заявляет тот кто не пробывал это сделать и не знает что в результате получит другие грабли, например, с меню, с хлебными крошками и т.д... Сразу перехожу к Яндексу.
С 2009-го года Яндекс обещал что будет поддерживать rel="canonical", но только обещал... На протяжении двух лет Яша безжалостно выкидывал страницы из индекса или понижал в выдаче не взирая на атрибут rel="canonical". Если я не ошибаюсь, 23 мая 2011-го года Яндекс объявил о поддержке атрибута rel="canonical", но как обычно надув щёки ничего не поясняет как он будет учитывать этот атрибут.
А теперь почему я недолюбливаю rel="canonical"... допустим у каждого товара по 3 URL - не вижу ничего хорошего в том что поисковику прийдётся индексировать в 3 раза больше страниц. Поэтому самый правильный вариант - сделать так что-бы у каждой страницы был один URL. Именно это и было сделано в верси SEO URL который был включен в версию ocStore 0.1.9 Эта версия SEO URL не только формировала уникальные ЧПУ, а так-же делала уникальными URL с обычными GET параметрами, контролировала входящие запросы и делала переадресацию со статусом 301 на выбранный формат URL (это для того что-бы не проседали позиции если поисковик уже заглотил кучу ссылок в разных форматах).
Что произошло у smarteg
К формированию ЧПУ отнёсся крайне беспечно и в итоге получил полное безобразие, например, /алкогольные-напитки/водка/?product=2234 и /алкогольные-напитки/водка/смирнов-номер-21 (ума не приложу как такое могло приключится... разве что были добавлены/изменены модули с бардаком в формировании ссылок)
После 23-го мая 2011-го года поимел грыжу от Яши. Это вылезли особенности поддержки Яндексом атрибута rel="canonical". Предполагаю что Яша просто выкинул из индекса страницы URL которых не совпадал с каноническим, а канонические URL по каким-то причинам не включил в индекс или не успел включить... Подозреваю что как и в случае с WWW и без WWW, склейкой занимается паук-зеркалировщик, а он приходит крайне редко и можно ожидать его от нескольких месяцев до полугода. Надо более плотно анализировать ситуацию что-бы точно ответить что произошло и как этого избежать. Самый правильный выход из положения - сделать что-бы у каждой страницы был один URL.
При наличии нескольких URL на одну страницу ничего хорошего в отсутствии канонических ссылок - нет и возможно все "радости" ещё впереди... Например, продвигаеш страницу с каким-то URL, а поисковик решил включить в индекс эту страницу с другим URL... радует?