dvi3001

Как удалить дубли ссылок?

Рекомендуемые сообщения

dvi3001    7

Парни помогите!Как удалить дубли ссылок с индекса?

Давно нужно было это сделать уже.Не хватка опыта останавливала этот процесс что вообще всё не испортить.

Теперь к сути вопроса! Начнём с Google.

Я сделал запрос в site:ooo-arle.ru и там оказалось в индексе "Результатов: примерно 673"..И это очень много потому что страниц всего где то 70 шт.

Есть страницы такого содержания:

Категория Блузки.

правильная ссылка:

Блузки женские собственного производства.

ooo-arle.ru/60-bluzki/

Стильные блузки.Широкий выбор стильных женских рубашек, блузок и туник собственного производства в нашем интернет магазине.Из натуральных ...

Но есть и такие:

ooo-arle.ru/60-bluzki/?limit=50

Описание веб-страницы недоступно из-за ограничений в файле robots.txt. Подробнее...

ooo-arle.ru/60-bluzki/?sort=rating&order=DESC

Описание веб-страницы недоступно из-за ограничений в файле robots.txt. Подробнее...

И такая ситуация на всех категориях.Как мне запереть в robots.txt. и удалить с индекса.

Дело в том что в robots.txt. уже прописано так:Disallow: /*?limit= и так:Disallow: /*&limit=

Почему же они всё равно в индексе и такого странного вида.

Помогите!

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
snastik    822

роботс был таким с самого начала ?

в вебмастере при проверке урла говорит что он заблокирован ?

что пишет в оптимизации html ?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
dvi3001    7

роботс был таким с самого начала ?

в вебмастере при проверке урла говорит что он заблокирован ?

что пишет в оптимизации html ?

Да,роботс был таким с самого начала!

В вебмастере при проверке урла всё нормаль,строка от туда " у робота Goolebot не возникает проблем при сканировании вашего сайта".

Оптимизации html на скриншоте.Но я эти все дубли удалил через удаление URL-адреса.Удолил сегодня Но они пока там.Когда они удолятся?

И тех ссылок там нет.

post-22510-0-79874700-1363694093_thumb.png

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
snastik    822

вы вот эту ссылку ткните в проверку http://ooo-arle.ru/60-bluzki/?limit=50 должно ответить что запрещено по такой то строчке

а дубли пропадут через пару проверок в течение недели думаю

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
dvi3001    7

вы вот эту ссылку ткните в проверку http://ooo-arle.ru/60-bluzki/?limit=50 должно ответить что запрещено по такой то строчке

а дубли пропадут через пару проверок в течение недели думаю

Не совсем понял.Извините.

Куда её вставить для проверки?

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
snastik    822

в вебмастере

состояние-заблокированные урлы

внизу URL-адреса Укажите URL-адреса и роботов User Agent для проверки.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
dvi3001    7

Результаты проверки URL Робот Google Googlebot-Mobile http://ooo-arle.ru/60-bluzki/?limit=50

. Заблокировано по строке 29: Disallow: /*?limit=

Значит их нужно удалить с индекса?

Как это сделать?

Ещё там есть такая строка:Строка 72: Clean-param: tracking Синтаксис не распознается.

Что это значит?

Изменено пользователем dvi3001

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
snastik    822

удалить в том же вебмастере есть запрос на удаление урл

а строка не распознается по той причине что она для яндекса если я конечно ничего не путаю

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
dvi3001    7

удалить в том же вебмастере есть запрос на удаление урл

а строка не распознается по той причине что она для яндекса если я конечно ничего не путаю

Я уже все удалил на гугле.Спасибо!

Теперь буду ждать пока удаляться ссылки.Потом будем дальше продолжать разбегаться.

Спасибо за помощь!

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
dvi3001    7

У меня не получается удалить не нужные страницы (которых уже не существуют.) из янкеса.Яндек удоляет строницы те которые закрыты в файле robots.txt. А как же удалить мне страницу каторая не скрыта в robots.?Подскажите

Пример ссылок:

Товар не найден!

/index.php?route=product/product&product_id=61

Категория не найдена!

/index.php?route=product/category&path=25

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
snastik    822

значит там должен быть статус 404 и тогда такие страницы тоже можно удалить

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
dvi3001    7

Я запер их в robots.и удалил.

После того как они удалятся из поиска.Можно удалить из robots.эти ссылки?.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
PVL    21

Але, ребята!? Русским языком ведь написано:

Описание веб-страницы недоступно из-за ограничений в файле robots.txt. Подробнее...

нет?

Что вы пытаетесь проверить? Вам все грамотно написал гугл.

Учите мат часть. Читай про сопли и основной индекс.

В основном индексе - тот, который участвует в поисковой выдаче (Пишется так: site:ooo-arle.ru/&) у вас 56 страниц, все правильно.

Ч.Т.Д.

Ваша ситуация - это нормально, удалить ничего не получится и это не требует гугл. Другое дело, если вам нужно вытащить страницу из соплей в основной индекс.

P.S. Удалить страницу можно только через тег "<meta name="robots" content="noindex,nofollow" />". Остальные манипуляции в гугл вэбмастер, если и удалят страницу, то ненадолго.

Успехов, хакеры ;)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты
dvi3001    7

Почищу,удалю не существующие страницы.А потом буду делать выводы что надо а что не надо.Но всё равно спасибо за советы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти


  • Последние посетители   0 пользователей онлайн

    Ни одного зарегистрированного пользователя не просматривает данную страницу