Перейти до вмісту
Пошук в
  • Детальніше...
Шукати результати, які ...
Шукати результати в ...

Фильтр, ЧПУ, noindex и (ajax/js) ссылки и индексация. Что делать?


Recommended Posts

Обнаружил я сегодня в одном логе интересные заходы:

 

 [19/Sep/2019:03:58:20 +0300] "GET /women-parfum/proizvoditeli_adam-levine~afnan~tiffany~salvatore-ferragamo~larc~natori HTTP/1.1" 200 38926 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
[19/Sep/2019:03:58:20 +0300] "GET /women-parfum/proizvoditeli_adam-levine~tiffany~salvatore-ferragamo~larc~amzan~natori HTTP/1.1" 200 37936 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
 [19/Sep/2019:03:58:23 +0300] "GET /women-parfum/proizvoditeli_adam-levine~tiffany~salvatore-ferragamo~larc~100-bon~natori HTTP/1.1" 200 38166 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
 [19/Sep/2019:03:58:26 +0300] "GET /women-parfum/proizvoditeli_ajmal~adam-levine~tiffany~salvatore-ferragamo~larc~natori HTTP/1.1" 200 40672 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
 [19/Sep/2019:03:58:27 +0300] "GET /women-parfum/proizvoditeli_adam-levine~adidas~tiffany~salvatore-ferragamo~larc~natori HTTP/1.1" 200 37876 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
[19/Sep/2019:03:58:30 +0300] "GET /women-parfum/proizvoditeli_adam-levine~agnes-b~tiffany~salvatore-ferragamo~larc~natori HTTP/1.1" 200 37833 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
[19/Sep/2019:03:58:31 +0300] "GET /women-parfum/proizvoditeli_amouage~adam-levine~tiffany~salvatore-ferragamo~larc~natori HTTP/1.1" 200 40704 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

А ссылок таких в магазине нету. А есть только вида:

 

<a class="checkb" onclick="javascript:location='https://site.ru/women-parfum/proizvoditeli_abercrombie-fitch~text'">text</a>

 

Тоесть вроде это как фильтр. И там вроде как есть noindex, но гугл его чудесно увидел и пошел индексировать и придет еще и еще, так ка noindex тег - это "неиндексировать" а не "незаходить" .

Таких ссылок в магазине только в одной категории если брать категорию +  комбинацию пары брендов без доп атрибутов  (брендов поярдка тысячи и вот каждый с каждым - миллион комбинаций только в одной категории). Совершенно ненужных мусорных страниц, на которые бродит бот.

 

Да там каноникал и noindex, но он же будет туда все равно ходить повторно?

А когда ему ходить то на нужные страницы ? Да и зачем уганять краулинговый бюджет на миллион холостых заходов?

Непонятно мне совсем.


И тут собственно вопрос в студию. А как это все прикрыть?
Может отдать ему 404? Но тогда в магазине будет куча 404 страниц.

 

Закрывать в robots по /*proizvoditeli_* но тогда пропадет часть посадочных, на которых есть текст и тайтлы и которые нужны.

 

Че делать посоветуете господа ?

 

UPD - чтобы совсем корректно не ajax ссылки, а js-ссылки, хотя мне кажется если у нас будет кусок ajax контента, он также проиндексируется.

UPD2 - дабы не было холиваров. Эта проблема не с конкретным фильтром, а с любым, где есть автогенерация ЧПУ для параметров выборки.

Надіслати
Поділитися на інших сайтах


Светлейший @Yoda и не знает что делать? Ну ладно, подскажем барину. 

Все подобные ссылки нужно привести к одному виду, это же очевидно. Как? Да очень просто, сортируйте все параметры в алфавитном порядке и все. Если бот приходит по ссылке в которой они не в алфавитном порядке, отправляйте его 301 редиректов на ссылку где они в алфавитном порядке и все. Тем самым вы оставите эти, хоть и мусорные, страницы в индексе и избежите дублей 

 

Надіслати
Поділитися на інших сайтах


31 минуту назад, Jurgen сказал:

Светлейший @Yoda и не знает что делать? Ну ладно, подскажем барину. 

Все подобные ссылки нужно привести к одному виду, это же очевидно. Как? Да очень просто, сортируйте все параметры в алфавитном порядке и все. Если бот приходит по ссылке в которой они не в алфавитном порядке, отправляйте его 301 редиректов на ссылку где они в алфавитном порядке и все. Тем самым вы оставите эти, хоть и мусорные, страницы в индексе и избежите дублей 

 

сразу видно, что в сео вы не шарите совсем, такое кол-во 301 редиректов аукнется легко

Надіслати
Поділитися на інших сайтах

5 минут назад, Nameless сказал:

сразу видно, что в сео вы не шарите совсем, такое кол-во 301 редиректов аукнется легко

я и не претендую на знания в сео. Как по мне вариантов разного порядка  порядка значений фильтра в урле не должно быть априори. Да и зайдите на ту же розетку, клацните фильтр, а потом руками подправьте урл, вас редиректнет на верный. Другое дело что автор уже расплодил кучу таких страниц...

 

 

upd Если человек, например, сначала выбрал производителя асус, а потом лж, и получил ссылку типа /asus,lg а другой выбрал в другом порядке и получил ссылку типа /lg,asus то это кривость фильтра, которую изначально нужно фиксить

Змінено користувачем Jurgen
Надіслати
Поділитися на інших сайтах


Ничего не делать. Робот посетит их несколько раз и потом больше по ним не будет ходит.
На сегодняшний день указания Г такие:

- robots.tx  - уже практически не учитивается, робот все равно ходит по ссилки, которие как нибудь нашел даже если они закрити в роботс:

- тег ноиндекс основной признак, которой робот учитиваеть.

 

https://www.searchenginejournal.com/google-robots-txt-noindex/314961/#close

https://webmasters.googleblog.com/2019/07/a-note-on-unsupported-rules-in-robotstxt.html

  • +1 1
Надіслати
Поділитися на інших сайтах

  • 2 weeks later...
В 19.09.2019 в 23:37, vier сказал:

rel="nofollow"

и еще убрать имя домена - https://site.ru/


<a class="checkb" rel="nofollow" onclick="javascript:location='women-parfum/proizvoditeli_abercrombie-fitch~text'">text</a>

 

Да, сам так делал ))).

Надіслати
Поділитися на інших сайтах

8 минут назад, legioner26 сказал:

Да, сам так делал ))).

 

не знаю на сколько это еще актуально для Поисковиков, кажись пару лет назад эта статья была - https://pixelplus.ru/samostoyatelno/stati/indeksatsiya/skrytie-ssylok-seo.html

но пока в моем модуле его эксперименты работают. а там если что - будем посмотреть.

Надіслати
Поділитися на інших сайтах

В 19.09.2019 в 23:37, vier сказал:

rel="nofollow"

и еще убрать имя домена - https://site.ru/

весь вопрос - заходит на них бот или нет? Есть у вас такая инфа?

и угоняется ли краулинговый бюджет?

Надіслати
Поділитися на інших сайтах


21 минуту назад, Sergeyy84 сказал:

весь вопрос - заходит на них бот или нет? Есть у вас такая инфа?

нет.

если у Вас есть, то делитесь. и какие другие меры тогда надо предпринимать.

Надіслати
Поділитися на інших сайтах

Створіть аккаунт або увійдіть для коментування

Ви повинні бути користувачем, щоб залишити коментар

Створити обліковий запис

Зареєструйтеся для отримання облікового запису. Це просто!

Зареєструвати аккаунт

Вхід

Уже зареєстровані? Увійдіть тут.

Вхід зараз
  • Зараз на сторінці   0 користувачів

    • Ні користувачів, які переглядиють цю сторінку

×
×
  • Створити...

Important Information

На нашому сайті використовуються файли cookie і відбувається обробка деяких персональних даних користувачів, щоб поліпшити користувальницький інтерфейс. Щоб дізнатися для чого і які персональні дані ми обробляємо перейдіть за посиланням . Якщо Ви натиснете «Я даю згоду», це означає, що Ви розумієте і приймаєте всі умови, зазначені в цьому Повідомленні про конфіденційність.