Сейчас дела обстоят так. Когда анонсировали Минусинск, Пингвин, мне написал коллега с просьбой разъяснить, каким образом поиск определяет, плохая ссылка или нет, что такое порог вхождения, и самое главное - как выстраивать защиту от таких нападок.
Каким образом поиск определяет "продажность" ссылки. Все довольно тривиально:
1. Регистрируемся на ссылочных биржах
2. Собираем данные
3. Обучаем модель
4.???
5. Выкатываем в прод
6. Читаем слезливые письма вебмастеров о том, что они ничего не делали, это все конкуренты.
Как определяем " происки конкурентов". Тут тоже все довольно просто.
1. Так как у поиска есть все данные о сайте в виде пары строчек на винте (более подробно можно посмотреть тут), мы можем знать о нем следующее:
а) Ссылочный граф, накопленный за n-времени
б) Периодичность обновления этого графа
в) Соотношение периодичности обновления с количеством трафика/позиций. Проще говоря, прикручиваем к паре "запрос*документ" рост этих ссылок.
Мы так же можем задать многоуровневый порог "продажных ссылок", чтобы исключить агрессивные накрутки (часто, вебмастера следят за тем, кто на них ссылается). Например, при достижении n-количества, учет ссылок снижается, снижаются позиции сайта, вебмастер начинает искать проблему. Обычно, конкуренты особо не церемонятся, и проставляют на сайты тысячи ссылок. Это называется аномалией, и скорее всего, будет отсечено поиском. Но бывали случаи, конечно
Что касается личного опыта: да, у меня был сайт, которому прилетел минусинск от предыдущих исполнителей. Человек не хотел ждать, решилось все переездом на новый домен+я спроектировал новый ресурс, с учетом чеклиста коммерческих факторов. Хотя, было очень интересно вывести именно домен под фильтром.
Я бы сказал, что базовая информация не меняется. Меняются лишь способы отлова этих ссылок.
Из совсем нового - Яндекс научился ловить крауд-ссылки. Я особо не заморачивался над изучением, как он это делает, но смею предположить, что сотрудники могли попросту заказать эти услуги под видом клиента, а затем так же обучить модель на готовых данных.
Если что-то непонятно, готов ответить на ваши вопросы и вопросы нормальных форумчан. Просто я вас принял за очередного тролля (тут это любят, как я понял), так что без обид