Про АГС
Недавно заметил, что часть моих проектов попало под АГС и страниц в индексе осталось ой как мало, а именно 1-10. Напишу, чего получилось после муторной переписки с Яндексом, и параллельным разбором полетов, почему сайты попали под этот фильтр.
Всё, что я напишу далее, является чисто моим субъективном опытом и взглядом на ситуацию, поэтому не обессудьте.
Из моих проектов попали под АГС:
- Сайты с рерайтом, который писался без внесения существенных изменений в текст, контентом, написанным на скорую руку.
- Сайты, на которых код sape устанавливался в течение первых двух-трёх месяцев после появления в индексе.
- Сайты, которые имели мало около содержательного текста. Сюда попадают галереи, где по сути и написать нечего, кроме названия картинки. Ещё одно моё наблюдение — под АГС попали сайты, у которых не было правой колонки, т.е. с дизайном из 2 div: левое меню и главный контейнер с содержимым.
- Сайты, с которых сливался трафик на партнерки sms-наебалова (тесты etc.). Если сайт целиком заточен под слив трафа под такие партнерки, то он уходит в бан по умолчанию. Если на нормальном сайте, есть страницы со сливом трафика на такие партнерки, то эти страницы исключаются из индекса. У меня на блоге про знакомства, висел блог со ссылками на sms партнерки и были страницы, заточенные под них, в результате сначала пропали эти страницы, а чуть позже в индексе осталась вообще 1 страница. После устранения и письма в суппорт справедливость восстановилась.
Далее, что ещё я наблюдал:
АГС это не совсем фильтр, который работает по каким-то определенным параметрам, это скорее система с набором правил, которые время от времени изменяются.
Один сайт может успешно торговать ссылками и целиком находится в индексе, а другой и без ссылок попадёт под фильтр. Также не важно сколько ссылок продается со страницы – на обоих сайтах может быть по 3 ссылки на страницу, один будет под фильтром, а второй нет.
Если какой-то сайт попадает в зону «подозрительных» он начинает «задрачиваться» от апа к апу - страницы то залетают в индекс, то вылетают. Другие же сайты могут находится в индексе, даже если там продаётся по 10 ссылок со страницы. У меня есть пару сайтов (обоим больше 3 лет), которые продавали в сапе по 8-10 ссылок со страницы, пока недавно я это не заметил и не исправил.
Яша будто разделяет сайты на трастовые и подозрительные и если на подозрительном происходит нарушение (например, начинается торговля ссылками), то он помещается в некую резервацию (карантин), там страницы индексируются, но в поиске не участвуют. Теоритически робот периодически проверяет, не устранена ли причина, и в случае её устранения может вернуть страницы в индекс, но происходит это редко, в 90% нужно писать письмо в суппорт.
Сильно влияет возраст домена, новые проекты чаще попадают под фильтр.
Основную сложность АГС доставляет на самом деле, когда под него попадает «серый» сайт (а таких большинство). С ГС всё понятно, попал под фильтр, либо делаем новый, либо задумываемся, а не пора ли перестать клепать говно. С белыми тоже ясно — письму Платону и через неделю страницы в индексе. Для того, чтобы вернуть страницы серого сайта, приходится побиться.
Что я пробовал делать для устранения фильтра:
- Минус код sape с сайта.
- Минус партнерские ссылки
- Добавление нового контента, изменение текущего, изменение текущей структуры сайта.
- Добавление правой колонки.
- Скрытие от робота дублирующих и ненужных страниц через noindex и robots.txt
- Развешивание пропорционально по сайту модулей, которые генерят рандомный контент (случайные статьи, популярные статьи, самое популярное, последние комментарии etc.) для создания текста вокруг основного контента.
С галереями сложнее — Яша не любит, когда контента мало. Что делалось в этом случае:
- наполнение футера
- обвешивание блоками вокруг картинки
- более детальное название для картинок, а также описание, в том числе категорий
- скрипт, который генерит под каждой картинкой разный текст в 10 предложений (например, правила галереи), тем самым разбавляя голую страницу
- максимально возможное «удлинение» названий меню, заголовков, для искусственного насыщения сайта текстом.
Далее письмо в суппорт, скрестив пальцы.
В итоге страницы 4 из 5 сайтов после 1.5 месячной переписки с суппортом удалось вернуть обратно. Для себя сделал вывод, что не стоит халтурить при изначальном создании сайта, т.к. это может обернуться в дальнейшем подобными проблемами. Ну и такой халявы с сапой как раньше больше не будет.
А вообще лучше не попадать ни под какие фильтры, чего я всем от души желаю.
Популярность: 10%
... и самое главное не забудь подписаться на RSS ! 



Интересные мысли. В целом, примерно также думал =)
если резюмировать: больше контента и разных примочек на сайте == хорошо)
и, да, у меня тоже есть один сайтик с полностью уникальным контентом, но новый и добавленный в сапу. при этом он даже не прошел там модерацию и естественно не имеет ни одной ссылки внешней. но в индекс так и не влетел за 3 месяца. так что, добавлять сайт в сапу до влетания в индекс == угробить сайт. джае после удаления из сапы и прикручивания всяких модулей, сайт за месяц так и не влетел в индекс.
Можно сделать вывод, что возраст сайта и домена играют огромную роль.
Cогласен, работать с сапой становится труднее.
С другой стороны есть GGL, которая приносит гораздо больше чем сапа. Плохо только то, что она не автоматизирована…
Да, написал у себя про свое видение агс. Кое-что почерпнул от вас, точнее, подтвердил свои догадки.
1st_MAN, это понятно, я писал немного про другое явление, когда новый нормальный сайт целиком попадает в индекс. После чего сразу добавляется в сейп и страницы начинают из индекса исчезать, причем величина срока до конца не понятна, я стараюсь не вешать код сапы на сайт, если ему меньше 2-3 месяцев.