Опубликовано Webmaster - чт, 05.03.2015 - 01:00

А многие владельцы сайтов не знают и даже не подозревают о том, что все поисковые системы применяют фильтры и накладывают санкции на страницы сайта с дублированным контентом. А узнают уже тогда, когда позиции сайта медленно сползают вниз. Кроме того, если в этом случае не предпринять немедленных мер реагирования, поисковая система может удалить сайт из своего основного поиска. В это случае отыскать его пользователи интернета смогут только зная название домена сайта. Дублировнный контент считается одной из основных проблем для новичков. Но также с этой проблемой могут сталкиваться и самые опытные вебмастера.


Как свести к минимуму возможные санкции за дублированный контент?

Чтобы обезопасить свой сайт от санкций поисковых систем, следует раз и навсегда избавиться от проблем, возникающих от использования дублированного контента на своем сайте!

Избавив свой сайт от такого контента, можно реально увеличить собственный заработок во всемирной сети. Самое интересное в том, что вебмастер может создавать дубликаты других страниц, даже не зная об этом. В статье идет речь о дублированном контенте, под понятием которого подразумевается только видимый для поисковых систем текст.

Графические изображения и текст внутри “alt”-тэга не принимаются в расчет при работе над дублированным контентом.

Учтите, что самый опасный тип дублированного контента тот, что размещен на страницах одного сайта. Если на сайте есть дубликаты с других ресурсов, они также могут ему навредить, но повторы внутри самого сайта сделают это гарантированно. Интернет-магазины, содержащие тысячи описаний различных торговых марок и информации о товарах, находятся в особой зоне риска в плане скопированного (дублированного) контента.

Залогом успеха при работе с дублированным контентом, как и при действиях с другими объектами SEO, является тестирование. В статье дается определенная база, от которой можно отталкиваться при работе над сайтом. И все же следует учесть, что добиться максимальных результатов можно лишь с помощью тестов и подробных анализов их итогов.


Понятие дублированного контента

Прежде чем узнать, как бороться с дублированным контентом на своем сайте, нужно узнать, что же это собственно такое. Дублированным (или скопированным) контентом называются страницы на сайте, которые настолько похожи для поисковиков, что они не индексируют их.

Отказ поисковых систем индексировать эти страницы может обернуться для сайта неприятными последствиями. Эта страница:

  • не попадет в выдачу по содержащемуся в ней ключевому слову.
  • не увеличит ссылочных вес страниц независимо от якоря ссылки.
  • будет не в силах участвовать в поднятии PageRank других страниц сайта.

Сочетание этих последствий имеет своим итогом то, что сайт не поднимается в топ популярности по выдаче поисковиками результатов ключевых запросов. При этом, если поисковая система считает дубликатами более половины страниц Вашего сайта, это приводит к его неминуемой гибели – найти сайт можно будет только набрав название самого домена.


Почему поисковики видят дубликаты?

Решать подобные проблемы нужно, взглянув на нее со стороны самого поисковика. Для этого робота каждая страница выглядит лишь сочетанием определенных элементов:

Шапка сайта, центр (наполнение), левая колонка, правая колонка, подвал.

Все эти элементы в совокупности составляют классический шаблон сайта. Каждый элемент, за исключением собственно наполнения, повторяется на всех без исключения страницах и выглядит на них одинаково. Поэтому логично определить, что страницы сайта различаются только наполнением.

Человек же, напротив, замечает только наполнение и не видит структурных элементов страницы сайта, так как быстро привыкает к стандартному шаблону. И эта особенность человеческого восприятия позволяет сконцентрировать все внимание посетителя непосредственно на сообщении страницы.

Но поисковики не запоминают повторяющиеся элементы сайта. Каждый раз при оценке страницы на вероятность дублирования контента робот учитывает содержание текста во всех имеющихся элементах страницы сайта.

Если две страницы будут различаться лишь изображением, каждый человек заметит разницу, но не робот! Любые несколько добавленные строчки текста, различающие страницы сайта он воспримет как погрешность и новая страница будет считаться дублированной.


Итак, выяснив все вышеозначенные аспекты, можно придти к таким выводам:

  • робот поисковой системы видит всю страницу со всеми элементами;
  • робот поисковой системы читает буквально каждое слово со страницы;
  • вебмастеры забывают об особенностях роботов и ориентируются при создании страницы на людей.

Однако, забывать о роботе не следует, ведь он играет важную роль и решает, какое место будет занимать страница в выдаче по ключевым запросам, да и будет ли она вообще им проиндексирована.


Как правильно оптимизировать шаблон сайта.

Чтобы робот поисковой системы правельно проиндексировал страницу, необходимо выполнить следующие пункты:

  1. Подсчитайте число слов в имеющемся шаблоне страницы, имея в виду все элементы, за исключением наполнения. Для этого нужно выделить весь текст страницы, скопировать его в новый документ Word и просмотреть меню статистика.
  2. Запомните эту цифру. Ваша дальнейшая задача будет заключаться в том, что снизить количество слов в элементах шаблона настолько, что текстовое наполнение будет обладать большим количеством слов.

Такое простое действие приведет к тому, что страница станет уникальной и не повторяющей другие, шансы, что поисковый робот сочтет ее дубликатом, будут минимальны.
Измените содержимое тэга <title>, то есть сам заголовок страницы. У каждой страницы сайта должен быть свой собственный заголовок. Это единственный раз в наших пунктах, когда придется потрудиться над кодировкой.

Учтите, однако, что некоторые заголовки, которые для человека будут считаться различными, для робота выглядят одинаково. В теории SEO есть понятие стоп-слов. Под ним подразумеваются собственно слова или небольшие фразы, которые роботы поисковиков не считывают при ранжировании страниц и определении релевантности.

Поэтому, если Вы уверены, что сделали Ваш контент уникальным, но поисковая система отказывается индексировать страницу, поищите проблему в заготовке. Если заголовки страниц разнятся лишь стоп-словами, это и есть источник бедствий сайта.
По возможности заменяйте текст рисунком везде, где это будет оправданно. Если часть текста будет являться изображением, который могут прочитать люди, но не может считывать робот, это значительно упростит задачу.

Также следует упомянуть о том, что мнение о более высоком весе ссылок с иных сайтов, чем с внутренних страниц, не более чем миф. Их вес одинаков при прочих равных условиях.

Таким образом, нужно приложить все усилия на то, чтобы робот поисковика не счел внутренние страницы дубликатами и проиндексировал их. Вернув их в индекс прямо сейчас, можно сразу же начать подниматься в выдаче. Тогда вместе с главной страницей будут подниматься и второстепенные, что в совокупности сможет значительно поднять весь сайт в целом!