Google и дублированный контент – мифы и реальность

не дублировать
Пару дней назад Грег Гротас (Greg Grothaus), специалист по качеству поиска Google опубликовал видеоподкаст про дублированный контент и ранжирование сайтов, имеющих дублированный контент. Эти вопросы интересны каждому вебмастеру, который занимается продвижением под Google.

Грег начал с обсуждения популярного в среде вебмастеров мифа о том, что Google «наказывает» сайты, которые имеют дублированный контент, и пояснил, что это действительно заблуждение. Нельзя сказать, что дублированный контент не оказывает совсем никакого влияния на поисковую выдачу, но собственно Google ранжирует дублированный контент не так, как считают многие вебмастера.

Многие считают, что на статьи в пределах одного сайта, которые являются копиями, накладывается определенный фильтр, и статьи сайта оказываются намного ниже в результатах поиска. Но Грег пояснил, что за дублированный контент таких санкций нет, а статьи оказываются ниже в результатах поиска по другим причинам.

Что же происходит на самом деле?

«Мы стараемся предоставить пользователям как можно более разнообразную информацию по запросам» — сказал Грег, – «мы отдаем себе отчет, что во многих случаях дублированный контент создается не для того, чтобы обмануть пользователей поисковой системы. Конечно, есть и исключения – это сайты, распространяющие спам! Но даже сайты, которые распространяют спам, ранжируются ниже в результатах поиска не за дублированный контент, а именно за спам. Например: многие спамеры используют на своих сайтах выделенные жирным шрифтом метки. Однако Google не понижает в результатах выдачи все сайты, на которых используются такие метки, а только те из них, которые распространяют спам. То же самое можно сказать и про дублированный контент!»

Примеры дублированного контента

example.com/ example.com/?

example.com/index.html example.com/Home.aspx

www.example.com/ www.example.com/

www.example.com/index.html www.example.com/Home.aspx

Выше показаны примеры URL, которые имеют разные адреса, но одинаковый контент. Google может распознать, что контент по этим адресам одинаковый и попытаться выбрать наиболее правильный вариант, но чтобы избежать ошибок, вебмастер должен сам указать, какая страничка является более важной.

Грег объяснил это так – «Вебмастер лучше знает, какая страничка является оригиналом, а какая копией. Вебмастерский сайт не будет искусственно занижаться в результатах поиска за дублированный контент в пределах сайта, но на ранжирование такая ситуация может повлиять – может понизиться ссылочный вес основной странички, если поисковый бот Google не сможет определить эту страничку как оригинал, или если ссылки будут указывать на разные адреса с одинаковым контентом. Более того, если в результатах поиска будут отображаться ссылки на менее важные страницы, например теги, это может повлиять на брендинг и на юзабилити сайта. Нужно еще учесть, что поисковому боту Google потребуется больше времени, чтобы проиндексировать дублированный контент. В этом случае возникает риск, что нужный контент вообще не будет проиндексирован.»

Для того, чтобы избежать проблем с дублированным контентом в пределах одного сайта Грег советует использовать директиву rel=»canonical» в ссылках, чтобы указать на первоисточник контента.

Директива rel=»canonical» может использоваться только пределах одного сайта (домена). Например мой субдомен links.vitvirtual.com может ссылаться на мой основной домен vitvirtual.com с использованием этой директивы. В этом случае Google «поймет», что первоисточником контента является мой основной домен. Между разными доменами директива rel=»canonical» не работает. Также эта директива может использоваться для протоколов, таких как http:// и https:// и для портов.

Указать на первоисточник контента можно при помощи постоянного (301) редиректа на предпочтительную страничку. Также можно указать на первоисточник контента при помощи инструментов для вебмастеров Google. Например, можно указать, какая версия сайта является оригиналом – с www или без www.

Многочисленные доменные имена

Под конец Грег коснулся проблемы многочисленных доменов. Многочисленные домены могут использоваться в том случае, если вы разделяете контент для разных аудиторий между различными доменами. Например – разные страны, языки и т.д. При работе с многочисленными доменами вы теряете возможность отображения страничек вашего сайта в дополнительных результатах поиска, и таким образом теряете переходы на ваш сайт, потому что Google не будет отображать ссылки на другие домены в дополнительных результатах поиска.

Это мой сокращенный, «вольный» перевод видеоподкаста Грега Гротаса (Greg Grothaus). А вот полная версия (естественно на английском языке!):

Была ли у вас проблема с дублированным контентом на сайте и с неправильным ранжированием в Google вследствии этого ? Как удалось ее решить?

Поделиться записью:

Оставьте комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *