Дублирование содержания страницы при использовании префикса www и пенальти поисковиков

Мне всегда бросалось во внимание неудобство пользования сайтами, на которые можно зайти только используя префикс www. Представте себе, если бы вам пришлось каждый день набирать www-точка-google-точка-com, а если вдруг напишете без www, то получите ругань что сайта не существует. Нормальные админы для любого домена создают дубликаты, как с www, так и без. Это не сложно реализовать в апаче через директиву ServerAlias, а для посетителей сайта очень удобно.

Однака, у любой педали есть две стороны. Оказывается, поисковые машины воспринимают эти два алиаса одного сайта как два разных сайта, отмечают их как дублированные страницы и на свое усмотрение дают ссылки на тот или другой сайт. Проверить это можно дав поиск в гугле два запроса "site:www.yoursite.com" и "site:yoursite.com". Количество результатов будет разным, причем одни страницы индексированы с одной версии вашего сайта, другие страницы индексированы с другой. Кроме этого, поисковик может интерпретировать такое дублирование, как попытку привлечь большую вероятность попадания на ваш сайт за счет большего количества проиндексированных страниц и может использовать разного рода баны, как они их называют пенальти. Используйте вот этот инструмент оптимизатора сайтов для выявления проблемы дублированния страниц вашего сайта: http://www.virante.com/seo-tools/duplicate-content.php

Подробнее о проблеме дублирования контента и способах решения читайте тут: http://gutorov.ru/blog/post_1166515450.html

Избавляться от копии сайта не нужно, потому что это не удобно пользователям, а во вторых проиндексированные страницы в поисковиках и на других сайтах станут недействительными.

Для того, чтоб избавиться от этого эффекта я создаю два разных сайта для одного домена и основной контект складываю на версии без www. На версии сайта с www я ложу всего лишь index.php следующего содержания:

<?
Header( "HTTP/1.1 301 Moved Permanently" );.
Header( "Location: http://YOURSITE.COM/?$_SERVER[QUERY_STRING]" );
?>

Этот скрипт перекидывает с помощью директивы HTTP 301 клиента на сайт без www, но передает все параметры для скриптов, так что ссылки остаются работоспособными. Поисковики понимают директивы HTTP 301 Moved Permanently и очень скоро переиндексируют сайт так, как нужно. После такого финта инструмент SEO http://www.virante.com/seo-tools/duplicate-content.php сразу показывает что ошибка устранена и только последняя ошибка исчезнет как только ваш сайт будет переиндексирован гуглем.

Комментарии

Речь в принципе

Речь в принципе идет о наличии самой проблемы и о том что ей все таки надо уделить внимание. Способов решения немеряно и каждый выберет себе лучший способ. Теперь буду знать, что через модуль тоже решается.

Как только поеду еще куда то, обязательно выложу еще свежих фоток с отчетом.

замудрено как то....

В апаче есть модуль мод_реврайт через который все намного проще и удобней настроить один раз и забыть
п.с. отчёт по турции просто шикарный )

Поделитесь этой страницей



0
0
0
0
0
0
0
0

0

Комментарии ВКонтакте