Дублирование содержания страницы при использовании префикса www и пенальти поисковиков
Мне всегда бросалось во внимание неудобство пользования сайтами, на которые можно зайти только используя префикс www. Представте себе, если бы вам пришлось каждый день набирать www-точка-google-точка-com, а если вдруг напишете без www, то получите ругань что сайта не существует. Нормальные админы для любого домена создают дубликаты, как с www, так и без. Это не сложно реализовать в апаче через директиву ServerAlias, а для посетителей сайта очень удобно.
Однака, у любой педали есть две стороны. Оказывается, поисковые машины воспринимают эти два алиаса одного сайта как два разных сайта, отмечают их как дублированные страницы и на свое усмотрение дают ссылки на тот или другой сайт. Проверить это можно дав поиск в гугле два запроса "site:www.yoursite.com" и "site:yoursite.com". Количество результатов будет разным, причем одни страницы индексированы с одной версии вашего сайта, другие страницы индексированы с другой. Кроме этого, поисковик может интерпретировать такое дублирование, как попытку привлечь большую вероятность попадания на ваш сайт за счет большего количества проиндексированных страниц и может использовать разного рода баны, как они их называют пенальти. Используйте вот этот инструмент оптимизатора сайтов для выявления проблемы дублированния страниц вашего сайта: http://www.virante.com/seo-tools/duplicate-content.php
Подробнее о проблеме дублирования контента и способах решения читайте тут: http://gutorov.ru/blog/post_1166515450.html
Избавляться от копии сайта не нужно, потому что это не удобно пользователям, а во вторых проиндексированные страницы в поисковиках и на других сайтах станут недействительными.
Для того, чтоб избавиться от этого эффекта я создаю два разных сайта для одного домена и основной контект складываю на версии без www. На версии сайта с www я ложу всего лишь index.php следующего содержания:
<?
Header( "HTTP/1.1 301 Moved Permanently" );.
Header( "Location: http://YOURSITE.COM/?$_SERVER[QUERY_STRING]" );
?>
Этот скрипт перекидывает с помощью директивы HTTP 301 клиента на сайт без www, но передает все параметры для скриптов, так что ссылки остаются работоспособными. Поисковики понимают директивы HTTP 301 Moved Permanently и очень скоро переиндексируют сайт так, как нужно. После такого финта инструмент SEO http://www.virante.com/seo-tools/duplicate-content.php сразу показывает что ошибка устранена и только последняя ошибка исчезнет как только ваш сайт будет переиндексирован гуглем.
Комментарии
Речь в принципе
Речь в принципе идет о наличии самой проблемы и о том что ей все таки надо уделить внимание. Способов решения немеряно и каждый выберет себе лучший способ. Теперь буду знать, что через модуль тоже решается.
Как только поеду еще куда то, обязательно выложу еще свежих фоток с отчетом.
замудрено как то....
В апаче есть модуль мод_реврайт через который все намного проще и удобней настроить один раз и забыть
п.с. отчёт по турции просто шикарный )