Дубликаты в CMS Joomla
Одна из самых больших проблем системы управления содержимым сайта Joomla 1.5 является то, что автоматически создаются и не закрываются от индексации дубликаты почти всех страниц сайта.
Также по дублирующим адресам не отдается код 404 (что означает, что страницы не существует), а отдается корректный ответ: 200 (Ok). Подробнее об ответах сервера. Страницы, которые содержат контент сайта, но адрес которых отличается лишь незначительно - это дубликаты. Страницы с неправильной версткой из того же содержимого, что и сайт - это тоже дубликаты.
Так какие же способы существуют для борьбы с повторяющимися страницами на сайте, сделанном с помощью Joomla или попросту "на Джумле". Первым делом необходимо понять:
Откуда появляются дубликаты страниц в Joomla Шаблон сайта - банальный пример, в шаблоне сайта зашита ссылка с логотипа или слогана Вашего сайта, которая может вести на www.сайт.ru, http://сайт.ru, сайт.ru/index.php?option=com_frontpage&Itemid=1 или даже сайт.ru/component/option,com_frontpage/Itemid,1 (если у Вас включена поддержка ссылок Joomla 1.0) Это может вызвать некоторые проблемы индексации сайта в поисковых системах, особенно если сам сайт состоит всего из нескольких страниц. Тем не менее даже если у Вас большой сайт, советуем проверить свой шаблон прямо сейчас по адресу: Административная панель>Расширения>Шаблоны>Ваш шаблон>Изменить html. Сторонние модули и компоненты. Иногда компоненты и модули создают поддержку и открыто оставляют ссылки на дубликаты страниц, причем таких, какие сама Joomla не поддерживает. Например, компонент сторонней разработки может просто дописывать к адресу существующей страницы внутренний адрес той страницы, на которую необходимо перейти. При включенных SEF-ссылках формируются огромные адреса страниц со множеством слешей (/) и более того, все они оказываются работоспособными и рано или поздно попадают в индекс. Собственный компонент содержимого - com_component, который создает дубликаты страниц, и в некоторых случаях попадает в индекс поисковых систем Как дубликаты страниц попадают в индекс поисковых систем
Зачастую, страницы, с неправильным адресом не доставляют неудобств, так как они недоступны пользователям. Ну действительно, разве может навредить ссылка вида http://сайт.ru/abracadabra даже если она дублирует содержимое главной страницы? Ведь ни у кого не возникнет мысли ввести такой адрес в строку браузера. Но если дубликат такой страницы попадет в индекс поисковой системы, то иногда ПС (поисковая система) может предложить пользователю перейти по такой ссылке. А вдруг окажется, что по такой ссылке интересная статья передается в неправильно верстке? Или вместо одного столбца статтьи разбиваются на 2 (3, 4) и из-за этого "плывут шрифты, картинки, разметка"?
Вот именно поэтому нужно иметь представление, как дубликаты становятся проиндексированными страницами:
Случайное попадание в индекс. Это когда вы случайно поделились ссылкой на свой сайт, использовав страницу, котора впоследствии была видоизменена. Например, изменилось количество выводимы в Блоге Категории статей. Ошибка компонента или модуля. Неакуратность вебмастера. В этом случаем нежелательная ссылка на страницу-дубликат была оставлена на сайте. Такое иногда бывает из-за того, что в Joomla автоматически, используя Глобальные настройки, ставится ссылка Читать Далее... И если вдруг Вы выводите статьи в модуле Последних Новостей или любом подобном, то такие ссылки могут выходить за пределы блока модуля и быть не видны пользователям, но видны поисковым системам. Злонамеренное желание конкурентов. Видя успешность Вашего сайта конкуренты могут добавить адреса дубликатов страниц в различные сервисы ускорения индексации страниц, и тогда они с большой вероятностью попадут в индекс. Такую возможность стоит считать маловероятной, но отбрасывать совсем не стоит.
Все вышесказанное говорит о том, что дубликаты страниц могут попасть в индекс поисковых систем, могут навредить сайту, поэтому с ними необходимо бороться.
Способы борьбы с дубликатами сайта
Существуют следующие способы избавления от дубликатов странци в Joomla:
Запрет индексации ненужных url в файле robots.txt, например вот так Disallow: /component/option,com_frontpage/ Настройка файла .htacces и установка mod_rewrite. Установка стороннего компонента, который позволяет осуществлять редирект со страниц дубликатов на исходные страницы сайта.
Дубликаты в CMS Joomla - Генератор расширений Joomla и многое другое на нашем сайте посвященном работе расширений, компонентов, модулей, плагинов для линейки Joomla. Отправляйте ссылку на страницу своим друзьям и в социальные сети воспользовавшись графическими иконками выше.