Диагностика проблемы дублирующегося контента в WordPress
Дублирующийся контент негативно влияет на SEO и пользовательский опыт. В WordPress основные причины дубликатов:
- Несколько URL ведут на одни и те же страницы (например, с www и без www, с https и без https);
- Архивы категорий, тегов и авторов дублируют контент постов;
- Ревизии и копии постов отображаются в индексе;
- Пагинация и параметры URL создают копии страниц;
- Плагины или темы создают дополнительные URL с похожим содержимым.
Для проверки дубликатов используйте инструменты:
- Google Search Console — раздел «Покрытие» и «Проблемы с индексированием»;
- Сервисы типа Screaming Frog SEO Spider для сканирования сайта и выявления дублей;
- Плагины для WordPress, например, Clearfy Pro (https://wpshop.ru/plugins/clearfy?utm_source=wpnews.ru&utm_medium=article&utm_campaign=kak-udalit-problemy-s-duplikatami-kontenta-v-wordpress) для анализа и устранения дублей.
Пошаговое решение: как убрать дубли контента в WordPress
1. Настройка постоянных ссылок
Перейдите в Настройки > Постоянные ссылки и выберите человекочитаемый формат, например, "Название записи".
Избегайте использования параметров типа ?p=123, так как они создают дубли.
2. Правильная настройка канонических URL
WordPress автоматически добавляет тег <link rel="canonical">, но в сложных темах или при использовании SEO-плагинов лучше контролировать этот процесс.
Пример добавления канонического URL вручную в functions.php вашей темы:
function add_custom_canonical_url() {
if (is_singular()) {
echo '<link rel="canonical" href="' . get_permalink() . '" />';
}
}
add_action('wp_head', 'add_custom_canonical_url');3. Отключение индексации архивов и тегов
Архивы категорий и тегов часто создают дубли. Чтобы запретить их индексацию, можно добавить в header.php условие:
if (is_category() || is_tag() || is_author()) {
echo '<meta name="robots" content="noindex, follow" />';
}Или использовать SEO-плагины с настройками индексации. Например, в Clearfy Pro можно массово управлять индексированием.
4. Удаление ревизий и отключение их создания
Ревизии постов создают копии контента в базе, что может замедлять сайт и иногда вызывать дубли.
Для удаления всех ревизий запустите SQL-запрос через phpMyAdmin или WP-CLI:
DELETE FROM wp_posts WHERE post_type = 'revision';Чтобы отключить ревизии, добавьте в wp-config.php:
define('WP_POST_REVISIONS', 0);5. Управление параметрами URL
Параметры типа ?sort=asc создают дубли. В Google Search Console можно указать параметры, игнорируемые при индексации.
Для WordPress добавьте в robots.txt запреты или используйте фильтр для очистки URL:
add_filter('redirect_canonical', 'disable_canonical_redirect_for_params', 10, 2);
function disable_canonical_redirect_for_params($redirect_url, $requested_url) {
if (strpos($requested_url, '?sort=') !== false) {
return false; // Отключаем редирект canonical для URL с параметром sort
}
return $redirect_url;
}Проверка результата после внедрения
После внесения изменений проверьте:
- Google Search Console — отсутствие сообщений о дублирующемся контенте;
- Сканер сайта (Screaming Frog) — отсутствие дублей по URL;
- Просмотр исходного кода страниц — наличие корректных канонических тегов;
- Скорость загрузки сайта — она должна улучшиться после удаления ревизий.
Частые ошибки и как их исправить
- Ошибка: Канонический URL отсутствует или неправильный.
Причина: Конфликт темы и SEO-плагина.
Решение: Выключить канонические теги в плагине и добавить вручную черезwp_head. - Ошибка: Архивы категорий и тегов индексируются.
Причина: Отсутствие мета-тегаnoindex.
Решение: Добавить правило в тему или SEO-плагин. - Ошибка: Ревизии не удаляются.
Причина: Некорректный SQL-запрос или база с префиксом.
Решение: Уточнить префикс таблиц и использовать WP-CLI командуwp post delete $(wp post list --post_type='revision' --format=ids). - Ошибка: Параметры URL создают дубли.
Причина: Не настроено игнорирование параметров.
Решение: Добавить правила в Google Search Console и при необходимости фильтры в WordPress.
Практические советы по безопасности и производительности
- Удаление ревизий уменьшает размер базы и ускоряет запросы.
- Корректные канонические URL предотвращают индексацию дублей от ботов.
- Используйте Clearfy Pro для автоматической чистки дублей и оптимизации SEO https://wpshop.ru/plugins/clearfy.
- Регулярно проверяйте дубли с помощью сканеров и Google Search Console.
Сравнение способов удаления дубликатов в WordPress
| Метод | Описание | Плюсы | Минусы |
|---|---|---|---|
| Ручной код (functions.php, wp-config.php) | Добавление фильтров и настроек через код | Полный контроль, бесплатно | Требует знаний, риск ошибок |
| SEO-плагины (Yoast, Rank Math, Clearfy Pro) | Автоматическая настройка индексации и канонических URL | Удобство, дополнительные функции SEO | Могут конфликтовать, нагрузка на сайт |
| WP-CLI и SQL-запросы | Удаление ревизий и очистка базы | Быстрое удаление, без нагрузки на сайт | Требует доступа к серверу и осторожности |