Вопрос или проблема
По какой-то причине есть 3 или 4 страницы на моем сайте, для которых Google индексировал версию без www.
Я перенаправляю все запросы на https и www в .htaccess, но для меня очень странно, что когда я ищу Мое название компании демо
, единственный результат для соответствующей страницы на моем сайте не имеет www (https://my-company-name.com/request-demo
). Однако если я ищу Мое название компании бесплатный пробный период
, результат для соответствующей страницы включает www (https://www.my-company-name.com/free-trial
). Страницы почти идентичны по коду… на самом деле страница бесплатного пробного периода была создана путем клонирования страницы демо в WordPress.
Теперь, когда у меня настроено перенаправление на www, это больше не является проблемой, но для последовательности, любопытства и избегания потенциальных проблем в будущем (для SEO, будет ли версия этой страницы с www считаться “дублированным контентом”?), я хотел бы “разиндексировать” версию без www и заставить поисковые результаты показывать (и ссылаться на) версию с www.
Есть идеи, как я могу это сделать? И, возможно, более важно, есть ли у кого-то объяснение, почему/как это происходит?
Если есть какие-либо ссылки на версию URL без www с где угодно, это может привести к индексации неконанической версии URL.
Также проверьте, чтобы у вас были:
-
правильный элемент ссылки
rel="canonical"
на ваших страницах (и/или заголовок ответа HTTPLink
). -
правильный URL, указанный в ваших XML-картах сайта, RSS-каналах и т.д.
-
правильные предпочтения в Google Search Console: www против non-www
Теперь, когда у меня настроено перенаправление на www, это больше не является проблемой
Тем не менее, вам все еще нужно убедиться, что у вас нет внутренних ссылок на неконанический URL.
MrWhite дал хороший ответ на вопрос, почему это может происходить, но я просто хотел затронуть другую часть, которую вы упомянули:
…и избегая введения потенциальных проблем в будущем (для SEO, будет ли версия этой страницы с www считаться “дублированным контентом”?), я хотел бы “разиндексировать” версию без www и заставить поисковые результаты показывать (и ссылаться на) версию с www.
Если обе страницы www и без www индексируются, то да – Google будет считать это дублированным контентом.
Однако, если 301 редирект настроен правильно, то Google в конечном итоге заметит это перенаправление и изменит список в SERP вместо того, чтобы индексировать оба.
Это может занять некоторое время, поэтому я рекомендую отправить страницу с www на переиндексацию, используя Google Search Console.
Вы также можете использовать Google Search Console, чтобы запросить удаление страницы без www из списков – это может быть радикальным действием, но если вас беспокоит дублированный контент или что перенаправление может не работать корректно, возможно, стоит рассмотреть это после выполнения шагов, которые описал MrWhite в своем ответе.
Ответ или решение
Для начала, давайте рассмотрим, почему не-www версия ваших страниц могла быть проиндексирована. Это часто случается из-за ряда факторов, связанных как с техническими аспектами, так и с поведением поисковых систем.
Причины индексации не-www версии
-
Отсутствие должной переадресации:
Если 301 переадресация на www версию вашей страницы была настроена не полностью или неправильно, поисковики могут продолжать индексировать не-www версию. Убедитесь, что в файле .htaccess установлены корректные правила переадресации, и все запросы не-www перенаправляются на соответствующий www URL. -
Внешние ссылки:
Если есть внешние ссылки на не-www версию вашего сайта (например, из статей, блогов или форумов), это может привести к тому, что поисковые системы проиндексируют эти адреса. Даже одна внешняя ссылка на не-www URL может вызвать эту проблему. -
Канонические URL:
Убедитесь, что на страницах правильно указаны канонические ссылки с использованием тега<link rel="canonical" href="https://www.my-company-name.com/request-demo">
. Это поможет поисковым системам понять, какая версия страницы является основной и какую необходимо индексировать. -
XML-карты сайта:
Проверьте, чтобы в вашей XML-карте сайта были указаны только www версии URL. Если в карте сайта будут ссылки на не-www, это может также привести к их индексации. -
Google Search Console:
Убедитесь, что в настройках Google Search Console у вас выбрана предпочтительная версия домена. Если вы не указали, что хотите использовать www, это может приводить к путанице.
Решения по «разиндексации» не-www версии
-
Переадресация:
Если 301 редиректы настроены корректно, Google со временем должен обновить индексацию и изменить ссылки в результатах поиска. Это может занять некоторое время, поэтому проявите терпение. -
Запрос на переиндексацию:
В Google Search Console вы можете вручную запросить переиндексацию вашей www страницы. Это ускорит процесс обновления в результатах поиска. -
Удаление из индексации:
Если у вас есть серьезные опасения касательно дублированного контента, вы можете использовать Google Search Console для запроса удаления не-www версии из индексации. Это может быть немного радикальным шагом, но в ситуациях с дублирующим контентом это может быть целесообразно. -
Поддержка внутренних ссылок:
Убедитесь, что на вашем сайте ни одна из внутренних ссылок не указывает на не-www версию. Проверьте ваши меню навигации, контентные ссылки и любые другие части вашего сайта.
Вывод
Индексация не-www страниц может быть вызвана несколькими факторами, и решение этой проблемы требует комплексного подхода. Убедитесь, что все ваши настройки (301 редиректы, канонические ссылки, карты сайта, настройки Search Console) выполнены правильно. Систематическое следование этим рекомендациям поможет вам контролировать индексацию и избежать потенциальных проблем с дублированным контентом в будущем.