Как/почему версия страницы на моем сайте без www была индексирована?

Вопрос или проблема

По какой-то причине есть 3 или 4 страницы на моем сайте, для которых Google индексировал версию без www.

Я перенаправляю все запросы на https и www в .htaccess, но для меня очень странно, что когда я ищу Мое название компании демо, единственный результат для соответствующей страницы на моем сайте не имеет www (https://my-company-name.com/request-demo). Однако если я ищу Мое название компании бесплатный пробный период, результат для соответствующей страницы включает www (https://www.my-company-name.com/free-trial). Страницы почти идентичны по коду… на самом деле страница бесплатного пробного периода была создана путем клонирования страницы демо в WordPress.

Теперь, когда у меня настроено перенаправление на www, это больше не является проблемой, но для последовательности, любопытства и избегания потенциальных проблем в будущем (для SEO, будет ли версия этой страницы с www считаться “дублированным контентом”?), я хотел бы “разиндексировать” версию без www и заставить поисковые результаты показывать (и ссылаться на) версию с www.

Есть идеи, как я могу это сделать? И, возможно, более важно, есть ли у кого-то объяснение, почему/как это происходит?

Если есть какие-либо ссылки на версию URL без www с где угодно, это может привести к индексации неконанической версии URL.

Также проверьте, чтобы у вас были:

  • правильный элемент ссылки rel="canonical" на ваших страницах (и/или заголовок ответа HTTP Link).

  • правильный URL, указанный в ваших XML-картах сайта, RSS-каналах и т.д.

  • правильные предпочтения в Google Search Console: www против non-www

Теперь, когда у меня настроено перенаправление на www, это больше не является проблемой

Тем не менее, вам все еще нужно убедиться, что у вас нет внутренних ссылок на неконанический URL.

MrWhite дал хороший ответ на вопрос, почему это может происходить, но я просто хотел затронуть другую часть, которую вы упомянули:

…и избегая введения потенциальных проблем в будущем (для SEO, будет ли версия этой страницы с www считаться “дублированным контентом”?), я хотел бы “разиндексировать” версию без www и заставить поисковые результаты показывать (и ссылаться на) версию с www.

Если обе страницы www и без www индексируются, то да – Google будет считать это дублированным контентом.

Однако, если 301 редирект настроен правильно, то Google в конечном итоге заметит это перенаправление и изменит список в SERP вместо того, чтобы индексировать оба.

Это может занять некоторое время, поэтому я рекомендую отправить страницу с www на переиндексацию, используя Google Search Console.

Вы также можете использовать Google Search Console, чтобы запросить удаление страницы без www из списков – это может быть радикальным действием, но если вас беспокоит дублированный контент или что перенаправление может не работать корректно, возможно, стоит рассмотреть это после выполнения шагов, которые описал MrWhite в своем ответе.

Ответ или решение

Для начала, давайте рассмотрим, почему не-www версия ваших страниц могла быть проиндексирована. Это часто случается из-за ряда факторов, связанных как с техническими аспектами, так и с поведением поисковых систем.

Причины индексации не-www версии

  1. Отсутствие должной переадресации:
    Если 301 переадресация на www версию вашей страницы была настроена не полностью или неправильно, поисковики могут продолжать индексировать не-www версию. Убедитесь, что в файле .htaccess установлены корректные правила переадресации, и все запросы не-www перенаправляются на соответствующий www URL.

  2. Внешние ссылки:
    Если есть внешние ссылки на не-www версию вашего сайта (например, из статей, блогов или форумов), это может привести к тому, что поисковые системы проиндексируют эти адреса. Даже одна внешняя ссылка на не-www URL может вызвать эту проблему.

  3. Канонические URL:
    Убедитесь, что на страницах правильно указаны канонические ссылки с использованием тега <link rel="canonical" href="https://www.my-company-name.com/request-demo">. Это поможет поисковым системам понять, какая версия страницы является основной и какую необходимо индексировать.

  4. XML-карты сайта:
    Проверьте, чтобы в вашей XML-карте сайта были указаны только www версии URL. Если в карте сайта будут ссылки на не-www, это может также привести к их индексации.

  5. Google Search Console:
    Убедитесь, что в настройках Google Search Console у вас выбрана предпочтительная версия домена. Если вы не указали, что хотите использовать www, это может приводить к путанице.

Решения по «разиндексации» не-www версии

  1. Переадресация:
    Если 301 редиректы настроены корректно, Google со временем должен обновить индексацию и изменить ссылки в результатах поиска. Это может занять некоторое время, поэтому проявите терпение.

  2. Запрос на переиндексацию:
    В Google Search Console вы можете вручную запросить переиндексацию вашей www страницы. Это ускорит процесс обновления в результатах поиска.

  3. Удаление из индексации:
    Если у вас есть серьезные опасения касательно дублированного контента, вы можете использовать Google Search Console для запроса удаления не-www версии из индексации. Это может быть немного радикальным шагом, но в ситуациях с дублирующим контентом это может быть целесообразно.

  4. Поддержка внутренних ссылок:
    Убедитесь, что на вашем сайте ни одна из внутренних ссылок не указывает на не-www версию. Проверьте ваши меню навигации, контентные ссылки и любые другие части вашего сайта.

Вывод

Индексация не-www страниц может быть вызвана несколькими факторами, и решение этой проблемы требует комплексного подхода. Убедитесь, что все ваши настройки (301 редиректы, канонические ссылки, карты сайта, настройки Search Console) выполнены правильно. Систематическое следование этим рекомендациям поможет вам контролировать индексацию и избежать потенциальных проблем с дублированным контентом в будущем.

Оцените материал
Добавить комментарий

Капча загружается...