Вопрос или проблема
У меня есть установка WordPress, которую Машина времени больше не может архивировать. Я пишу это здесь, потому что интуитивно чувствую, что это проблема более низкого уровня.
Когда я посещаю
https://web.archive.org/save/blog.spiralofhope.com
я получаю
Клиент не имеет прав доступа к http://blog.spiralofhope.com/ (HTTP статус=403).
Когда возникла эта проблема, я вообще не вносил никаких изменений: WordPress, плагины и т. д. Я не контролирую серверную часть.
Я изучал:
- Переустановка WordPress
- Я использую версию 6.0
- Отключение всех плагинов
- Переименование моего
.htaccess
- Серверные логи через ssh (ничего не появляется, когда я пытаюсь архивировать)
- Серверные логи через мою панель управления (это непонятно, и я не уверен, как искать что-либо)
Я делал веб-поиски на нескольких поисковых системах по фразам вроде Клиент не имеет прав доступа
, со статусом и т. д. по отношению к Машине времени. На (ужасном) форуме ничего связанного не дали. Мне не удалось найти другого пользователя с аналогичной проблемой.
Я написал, чтобы попросить о помощи, но пока ничего не пришло.
Я не уверен, как дальше устранять неполадки.
Это была смесь плагина Blackhole for Bad Bots и кэширования в Машине времени.
Плагин агрессивно блокировал их бота. Когда бот был заблокирован, он больше не работал для этого URL. Так что даже если плагин был отключен, бот всё равно не работал.
Решение заключалось в том, чтобы отключить плагин, подождать день или около того, а затем снова попробовать URL.
Простое решение, но сложные проблемы с устранением неполадок!
Привет, я только что получил это, когда пытался сохранить факты IMDb. Сохранение не удалось, потому что Save Page Now не имеет прав доступа к https://www.imdb.com
Решения нет: несколько дней назад я написал в Sprinklr, жалуясь на безумие IMDb “кликните для получения дополнительных сведений”, которое доставляет нам неудобства с индексом (как для моих пальцев, так и сейчас в архиве Save Page). За свои беспокойства IMDb не только БЛОКИРОВАЛ мой пост (отметили “ЧАСТНЫЙ” мгновенно, затем исчез после прочтения модераторами), так что это означает, что они связались с Archive.org, чтобы навсегда остановить их от сохранения страниц. Нет смысла бытьContributorом больше. Я ушел некоторое время назад, и вам тоже следует, потому что дураки могут вмешаться и удалить ранее одобренные вкладки, которые имели более 300 лайков. Им все равно: IMDb разрешает автоматическое удаление, и теперь это: он больше не будет сохранять ничего от IMDb!
Ответ или решение
Когда вы пытаетесь сохранить страницу с помощью Wayback Machine и получаете ошибку "Клиент не имеет прав доступа" с HTTP статусом 403, это указывает на то, что сервер блокирует доступ к запрашиваемому ресурсу. Рассмотрим возможные причины и способы устранения этой проблемы подробнее.
1. Причины возникновения ошибки 403
Ошибка 403 возникает по нескольким причинам, среди которых:
-
Политики безопасности сервера: Веб-сервер может иметь настройки, которые запрещают доступ к определённым ресурсам или к его архивированию. Это может произойти, если сервер настроен на блокировку бот-трафика, который используется Wayback Machine для архивации страниц.
-
Плагины и настройки WordPress: Использование определенных плагинов, таких как "Blackhole for Bad Bots", может привести к блокировке запросов от ботов. Если плагин настроен слишком агрессивно или работает некорректно, он может заблокировать попытку Wayback Machine заархивировать ваш сайт.
-
Файлы .htaccess: Этот файл может содержать правила, которые ограничивают доступ к различным частям сайта для определённых пользовательских агентов. Если в нём прописаны условия для запрета доступа к вашему контенту, это может создать аналогичную проблему.
2. Как выявить и устранить проблему
Для успешного разрешения возникшей ситуации рекомендуется предпринять следующий алгоритм действий:
-
Анализ настроек сервера: Если у вас есть возможность доступа к серверным логам, тщательно исследуйте их. Это поможет понять, что именно блокирует доступ для Wayback Machine.
-
Плагины WordPress:
- Попробуйте временно отключить все плагины, особенно те, которые работают с безопасностью или ботами.
- Установите более лояльные плагины, если это необходимо, чтобы избежать блокировки ботов.
-
Файл .htaccess:
- Временное переименуйте файл .htaccess и посмотрите, изменится ли что-то. Это покажет, влияет ли файл на доступ к вашему сайту.
- Проверьте, нет ли в файле правил, которые могут ограничить доступ для определённых пользовательских агентов.
-
Кэш и время ожидания:
- Если вы выявили, что плагин блокирует Wayback Machine, отключите его, но учтите, что состояние может не измениться немедленно. Необходимо подождать 24 часа, чтобы дать боту возможность попытаться получить доступ снова.
-
Проверка состояния страницы:
- После выполнения вышеуказанных действий попробуйте снова сохранить страницу на Wayback Machine.
3. Заключение
Ошибка "Клиент не имеет прав доступа" может возникнуть по многим причинам, однако обычно это связано с ограничениями, установленными на сервере или в ваших настройках сайта. Как правило, решение может заключаться в отключении соответствующих плагинов или корректировке файлов конфигурации. Если проблема сохраняется, возможно, стоит обратиться к вашему хостинг-провайдеру для обращения к логам сервера, что позволит определить более специфические причины. Оставайтесь на связи с сообществом, возможно, кто-то из пользователей Facing аналогичную проблему сочтет необходимым поделиться своим опытом.