Вопрос или проблема
Я пытаюсь создать зеркало/скачать на своем ПК веб-сайт sites.google
, используя wget. У меня нет проблем с загрузкой, но когда я открываю index.html
, он начинает с локальной папки и затем сразу же ссылается обратно на sites.google
.
Адрес моего сайта:
Команда wget, которую я использую:
wget --mirror --convert-links --page-requisites --no-parent -P documents/websites/ https://sites.google.com/view/craig-diana-wilkin/home
Я также пробовал:
wget --mirror --convert-links --no-clobber --no-parent --domains sites.google.com https://sites.google.com/view/craig-diana-wilkin/home
Все вышеперечисленные команды дают мне файл index.html
, но все они просто ссылаются обратно на настоящий sites.google.com
.
$ man wget
...
-k
--convert-links
После завершения загрузки, преобразовать ссылки в документе
так, чтобы они были подходящими для локального просмотра. Это
влияет не только на видимые гиперссылки, но и на любую часть
документа, которая ссылается на внешнее содержимое, такое как
встроенные изображения, ссылки на таблицы стилей, гиперссылки на
контент, не являющийся HTML, и т.д.
Каждая ссылка будет изменена одним из двух способов:
...
… там много других слов о локальной[1] обработке файлов и тому подобном. less
используется для отображения man-страниц, среди прочего, с ним можно осуществить поиск.
(нажмите h
, чтобы увидеть краткую версию всех опций less)
[1] ищите local
!
Ответ или решение
Чтобы создать зеркальную копию сайта на платформе Google Sites с использованием wget
и корректно преобразовать все ссылки в локальные, необходимо учесть несколько важных моментов. Несмотря на то, что вы уже пробовали различные команды wget
, результатом всегда является ссылка, ведущая обратно на сайт Google. Ниже представлен детальный подход к решению вашей задачи.
Шаги по созданию локальной копии сайта Google Sites
-
Проверка параметров командной строки: Вы используете два ключевых параметра
--mirror
и--convert-links
, что правильно. Однако, некоторые дополнительные параметры могут помочь обеспечить более успешную загрузку:--adjust-extension
: это помогает сохранить правильные расширения для файлов, таких как.html
.--no-check-certificate
: может быть полезным, если ваш сайт использует нестандартный SSL-сертификат.
Полная команда будет выглядеть так:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent --no-check-certificate -P ваш_путь/к_папке/ https://sites.google.com/view/craig-diana-wilkin/home
-
Структура каталога: Убедитесь, что путь, указанный с помощью параметра
-P
, корректен и существует.wget
создаст подкаталоги, поэтому лучше использовать полный путь. -
Проблемы с доступом к ресурсам: Платформы типа Google Sites могут ограничивать доступ к некоторым ресурсам во избежание неправомерного использования или сканирования. Если сайт применяет настраиваемые разрешения, это может привести к отсутствию некоторых файлов в загруженной копии.
-
Проверка локальных ссылок: После завершения загрузки, проверьте сохранённый файл
index.html
и все связанные файлы. Убедитесь, что все ссылки преобразованы. Если ссылки всё ещё ведут на внешние ресурсы, возможно, вам придётся вручную отредактировать некоторые файлы HTML. -
Локальная проверка: Чтобы проверить локальную версию сайта, откройте
index.html
в вашем браузере. Если вы всё сделали правильно, все внутренние ссылки должны вести на локальные файлы.
Заключение
Создание локальной копии веб-сайта на Google Sites с помощью wget
может потребовать некоторой настройки и внимания к деталям. Убедитесь, что вы используете правильные параметры командной строки и проверяете структуру загруженных файлов на наличие корректных локальных ссылок. Если проблема сохраняется, возможно, будет полезно рассмотреть альтернативные инструменты или методы, такие как визуальный сканер сайта или специализированные приложения для загрузки веб-контента.