Как скачать с web archive org
Страницы: 1
Как скачать с web archive org
Добрый день! Можете подсказать как можно скачать фотки с сайта из web archive org.
Кликаем правой кнопкой мышки, выбираем пункт сохранить как, сохраняем и получаем один файл .html и папку где все фотографии с этой страницы.
Добрый день, Дмитрий.Я скачиваю сайты с archive.org программой https://github.com/hartator/wayback-machine-downloader
Эта программа работает только в командной строке. Платный софт (Webarchiverecover) многие сайты вообще даже не скачивает.
Кроме скачивания надо также убрать счётчики, убрать внешние и битые ссылки, сделать внешние файлы внутренними. Всё это я делаю в командной строке Линукса, так как удобных и интуитивно понятных инструментов для этой задачи нет.
Могу просканировать сайт в Вебархиве на фотки и скачать их с сохранением структуры каталогов или в один каталог.

Вот мои отзывы: https://kwork.ru/website-repair/434052/vosstanovlenie-saytov-iz-vebarkhiva-bez-problem
Если интересно, пишите в телегу @freeeax или в почту freeaxmail@yandex.by
Или можете заказать выгрузку из Вебархива у специальных сервисов, но там может быть дороже в зависимости от объёма Вашего сайта.
Изменено: freeax - 28 Июля 2021 22:49
Цитата
Поляков Владимир пишет:
Кликаем правой кнопкой мышки, выбираем пункт сохранить как, сохраняем и получаем один файл .html и папку где все фотографии с этой страницы.
Спасибо!!!!!! Все получилось!!!!!
Оказалось всё так легко, огромное спасибо.
reeax, с wayback-machine-downloader даже ребёнок справится, зачем кворк? Первая инструкция в гугл: [url]https://banochkin.com/blog/download-from-web-archive/[/url] и всё понятно. Полностью бесплатно.
Изменено: Василий - 6 Февраля 2023 19:44
Цитата
Василий пишет:
reeax , с wayback-machine-downloader даже ребёнок справится, зачем кворк? Первая инструкция в гугл: [url]https://banochkin.com/blog/download-from-web-archive/[/url] и всё понятно. Полностью бесплатно.
Не справится, потому что надо уметь устанавливать это скрипт, надо уметь пользоваться командной строкой. Приходитя почти для каждого сайта править ссылки на стили, js и иногда даже на страницы. Настраивать редиректы надо, а если в урлах страниц есть знаки вопроса, тогда нужно настраивать скрипты для редиректов. Переводить некоторые сайты из одной кодировки в другую иногда нужно. wayback-machine-downloader также не выгружает все файлы и потом их приходится догружать программой wget, тоже линуксовой и тоже консольной кстати ! Надо уметь пользоваться анализаторами типа Screamingfrog, убирать битые и внешние ссылки, переносить сайт на Wordpress …
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
20:18 ЕС душит ТикТок: прощай бесконечная лента и RPM? Что с монетизацией? 
20:14 Гугл пухнет от кеша, а нам - крошки. Разбор $114 млрд: Адсенс в минусе, Ютуб на подписках 
20:11 01.02. Апдейт 31.01 // Chrome готовит "чёрную метку" для ИИ? 
18:53 Кнопки "скрыть" и "пожаловаться" в рекламе яндекса 
15:29 OpenAI и шейхи: Цензура на продажу и "гибкие" идеалы амеров 
13:26 Как безопасно купить Гугл почту? 
10:59 WB и Ozon - новые "русские поисковики"? Яндекс теряет коммерческую выдачу 
04:13 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
00:01 E-currency.exchange — ваш помощник в мире обменов 
23:40 Monitex: Мониторинг с кэшбэком 80% в USDT 
22:35 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 
18:41 Веривикация Авито 
17:37 Продам аккаунты Gmail USA IP | Gmail MIX IP | Outlook Old 
16:31 JustProxy.Biz - Резидентные прокси без ограничения по трафику 
03:45 Гильотина для классиков: Клод доедает физические книги 
01:24 Точные прогнозы на футбол 
21:04 Кулеры и БП станут золотыми? Медь по 13 штук, олово в космосе 
19:29 FIFA и Assassin’s Creed воруют пароли: В репаки зашили лютый стиллер. Чекаем логи 
19:24 Туалетные секреты: Замурчательная тема 
19:15 Сайты Рунета 
15:15 ИИ-театр для инвесторов: почему виральные посты в Moltbook писали люди и в чем подвох OpenClaw