Как скачать с web archive org
Страницы: 1
Как скачать с web archive org
Добрый день! Можете подсказать как можно скачать фотки с сайта из web archive org.
Кликаем правой кнопкой мышки, выбираем пункт сохранить как, сохраняем и получаем один файл .html и папку где все фотографии с этой страницы.
Добрый день, Дмитрий.Я скачиваю сайты с archive.org программой https://github.com/hartator/wayback-machine-downloader
Эта программа работает только в командной строке. Платный софт (Webarchiverecover) многие сайты вообще даже не скачивает.
Кроме скачивания надо также убрать счётчики, убрать внешние и битые ссылки, сделать внешние файлы внутренними. Всё это я делаю в командной строке Линукса, так как удобных и интуитивно понятных инструментов для этой задачи нет.
Могу просканировать сайт в Вебархиве на фотки и скачать их с сохранением структуры каталогов или в один каталог.

Вот мои отзывы: https://kwork.ru/website-repair/434052/vosstanovlenie-saytov-iz-vebarkhiva-bez-problem
Если интересно, пишите в телегу @freeeax или в почту freeaxmail@yandex.by
Или можете заказать выгрузку из Вебархива у специальных сервисов, но там может быть дороже в зависимости от объёма Вашего сайта.
Изменено: freeax - 28 Июля 2021 22:49
Цитата
Поляков Владимир пишет:
Кликаем правой кнопкой мышки, выбираем пункт сохранить как, сохраняем и получаем один файл .html и папку где все фотографии с этой страницы.
Спасибо!!!!!! Все получилось!!!!!
Оказалось всё так легко, огромное спасибо.
reeax, с wayback-machine-downloader даже ребёнок справится, зачем кворк? Первая инструкция в гугл: [url]https://banochkin.com/blog/download-from-web-archive/[/url] и всё понятно. Полностью бесплатно.
Изменено: Василий - 6 Февраля 2023 19:44
Цитата
Василий пишет:
reeax , с wayback-machine-downloader даже ребёнок справится, зачем кворк? Первая инструкция в гугл: [url]https://banochkin.com/blog/download-from-web-archive/[/url] и всё понятно. Полностью бесплатно.
Не справится, потому что надо уметь устанавливать это скрипт, надо уметь пользоваться командной строкой. Приходитя почти для каждого сайта править ссылки на стили, js и иногда даже на страницы. Настраивать редиректы надо, а если в урлах страниц есть знаки вопроса, тогда нужно настраивать скрипты для редиректов. Переводить некоторые сайты из одной кодировки в другую иногда нужно. wayback-machine-downloader также не выгружает все файлы и потом их приходится догружать программой wget, тоже линуксовой и тоже консольной кстати ! Надо уметь пользоваться анализаторами типа Screamingfrog, убирать битые и внешние ссылки, переносить сайт на Wordpress …
Страницы: 1
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
19:45 С чего сейчас проще начать? 
19:31 Яндекс Нейро и выдача в 2026 - остались ли лазейки для маленьких сайтов? 
08:21 Продвижение-2022: Гугл все? Нет – Гугл не все! 
08:05 Гугл запустил Первый АПдейт года и серп уже трясёт - Google March 2026 Core Update 
18:49 Биржи ссылок в 2026 - реально ли новичку с одним сайтом поднять копейку? 
13:09 Выбор CMS для первого блога в 2026 - реально ли новичку войти без кода? 
12:47 MAX попер в бурж: 40 стран, ведение каналов и горы дешевого трафика 
18:46 Прямой поставщик услуг для MAX 
17:52 Mixmasters - Exchange without AML and KYC 
16:47 Продам домен translated.ru 
16:11 TUNNEL-to-PROXY: превращает тысячи публичных сетевых конфигураций - в стабильные SOCKS5-прокси! 
14:43 - Вечные ссылки с трастовых сайтов 2024 проверен FastTrust 
14:24 Создам под вашу нишу сетку сайтов-сателлитов для привлечения целевого трафика 
12:54 От $0.015 за IP | $0.68 за ГБ | 9PROXY.COM | 20+ млн резидентных прокси | 99,95% аптайм | Без чёрных списков 
19:38 Голландцы влепили Grok по яйцам - теперь нельзя раздевать реальных людей, штраф 100к евро в день 
17:56 8 марта: желаю аптайма 99.9% и e-e-a-t без локов 
14:56 молодильные яблоки и живая вода 
06:50 Ставки на супер тренды в спорте 
13:04 Gartner обещал смерть SEO к 2026 году. Открываем метрику и проверяем 
18:49 Чак Норрис ушел - 19 марта 2026, 86 лет, семья подтвердила 
17:05 Огородники