СообЧа > База Знаний > Интернет

Вопрос

Как сохранить за один раз много web-страниц в текстовом формате?

На сайте есть ссылки на страницы : 1,2,3,4,5…и т.д. Через Internet Explorer можно задать команду «Сохранить как:» и выбрать сохранение только текста (сохраняется моментально). Размер файла получается около 3 Kb. Но для этого надо открыть каждую страницу и каждый раз задавать команду, что займет очень много времени. С помощью программ закачек (ReGet или FlashGet) можно задать «закачать все:», но файлы закачиваются в формате html (каждый занимает около 50 Kb и закачка идет очень долго)

Ответ

Такую чтоб сразу конвертировал в текст программу я не знаю. Есть другой подход. Для скачивания страниц лучше использовать такие как

Disko Pump

Webextrator

Teleport

и т.д.

Чем они примечательны

Тем что много настроек по типам файов, глубине уровней. В Вашем слечае устанавливаете качать только htm или html (или то и другое), а остальное запретить и размер будет не так уж велик. Указывать достаточно стартовую страницу. Он сам перепишет ссылки для удобства локального просмотра. Ну а уж если нужен только текст. Тут надо обработь еще каким либо конвертором типа Html to Text

Из конференции Expert_FAQ



Copyright © 2000-2004 Сообщество Чайников
Контактная информация