Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Софт для оптимизаторов и вебмастеров (http://forum.sape.ru/forumdisplay.php?f=36)
-   -   Ищу софт для скачивания сайтов... (http://forum.sape.ru/showthread.php?t=94619)

tex_1982 26.01.2015 18:18

Ищу софт для скачивания сайтов...
 
Ищу лично для себя софт для выкачивания сайтов...
wget -r -x ... более не устраивает, когда выяснилось, что он даже на мелких сайтах на стареньком чистом html пропускает кучу страничек и картинок...
Всё что видел с разбегу - стоит кучу сотен [s]нефти[/s] долляров/евро и предназначен для сео-вэбмастеров, желающих быстро (много потоков) и нахаляву разжиться чужим контентом...

А мне, в среднем, сайтик-другой в месяц скачивать приходится...

Так что рассматриваю, желательно, фри вариант или с существующим достаточно публичным кряком/кейгеном...

Заодно, одной темой, ищу вариант софта для скачивания сайтов с вэбархива... Обязательная особенность - скачивать все версии страниц, чтобы отслеживать дату внесения изменения в текст...

Заранее спасибо за советы и заранее фи за попытку троллить...

MonAmur 26.01.2015 18:39

WinHTTrack Website Copier

poplop 26.01.2015 18:40

Цитата:

Сообщение от MonAmur (Сообщение 1432809)
WinHTTrack Website Copier

потдержу

SPQR 26.01.2015 19:48

Цитата:

Сообщение от tex_1982 (Сообщение 1432808)
Заодно, одной темой, ищу вариант софта для скачивания сайтов с вэбархива... Обязательная особенность - скачивать все версии страниц, чтобы отслеживать дату внесения изменения в текст...

Вебархив очень хитрая штука, может каждый месяц что-то юзать, а может на год болт забить на ваш сайт. Так что с получением даты по вебархиву Вы погорячились, там, в лучшем случае, будет кривой диапазон "от и до".

Прогу восстановления сайта из данных вебархива год назад написал за пару дней ))).

tex_1982 26.01.2015 20:55

Цитата:

Сообщение от MonAmur (Сообщение 1432809)
WinHTTrack Website Copier

Забавная штука... Есть серверная линукс версия... Затестю завтра обе...

Цитата:

Сообщение от SPQR (Сообщение 1432815)
Вебархив очень хитрая штука, может каждый месяц что-то юзать, а может на год болт забить на ваш сайт. Так что с получением даты по вебархиву Вы погорячились, там, в лучшем случае, будет кривой диапазон "от и до".

Да своё-то сайт я и так знаю... Есть локальная копия со всеми бэкапами... Мне в некоторых узкотематических сайтиках копаться... Когда страница скравлена десятки раз, вручную искать, когда же адекватную версию статьи порезали и оставили лишь рваные огрызки, оченьна задалбывает, особенно когда вэбархив говорит после таймаута, что его очередной сервачёк с хабаром в слегка оффлайне.... ;)

Цитата:

Сообщение от SPQR (Сообщение 1432815)
Прогу восстановления сайта из данных вебархива год назад написал за пару дней ))).

Мне не хватает для этого усидчивости и некоторых знаний нюансов библиотеки LWP... Да и дел irl важных как бы больше...

tex_1982 13.02.2015 14:33

Апаю, так как всё ещё
Цитата:

Сообщение от tex_1982 (Сообщение 1432808)
ищу вариант софта для скачивания сайтов с вэбархива... Обязательная особенность - скачивать все версии страниц, чтобы отслеживать дату внесения изменения в текст...

Варианты? Предложения?

tex_1982 17.02.2015 08:52

Цитата:

Сообщение от MonAmur (Сообщение 1432809)
WinHTTrack Website Copier

Погонял сие изделие и пока не понимаю следующее...
При некоторых условиях даже со 100% статичного сайта, со стоящими опциями не выходить за предел сайта, начинает выкачивать заодно сторонние сайты, ссылка на которые есть на исходном... Ну и на лету фильтры менять не даёт...

Кто сталкивался, как лечить?

dronbaton 05.03.2015 11:54

Я пользуюсь TelePort

10012003 05.03.2015 20:49

Цитата:

Сообщение от tex_1982 (Сообщение 1434003)
Варианты? Предложения?

google.com

Вы батенька мало того, что хотите красть контент, так еще и хотите что бы для Вас и прогу сломали и скрипты написали и все на халяву.
Если уж есть более приоритеные дела будьте любезны платить за то что кто-то будет работать за вас.

сначала рекламируют подобное УГ а потом жалуемся что контент скомунуздили и прихватизировали.

Закройте уже кто-нибудь эту тему, а лучше удалите как пособничество воровству и пиратству

tex_1982 09.03.2015 11:50

Цитата:

Сообщение от dronbaton (Сообщение 1435280)
Я пользуюсь TelePort

Я опять его пошлю, так как наплевался с ним и его "интеллектом"... Заново наступать на грабли не хочу...

10012003, Каждый читает и понимает в меру своей испорченности... Если Вы тырите контент, то и других подразумеваете также... А лично я задолбался уже от того, что полгода назад занёс сайт в избранное, а он издох и в вэбархив нужные мне страницы не попали... И как перечитать нужную статью? А никак... А если сделать дамп сайта, то хотя бы со старой оффлайновой копией поработать можно...

ЗЫ. после переезда Народа в юкоз, куча мелких сайтиков попередохли из-за политики "посещаемости" юкоза... А в вэбархив они и не попадали... И как искать именно то самое нужное?...

ЗЗЫ. а в гугле один переоптимизированный гоуноконтент, нормальные человеческие статьи из него Вами, сеошниками, вымыты... С Яндексом всё по некоторым тематикам запросов ещё хуже... ;(


Часовой пояс GMT +3, время: 01:37.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.