07.02.2009, 13:36 | #12 |
Эксперт
Регистрация: 15.07.2008
Сообщений: 2,004
Вес репутации: 318
|
Пусть тогда сходу и карту сайта делает)
P.S. В архиве не все страницы сайта, если уж делать но хорошо, а у проги так не получиться
__________________
|
07.02.2009, 14:38 | #13 |
Эксперт
|
Плaтон, имхо, Вам не стоило палить источник полученных саттелитов
проще как собственного изготовления продавать было = дороже гарантированный (заказанный) спрос не всегда хорошо тем более если прога еще не готова - а представляете, если не выйдет ) |
10.02.2009, 22:30 | #15 |
Специалист
Регистрация: 01.02.2009
Адрес: Анадырь (Арзамас - 13)
Сообщений: 482
Вес репутации: 207
|
Ну получится не получится, а с сайта 150 страниц вытащила 146 это тоже не плохой вариант + сделал перелинковку, так хоть сразу забрасывай на хостинг и раскручивай, просто прелесть !
(сам себя не похвалишь никто не похвалит) Да ничего я не палил тема абсолютно не нова, и ищущий ее может найти без проблем ! Немного не понял, но как говориться спрос рождает предложение, был заказ на данный софт я просто его реализую (ну и для себя попользоваться) Ну если не выйдет то значит не судьба, хотя пока результаты неплохие З.Ы. Жду еще предложений ! Скоро первая версия |
13.02.2009, 15:16 | #16 |
Особый статус
|
Добавлять перед тегом </body> и после <body> уникальные теги для индексации сайта роботом сапы. Или вставлять <? include('inc.php');?>, чтобы потом быстро разместить рекламу и код сапы.
Запишусь на программу... |
13.02.2009, 21:53 | #17 |
Специалист
Регистрация: 01.02.2009
Адрес: Анадырь (Арзамас - 13)
Сообщений: 482
Вес репутации: 207
|
Тут я не знаю, конечно реализовать не проблема, токо сайты получаются не человеческие, т.к. изображения в архиве отсутствуют , стоит ли их сразу в сапу впихивать т.к. есть еще куча левых ссылок на тотже архив
Русским языком получается удобоваримое сырье, а дорабатывать для той же сапы его все равно необходимо |
13.02.2009, 22:33 | #18 |
Особый статус
|
Нет, это не так. Бывает, картинки отсутствуют, но это привычный глюк вебархива.
Выводить список урлов, которые не получилось загрузить (страницы, картинки итд). Там уже можно будет извратиться и вставить на "штатные места"... http://regexpstudio.com/TRegExpr/Help/About.html выручит. Все взаимозаменяемо. Есть у меня довольно трастовый сайт 2000 г.в., с добротным пузом. Но проблема в том, что в вебархиве более 1000 страниц и практически вся графика в целости . Если все это вытащить оттуда, сайт не будет висеть мертвым грузом. Собственно, сам начал писать софт, есть некоторые идеи по выдергиванию недоступных страниц, по общему функционалу, по "посадке" готового сайта на простенький движок, по интерфейсу и так далее. Если всерьез интересно, можно пообщаться в аське. На форуме отписал только из-за того, что самому интересна эта тема. PlaDima, нет. Просто реально исключительный случай... |
27.02.2009, 22:52 | #20 |
Специалист
Регистрация: 01.02.2009
Адрес: Анадырь (Арзамас - 13)
Сообщений: 482
Вес репутации: 207
|
Сорри, так мы и не пообщались, куча проблем навалилась дома, а на работе нормального инета увы нет и аси тоже нет
Обещанное А теперь исполняю обещанное некоторым личностям сделать к 28 февраля демку программы, ее можно взять по адресу _http://searchelp.ru/download/webarchive.rar Все желающие могут тоже посмотреть, принимаю здоровую критику. Небольшое описание в файле прочтименя.txt |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Аналог web.archive.org ? | siarzhuk | Общие вопросы оптимизации | 1 | 13.04.2013 21:27 |
Ищу парсер web.archive.org | Ufaweb | Разработка и сопровождение сайтов | 17 | 09.07.2009 21:20 |
Принимаю ставки на АП тИЦ | datot | Яндекс | 69 | 14.05.2008 09:39 |
Принимаю поздравления | datot | Курилка | 34 | 12.03.2008 16:05 |
Часовой пояс GMT +3, время: 22:56.