01.10.2009, 09:12 | #1 |
Мафиози
Регистрация: 11.09.2008
Адрес: <H1></H1>
Сообщений: 1,174
Вес репутации: 243
|
php+регулярки=вытащить ссылки со страницы
Есть у кого нибудь готовая регулярка? Поделитесь плиз
__________________
|
01.10.2009, 10:58 | #3 | ||
Новичок
Регистрация: 26.05.2009
Сообщений: 21
Вес репутации: 0
|
когда-то использовал
Цитата:
Цитата:
|
||
01.10.2009, 11:48 | #5 |
Пожиратель черепашкоВ
Регистрация: 24.12.2008
Адрес: Телемелетрямдия
Сообщений: 4,739
Вес репутации: 396
|
вот накидал примерчик (выдираем все ссылки с http://site.ru):
PHP код:
__________________
|
01.10.2009, 14:45 | #6 | |
JS Developer
|
Цитата:
Код HTML:
<a href="/" title"<a href=\"#\"></a>">Ссылка</a> |
|
01.10.2009, 14:49 | #7 |
Мафиози
Регистрация: 11.09.2008
Адрес: <H1></H1>
Сообщений: 1,174
Вес репутации: 243
|
Regent, для создания карт сайтов
chahlic, нужно чтоб все случаи тянуло Telemad, попробую понять, спс
__________________
|
01.10.2009, 16:02 | #8 |
JS Developer
|
Русская мафия, это какой - то онлайн - сервис?
Либо для создания внутренней карты сайта? Почти идеальным будет сначало вырезать все экранированные символы \\. Далее вырезать все коментарии <!----> Далее вырезать все строки '[^']*' и "[^"]*" Далее вырезать все тэги <script> - <script[^>]*>.*</script> Ну и дальше уже можно смотреть ссылки. Как - то так. |
01.10.2009, 16:16 | #9 |
Мафиози
Регистрация: 11.09.2008
Адрес: <H1></H1>
Сообщений: 1,174
Вес репутации: 243
|
да, именно. Нужно вытащить внутренние и внешние ссылки
__________________
|
01.10.2009, 17:58 | #10 |
JS Developer
|
Хы, ну надо было так и сразу говорить
Берёте, делаете AJAX запрос через самопальный php прокси. Дальше анализируете DOM дерево например с помощью jQuery ну и самое простое, это перебираете все ссылки. Примерно так: Код HTML:
<script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jquery/1.3.2/jquery.min.js"></script> <script type="text/javascript"> // После полной загрузки страницы $( function(){ $( 'form#chekLinks' ) .submit( function(){ $.ajax({ url: 'адресНашегоСкрипта.php', type: 'POST', data:{ url:$( this ).find( 'input:text' ).val() }, success: function( DOM ){ var result = $( DOM ).find( 'a' ).map( function(){ // Здесь возвращает поочерёдно адреса ссылок return this.href; } ) // Склеиваем полученый массив .join( '<br />' ); // Вставляем результат $( '#chekLinksResults' ).html( 'Адреса на страницы:<br />' + result ); } }; return false; } ); } ); </script> <form id="chekLinks" action=""> <input type="text" value="Адрес сайта" /> </form> <div id="chekLinksResults"></div> PHP код:
Писал быстро, извеняюсь за ошибки. |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Вытащить с сайта внешние ссылки. | AdmninsCluba | Яндекс | 21 | 28.10.2009 14:48 |
вытащить из индекса страницы | nvrskozzy | Яндекс | 10 | 20.08.2009 05:34 |
Нужно вытащить все страницы сайта | grabus | Софт для оптимизаторов и вебмастеров | 8 | 14.02.2009 11:47 |
Возможно ли вытащить сайт из бана? | SerGG | Яндекс | 29 | 28.11.2008 00:35 |
Ссылки на страницы и ТиЦ | MS555 | Яндекс | 1 | 07.09.2008 19:30 |
Часовой пояс GMT +3, время: 06:33.