06.07.2008, 21:57 | #1 |
Мастер
Регистрация: 10.12.2007
Сообщений: 566
Вес репутации: 237
|
Обрезание URL-ов
Столкнулся с такой проблемой. Напарсил сайтов из выдачи, часть из адресов с хвостами (т.е. именно ссылки). Может у кого-то есть готовое решение? Нужно эти хвосты убрать или в отдельный файл записать только адреса самих сайтов.
РегЭкспом по формуле http://[^/]*/ нахожу сами адреса, а вот как сделать формулу, чтобы находило всё, что после них - не додумался. Я уверен, я не один такой весёлый с такой проблемой - поэтому не жадничайте, если богаты на минисофтинку для этого случая. Что-то выдумывать, когда я уверен, что оно уже есть - не очень-то хочется
__________________
Зарегистрируйся в системе моим рефералом |
06.07.2008, 22:18 | #5 | ||
Особый статус
|
Цитата:
Добавлено через 1 минуту Цитата:
Последний раз редактировалось Ufaweb; 06.07.2008 в 22:20. Причина: Добавлено сообщение |
||
06.07.2008, 22:21 | #6 | |
Специалист
Регистрация: 29.09.2007
Сообщений: 403
Вес репутации: 217
|
Цитата:
echo $url['dirname']; что непонятно? Добавлено через 2 минуты регулярка кстати косячная Последний раз редактировалось MadGreen; 06.07.2008 в 22:24. Причина: Добавлено сообщение |
|
06.07.2008, 22:54 | #9 | |
Мастер
Регистрация: 10.12.2007
Сообщений: 566
Вес репутации: 237
|
Цитата:
Добавлено через 7 минут ещё варианты?
__________________
Зарегистрируйся в системе моим рефералом Последний раз редактировалось MrJinx; 06.07.2008 в 23:01. Причина: Добавлено сообщение |
|
06.07.2008, 23:35 | #10 |
Специалист
Регистрация: 29.09.2007
Сообщений: 403
Вес репутации: 217
|
а, согласен, тогда вот так:
$url = 'http://site.com/site/site/1.html'; $url = substr($url, 0, strpos($url, '/', 7)+1); echo $url; Добавлено через 4 минуты ну или parse_url на самом деле только вот массив по любому больше памяти будет выедать... Последний раз редактировалось MadGreen; 06.07.2008 в 23:39. Причина: Добавлено сообщение |