24.02.2008, 10:47 | #1 |
Злой модератор
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,343
Вес репутации: 508
|
YACA Парсер
Простенький скрипт парсера YACA. Вручную задается ссылка на раздел и количество страниц. Отсеиваются народные сайты, сообщества livejournal и те сайты, которые умудрились запихнуть в YACA только одну страничку.
На правах гуманитарной помощи оптимизаторам PHP код:
|
24.02.2008, 11:42 | #2 |
Погулять вышел
Регистрация: 15.05.2007
Адрес: С-Пб! О/ВМ 50/50
Сообщений: 1,921
Вес репутации: 321
|
Блин, незачОТ! Всё много менее объёмно
<? set_time_limit(0); $cat = 'Business/Production/'; //сюда вписывает нужную категорию $delay = '7'; $url = 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat; $np_pat = '/<a target="_self" href="(.*)"><font color="#333333">след.<\/font><\/a>/U'; $yc_pat = '/<li>\n<font><a.*href="(.*)".*>.*<\/li>/isU'; echo "<ol>"; while ($data = file_get_contents($url)) { $data = iconv('utf-8', 'cp1251', $data); preg_match_all($yc_pat, $data, $o1, PREG_SET_ORDER); foreach ($o1 as $o) echo "<li>".$o[1]; flush(); preg_match($np_pat, $data, $o2); $url = ($o2 ? 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat. $o2[1]:FALSE); sleep($delay); } ?> |
24.02.2008, 12:40 | #6 |
Специалист
Регистрация: 23.06.2007
Сообщений: 115
Вес репутации: 214
|
ух ты, спасибки :-)
__________________
|
24.02.2008, 14:18 | #9 |
Специалист
Регистрация: 31.10.2007
Адрес: нет тут меня...
Сообщений: 143
Вес репутации: 213
|
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Подскажите парсер ЯКа | bulya | Курилка | 17 | 25.04.2012 19:34 |
Ищу парсер web.archive.org | Ufaweb | Разработка и сопровождение сайтов | 17 | 09.07.2009 21:20 |
Парсер YACA | Алексей Барыкин | Разработка и сопровождение сайтов | 44 | 06.09.2008 00:11 |
Парсер Я.Каталога | kip | Курилка | 3 | 06.10.2007 20:17 |
Соотношение цены YACA / не YACA | Zhoo | Яндекс | 5 | 16.08.2007 15:45 |
Часовой пояс GMT +3, время: 22:01.