Старый 05.06.2008, 12:47   #1
Мастер
 
Аватар для big.bon
 
Регистрация: 04.11.2007
Сообщений: 747
Вес репутации: 165
big.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всем
Exclamation Яндекс меняет выдачу....

И так, автоматические чекалки проиндексированности страниц пошли в лес, после смены Яндексом вида выдачи результатов. А именно строчки, где было написано точное количество найденных страниц.

Было:
Цитата:
найдено: 123 222 страниц...
Стало:
Цитата:
Нашлось
179 тыс. страниц
http://yandex.ru/yandsearch?date=&te...&ds=&numdoc=10

Раньше чекалки искали по регэкспу блок refblock, сейчас же получить точное количество страниц стало невозможным обычным путем: написано 179 тысяч страниц, а их на самом деле 179 210 страниц.

В принципе, это не играет существенной роли, но вот сервис по мониторингу параметров сайта перестанет быть актуальным, когда замечает скачки в 1-5% проиндексированности.

Как быть дальше?

Есть у кого решение на PHP по парсингу новой выдачи?

PS: в регэкспе не силен, а надо: вырезать из титла "нашлось 179 тыс. страниц" и перевести её в циферки...

PS2: заметил смену выдачи ещё 2 месяца назад. Видимо смена была на некоторых серверах. Так как с другого выхода всё было по-старому. Сегодня же ночью для моего IP поменялось тоже...
big.bon вне форума   Ответить с цитированием
Старый 05.06.2008, 13:17   #2
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,346
Вес репутации: 448
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

Похоже еще будут менять что-то, судя по такому кривому заголовку.
Регэксп вот такой можно попробовать:
PHP код:
if preg_match("~нашлось ([0-9]+) страниц~"$content$match
     
$num intval($match[1]);
elseif 
preg_match("~нашлось ([0-9]+)\ тыс\. страниц~"$content$match
     
$num 1000intval($match[1]);
else 
$num 0
Wink вне форума   Ответить с цитированием
Старый 05.06.2008, 13:20   #3
Мастер
 
Аватар для big.bon
 
Регистрация: 04.11.2007
Сообщений: 747
Вес репутации: 165
big.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всем
По умолчанию

Между "нашлось" и циферками ещё разделитель строки... не покатит же?
big.bon вне форума   Ответить с цитированием
Старый 05.06.2008, 13:30   #4
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,346
Вес репутации: 448
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

Внутри <title> нет перевода строки, так что должно оттуда взять.
Wink вне форума   Ответить с цитированием
Старый 05.06.2008, 13:33   #5
Мастер
 
Аватар для big.bon
 
Регистрация: 04.11.2007
Сообщений: 747
Вес репутации: 165
big.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всем
По умолчанию

нету??
Цитата:
<title>
asd&nbsp;-
Яндекс:
нашлось 875&nbsp;тыс. страниц
</title>
big.bon вне форума   Ответить с цитированием
Старый 05.06.2008, 13:37   #6
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,346
Вес репутации: 448
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

Нету. Мы берем только начиная со слова "нашлось", а не весь заголовок.
Цитата:
<title>
&nbsp;-
Яндекс:
нашлось 875&nbsp;тыс. страниц
</title>
Wink вне форума   Ответить с цитированием
Старый 05.06.2008, 13:47   #7
Мастер
 
Аватар для big.bon
 
Регистрация: 04.11.2007
Сообщений: 747
Вес репутации: 165
big.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всем
По умолчанию

А 533 страницы ?
big.bon вне форума   Ответить с цитированием
Старый 05.06.2008, 13:52   #8
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,346
Вес репутации: 448
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

Цитата:
Сообщение от big.bon Посмотреть сообщение
А 533 страницы ?
Тоже возьмет. Первым регэкспом. "533 страницы"
Wink вне форума   Ответить с цитированием
Старый 05.06.2008, 13:55   #9
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,346
Вес репутации: 448
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

... и 1 страница возьмет
Wink вне форума   Ответить с цитированием
Старый 05.06.2008, 13:56   #10
Мастер
 
Аватар для big.bon
 
Регистрация: 04.11.2007
Сообщений: 747
Вес репутации: 165
big.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всем
По умолчанию

Понял косяк - яндекс в UTF отдает результат, гад
big.bon вне форума   Ответить с цитированием
Ответ

Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Влияние домена на выдачу в Яше Valeriy007 Яндекс 12 06.06.2008 12:28
Яндекс зарезал выдачу из за Сапы. rock555 Яндекс 63 08.05.2008 01:10
Не пойму выдачу Яши... new Яндекс 10 04.04.2008 12:07
Яндекс меняет морду Lesnik59 Яндекс 30 03.08.2007 22:19
Яндекс не меняет Бэки Jooz Яндекс 12 21.07.2007 23:20


Часовой пояс GMT +3, время: 14:33.