23.09.2009, 14:47 | #131 |
Э̀҉к͜с͜͏п̧́е͟р̶т̧̕
Регистрация: 11.04.2008
Адрес: Маськва
Сообщений: 1,996
Вес репутации: 320
|
Собираю статистику по вылетам среди своих. Пока видно, что абсолютное большинство вылетевших сайтов и страниц, в общем-то, в выдаче были нафиг не нужны
Сомневаюсь, конечно, что отсев идет по такому принципу )) По сути, вылет ббольшой кучи сайтов, сделанных под сапу, практически равносилен отказу от огромного количества сапоссылок. Посмотрим, что нам покажет ап выдачи
__________________
|
23.09.2009, 14:48 | #132 |
Эксперт
Регистрация: 04.02.2007
Сообщений: 2,242
Вес репутации: 385
|
только нечеткие дубли это наверное 90% рунета даже крупные новостные порталы (которые в ленте яндекс новостей) рерайтят новости друг друга, стоит только одному из них выдать копирайт или перевод с иностранного сайта
__________________
|
23.09.2009, 14:53 | #133 |
Мастер
|
Argi,
В принципе тоже самое сказал. Только моё мнение - Если бы была у Яши возможность, он бы сейчас не стал мутиться с этими алгоритмами, так как сам понимает, что наворотил чёрти чего, но обратную давать уже поздно. Оффтоп: Помню лет 5 назад все очень любили фирму Интел, мерились тактовой частотой процессоров. Не многие тогда верили в АМД. И не многие тогда верили, что такая фирма как Интел может идти не правильным путём. А потом случилось так, что по продажам АМД обогнала Интел в США. И тогда у Интел хватило смелости признать, что они не правы и что надо делать то же что и АМД, улучшать внутреннюю работу процессора, а не повышать частоту. Это Интел и спасло, и снова вывело в лидеры. С Яндексом происходит такая же ситуация. Гугл медленно, но верно догоняет Яндекс в России. Во многом благодаря самому же Яндексу. Яша только усложняет свой алгоритм. А сложно, в данном случае не означает хорошо. Что мы и видим на практике. Нельзя рубить лес так, что бы щепки летели. Это ошибка Яши. Вон, Гугл не рубит. Понимает, что есть ГС в рунете, но не рубит с плеча. Что бы не задеть нормальный сайт. А нормальный сайт всегда будет выше в выдаче, чем ГС. И Гугл это знает. И что, что с него продают ссылки. Почему бы и нет. Как по другому коммерческому сайту подняться в выдаче, что бы в конечном итоге предоставить полезную услугу юзеру, который её и ищет в ПС. Собственно я это к чему. Да к тому, что Яша всё это прекрасно понимает. Вот и начал суетиться. Рекламу наружную по улицам раскидал. Да и алгоритм свой пытается привести в порядок из последних сил. Вопрос в том, сможет ли Яша признать, что не по правильному пути идёт. Ну согласитесь со мной. Стоит только Гуглу обогнать Яшу, хотя бы на 1%, так все сразу ломанутся в него. А Яша станет как Рамблер, когда то и был лидером, но когда то кончилось. А как только все ломанутся в Гугл, отрыв от Яши начнёт резко увеличиваться. И тогда Яндексу уже будет поздно думать, что делать.... |
23.09.2009, 14:54 | #134 | |
Эксперт
|
Цитата:
хотя это уже больше флуд если Яндекс сумеет написать правильный алгоритм 1. уник вернется (а он выпадал) 2. Яша осделает серьезный шаг к формированию интеллектуальной выдачи но я в это не верю поэтому пока смотрим и ждем, пытаясь разгадать, какого результат пытаются достигнуть новые алгоритмы яндекса и как приспосабливаться к новым условиям. Либо обходить их. если все так серьезно, как пишут, декабрь-январь могут показаться раем....
__________________
выдыхаю криптон |
|
23.09.2009, 14:58 | #135 |
Эксперт
Регистрация: 25.06.2008
Адрес: ...у берега моря гляжу на ржавеющий флот
Сообщений: 1,069
Вес репутации: 273
|
В общем потратив 1,5 часа своей жизни и пообщавшись за чашкой безалкогольного пива (фу, какая гадость) с рядом понимающих в робо-поиске товарищей, выскажу совместно родившуюся крамолу по поводу происходящих событий):
Повылетали. - сайты с "уникальным" контентом, в котором есть явные нарушения семантики и лексики русского языка. Проще говоря синонимизированный текст, в котором многие (или некоторые) синонимы не применимы к данной конкретной тематике. Пример, "широкая река" - "толстая (размашистая) река") ; - сайты, содержащие в себе "последствия Файнрайдера", т.е. с многочисленными нарушениеми пунктуации, неправильных символов, технических помарок и т.д. - сайты с недостаточной трастовостью и неуникальным контентом в плане смысловой нагрузки (инет магазины, визитки, доски и т.д.). Тут скорее огрехи фильтра, чем запланированный результат. Опять же расчет на то, что действующая визитка или магазин всегда под присмотрим ВМ и в случае неправильного вылета оный напишет в ТП Я; - сайты, не несущие существенной новой смысловой нагрузки. Другими словами, например выделяется группа сайтов (а на них выделяются либо кластеры, либо ветки) о ремонте подвески в атомобилях ВАЗ, производится оценка контента в плане - размера текста, похожести гр. объектов на активной части страницы, производится десенонимизация текста (или унисинонимизация). Далее, полученная выборка делится на группы с приблизительно одинаковыми показателями, сортируется с учетом еще некоторых факторов, хвост из каждой группы убирается из индекса. + старые, проверенные фильтры никто не отменял. Остались: - сайты с высокой трастовостью вне зависимости от контента (точнее зависимость осталось "обычной"); - сайты с реально уникальным контентом, как по построению, так и по многочисленности смысловой выборки. Другими словами, если об анатомии мухи "ЦЦ" точно выдается только три ресурса, а все остальное мусор, то все три могут остаться в выборке, даже если тексты почти (либо полностью) одинаковые. - сайты с контентом (или существенной части контента), не поддающимся качественной оценке вышеописанного фильтра...называем это дело удачным бредогенератором, компоновщиком, либо очень удачной тематикой текста. - сайты, до которых еще не дошла очередь...учитывая высокую ресурсоемкость данного фильтра, скорее всего понадобится не один и даже не 5 апов, для полного прохода анализатора. Скорее переодичность может напоминать работу робота-склейщика. Синдром "10 (или 1) страниц" - все новые сайты явно не прошедшие фильтр, ставятся на отстой. Возможно что ждут перепроверки. - сайты с нарушенной логикой создания. Например, даты статей стоят мартовские, домен июльский, первое упоминание сайта (либо добавление добавление в аддурилку) в сентябре, причем страниц вывалилось этак сразу 500-600 (критическую цифру решили считать >100); - сайты с неярко выраженным показаниям к бану. Либо где бану по вышеупомянутому фильтру попала существенная (но не вся) часть страниц, а часть еще не проверялась. Как бы такая гипотеза... |
23.09.2009, 14:59 | #136 | |
Эксперт
|
Цитата:
мое ИМХО - яша сейчас ищет лучше, чем гугл хех, а не поставить ли эксперимент?...
__________________
выдыхаю криптон |
|
23.09.2009, 15:01 | #137 |
фОшЫст
|
Ну, если по инет магазинам куда ни шло - есть я-маркет, то вот визитки - им то куда идти? ))
__________________
|
23.09.2009, 15:02 | #138 |
Эксперт
|
супер а сколько сайтов анализировали? такое ощущение, что несколько сотен
__________________
выдыхаю криптон |
23.09.2009, 15:09 | #139 |
Эксперт
Регистрация: 25.06.2008
Адрес: ...у берега моря гляжу на ржавеющий флот
Сообщений: 1,069
Вес репутации: 273
|
|
23.09.2009, 15:09 | #140 |
Эксперт
Регистрация: 07.02.2009
Адрес: www
Сообщений: 1,028
Вес репутации: 224
|
Если нужно найти какую-то фирму по оказанию услуг или купить что-то, то Яндекс вне конкуренции, особенно с введением региональной выдачи - почти весь топ в тему.
Но если нужно решить какую-то проблему, найти варианты решения и т.п. информацию - больше пользы от гугла. (на основе моего опыта). |