Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Яндекс (http://forum.sape.ru/forumdisplay.php?f=16)
-   -   Почему вылетели из индекса? (http://forum.sape.ru/showthread.php?t=35543)

anyhow 03.08.2009 19:00

Почему вылетели из индекса?
 
Не могу понять почему у меня не давно стали выпадать из индекса сайты на вп. Все они свежие и только недавно робот их проиндексировал, сразу выпали из индекса. Ни когда токого не было, обычно даже самые гс и хотя бы месяц проживут, а тут неделя не прошла . Пока добавлял несколько в сапу, опять один выпал. Еще некоторые проверял через сайт аудитор: одним запросом находит (вторым) страницы а другим нет
http://yandex.ru/yandsearch?text=&si..._manually=true
http://yandex.ru/yandsearch?serverurl=oklemvs.ru
Домены зарегистрированы не в один день, хуизы разные, несколько регистраторов, разные Ip, не перелинкованы, шаблоны уникальные на каждом и не обычный копипаст (синонимизированный). Многие статьи дают 100% уникальность через DCFINDER.

boric 03.08.2009 19:13

anyhow
Имхо сейчас синонимонизация, разрушение шинглов в таком примитивном виде, как обычно предлагается сейчас - это все туфта. Я не вижу никаких сложностей в определении тождественности текстов, даже если в них каждое слово будет синонимизированно. И никакой метод шинглов тут не требуется - все намного проще.

Atomic 03.08.2009 19:14

anyhow, на период летних каникул Яндекс приостановил индексацию новых "сайтов", вы не знали?

anyhow 03.08.2009 19:22

Цитата:

Сообщение от boric (Сообщение 522990)
anyhow
Имхо сейчас синонимонизация, разрушение шинглов в таком примитивном виде, как обычно предлагается сейчас - это все туфта. Я не вижу никаких сложностей в определении тождественности текстов, даже если в них каждое слово будет синонимизированно. И никакой метод шинглов тут не требуется - все намного проще.

синонимизацию сложно пропалить когда своя база слов на несколько десятков тыс. слов. Тем более даже копипаст живет не плохо если правильно его использовать. Дело здесь не в контенте. Может быть из за хостинга или просто яндекс решил банить все подряд на wp.

Добавлено через 1 минуту
Цитата:

Сообщение от Atomic (Сообщение 522991)
anyhow, на период летних каникул Яндекс приостановил индексацию новых "сайтов", вы не знали?

нет, не знал.

Йода 03.08.2009 19:31

Цитата:

Сообщение от boric (Сообщение 522990)
Имхо сейчас синонимонизация, разрушение шинглов в таком примитивном виде, как обычно предлагается сейчас - это все туфта. Я не вижу никаких сложностей в определении тождественности текстов, даже если в них каждое слово будет синонимизированно. И никакой метод шинглов тут не требуется - все намного проще.

А расскажите немножко об этом, а?
:)

anyhow 03.08.2009 19:36

Цитата:

Сообщение от Йода (Сообщение 523004)
А расскажите немножко об этом, а?
:)

это больше похоже на признаки внедрения искуственного интеллекта в алгоритм яндекса. :) Если у яндекса нету такой же базы синонимов то обнаружить и тем более забанить это уже из области фантастики.

boric 03.08.2009 19:37

anyhow
Цитата:

синонимизацию сложно пропалить когда своя база слов на несколько десятков тыс. слов.
Не имеет никакого значения какая база синонимом была использована, если, конечно, она сохраняет смысловую связь между словами.

Йода 03.08.2009 19:41

Цитата:

Сообщение от anyhow (Сообщение 523007)
похоже на признаки внедрения искуственного интеллекта в алгоритм яндекса

1. Скажите, а вы знаете признаки внедрения ии? Не просвятите?
2. Сегалович- один из признанных гуру по ии в мире;
3. В Яндексе эвристики и семантических штуковин больше чем у некоторых в мозгу; А как известно, компьютерная семантика- это одна из областей ии..

вот както так
:)

boric 03.08.2009 19:46

Йода
Цитата:

А расскажите немножко об этом, а?
Это же все очевидно и решение лежит на поверхности. Как при морфологическом анализе словоформа приводится к исходной форме (лемме) и заносится в индекс, так и с синонимами можно поступить также - словоформу привести к исходной форме, а потом ее по словарю синонимов привести, например, к первому слову в строке синонимов. Другой вариант - сравнивать тексты по морфологическим схемам падежей, родов, чисел (мн., ед.) и пр. Если эта структура сильно совпадает для двух текствов, то велика вероятность, что и сами тексты идентичны. Это то, что сразу в голову приходит.

Йода 03.08.2009 19:52

Цитата:

Сообщение от boric (Сообщение 523017)
Это же все очевидно и решение лежит на поверхности. Как при морфологическом анализе словоформа приводится к исходной форме (лемме) и заносится в индекс, так и с синонимами можно поступить также - словоформу привести к исходной форме, а потом ее по словарю синонимов привести, например, к первому слову в строке синонимов. Другой вариант - сравнивать тексты по морфологическим схемам падежей, родов, чисел (мн., ед.) и пр. Если эта структура сильно совпадает для двух текствов, то велика вероятность, что и сами тексты идентичны. Это то, что сразу в голову приходит.

На мой взглад, это то, что если и приходит сразу в голову, то сразу из нее и выходит. Потомучто этот путь- он конечно идеален- каждое уникальное знание будет представлено в индексе только один раз. Но у нас пока до этого не дошло. Пока всетаки яндекс оперирует текстами, а не знаниями. А раз так, то тексты
Цитата:

по дороге ехал броневик
и
Цитата:

по шоссе мчался армейский бронированный джип
будут считаться разными, несмотря на то, что и содержут одинаковое знание.
Значит всетаки вы неправы насчет того что синонимии яндексом убираются.
Имхо.
:)


Часовой пояс GMT +3, время: 22:12.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.