Форум SAPE.RU - Почему вылетели из индекса?

Форум SAPE.RU (http://forum.sape.ru/index.php)

- Яндекс (http://forum.sape.ru/forumdisplay.php?f=16)

- - Почему вылетели из индекса? (http://forum.sape.ru/showthread.php?t=35543)

Почему вылетели из индекса?

Не могу понять почему у меня не давно стали выпадать из индекса сайты на вп. Все они свежие и только недавно робот их проиндексировал, сразу выпали из индекса. Ни когда токого не было, обычно даже самые гс и хотя бы месяц проживут, а тут неделя не прошла . Пока добавлял несколько в сапу, опять один выпал. Еще некоторые проверял через сайт аудитор: одним запросом находит (вторым) страницы а другим нет
http://yandex.ru/yandsearch?text=&si..._manually=true
http://yandex.ru/yandsearch?serverurl=oklemvs.ru
Домены зарегистрированы не в один день, хуизы разные, несколько регистраторов, разные Ip, не перелинкованы, шаблоны уникальные на каждом и не обычный копипаст (синонимизированный). Многие статьи дают 100% уникальность через DCFINDER.

anyhow
Имхо сейчас синонимонизация, разрушение шинглов в таком примитивном виде, как обычно предлагается сейчас - это все туфта. Я не вижу никаких сложностей в определении тождественности текстов, даже если в них каждое слово будет синонимизированно. И никакой метод шинглов тут не требуется - все намного проще.

anyhow, на период летних каникул Яндекс приостановил индексацию новых "сайтов", вы не знали?

Цитата:

Сообщение от boric (Сообщение 522990)

синонимизацию сложно пропалить когда своя база слов на несколько десятков тыс. слов. Тем более даже копипаст живет не плохо если правильно его использовать. Дело здесь не в контенте. Может быть из за хостинга или просто яндекс решил банить все подряд на wp.

Добавлено через 1 минуту

Цитата:

Сообщение от Atomic (Сообщение 522991)

anyhow, на период летних каникул Яндекс приостановил индексацию новых "сайтов", вы не знали?

нет, не знал.

Цитата:

Сообщение от boric (Сообщение 522990)

Имхо сейчас синонимонизация, разрушение шинглов в таком примитивном виде, как обычно предлагается сейчас - это все туфта. Я не вижу никаких сложностей в определении тождественности текстов, даже если в них каждое слово будет синонимизированно. И никакой метод шинглов тут не требуется - все намного проще.

А расскажите немножко об этом, а?
:)

Цитата:

Сообщение от Йода (Сообщение 523004)

А расскажите немножко об этом, а?
:)

это больше похоже на признаки внедрения искуственного интеллекта в алгоритм яндекса. :) Если у яндекса нету такой же базы синонимов то обнаружить и тем более забанить это уже из области фантастики.

anyhow

Цитата:

синонимизацию сложно пропалить когда своя база слов на несколько десятков тыс. слов.

Не имеет никакого значения какая база синонимом была использована, если, конечно, она сохраняет смысловую связь между словами.

Цитата:

Сообщение от anyhow (Сообщение 523007)

похоже на признаки внедрения искуственного интеллекта в алгоритм яндекса

1. Скажите, а вы знаете признаки внедрения ии? Не просвятите?
2. Сегалович- один из признанных гуру по ии в мире;
3. В Яндексе эвристики и семантических штуковин больше чем у некоторых в мозгу; А как известно, компьютерная семантика- это одна из областей ии..

вот както так
:)

Йода

Цитата:

А расскажите немножко об этом, а?

Это же все очевидно и решение лежит на поверхности. Как при морфологическом анализе словоформа приводится к исходной форме (лемме) и заносится в индекс, так и с синонимами можно поступить также - словоформу привести к исходной форме, а потом ее по словарю синонимов привести, например, к первому слову в строке синонимов. Другой вариант - сравнивать тексты по морфологическим схемам падежей, родов, чисел (мн., ед.) и пр. Если эта структура сильно совпадает для двух текствов, то велика вероятность, что и сами тексты идентичны. Это то, что сразу в голову приходит.

Цитата:

Сообщение от boric (Сообщение 523017)

На мой взглад, это то, что если и приходит сразу в голову, то сразу из нее и выходит. Потомучто этот путь- он конечно идеален- каждое уникальное знание будет представлено в индексе только один раз. Но у нас пока до этого не дошло. Пока всетаки яндекс оперирует текстами, а не знаниями. А раз так, то тексты

Цитата:

по дороге ехал броневик

Цитата:

по шоссе мчался армейский бронированный джип

будут считаться разными, несмотря на то, что и содержут одинаковое знание.
Значит всетаки вы неправы насчет того что синонимии яндексом убираются.
Имхо.
:)