15.11.2009, 06:27 | #1 |
Специалист
Регистрация: 17.07.2009
Сообщений: 478
Вес репутации: 196
|
Синонимизация размышления о перспективах
Хотел услышать мнение профессионалов в ответ на мои вольные размышления не тему...
1) Синонимизированные статьи с натяжкой можно назвать текстом для людей, много косяков даже если использовать хорошие проги и базы. Так? 2) Технически в принципе возможно сделать алгоритм который определяет что текст Синонимизирован. Так? 3) Пока Яндекс далеко не всегда просекает Синонимизированные тексты, вероятно потому что на это нужны дополнительные вычислительные мощьности и доработка алогоритма который адекватно будет палить. 5) В обозримом будущем можно ожидать от поисковиков появления более совершенных алгоритмов соответственно большая часть синонимизированных текстов будет пропалена и к сайтам на которых такие тексты находятся будут применяться фильтры и санкции. Общий вывод: использование на сайте даже небольшого количества Синонимизированного контента чревато последствиями в ближайшем будушем когда алгоритмы распознования станут более совершенными... |
15.11.2009, 06:52 | #2 | |
пусто
Регистрация: 28.10.2007
Сообщений: 3,115
Вес репутации: 375
|
профессионалы не занимаются синонимайзингом
1) И так и не так, если своя база, то можно сделать текст максимально читабельным, но вот я писал свою базу, а потом забил, потому что писать пришлось бы лет эдак 15 2) Ну копискейп видит плагиат синонимизированный, значит технологию сделать реально 3) Ему нужен искусственный мозг 4) ?... 5) Мне кажется, что УЖЕ применяются такие фильтры Цитата:
если же делать свою базу, где будут учтены все нюансы или хотя бы большинство, то все будет нормально. а подозрительные слова в предложениях глазами яндекса буду восприниматься как опечатки
__________________
|
|
15.11.2009, 07:00 | #3 | |||||
Специалист
Регистрация: 14.08.2007
Сообщений: 101
Вес репутации: 0
|
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Пока писал - меня опередили ) |
|||||
16.11.2009, 20:53 | #4 |
Новичок
Регистрация: 31.12.2008
Адрес: Фввкуыы
Сообщений: 23
Вес репутации: 0
|
treningdom, отличный вопрос Вы подняли, мне кажется весьма злободневный.
Сугубо ИМХО: 1. Синонимизированный текст может быть вполне читаемым, другой вопрос что он почти всегда создан для поисковых роботов. Поэтому особого какая разница, читаем ли он, главное чтобы не выпадал из индекса. А вот с этим то как раз сейчас проблемы. 2,3. Опять же, сугубо ИМХО, долгое время яндексу было параллельно на наличие синонимизированных текстов в индексе. Но сейчас они составляют основную часть контента сателлитов. А влияние сателлитов на выдачу растет с каждым днем из-за увеличения их числа. Поэтому яндекс вводит фильтры на синонимизированный контент. АГС17 - типичный пример такого фильтра. В отлове синонимизированных текстов я не вижу никаких существенных проблем. Возьмем три текста: Сей текст уникален Данный контент авторский Текущая статья единственная и десинонимизируем по такой вот базе синонимов: Сей, Данный, Текущая: Этот текст, контент, статья: спам уникален, авторский, единственная: уныл Сравнение же приведенного десинонимизированного контента тем более не является проблемой, подкрутят еще алгоритмы и это станет видно невооруженным глазом. А с выводами Вашими трудно не согласиться, да... Не исключено, что будет лучше держать на сайте умеренное количество копипаста, чем тот же объем синонимайза, поскольку это прямое указание на то, что сайту не место в индексе |
16.11.2009, 21:41 | #6 | ||||
Эксперт
Регистрация: 18.06.2007
Адрес: Картофель
Сообщений: 2,417
Вес репутации: 361
|
Цитата:
Цитата:
Цитата:
Цитата:
и уник ваш вылетит на ура через несколько АПов, - достаточно лишь просто уронить траст ниже плинтуса и БАН придет сам |
||||
05.08.2010, 02:21 | #7 |
Новичок
Регистрация: 28.07.2010
Сообщений: 9
Вес репутации: 0
|
Но ведь если брать тексты, синонимизированные Баззингой (http://bazzinga.org/) - ведь текст получается читаемый почти на 100%. Читается человек идеально, но при это страдает уникальность - не так много слов заменяется, как хотелось бы. В результате имеем идеальный текст с точки зрения читаемости но не идеальный с точки зрения уникальности.
Что делать? Только развивать и развивать базы. Но КАК Яндекс определит уникальность этой синонимизированной статьи? Очень просто - для того есть шинглы. Они в яндексе не просто фигню придумывают, а занимаются наработкой всех этих алгоритмов и баз тоже. А команда у них намного больше, чем у любого синонимизатора. Поэтому они на сто шагов впереди и нам остается только делать выводы из собственного опыта: синонимизировать, размещать и наблюдать. А сервис этот - баззинга действительно хорошо делает, люди трудятся над сервисом. "Деревянный скворечник" заменяет на "скворечник, сделанный из дерева" и обратно, и все подобные обороты заменяет. Вообще очень хорошо проработаны нюансы, фразы заменяются, слова целые, плюс законы Зипфа участвуют в разработке. Но опять же - процент синонимизации. Статьи получаются не бредовые, а читаемые. И мне бы хотелось довести синонимизацию до максимального процента, но уже то, что мы имеем сегодня позволяет нам скармливать поисковикам синонимизированные статьи как оригинал, главное - читаемость. Я видел мнжество синонимизаторов и ни один из них не давал читаемость. Вообще. Даже приблизительной. Эта баззинга, о которой я говорю, больше всего понравилась, потому и упоминаю. Но из всего, что можно узнать в интернете о синонимизации, можно сделать вывод: законы Зипфа и читаемость - важнейший критерий. Я добавил кучу статей втупую синонимизированных простым синонимизатором и они вылетели через неделю уже! Потому что яндексу не нужен набор слов. |
05.08.2010, 09:26 | #8 |
Специалист
Регистрация: 19.11.2009
Сообщений: 157
Вес репутации: 186
|
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Программа синонимизация с учетом морфологии русского языка WordSyn | vtomas | Софт для оптимизаторов и вебмастеров | 50 | 09.02.2010 17:46 |
Синонимизация и рерайт для бирж статей | Gothic | Софт для оптимизаторов и вебмастеров | 17 | 11.01.2010 18:56 |
Размышления об АП Гугла | Бедуин | Google, MSN, Yahoo | 32 | 11.11.2007 19:04 |
Размышления о слипах | timtroll | Курилка | 7 | 30.07.2007 18:28 |
Часовой пояс GMT +3, время: 01:52.