Вернуться   Форум SAPE.RU > Система SAPE.ru > Пожелания пользователей системы

-->
Ответ
 
Опции темы
Старый 09.04.2012, 18:12   #11
Специалист
 
Регистрация: 25.04.2008
Сообщений: 135
Вес репутации: 200
Langly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человек
По умолчанию

Цитата:
Сообщение от zhegloff Посмотреть сообщение
Директивой disallow. Список непроиндексированных страниц же есть у вас...
Наоборот.
Суть в том, что в яндекс вебмастере есть список проиндексированных страниц. Нужно именно их скормить сапаботу. А он хавает все подряд.
А списка непроиндексированных у меня нет. Да если бы и был, представьте робот в котором тысяч 7-10 директив типа
Disallow: /категория/подкатегория/id-название_статьи_транслитом.html
Это нереально.
Langly вне форума   Ответить с цитированием
Старый 09.04.2012, 18:13   #12
Banned
 
Регистрация: 23.04.2009
Адрес: Глобус Украины
Сообщений: 790
Вес репутации: 0
cherep777 - весьма и весьма положительная личностьcherep777 - весьма и весьма положительная личность
По умолчанию

а идею со спец.файлом для сапе поддерживаю
cherep777 вне форума   Ответить с цитированием
Старый 09.04.2012, 18:14   #13
Добрый модератор
 
Аватар для zhegloff
 
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1025
zhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущее
По умолчанию

Цитата:
Сообщение от Langly Посмотреть сообщение
Суть в том, что в яндекс вебмастере есть список проиндексированных страниц. Нужно именно их скормить сапаботу. А он хавает все подряд.
Составьте правильную карту сайта


Цитата:
Сообщение от Langly Посмотреть сообщение
А списка непроиндексированных у меня нет.
А что ж вы там Винкоплагином то проверяли?


Цитата:
Сообщение от Langly Посмотреть сообщение
Да если бы и был, представьте робот в котором тысяч 7-10 директив типа
Disallow: /категория/подкатегория/id-название_статьи_транслитом.html
Это нереально.
Почему?
__________________
Установка кода сапы от $9.95. Пишите в личку.
Правильный хостинг.
В личке бесплатно не отвечаю обычно.
zhegloff вне форума   Ответить с цитированием
Старый 09.04.2012, 18:20   #14
Куриллочный троль
 
Аватар для Клон
 
Регистрация: 15.03.2010
Сообщений: 8,483
Вес репутации: 521
Клон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущее
Отправить сообщение для Клон с помощью ICQ
По умолчанию

Цитата:
Сообщение от zhegloff Посмотреть сообщение
Почему?
потому что это ведь думать и что-то делать прийдеццо, а они хотяд ничего не делая, все и сразу =))
__________________
2013 год. В прошлом апокалипсис. Страшный апокалипсис. Гнилой апокалипсис. Просто чмо
Клон вне форума   Ответить с цитированием
Старый 09.04.2012, 18:28   #15
Banned
 
Регистрация: 23.04.2009
Адрес: Глобус Украины
Сообщений: 790
Вес репутации: 0
cherep777 - весьма и весьма положительная личностьcherep777 - весьма и весьма положительная личность
По умолчанию

Цитата:
Сообщение от Клон Посмотреть сообщение
потому что это ведь думать и что-то делать прийдеццо
чё думать? как сделать роботс размером 5000 строк?
cherep777 вне форума   Ответить с цитированием
Старый 09.04.2012, 18:35   #16
Специалист
 
Регистрация: 25.04.2008
Сообщений: 135
Вес репутации: 200
Langly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человек
По умолчанию

Цитата:
Сообщение от zhegloff Посмотреть сообщение
Составьте правильную карту сайта
:-)))
Нет, вы все-таки суть и не поняли...
Суть в том, что паук гребет все подряд страницы. Я предлагаю дать ему список только проиндексированных, чтобы он только их взял и не парсил все остальные.
Как я в карте сайта укажу проиндексированные страницы без непроидексированных? Сайтмап у меня из админки создается нажатием кнопки. Вручную его чтоли делать? А толку? Паук пойдет один черт по всем страницам независимо от сайтмапа. Доказать очень просто, представьте, на сайте 100 страниц, в сайтмапе я укажу одну-единственную. Сколько паук саповский отпарсит страниц, одну или 100?
Цитата:
Сообщение от zhegloff Посмотреть сообщение
А что ж вы там Винкоплагином то проверяли?
То что сапобот напарсил в индексе/не в индексе.

Цитата:
Сообщение от zhegloff Посмотреть сообщение
Почему?
Объем представьте. Подавится и сапабот и поисковик :-)))
Да и не дело это в роботе всяко ненужно писать. По закону подлости в этот самый момент поисковые пауки навалятся. Плюс гемору сколько с его изготовлением итд. Это просто очень неудобно.
PS Вот это я не правильно написал:
"Да если бы и был, представьте робот в котором тысяч 7-10 директив типа
Disallow: /категория/подкатегория/id-название_статьи_транслитом.html"
Чтобы так прописать в роботе, сначала придется отпарсить весь сайт чем-то типа сайтмап генератора, затем удалить всё лишнее, оставив только чистые урлы, затем спарсить все проиндексированные урлы из ЯВ, затем сравнить оба файла и из первого удалить все проиндексированные, чтобы остались только урлы которые не в индексе, а вот их уже в виде Disallow: /категория/подкатегория/id-название_статьи_транслитом.html писать в робот.
Вы представляете весь этот процесс?

Добавлено через 2 минуты
Цитата:
Сообщение от Клон Посмотреть сообщение
потому что это ведь думать и что-то делать прийдеццо, а они хотяд ничего не делая, все и сразу =))
Ну я выше процесс описал, вы считаете что это оптимальный вариант? :-)))

Последний раз редактировалось Langly; 09.04.2012 в 18:35. Причина: Добавлено сообщение
Langly вне форума   Ответить с цитированием
Старый 09.04.2012, 18:38   #17
Куриллочный троль
 
Аватар для Клон
 
Регистрация: 15.03.2010
Сообщений: 8,483
Вес репутации: 521
Клон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущее
Отправить сообщение для Клон с помощью ICQ
По умолчанию

Цитата:
Сообщение от Langly Посмотреть сообщение
Нет, вы все-таки суть и не поняли...
это вы не поняли суть =))
__________________
2013 год. В прошлом апокалипсис. Страшный апокалипсис. Гнилой апокалипсис. Просто чмо
Клон вне форума   Ответить с цитированием
Старый 09.04.2012, 18:39   #18
Специалист
 
Регистрация: 25.04.2008
Сообщений: 135
Вес репутации: 200
Langly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человек
По умолчанию

Цитата:
Сообщение от Клон Посмотреть сообщение
это вы не поняли суть =))
Так и в чем же-ж, она родимая, заключается :-))
Langly вне форума   Ответить с цитированием
Старый 09.04.2012, 18:40   #19
Куриллочный троль
 
Аватар для Клон
 
Регистрация: 15.03.2010
Сообщений: 8,483
Вес репутации: 521
Клон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущееКлон - прекрасное будущее
Отправить сообщение для Клон с помощью ICQ
По умолчанию

ну Мурзик написал же =)
Цитата:
Сообщение от zhegloff Посмотреть сообщение
Составьте правильную карту сайта
__________________
2013 год. В прошлом апокалипсис. Страшный апокалипсис. Гнилой апокалипсис. Просто чмо
Клон вне форума   Ответить с цитированием
Старый 09.04.2012, 18:49   #20
Специалист
 
Регистрация: 25.04.2008
Сообщений: 135
Вес репутации: 200
Langly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человекLangly - очень-очень хороший человек
По умолчанию

Прочтите что я по этому поводу написал выше.

Добавлено через 5 минут
Цитата:
Сообщение от Langly Посмотреть сообщение
Паук пойдет один черт по всем страницам независимо от сайтмапа. Доказать очень просто, представьте, на сайте 100 страниц, в сайтмапе я укажу одну-единственную. Сколько паук саповский отпарсит страниц, одну или 100?
Карта сайта не отображает непроиндексированные/проиндексированные страницы.
Можно вручную сделать сайтмап, но смысла нет, паук пойдет дальше, сайтмап не ограничивает его передвижений по сайту.

Цитата:
Сообщение от Langly Посмотреть сообщение
...сначала придется отпарсить весь сайт чем-то типа сайтмап генератора, затем удалить всё лишнее, оставив только чистые урлы, затем спарсить все проиндексированные урлы из ЯВ, затем сравнить оба файла и из первого удалить все проиндексированные, чтобы остались только урлы которые не в индексе, а вот их уже в виде Disallow: /категория/подкатегория/id-название_статьи_транслитом.html писать в робот.
Вы представляете весь этот процесс?
Или из этого сделать сайтмап. То есть что робот, что сайтмап чтобы составить нужно вот это все сделать.

Добавлено через 1 минуту
При этом, как я выше сказал, сайтмап не ограничивает робота в индексации. Робот возьмет все что найдет - есть оно в сайтмапе или нет.
Ограничить может robots.txt Но и про него я написал.

Последний раз редактировалось Langly; 09.04.2012 в 18:49. Причина: Добавлено сообщение
Langly вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Переиндексация нового сайта (при изменении адресов страниц) baya Общие вопросы оптимизации 4 06.10.2011 14:18
Индексация нового сайта jeka66 Вопросы по работе системы 0 25.08.2011 12:14
Индексация нового сайта latseo Вопросы от новичков 5 10.04.2011 01:43
индексация нового сайта.найдена 1 стр! romareo Ошибки при работе с системой 0 29.10.2009 17:25
Индексация нового сайта. Tony Soprano Яндекс 5 18.09.2009 03:49


Часовой пояс GMT +3, время: 09:12.