Официальный партнер проекта: компания "ПРОФИ" - Бухгалтерские услуги
Поделитесь ссылкой
Радио и TV онлайн :
Наши друзья:
| Управление роботами |
Управление роботамиКак же вебмастер может управлять поведением поисковых роботов на своем сайте? Как уже было сказано выше, в 1994 году в результате открытых дебатов вебмастеров был разработан специальный протокол исключений для роботов. До настоящего времени этот протокол так и не стал стандартом, который обязаны соблюдать все без исключения роботы, оставшись лишь в статусе строгих рекомендаций. Не существует инстанции, куда можно пожаловаться на робота, не соблюдающего правила исключений, можно лишь запретить доступ к сайту уже с помощью настроек веб-сервера или сетевых интерфейсов для IP-адресов, с которых "неинтеллигентный" робот отсылал свои запросы. Однако роботы крупных поисковых систем соблюдают правила исключений, более того, вносят в них свои расширения. Об инструкциях специального файла robots . txt и о специальном мета-теге robots подробно рассказывалось в главе 6 "Как сделать сайт доступным для поисковых систем". С помощью дополнительных инструкций Brobots.txt, которых нет в стандарте, некоторые поисковые системы позволяют более гибко управлять поведением своих роботов. Так, с помощью инструкции Crawl-delay вебмастер может устанавливать временной промежуток между последовательными запросами двух документов для роботов Yahoo! и MSN, а с помощью инструкции Host указать адрес основного зеркала сайта для Яндекса. Однако работать с нестандартными инструкциями в robots . txt следует очень осторожно, поскольку робот другой поисковой системы может проигнорировать не только непонятную ему инструкцию, но и весь набор правил, связанных с ней. Управлять посещениями поисковых роботов можно и косвенно, например, робот поисковой системы Google чаще будет повторно забирать те документы, на которые много ссылаются с других сайтов.
Выводы Роботы — необходимая и очень важная составная часть поисковых систем. Если представить поисковую систему как "черный ящик", где выдача результатов поиска — это "выход" системы, то поисковые роботы — это "вход", на который поступают документы. Если грамотно подавать свои страницы на этот "вход", управляя поведением поискового робота, можно добиться лучших результатов индексации — периодичности, полноты и лучшего ранжирования. Полезные ссылки
|
