Описание тегов META TITLE и файл robots.txt

Подробней о тегах < META >,< TITLE > и файле robots.txt

Начнем по порядку
Поговорим о том, что заключено между <HEAD> и </HEAD>
Пример с этой странички
Первым делом идет тег <TITLE>Подробней о тегах META , TITLE и файле robots.txt</TITLE> Информацию между <TITLE></TITLE> Читают практически все поисковые роботы, она является приоритетной. Один маленький нюанс - желательно чтобы информация между этими тегами не превышала 75 знаков, в некоторых случаях и меньше. Если Вы превышаете это значение, то может быть несколько вариантов:
1. Лишний текст будет просто-напросто отрезан.
2. Вам могут отказать от регистрации. (Наших поисковые системы Вам не откажут) :)))

Теперь о теге <META>
Ключевые слова для поиска.
<META NAME="KeyWords" CONTENT="Подробней,тегах,META ,TITLE,
файле,robots.txt">
Вводите ключевые слова, через запятую. После запятой пробел не обязателен. Поскольку западные поисковые системы более разговорчивы, могу сказать одно - им это нравится! :))) Причем основное число индексируемых слов варьируется от 9 до 15. Учитывая этот факт, Вы должны в правильном порядке расставить ключевые слова. Если Вы вписываете больше ключевых слов, чем 15, никто ничего плохого Вам не скажет. Принято считать, что слова написанные подряд без запятой будут засчитываться как выражение.
Например
CONTENT="слово,слово,ключевое выражение,слово,слово" На сколько это является правдой не могу судить, а те, что разговорчивые по умолчанию этого не понимают. Есть еще и такое понятие как чрезмерное использование одного и того же слова, СПАМ. Вам просто откажут в регистрации.

Описание
<META NAME="Description" CONTENT="Подробней о тегах META TITLE и файле robots.txt>
Краткое описание содержимого странички. Основная част около 160 знаков.
Не желательно использование спец символов.

META для робота :)))
<META NAME="robots" CONTENT="команды для робота, через запятую">

Комбинируя ниже перечисленные команды вы можете управлять действиями робота.
NONE говорит всем роботам игнорировать эту страницу при индексации.

ALL разрешает индексировать эту страницу и все ссылки из нее.

INDEX разрешает индексировать эту страницу.

NOINDEX не разрешает индексировать эту страницу.

FOLLOW разрешает индексировать все ссылки из этой страницы.

NOFOLLOW не разрешает индексировать ссылки из этой страницы.

Одно могу сказать от себя. Все роботы ведут себя по-разному.
Приведу пример.
Установил значение для робота ALL. Yandex и Rambler его дружно проигнорировали. Пришлось в ручную регистрировать ключевые страницы.

Один из самых эффективных способов, это когда ссылки с главной страницы ведут только на другие страницы вашего ресурса.
Исходя из этого, надо ненадолго отложить регистрацию в каталогах и рейтингах :))) В среднем, чтобы Ваш сайт был проиндексирован нужна неделя. Если это Yandex, Rambler или Aport. Yandex и Rambler индексируют новые ресурсы в выходные, а Aport на неделе. В зарубежных поисковых системах, если Вы регистрируете свой сайт на бесплатно, можно ждать не один месяц...

И на последок.
Поисковый робот может вообще потерять ссылку на Ваш сайт :))) Так что следите в оба!

Есть еще куча используемых значений в теге META, но они имеют вспомогательный характер и мало влияют на индексацию.

Теперь о файле robots.txt
Эта штука находиться в корне каталога, более действенна и полезна :))
Практически все поисковые системы заходя на сайт первым делом ищут файлик robots.txt некоторые поисковые роботы не найдя оного, просто уйдут с Вашего сайта :(
Что же это за штука такая и где она должна лежать? А лежать она должна в корне вашего сайта в виде простого файла в формате .txt Делов то :)))
А самое интересное, что написать его в принципе может каждый. Надо-то всего две строчки. (условно)

User-agent: *
Disallow:

User-agent:
- обращение к поисковым роботам
* - означает, что обращение касается всех роботов!
User-agent: Yandex - обращение к конкретному поисковому роботу.

Disallow: / - запретить индексировать все!
Disallow: - разрешить индексировать все. (В свое время получить информацию о том, как разрешить индексировать все, оказалось не так просто :)) )
Disallow: /cgi-bin/ - запретить индексацию конкретного каталога.
Disallow: /main/sekret.html - запретить индексацию конкретной страницы находящейся в каталоге main. (вместо sekret.html может быть указан любой файл)

Примеры написания:

User-agent: *
Disallow:

Всем все можно

User-agent: *
Disallow:
/

Всех в сад. (Всем все запрещено)

User-agent: *
Disallow:


User-agent: Aport
Disallow: /

Всем все можно, а Апорту ничего нельзя

User-agent: *
Disallow: /gif/ /pictures/

Всем роботам нельзя индексировать каталоги GIF и Pctures

Тоже самое можно написать по другому
User-agent: *
Disallow: /gif/

Disallow: /pictures/


Еще подробней :)

Открываем НотеПад(NotePad)
Создаем новый файл.
Пропускаем первую строчку
Далее пишем
User-agent: *
Disallow:

(Все что мы хотим сказать всем роботам)
Если у нас есть необходимость в ограничении действий какого-нибудь конкретного робота, пропускаем строчку и пишем обращение специально для него.
Пропускаем строчку и сохраняем файл как robots.txt
Копируем файл в корневую директорию сайта.

ВСЕ!!!!!!!!!
(Вытирая пот со лба) 8)))

Если у Вас есть замечания или дополнения.
Пишите webcentre@yandex.ru


НА ГЛАВНУЮ


Hosted by uCoz