Форма входа
Меню сайта
Главное Меню
Главная страница
Помощь Web мастеру
Связь с админом
Залить фото
Статьи
Форум
Всё для ucoz
Шаблоны для форума
Светлые шаблоны
Тёмные шаблоны
Иконки групп
Иконки разные
Скрипты
Другое
Темы форума
Бесплатные услуги
Раскрутка сайтов
Аренда(реклама)
Заработок
Клик-Клик



Календарь
Опрос
Откуда вы узнали о нас?
Всего ответов: 382
Архив сайта
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Облоко тэгов
Персональная страница пользователя Скрипт от ucozon скачивание с депозита в окне ajax для uCoz counter strike еще одиндля Ucoz 10 рекламных баннеров Властелин колец Черный шаблон GTA с рабочим конструктором РИП шаблона сайта samp-team.org.ua Шаблон By Nver для ucoz Block Games New Скрипт для ucoz Кнопка выделить всё для форума Регистрация после прочтения правил Игра счасливый фермер у вас на сайте для uCoz Пак кнопок для UcoZ Еще вид новостей ucoz Кнопки Download в стиле Web 2.0 для ucoz Downloads icon by Dim4ik Cкачать шаблон Counter-Strike для ucoz Blue шаблон для Форума Анимация для uCoz Форум для MediaPortal (зелёный)
Наш банер
Всё для ucoz

Мини-чат
Тэги сайта

скрипты для ucoz, ucoz, шаблоны для ucoz, иконки групп для ucoz, гсщя, всё для ucoz, скачать бесплатно шаблоны для ucoz, скрипты для ucoz без регистрации

Главная » Статьи » Статьи про всё

Как работает робот и как регистрироваться в поиске Yandex

Робот, или паук, или червь, или crawler,
или сетевой агент - программа обхода Сети.
Базовой информацией для работы этой программы
является список адресов (URL). Дополнительная
информация берется из robots.txt (файла, в котором
Web-администратор может запретить роботу заходить
на те или иные разделы сайта). В самом общем случае робот предназначен для
скачивания страниц по указанным адресам в место,
указанное его хозяином.

Помимо robots.txt существуют и другие
джентельменские соглашения для работы роботов -
например, он не должен делать более одного
коннекта, чтобы не забить канал и дать
возможность другим пользователям Сети общаться
с данным сервером.

Для поисковой машины Yandex.Ru в состав
робота входят еще модули индексации,
распознавания кодировок (если на странице
содержится русский язык) и определения
уникальности документа.

Как Yandex.Ru узнает о новых ресурсах

Как Yandex.Ru узнает о новых серверах и
страницах? Есть два способа - или владельцы
ресурсов сами добавляют их (заполнив форму AddURL на
http://yandex.ru/addurl.html или
послав письмо на addurl@yandex.ru), или робот находит
новые ссылки в проиндексированных страницах.
Так, например, с первой страницы сервера робот
берет ссылки на последующие и так далее, без
ограничения глубины, до тех пор, пока новые
адреса не перестанут появляться.

Поскольку задачей Yandex.Ru является
работа с русско-язычным и/или
российско-ориентированным Интернетом, введено
следующее правило: сервера в доменах России и
стран СНГ ('su', 'ru', 'am', 'az', 'by', 'ge', 'kg', 'kz', 'md', 'tj', 'ua', 'uz')
принимаются по умолчанию. Сервера в других
доменах - если на них найден русский язык или если
владельцы ресурсов убедят администрацию
поисковой машины в том, что их сервер подпадает
под указанную категорию (это обычно делается
письмом на addurl@yandex.ru).

Итак, не удивляйтесь, если URL, который
Вы добавляете, уже есть в базе робота. Наш робот
мог найти Ваш URL по ссылкам из других
проиндексированных документов. Не стоит также
огорчаться, если при этом Вы не можете найти этот
документ в Yandex. Наверняка наш "паук" просто
еще не успел дойти до Вашего документа, и он будет
проиндексирован через несколько дней.

Категория: Статьи про всё | Добавил: autumn (30.07.2010)
Просмотров: 578 | Комментарии: 1 | Теги: поиске, работает, робот, КАК, yandex, регистрироваться | Рейтинг: 0.0/0
Всего комментариев: 1
1 Иван  
0
Играть в игровые автоматы у нас на сайте http://bunchofslots.ru

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]