Как работает поиск в Google

Каждый веб-мастер должен понимать, как поисковые роботы ранжируют и индексируют сайты. Это поможет добиться значимых результатов и вывести ресурс в ТОП поисковой выдачи намного быстрее.

 

Итак, анатомия поисковых роботов:

  • URL-сервер составляет и отправляет списки адресов сайтов, страниц для последующего сканирования;
  • поисковики скачивают и отправляют страницы в базу, где они сжимаются;
  • система для каждой страницы назначает индивидуальный идентификатор DocID;
  • веб-страница отправляется на индексацию; – за данным процессом следит индексатор и сортировщик;
  • все страницы конвертируются в некие элементы, которые состоят из слова и его позиции в документе;
  • расположение ссылки на странице анализирует индексатор, после чего он сохраняет информацию о них (якорный текст, расположение ссылки).

.

Дальше база ссылок используется для формирования показателя PageRank. Далее сортировщик принимает контейнеры, составленные роботом, и сортирует их, чтобы создать инверсию индекса. Стоит отметить, что вместе с показателем PageRank для ранжирования в поисковой выдаче используется инверсный индекс.

.

Как видите, формирование поисковой выдачи – довольно сложный процесс и имеет массу слагаемых. Это как профессиональные ребята делают восстановление операционной системы и ремонт компьютеров в Алтуфьево, сложно, но можно. И когда пользователь вводит в поисковую строку какой-то запрос, система автоматически собирает документы и конвертирует их в блоки. После этого блоки анализируются и самые подходящие выдаются на предмет запроса. Понятно, что самый релевантный документ будет иметь наиболее высокие позиции в выдаче.

.

В следующей теме мы продолжим разговор о том, как работает поиск в Google, не пропустите, будет интересно!

{lang: 'ru'}
Комментарии и пинги к записи запрещены.

Комментарии закрыты.

|
ЧИТАТЬ БЛОГ / ПОСЛЕДНИЕ НОВОСТИ - 1.. 2.. 3.. 4..
© 2011-2014 Reall-Rabota.ru / Seo-блог Алексея Анисимова. Все права защищены.
Полное или частичное использование материалов без согласия автора и прямой индексируемой гиперссылки на сайт Reall-Rabota.ru запрещено.

Яндекс.Метрика