Алгоритм поисковых систем

Алгоритм поисковых систем это математическое «правило» выраженное специальной формулой, согласно которой обрабатывается запрос пользователя и выдается ответ, на основе выбора из нескольких вариантов.

Алгоритм поисковой системы сначала «получает задачу», оценивает все возможные варианты и возвращает готовое решение в виде поисковой выдачи.

Алгоритм поисковой системы анализирует ключевые слова, которые определяются роботом поисковика, после чего сортирует данные и формирует релевантный поисковый результат, который мы, собственно, и видим на странице выдачи.

Алгоритм поисковых систем состоит, таким образом, в анализе содержания страниц и релевантности ключевиков на основе специальной математической формулы, которая и составляет алгоритм. Каждая поисковая система имеет свой уникальный алгоритм, поэтому. В разных поисковых системах, по одним и тем же запросам разная поисковая выдача.

Формула алгоритма поисковой системы обрабатывает и анализирует следующие данные:

  1. Возраст сайта, то есть время прошедшее с первого появления сайта в данной поисковой системе;
  2. Имя домена – уникальный URL сайта, а так же его название;
  3. Язык, или языки используемые на сайте;
  4. Количество страниц сайта;
  5. Степень популярности основной темы сайта;
  6. Суммарный объём ( или же вес) сайта, а так же физический объем каждой из страниц сайта;
  7. Общий объём текста сайта, а также объем каждой конкретной страницы данного сайта;
  8. Использование стиля в страницах сайта;
  9. Суммарное количество ключевиков как всего сайте, так и отдельных его страниц;
  10. Математическое соотношение суммарного числа всех слов на сайте или странице к общему количеству ключевиков слов на сайте странице соответственно;
  11. Google Page Rank или тематический Индекс цитирования Яндекса (в случае с этими двумя самыми значимыми поисковиками, у других поисковых систем существуют свои аналогичные параметры);
  12. Общее количество запросов, поданных пользователями по данному конкретному ключевику с за определенное время;
  13. Период, за который происходит обновление информации сайта и конкретная дата последнего обновления как сайта, так и каждой из его страниц;
  14. Общее количество графических и мультимедийных файлов, содержащихся в сайте;
  15. Наличие и использование фреймов;
  16. Шрифтовое оформление ключевых слов (жирный шрифт, курсив, заглавные буквы и др.) Особенности стиля заголовков и ключевиков;
  17. «Реальность» использования ключевых слов на странице. То есть, распределены ли они гармонично в тексте, или «свалены в кучу»;
  18. Удаление ключевых слов от начала странице ( есть мнение, что в основных поисковиках значимость этого фактора теперь минимальна);
  19. Наличие в коде сайта мета-тегов и их соотношение с текстом сайта;
  20. Присутствие и конкретное содержание описания и «свойств» страниц сайта;
  21. Наличие легендарного файла «robots.txt»;
  22. Географическая и региональная привязка сайта;
  23. Наличие, количество и содержание комментарии в коде страниц сайта;
  24. Тип кода (html или asp) каждой из страниц данного сайта;
  25. Наличие flash модулей на сайте и его отдельных страницах;
  26. Наличие страниц-дублей (клонов), или незначительно отличающихся по контенту;
  27. Соответствие ключевиков сайта конкретному разделу каталога поисковика, в случае, если он в нем зарегистрирован (например DMOZ для Google и Яндекс Каталог для Яндекса);
  28. Наличие на сайте «стоп слов» (в основном, служебных частей речи и местоимений), которые поисковая система автоматически исключает из алгоритма;
  29. Алгоритм поисковых систем учитывает суммарное количество гиперссылок сайта, число внутренних ссылок (со страниц сайта на другие страницы этого же сайта), число внешних ссылок сайта (ссылок ведущих с других сайтов);
  30. Глубина сайта, сиречь количество структурных уровней, содержащих внутренние страницы сайта, начиная с главной страницы, и далее по «дереву» сайта;

А также еще немалое количество параметров, которые включаются в алгоритм поисковых систем.

Всех их знать не может никто, так как алгоритмы поисковых систем составляют главную коммерческую и техническую тайну. Так же неизвестно, какие из факторов оказывают большее или меньшее влияние на выдачу, а какие уже не оказывают вовсе.

Так же с алгоритмом поисковой системы взаимодействуют специальные фильтры поискового спама, фильтры уникальности, трастовости и.т.д. (например один из фильтров — знаменитая «песочница» Google, применяемая к вновь созданным сайтам не протяжении нескольких первых месяцев).

Если вам интересно узнать про математическую сторону работы алгоритма поисковых систем, вы можете сделать это прочитав про Алгоритм текстового ранжирования Яндекса.

 
Написать нам