суббота, 21 августа 2010 г.

Как работают поисковые системы


Вчера я немного познакомил вас с тем, какие поисковики рунета существуют. Их, конечно же, намного больше. Скоро даже планируют сделать и наш национальный поисковик (русский), но не знаю, когда это на самом деле осуществится. Вчерашняя статья была только ознакомительной. Сегодня я планирую рассказать о том, как работают поисковые системы. Для тематики данного блога это будет очень интересно.
Для тех, кто более-менее уже знаком с интернетом – сегодняшняя статья не принесет никакой пользы, так что можете пропустить. Но новичкам она будет очень полезна, так как раньше я не знал, как устроен поиск информации в интернете. А после того, как узнал – понял, что представлял это себе совсем по другому.
Кстати, подобные статьи я уже видел в интернете. Но в свою я вложу частичку себя – расскажу ее так, как сам понимаю принцип работы поисковых систем.
Условно, в поисковых системах можно выделить пять составляющих:
Паук
Путешествующий паук
Индексатор
База данных
Система выдачи результатов

Возможно, для того, чтобы понять, как работают поисковые системы – надо узнать и о других компонентах поисковиков, но мы сегодня этого делать не будем, так как и этих пяти достаточно, чтобы начать работать с поисковыми системами.
Паук. Это программа, которая скачивает веб-сайт из интернета (html-код). Паука можно сравнить с вашим браузером.

Путешествующий паук. Так как это тоже паук – то он также скачивает веб-сайты, но ищет в исходном коде ссылки и определяет, куда пойдет потом паук. Так что ссылки с ваших сайтов надо ставить продуманно.

Индексатор. Его работа заключается в разбиении и анализе элементов веб-страниц. Все эти действия осуществляются на основе исходного html-кода (таких тегох, как title, head, body, h1-h6, b, и других подобных).

База данных. Тут даже говорить нечего. База данных – это место, где хранятся все скачанные из интернета данные.

Система выдачи результатов. Это именно то, что обычно подразумевают под запросом «как работают поисковые системы». Эта система определяет, какие сайты должны быть выведены в результатах поиска. Для того, чтобы попасть в топ по какому-нибудь запросу – нужно понять, как работает эта система. В дальнейших статьях я буду пробовать это сделать. Так что подписывайтесь на обновления и посещайте регулярно блог.

Итак, сегодня мы узнали, что входит в состав поисковых систем. Завтра более подробно поговорим о самых главных поисковых системах.

Комментариев нет:

Отправить комментарий