Главная » 2014 » Февраль » 3 » Поисковики интернета
12:16
Поисковики интернета

Поисковые системы – особенности и принцип работы.

 

поисковые системыКаждый пользователь интернета тратит достаточно большое количество своего времени на поиск различной интересующей его информации. Есть много способов получить ответ на интересующий вас вопрос. Можно воспользоваться онлайновой энциклопедией и отыскать в ней ответ, можно оформить подписку на рассылки по интересующей тематике и изучать полученную корреспонденцию, а также можно задать вопрос на соответствующем форуме и получить консультацию у знающих людей.

Однако самый универсальный способ получить интересующую информацию – это воспользоваться одним из поисковиков интернета. В интернете существуют более сотни, а может быть и больше, различных поисковых систем. Сервисы поиска информации – основополагающая составляющая всемирной сети. Базы данных поисковых систем содержат информацию обо всех сайтах, существующих в интернете.

Эти базы ежедневно обновляются полностью автоматизированными системами (так называемыми роботами), которые отслеживают появление новых сайтов в сети. Значение поисковиков интернета для работы в сети невозможно переоценить. У основной массы пользователей сети стартовой страницей является страничка одной из поисковых систем и именно с нее начинается увлекательная экскурсия по разнообразным ресурсам интернета. Без Google, Yandex или многих других поисковиков, которыми изобилует интернет, пользователь сети чувствовал бы себя как слепой в большом городе.

 

Так что же такое поисковик интернета?

 


Любая поисковая система - это программно-аппаратный набор средств, который реагирует на поисковый запрос, вводимый как текстовая фраза, и выдающий список ссылок на различные источники информации в соответствии запросу. Ее основная задача – доставлять пользователю информацию, именно ту, которую он ищет.

К основным характеристикам любой поисковой системы относятся:

- Полнота, которая является отношением числа найденных по запросу ссылок к общему числу ссылок в интернете, которые удовлетворяют данному запросу. Чем выше полнота, тем больше вероятность найти нужную информацию.

- Точность поиска или другими словами - степень соответствия найденных ссылок запросу. Например, если на запрос «как выбрать автомобиль» получено 200 ссылок, из которых в 50-ти присутствует прямое словосочетание запроса «как выбрать автомобиль», а в оставшихся эти слова только присутствуют («как правильно выбрать и установить видео регистратор в автомобиль»), то точность равна 0,25 (50/200). Чем выше степень соответствия, тем меньше «мусора» среди нужных ссылок.

- Актуальность, характеризующаяся временем, которое прошло с момента размещения документа в интернете, до занесения его в поисковую базу поисковика. Например, после появления свежей новости, множество пользователей обращаются к поисковой системе с соответствующим запросом и практически в тот же день получают к ней доступ. Благодаря наличию у поисковых систем функции «быстрая база», которая автоматически обновляется много раз в сутки, свежие записи очень быстро индексируются и становятся доступными для поиска.

- Скорость поиска, которая напрямую зависит от быстродействия поисковой машины по обработке отдельного запроса и ее устойчивости к нагрузкам.

- Наглядность представления полученных результатов, которая определяет удобство поиска. Зачастую из-за нечеткости запроса или неточности поиска, поисковая машина выдает тысячи различных ссылок, при этом даже первые страницы поисковика не несут нужной информации.

Поэтому пользователю часто приходится производить дополнительный поиск внутри предложенного списка. Наглядность подразумевает наличие дополнительных сервисов на странице поисковика, облегчающих дополнительный поиск (предварительный просмотр страницы, встроенный переводчик, сортировка в «найденном», выборка по дате, по местоположению, объему и т.д.).

Почти все крупные поисковики интернета имеют свою собственную оригинальную структуру построения, однако у всех поисковых машин есть общие основные компоненты. Разница лишь в организации взаимодействия между этими компонентами.

Главный элемент любого интернет поисковика – модуль индексирования, состоящий из 3-х вспомогательных роботов (программ). Программа Spider («паук»), которая отвечает за скачивание страниц и извлечение всех внутренних ссылок, Crawler («блуждающий паук») – осуществляющая автоматический переход по ссылкам на найденной странице, Indexer (индексатор) – анализирующая скаченные страницы.

Анализ страниц производится с помощью различных лексических и морфологических алгоритмов, ему подвергаются заголовки, текст, стилевые особенности, служебные теги и т.д. Следующим обязательным элементом поисковика интернета является база данных (индекс), которая представляет собой информационный массив, преобразованных специальным образом параметров всех скаченных с помощью модуля индексирования страниц.

И наконец, важнейший элемент – поисковый сервер, от которого в огромной степени зависят скорость и качество поиска.
Наиболее крупными и востребованными поисковиками интернета на сегодняшний день являются такие международные ресурсы как «Google» и «Yahoo», среди отечественных - «Яндекс» и «Рамблер». Хотя еще раз хочется отметить – что различных поисковиков на просторах интернета больше сотни. В том числе существуют и специализированные поисковики: FindSounds.com – для поиска различных звуков, Taggalaxy.de – для поиска фотографий и рисунков, Gnod.net – для подбора книг, музыки и фильмов и т.д.

 

 

Просмотров: 1566 | Добавил: novinka_2003 | Теги: поисковый сервер, поисковый паук, поисковики интернета, поисковики | Рейтинг: 5.0/1