Поисковая система - это компьютерная система, которая предназначена для поиска информации.
Введение
Практически все пользователи сети Интернет в начале своего рабочего дня используют поисковые системы, пытаясь найти с их помощью требуемую им информацию и разрешить возникшие проблемы. Однако поисковые системы не всегда могут ясно и корректно отобразить интерпретацию ресурсов. В итоге, первые строки в поисковых итогах часто занимают сайты, которые не соответствуют проблематике поставленного вопроса. Причём ресурсы, которые реально могут принести пользу, выпадают из поиска. Причины такого расклада просты и заложены в технологии нахождения и отображения итогов работы поисковых систем. Следует отметить, что основная проблема состоит в отсутствии ясных и понятных законов поиска, которые должны быть доступны и открыты для всей пользовательской аудитории.
Чем более неопределенны алгоритмы создания поисковых индексов, представляющие собой «чёрный ящик», тем менее актуально отображение поисковыми системами процесса формирования реальных информационных данных. И, естественно, тем меньше доверия вызывают итоговые результаты поиска поисковой системы. Как это ни покажется странным, но в этой проблеме не виноваты разработчики поисковых систем, так как они должны держать в секрете законы формирования поисковых индексов. Здесь виновата сама технология организации поиска. По своему содержанию технологии поисковых систем рассчитаны на пассивных пользователей. Требуется просто выполнить регистрацию сайта, а далее всё реализует поисковый робот.
Классификация поисковых систем
Поисковая система является программным обеспечением, предоставляющим доступ к набору слабоструктурированных информационных данных.
Ориентировка на слабоструктурированную информацию, то есть информацию, которую невозможно отобразить в форме реляционной таблицы, является отличием поисковой системы от СУБД (системы управления базами данных). В такой трактовке поисковых систем подразумеваются информационные данные разных типов, то есть это может быть текстовая информация, аудио, видео и тому подобное. Но необходимо заметить, что как раз текстовая информация идеально соответствует описанию полной функциональности поисковой системы, поскольку поисковые алгоритмы информации типа мультимедиа, базируются на поисковых алгоритмах текстовых данных.
Все существующие системы поиска информации можно условно разделить на следующие классы:
- Класс поисковых машин (в английской интерпретации search engines). Другим названием этого класса является программы червяки и программы пауки. То есть, программы этого типа переползают между сайтами, методично выполняя индексацию содержания.
- Класс веб-каталогов или поисковых порталов (directories). Информационные данные в них организованы в формате древовидных структур, как правило, по тематическим признакам и согласно рейтингу. Адреса с описаниями веб-сайтов записываются в каталог по заявкам. Записи могут редактироваться модераторами в ручном режиме.
- Класс мета поисковых систем содержит поисковые системы, с отсутствующей своей базой данных адресов и описаний ресурсов. Здесь применяются базы данных каталогов, а собственные базы данных хранят лишь адреса ресурсов. В настоящее время это наиболее распространённые системы.
Самой известной поисковой машиной является торговая марка AltaVista. Она считается одной из самых больших в сети Интернет. Кроме разветвлённых поисковых средств по нахождению информации в текстовом формате, имеет в своём составе такой инструментарий, как Photo Finder, который занимается поиском изображений, обладает технологией перевода документов в режиме он-лайн и может выполнять индексацию на разных языках. Совместно с фирмой AskJeeves, AltaVista сформировала информационную базу данных, которая может управляться с помощью команд на различных языках.
Лицензией на поисковую машину Excite обладает фирма Netscape Communications для её применения на портале NetCenter, а также компания America Online, имеющая право собственного пополнения базы данных. Эта поисковая машина обладает интеллектуальным алгоритмом поиска согласно технологии ICE (Intelligent Concept Extraction), позволяющим использовать не только отдельные ключевые слова, но и объединяющие их понятия.
Среди систем, класса веб-каталогов и поисковых порталов, наиболее известной является LookSmart. Система представляет собой каталог ссылок, редактируемый вручную и усиленный самой мощной поисковой машиной AltaVista. Такая комбинация позволила сформировать самый информативный портал. Огромная база данных AltaVista способна помочь найти необходимый сайт согласно ключевым словам, а рубрики LookSmart дают возможность точного определения предмета поиска.
Yahoo также считается одним из наиболее популярных порталов Интернета. Каталог имеет в своём составе ссылки, наиболее полно отвечающие тематике, которая указывается в запросе.
Среди систем мета поискового класса следует выделить All4One (все в одном), которая даёт возможность пользователям видеть итоги поиска прямо из поддерживаемых поисковых систем, то есть в рамках привычного интерфейса. После задания запроса окно браузера делится на ряд окон, в каждом из которых появляется перечень ссылок, обнаруженных используемой поисковой машиной. Обычно это поисковые машины AltaVista, и Lycos, и Excite.
Debriefing является мета поисковой системой, имеющей два разных варианта интерфейса пользователя, а именно, интернациональный, на английском языке и национальный, то есть на французском языке.
Google считается одной из наиболее распространённых систем класса мета поисковых. Корректно осуществляет вывод запрошенной информации. Информация представляется в соответствии с рейтингом, основой которого является индекс цитируемости страниц.