Автор работы: Пользователь скрыл имя, 16 Февраля 2012 в 21:28, реферат
Поисковая система - это программное обеспечение, предоставляющее доступ к коллекции слабоструктурированной информации. Ориентация на слабоструктурированные данные, т.е. данные, которые нельзя представить в виде реляционной таблицы, отличает поисковую систему от СУБД.
Федеральное агентство по образованию
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТИЛЬНОЕ
УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
« РОСТОВСКИЙ ГОСУДАРСТВЕННЫЙ
ЭКОНОМИЧЕСКИЙ
УНИВЕРСИТЕТ (РИНХ)»
Работа по информатике
на тему:
«Поисковые
сайты и технологии
Выполнил:
По специальности
Серобян А.Х
Проверила:
344066,Ростова-на-Дону, ул. М. Горького,166
Телефон/факс: (863) 264-55-44
2011г
Поисковая
система - это
программное обеспечение, предоставляющее
доступ к коллекции слабоструктурированной
информации. Ориентация на слабоструктурированные
данные, т.е. данные, которые нельзя представить
в виде реляционной таблицы, отличает
поисковую систему от СУБД.
В данном определении поисковой системы
подразумевается информация различного
рода, т.е. текст, аудио, видео, изображения
и т.п. Однако следует отметить, что именно
текстовые данные идеально подходят для
описания полной функциональности поисковой
системы, т.к. алгоритмы поиска мультимедийной
информации, прежде всего, основываются
на алгоритмах поиска текста.
Основная
задача поисковой системы
- минимизировать время, затрачиваемое
пользователем на поиск релевантной запросу
информации. Релевантность - одно из самых
субъективных и запутанных понятий в науке
информационного поиска. Наиболее часто
говорят о релевантности с точки зрения
пользователя, и тогда ``релевантная запросу
информация'' и ``нужная пользователю информация''
- одно и то же. Именно о такой релевантности
мы говорим в данном разделе. Вопрос заключается
в том, какую информацию пользователь
посчитает нужной? В некоторых обстоятельствах
релевантную информацию можно определить
как всю информацию из базы, имеющую отношение
к запросу. Так, например, если пользователю
нужно узнать все о конкретной фирме, то
он заинтересован в нахождении всех документов,
в которых упоминается об этой фирме. В
других обстоятельствах релевантная информация
- это только та информация, которая достаточна
для выполнения определенной задачи пользователя,
например, поиска ответа на конкретный
вопрос. Если в последнем случае в результатах
поиска будет много избыточных данных,
т.е. данных, которые имеют отношение к
запросу, но не нужны для выполнения данной
задачи, то выборка нужной/релевантной
информации займет у пользователя дополнительное
время.
Таким образом, традиционно к поисковой
системе применяют две основные характеристики: точность
и полнота,
а точнее, их зависимость. Каждый раз, когда
пользователь задает системе запрос, тем
самым инициализируя поиск, все документы
в коллекции поисковой системы делятся
на четыре части. Точность определяет
один аспект поиска, а именно, насколько
хорошо поисковая система способна минимизировать
время, затрачиваемое пользователем на
поиск релевантной данному запросу информации.
В то время как полнота определяет другой
аспект - насколько хорошо система способна
найти релевантную данному запросу информацию.
Можно подобрать оптимальный запрос, когда
каждый найденный документ будет релевантным,
и каждый релевантный документ будет найден.
Поисковые системы при использовании
Интернет играют очень важную роль. В Интернете
сосредоточено такое количество информации,
что ее поиск уже превращается в отдельную
задачу и отнимает очень много времени.
Поисковые серверы выдают на запрос тысячи
ссылок вместо нескольких страниц, где
действительно имеется нужная информация.
Пользователи всемирной сети Интернет,
осознав преимущества, предоставляемые
возможностью анализа пространственных
данных, нуждаются в инструменте, позволяющем
осуществлять быстрый и удобный поиск
и доступ к цифровым снимкам местности
и другой пространственной информации,
сосредоточенной во многих правительственных,
коммерческих и академических организациях.
Интернет – это информационное
пространство, в котором можно отыскать
ответ практически на любой интересующий
пользователя вопрос. Это огромная глобальная
сеть, в которую как информационные ручейки
стекаются потоки более мелких сетей.
Любой пользователь, располагающий ПК
и соответствующими программами, сможет
подключиться к сети, используя её возможности
для самых разных целей – проведения досуга,
обучения, чтения научных работ, отправки
электронной почты и т.д. По различным
данным, в 2004 г. количество пользователей
глобальной системы Интернет составило
от 600 до 900 миллионов человек. Это число
продолжает стремительно расти и уже в
2006 г. оно достигло миллиарда человек.
Сегодня глобальная сеть превращается
в важный социальный и политический фактор
современного информационного общества.
С развитием Интернет-технологий появился
новый гигантский источник информационных
ресурсов, доступ к которым является не
только относительно дешевым, но и очень
быстрым.
Поиск в компьютерных сетях становится
искусством и требует вполне определённых
знаний, которыми современному человеку
необходимо овладеть. Я выбрала данную
тему реферата, так как считаю что одной
из составляющей грамотной работы в Интернет
является умение работать в глобальной
сети. И для того, чтобы не утонуть во всём
изобилии информации необходимо научиться
не только её искать, но и находить.
Прежде чем
начать поиск следует четко
Дать общий рецепт эффективной стратегии
поиска информации в Интернет, пожалуй,
невозможно. Есть лишь некоторые принципы,
позволяющие тратить меньше времени. Вот
некоторые из них. Например, вам необходимо
узнать, где обитает трёхлапый ленивец,
то вряд ли вы пойдете в алфавитный каталог
библиотеки. Может быть, вы найдете нужную
литературу с помощью систематического
каталога. С несколько большей вероятностью
- с помощью предметного. Но, скорее всего,
ни один из библиотечных каталогов вам
не поможет. Но, зайдя в информационно-
Этот пример иллюстрирует еще один элемент
стратегии: читайте найденные документы
в поисках наиболее точных терминов и
связей между терминами. Возможно, вы мыслите
в совершенно не тех терминах, которые
используют авторы искомых документов
(ведь большую роль играют культурные
различия!).
Третий элемент стратегии: используйте
несколько ИПС. Если вы регулярно занимаетесь
поиском информации по какой-то тематике,
отметьте те ИПС. которые для вас наиболее
эффективны.
По принципу организации
и использования
средства поиска можно
разделить на каталоги (справочники,
директории) и поисковые
машины.
Каталоги
являются справочниками,
содержащими списки
адресов Интернет, сгруппированные
по определенным признакам.
Как правило, они объединяются
по тематике (наука,
искусство, новости
и т.д.), где каждая тема
разветвляется на несколько
подуровней. Особенность
этих средств поиска
информации состоит
в том, что создание
структуры, базы данных
и их постоянное обновление
осуществляется "вручную",
коллективом редакторов
и программистов, и сам
процесс поиска требует
непосредственного
участия пользователя,
самостоятельно переходящего
от ссылки к ссылке.
Основное достоинство
поисковых каталогов
ресурсов в том, что
накапливаемая в них
информация тщательно
отбирается, сортируется,
разбивается на отдельные
категории.
Все каталоги построены
по единому принципу.
Страницы каталогов
содержат тематические
классификаторы. На
стартовой странице
располагается тематический
каталог высшего уровня.
Под каждой категорией
каталога могут быть
развёрнуты подкатегории.
Посредством щелчка
на одной из тематических
ссылок открывается
страница с тематическими
категориями более низкого
уровня, которые, в свою
очередь, тоже разбиваются
на подкатегории. Все
категории и подкатегории
соответствующим образом
выделяются.
Информация о работе Поисковые сайты и технологии поиска информации в интернете