Автор работы: Пользователь скрыл имя, 18 Января 2012 в 16:32, реферат
В нашем современном мире не возможно представить жизни без Интернета. С его помощью мы можем сделать многое: приобрести разнообразные товары, познакомиться, общаться, работать, слушать музыку, смотреть фильмы и т.д. Возможности Всемирной Паутины безграничны.
1. Введение 3
2. Поиск информации 4
2.1 Основы поисковых служб 4
2.2 Основные поисковые системы 5
2.2.1 Отечественные поисковые системы 11
2.3 Задачи и стратегии поиска 13
2.4 Средства поиска 14
2.5 Технологии и результат поиска 15
Заключение 17
Список литературы 18
Содержание
1. Введение 3
2. Поиск информации 4
2.1 Основы поисковых служб 4
2.2 Основные поисковые системы 5
2.2.1 Отечественные поисковые системы 11
2.3 Задачи и стратегии поиска 13
2.4 Средства поиска 14
2.5 Технологии и результат поиска 15
Заключение 17
Список литературы 18
1.
Введение
Интернет - это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки стекаются потоки более мелких сетей. Любой пользователь, располагающий ПК и соответствующими программами, сможет подключиться к сети, используя её возможности для самых разных целей - проведения досуга, обучения, чтения научных работ, отправки электронной почты и т.д. По различным данным, в 2004 г. количество пользователей глобальной системы Интернет составило от 600 до 900 миллионов человек. Это число продолжает стремительно расти и уже в 2006 г. оно достигло миллиарда человек. Сегодня глобальная сеть превращается в важный социальный и политический фактор современного информационного общества. С развитием Интернет-технологий появился новый гигантский источник информационных ресурсов, доступ к которым является не только относительно дешевым, но и очень быстрым.
В настоящее
время Интернет объединяет сотни
миллионов серверов, на которых размещены
миллиарды различных сайтов и
отдельных файлов, содержащих различного
рода информацию. Это гигантское хранилище
информации. Существуют различные приемы
поиска информации в Интернет.
2.
Поиск информации
Сеть интернет растет очень быстрыми темпами, и найти нужную информацию среди миллиардов Web-страниц и файлов становится все сложнее. Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернета.
Различные поисковые
сервера могут использовать различные
механизмы поиска, хранения и предоставления
пользователю информации. Поисковые
серверы Интернета можно
Современные
поисковые системы часто
2.1
Основы поисковых
служб
Сегодня пользователь World Wide Web оказывается в той же ситуации, что читатель крупной библиотеки. Чем больше фонды библиотеки, тем труднее найти именно ту книгу, которая сейчас нужна. Для упрощения поиска в библиотеке существуют каталоги: систематический, алфавитный, предметный и другие. Существуют и специализированные каталоги, например каталоги новых поступлений.
В сети
поиск обеспечивают специальные
поисковые службы. Умение пользоваться
ими, собственно говоря, и составляет
умение пользоваться Интернетом. Все поисковые
системы WWW основаны на гиперссылках. Обращаясь
к поисковой службе, мы формулируем запрос,
в котором формально описываем то, что
хотим найти. Проведя нужные операции,
служба формирует Web-документ, состоящий
из гиперссылок, ведущих к ресурсам WWW,
соответствующим нашему запросу. Какой
из этих гиперссылок мы воспользуемся
- дело наше. Несмотря на то, что результат
всегда един (клиент получает список рекомендованных
гиперссылок), принцип действия у разных
поисковых служб может быть различным.
Ниже мы рассмотрим, как классифицируются
поисковые службы по типам предоставляемых
услуг, а также по способам формирования
своих ресурсов. Последнее очень важно
для эффективной работы не только пользователей,
но и Web-мастеров. Пользователи должны
учитывать способ формирования баз данных,
чтобы знать, на что они могут рассчитывать
при поиске информации, а Web-мастера должны
это знать, чтобы добиться наилучшего
представления своих ресурсов в основных
поисковых службах мира.
2.2
Основные поисковые
системы
Поисковая система -- программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. В просторечии под поисковой системой подразумевают веб-сайт, на которой размещён интерфейс системы. Программной частью поисковой системы является поисковая машина - комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы.
Поисковые
системы уже давно стали
Большинство
пользователей поисковых систем
никогда не задумывались (либо задумывались,
но не нашли ответа) о принципе работы
поисковых систем, о схеме обработки запросов
пользователей, о том, из чего эти системы
состоят и как функционируют.
Основные
поисковые системы:
По количеству индексированных Web-страниц Alta-Vista -- одна из крупнейших (но не самая крупная, как это иногда считается) поисковых систем мира. Огромный объем охвата Web-пространства и мощный набор поисковых команд делают эту систему излюбленным средством поиска для большинства пользователей. Система была запущена в эксплуатацию в декабре 1995 г. и долгое время считалась молодой, но бурно развивающейся. Для начинающих система имеет упрощенную службу, которая называется Ask Alta Vista. В своей работе эта служба привлекает другую поисковую службу - Ask Jeeves (см. далее). Несмотря на то, что сегодня Alta Vista уже не является самым удобным средством поиска и владеет не самым большим индексом, ее популярность по-прежнему выше, чем у служб, которые превзошли ее по многим показателям, что связано с устоявшимися привычками миллионов пользователей.
Эта система представляет образец человеческого (неавтоматизированного) подхода к индексации и хранению информации о Web-документах. Ее цель не в том, чтобы выдать в ответ на запрос как можно больше возможных ссылок, в том, чтобы они были наиболее точны. В идеале система должна вас направить именно к той Web-странице, которая вам как раз и нужна. Система была введена в эксплуатацию в июне 1997 г. Результаты поиска в этой системе используются и при размещении запроса в Alta Vista.
Систему Direct Hit можно назвать системой «рафинирования» результатов поиска, выдаваемых другими поисковыми системами. Она контролирует, какими результатами поисков клиенты пользуются наиболее часто и, тем самым, создает некий рейтинг популярности Web-страниц. Этот рейтинг она предоставляет другим поисковым системам, и они учитывают его при выдаче результатов. Технология Direct Hit напрямую используется поисковой системой HotBot. Она также учитывается системами Lycos, LookSmart и MSN Search.
Excite -- одна
из самых популярных поисковых
систем World Wide Web. Она имеет указатель
среднего размера и кроме
Эта система,
принадлежащая норвежской компании,
ранее называлась All TheWeb. Несмотря на
то, что она была запущена совсем
недавно (в мае 1999 г.), перед ней
ставится задача обогнать конкурентов
в полноте коллекций ссылой на
Web-страницы. Кажется, ей это удается.
Летом 1999 г. FAST Search первое перешагнула
200-миллионный рубеж проиндексированных
Web-докумеатов. Кроме системы FAST Search
та же компания контролирует подразделение
системы Lycos, занимающееся поиском музыкальных
файлов в формате МРЗ.
Go/lhfoseek - это сочетание известной в прошлом поисковой системы Infoseek (была основана в 1995 г.) и современного портала Go (создан в 1999 г. и принадлежит небезызвестной Walt Disney Co). Кроме поисковых возможностей Infoseek портал предоставляет зарегистрированным пользователям возможность персональной настройки среды, бесплатную электронную почту и другие полезные cepвисы. Пользователи этой системы отмечают высокое качество ссылок, возвращаемых системой, что объясняется специальным «фирменным» алгоритмом! поиска. Кроме автоматизированного указателя система имеет также обширный каталог Web-узлов, составляемый вручную.
Поисковая служба GoTo не имеет отношения к порталу Go , и известна тем, что формирует результаты поиска на коммерческой основе. Компании, владеющие Web-узлами, за определенную плату могут договориться, чтобы ссылки на них появлялись на более высоких местах в списках итоговых результатов. Насколько известно, более никто, кроме Alta Vista, не занимается такими махинациями. Впрочем, служба GoTo не считает это махинацией, а полагает, что платежеспособность Web-издателя напрямую связана с качеством поставляемой им информации, и потому для пользователя такой подход полезен. При формировании списка служба берет оплаченные ссылки из собственной базы данных, а неоплаченные черпает от поисковой системы Inktomi (см. далее).
Служба была запущена в 1997 г. В ее основу был положен Web-краулер World Wide Web Worm, приобретенный у разработчика - университета штата Колорадо. С его помощью собиралась первичная база указателя. В 1998 г. служба перешла на нынешнюю «коммерческую» модель обслуживания и начала использовать систему Inktomi в качестве генератора «некоммерческих» ссылок.
Служба Google известна тем, что при генерации списка ссылок в первую очередь выдает ссылки на те Web-страницы, к которым из других документов ведет наибольшее количество ссылок. Это дает очень интересный эффект. На большинстве поисковых систем совершенно бесполезно искать информацию по таким тривиальным словам как Cars (Автомобили), Internet, WWW, Games (Игры). Поиск по этим словам вернет столько ссылок, что среди них невозможно найти самые полезные. Служба Google при проведении поиска по тривиальным словам дает отличные результаты, поскольку руководствуется мнением других пользователей, ранее осуществлявших подобный поиск.
По популярности среди сетевой общественности HotBot приближается к Alta Vista. Как и Alta Vista, эта служба имеет огромный поисковый указатель и много полезных функций. При генерации первой страницы ссылок HotBot использует результаты, поступающие от системы Direct Hit . При генерации последующих страниц используется система Inktomi (см. далее), услугами которой пользуются и другие поисковые службы. Кроме поиска по ключевым словам служба предоставляет также возможность поиска по тематическому каталогу. Данные для каталога черпаются из проекта Open Directory (см. ниже).
Служба HotBot была создана в мае 1996 г. компанией Wired Digitals, которую в 1998 г. перекупила поисковая служба Lycos. Несмотря на это, HotBot продолжает функционировать как самостоятельная поисковая служба, параллельно с Lycos.
Ядро поисковой
системы Inktomi было разработано вуниверситете
Калифорнии в Беркли. Несколько позже
создатели системы учредили одноименную
компанию и сформировали указатель ссылок
Inktomi, который был использован в качестве
основы службой HotBot. Сегодня этот указатель
используют и некоторые другие поисковые
службы. Несмотря на то, что при ответе
на запрос пользователя все подключенные
службы обращаются к одной и той же базе
данных, результаты выдаются разные. Это
связано с тем, что хотя Inktomi и обеспечивает
партнерам доступ к общей базе указателей,
система всетаки различает партнеров
и применяет системы рейтингования и фильтрации
результатов в соответствии с их идеологией.