Автор работы: Пользователь скрыл имя, 22 Марта 2012 в 21:09, курсовая работа
Цель курсовой работы заключается в изучении основных принципов хранения и поиска данных сети Интернет.
Главная задача состоит в рассмотрении:
1. понятия и значения гипертекстового документа;
2. видов графических файлов сети Интернет;
3. основных правил поиска информации.
ВВЕДЕНИЕ 3
1 ХРАНЕНИЕ ДАННЫХ В СЕТИ ИНТЕРНЕТ 5
1.1 ГИПЕРТЕКСТОВЫЕ ДОКУМЕНТЫ, ВИДЫ ФАЙЛОВ 5
1.2 ГРАФИЧЕСКИЕ ФАЙЛЫ , И ИХ ВИДЫ И ОСОБЕННОСТИ 9
1.3 ПОИСКОВЫЕ СИСТЕМЫ И ПРАВИЛА ПОИСКА ИНФОРМАЦИИ 14
2 ОБЗОР И ХАРАКТЕРИСТИКА ПОИСКОВЫХ СИСТЕМ СЕТИ ИНТЕРНЕТ 17
2.1 RAMBLER 17
2.2 YANDEX 18
2.3 YAHOO 21
2.4 ALTAVISTA 23
ВЫВОДЫ И ПРЕДЛОЖЕНИЯ 25
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЯ
При отсутствии какой-либо дополнительной информации система индексирует все слова документа, за исключением комментариев, и использует несколько первых слов документа в качестве краткой аннотации.
В процессе поиска AltaVista реализует алгоритм ранжирования, согласно которому каждому документу, содержащему совпадение по заданному термину, присваивается ранг, определяющий порядковый номер документа в списке результатов поиска. Ранг приписывался на основе частоты употребления термина в документе, области документа, где он встретился, а также близости терминов друг к другу при комбинированном поиске.
Таким образом, World Wide Web - самый популярный и интересный сервис Интернет, удобное средство работы с информацией. Очень часто понятия WWW и Интернет даже считают тождественными. Чтобы понять, как работает эта система надо определить понятие гипертекста (hypertext). Гипертекст - по определению, формат текстового документа, который кроме, собственно текста, может содержать ссылки на другие гипертекстовые документы. В WWW понятие гипертекста еще более расширено. Гипертекстовый документ WWW может также включать в себя текст, оформленный разными шрифтами, цветом и т.д., картинки, музыку, ссылки файлы и так далее.
Вся система WWW основана на двух "китах" - Протокол Передачи Гипертекста - Hypertext Transport Protocol (HTTP), который служит для передачи гипертекстовых документов, и Язык Создания Гипертекста - Hypertext Markup Language (HTML), использующий гипертекстовые связи для определения объектов внутри документов и для ссылки на другие гипертекстовые документы.
Интернет - это большая компьютерная сеть, объединяющая компьютеры по всему миру. Каждый компьютер в сети имеет определенные координаты, так называемый адрес. Зная адрес компьютера, можно получить доступ к данным, расположенным на этом компьютере, то есть эти данные, тоже имеют свой адрес. Такими данными могут быть отдельные тексты и изображения, которые можно непосредственно посмотреть на экране того компьютера, которым вы пользуетесь. Такими данными могут быть и различные выполняемые программы, при помощи которых можно проводить различные расчеты.
Кроме этого, есть специальные программы, позволяющие вести в Интернете дискуссии. Как на обычной доске объявлений каждый может наклеить свое объявление, так и в Интернете есть электронные доски объявлений, где каждый может оставить свое сообщение или прочитать сообщения других.
Понятно, что ориентироваться в том море информации, которое содержит Интернет, достаточно сложно. Для облегчения этой задачи есть специальные программы (поисковые системы), которые позволяют найти в Интернете текст, связанный с той информацией, которую требуется найти. Таких поисковых систем много. Самые известные из них: англоязычная: Altavista (www.av.com), Yahoo (www.yahoo.com); русские - Yandex (www.yandex.ru), Rambler (www.rambler.ru).
И Yandex, и Yahoo, и Rambler, и Altavista имеют все необходимое, чтобы обеспечивать качественный поиск: обширную базу данных, точный механизм оценки релевантности и удачный интерфейс. Успешного поиска можно добиться в любой из поисковых систем, и ответ на вопрос, чем лучше пользоваться, зависит от личных предпочтений и привычек, а также от поставленных задач. Системы, удовлетворяющей всем потребностям пользователей одинаково хорошо, не существует, потому в одном случае удобнее обратиться к Yandex, в другом — к Yahoo, а где-то оптимальным решением будет Rambler.
Оценивать интерфейс сложно, в таких выводах всегда очень много субъективного. Altavista — он более логичен, легко запоминается и очень гибок. Rambler подошел к проблеме создания языка запроса по-своему, избавив пользователя от необходимости запоминать, как задаются специальные запросы. Уточнение запроса у Rambler производится только в форме расширенного поиска
Все поисковые системы имеют достаточно мощностей, чтобы находить нужную информацию. Вектор развития сместился в сторону пользователя — разработчики пытаются научить машину понимать, что пользователь хочет найти, даже когда тот сам не в состоянии сформулировать запрос. Но формулой успешного поиска остается фраза «Правильно заданный вопрос содержит больше половины ответа».
1. Архитектура компьютерных систем и сетей: Учеб. Пособие/ Т.П. Барановская, В.И.Лойко.-М.: Финансы и статистика, 2003.-156-160.
2. Интернет: Энциклопедия/Мелихова, 2 изд. 2000.-423-426.
3. Информатика: Учебник./Под ред. А.П. Курносова-Воронеж, ВГАУ, 1997.-45-48.
4. Информатика/Симонович С.В. 2000.-562-570.
5. Информатика: Практикум по технологии работы на компьютере. Под ред. Макаровой, 1997.-47-49.
6. Комер Д. Принципы функционирования Интернета. - СПб.: Питер,2002.-120-123.
7. Компьютерные сети. Принципы, технологии, протоколы/В.Г.Олифер, 2002.-600-605.
8. Компьютерные сети и средства защиты информации/Камалян, Кулев,1999.-10-15.
9. Могилев А.В. Информатика: Учеб. Пособие/А.В.Могилев, Н.И.Пак, Е.К.Хеннер, - М.,1999.-210-211.
10. Муштоватый И.Ф. Самоучитель по работе в Интернете/2 изд., Ростов Н/Д,2002.-310-312.
11. Острейковский В.А. Информатика: Учеб. для вузов школа,2000.-400-410.
12. Попов В. Практикум по Интернет-технологиям.2002.-
13. Протоколы INTERNET.С.Золотов.1998.-М,-
14. Солоницын Ю., Холмогоров В. Интернет. Энциклопедия.3 изд. - СПб.: Питер, 2002.-500-505.
15. Эд Крол. Все об Internet:Пер с англ. - М.: Торгово-издательское бюро BHV, 1995.-444-446.
3
Приложение 1
Таблица 1. Логические операторы, используемые Rambler
Синтаксис | Что означает оператор | Пример запроса |
Пробел, либо &, либо AND | Логическое И (в пределах фрагмента текста, по умолчанию состоящего из 40 слов) | «зелёная карета» - будут найдены документы, в которых слова «зелёная» и «карета» встречаются в пределах фрагмента, состоящего не более из 40 слов |
/ либо OR | Логическое ИЛИ | план/ абрис/ кроки/ карта - будут найдены документы, содержащие хотя бы одно из перечисленных в запросе слов |
( ) | Группирование слов | (технология/ изготовление) (сыра/ творога) – будут найдены документы, касающиеся технологии изготовления сыра и творога |
! | Бинарный оператор И НЕ | модем! внутренний – будут найдены документы, содержащие информацию о внешних, кабельных и других модемах, но не о внутренних |
(n, выражение) | Оператор контекстной близости NEAR; разница в порядковых номерах слов должна быть меньше указанного n | (2, поставщики кофе) – между словами «кофе» и «поставщики» не должно быть ни одного другого слова; разница в порядковых номерах равна 1, что меньше 2 |
«…» | Поиск фразы | «зелёная карета» - эквивалентно (2, зелёная карета) |
Приложение 2.
Таблица 2. Логические операторы, используемые Yandex
Синтаксис | Что означает оператор | Пример запроса |
Пробел либо & | Логическое И (в пределах предложения) | «зелёная карета» - будут найдены документы, в которых слова «зелёная» и «карета» встречаются в одном предложении |
&& | Логическое И (в пределах документа) | «коктейли && (кровавая Мэри)» - будут найдены документы, в которых встречаются словосочетания «коктейли» и «кровавая Мэри» |
/ | Логическое ИЛИ | «план/ абрис/ кроки/ карта» - будут найдены документы, содержащие хотя бы одно из перечисленных в запросе слов |
+ | Обязательное наличие слова в найденном документе (работает также в применении к стоп словам) | «быть + или + не быть» – могут быть найдены документы с гамлетовским вопросом |
( ) | Группирование слов | «(технология/ изготовление) (сыра/ творога)» - будут найдены документы, касающиеся технологии изготовления сыра и творога |
~ | Бинарный оператор И НЕ (в пределах предложения) | «модем ~ внутренний» - будут найдены документы, содержащие информацию о внешних, кабельных и других модемах, но не о внутренних |
~~ либо знак «минус» | Бинарный оператор И НЕ (в пределах документа) | «путеводитель по Парижу» ~~(агентство|тур) - интересует именно путеводитель по Парижу, турагенствам просьба не беспокоиться |
/(n, m) | Указывает допустимое «расстояние» между ключевыми словами, «измеряемое» в словах (-назад + вперёд) | «музыкальное/ (2,4) образование - будут найдены документы, в которых слово «музыкальное» находится по отношению к слову «образование» в интервале расстояний от 2 слов до 4 слов справа |
«…» | Поиск фразы | «зелёная карета» (эквивалентно запросу «зелёная/ +1 карета») |
&&/(n, m) | Указывает допустимое «расстояние» между ключевыми словами, «измеряемое» в предложениях (-назад + вперёд) | «банк &&/ 1 налоги» - будут найдены документы, в которых слово «налоги» находится в том же самом либо в соседнем со словом «банк» предложении |
Приложение 3.
Таблица 3. Логические операторы, используемые Yahoo
Синтаксис | Что означает оператор | Пример запроса |
« » | Поиск точной фразы | «белый пароход» |
+ или пробел между словами | Логический оператор И | белый + пароход |
- | Логическое И НЕ | белый – пароход |
t: слово | Поиск документов, в которых указанное слово встречается в заголовке | t: футбол – будут найдены страницы, содержащие слово «футбол» в заголовке |
u: слово | Поиск документов, в URL которых встречается указанное слово | u: football – будут найдены страницы, в адресе которых содержится слово «football», например: www.domain.com/football.html |
Информация о работе Организация хранения и поиска информации в сети Internet