Организация хранения и поиска информации в сети Internet

Автор работы: Пользователь скрыл имя, 22 Марта 2012 в 21:09, курсовая работа

Краткое описание

Цель курсовой работы заключается в изучении основных принципов хранения и поиска данных сети Интернет.
Главная задача состоит в рассмотрении:
1. понятия и значения гипертекстового документа;
2. видов графических файлов сети Интернет;
3. основных правил поиска информации.

Содержание работы

ВВЕДЕНИЕ 3
1 ХРАНЕНИЕ ДАННЫХ В СЕТИ ИНТЕРНЕТ 5
1.1 ГИПЕРТЕКСТОВЫЕ ДОКУМЕНТЫ, ВИДЫ ФАЙЛОВ 5
1.2 ГРАФИЧЕСКИЕ ФАЙЛЫ , И ИХ ВИДЫ И ОСОБЕННОСТИ 9
1.3 ПОИСКОВЫЕ СИСТЕМЫ И ПРАВИЛА ПОИСКА ИНФОРМАЦИИ 14
2 ОБЗОР И ХАРАКТЕРИСТИКА ПОИСКОВЫХ СИСТЕМ СЕТИ ИНТЕРНЕТ 17
2.1 RAMBLER 17
2.2 YANDEX 18
2.3 YAHOO 21
2.4 ALTAVISTA 23
ВЫВОДЫ И ПРЕДЛОЖЕНИЯ 25
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЯ

Содержимое работы - 1 файл

Копия Курсовая по информатике.doc

— 194.00 Кб (Скачать файл)

При отсутствии какой-либо дополнительной информации система индексирует все слова документа, за исключением комментариев, и использует несколько первых слов документа в качестве краткой аннотации.

В процессе поиска AltaVista реализует алгоритм ранжирования, согласно которому каждому документу, содержащему совпадение по заданному термину, присваивается ранг, определяющий порядковый номер документа в списке результатов поиска. Ранг приписывался на основе частоты употребления термина в документе, области документа, где он встретился, а также близости терминов друг к другу при комбинированном поиске.

Выводы и предложения

Таким образом, World Wide Web - самый популярный и интересный сервис Интернет, удобное средство работы с информацией. Очень часто понятия WWW и Интернет даже считают тождественными. Чтобы понять, как работает эта система надо определить понятие гипертекста (hypertext). Гипертекст - по определению, формат текстового документа, который кроме, собственно текста, может содержать ссылки на другие гипертекстовые документы. В WWW понятие гипертекста еще более расширено. Гипертекстовый документ WWW может также включать в себя текст, оформленный разными шрифтами, цветом и т.д., картинки, музыку, ссылки файлы и так далее.

Вся система WWW основана на двух "китах" - Протокол Передачи Гипертекста - Hypertext Transport Protocol (HTTP), который служит для передачи гипертекстовых документов, и Язык Создания Гипертекста - Hypertext Markup Language (HTML), использующий гипертекстовые связи для определения объектов внутри документов и для ссылки на другие гипертекстовые документы.

Интернет - это большая компьютерная сеть, объединяющая компьютеры по всему миру. Каждый компьютер в сети имеет определенные координаты, так называемый адрес. Зная адрес компьютера, можно получить доступ к данным, расположенным на этом компьютере, то есть эти данные, тоже имеют свой адрес. Такими данными могут быть отдельные тексты и изображения, которые можно непосредственно посмотреть на экране того компьютера, которым вы пользуетесь. Такими данными могут быть и различные выполняемые программы, при помощи которых можно проводить различные расчеты.

Кроме этого, есть специальные программы, позволяющие вести в Интернете дискуссии. Как на обычной доске объявлений каждый может наклеить свое объявление, так и в Интернете есть электронные доски объявлений, где каждый может оставить свое сообщение или прочитать сообщения других.

Понятно, что ориентироваться в том море информации, которое содержит Интернет, достаточно сложно. Для облегчения этой задачи есть специальные программы (поисковые системы), которые позволяют найти в Интернете текст, связанный с той информацией, которую требуется найти. Таких поисковых систем много. Самые известные из них: англоязычная: Altavista (www.av.com), Yahoo (www.yahoo.com); русские - Yandex (www.yandex.ru), Rambler (www.rambler.ru).

И Yandex, и Yahoo, и Rambler, и Altavista имеют все необходимое, чтобы обеспечивать качественный поиск: обширную базу данных, точный механизм оценки релевантности и удачный интерфейс. Успешного поиска можно добиться в любой из поисковых систем, и ответ на вопрос, чем лучше пользоваться, зависит от личных предпочтений и привычек, а также от поставленных задач. Системы, удовлетворяющей всем потребностям пользователей одинаково хорошо, не существует, потому в одном случае удобнее обратиться к Yandex, в другом — к Yahoo, а где-то оптимальным решением будет Rambler.

Оценивать интерфейс сложно, в таких выводах всегда очень много субъективного. Altavista — он более логичен, легко запоминается и очень гибок. Rambler подошел к проблеме создания языка запроса по-своему, избавив пользователя от необходимости запоминать, как задаются специальные запросы. Уточнение запроса у Rambler производится только в форме расширенного поиска

Все поисковые системы имеют достаточно мощностей, чтобы находить нужную информацию. Вектор развития сместился в сторону пользователя — разработчики пытаются научить машину понимать, что пользователь хочет найти, даже когда тот сам не в состоянии сформулировать запрос. Но формулой успешного поиска остается фраза «Правильно заданный вопрос содержит больше половины ответа».

Список использованной литературы

1. Архитектура компьютерных систем и сетей: Учеб. Пособие/ Т.П. Барановская, В.И.Лойко.-М.: Финансы и статистика, 2003.-156-160.

2. Интернет: Энциклопедия/Мелихова, 2 изд. 2000.-423-426.

3. Информатика: Учебник./Под ред. А.П. Курносова-Воронеж, ВГАУ, 1997.-45-48.

4. Информатика/Симонович С.В. 2000.-562-570.

5. Информатика: Практикум по технологии работы на компьютере. Под ред. Макаровой, 1997.-47-49.

6. Комер Д. Принципы функционирования Интернета. - СПб.: Питер,2002.-120-123.

7. Компьютерные сети. Принципы, технологии, протоколы/В.Г.Олифер, 2002.-600-605.

8. Компьютерные сети и средства защиты информации/Камалян, Кулев,1999.-10-15.

9. Могилев А.В. Информатика: Учеб. Пособие/А.В.Могилев, Н.И.Пак, Е.К.Хеннер, - М.,1999.-210-211.

10. Муштоватый И.Ф. Самоучитель по работе в Интернете/2 изд., Ростов Н/Д,2002.-310-312.

11. Острейковский В.А. Информатика: Учеб. для вузов школа,2000.-400-410.

12. Попов В. Практикум по Интернет-технологиям.2002.-303-310.

13. Протоколы INTERNET.С.Золотов.1998.-М,-12-15.

14. Солоницын Ю., Холмогоров В. Интернет. Энциклопедия.3 изд. - СПб.: Питер, 2002.-500-505.

15. Эд Крол. Все об Internet:Пер с англ. - М.: Торгово-издательское бюро BHV, 1995.-444-446.

3

 



Приложения

Приложение 1

             

Таблица 1. Логические операторы, используемые Rambler

Синтаксис

Что означает оператор

Пример запроса

 

 

 

Пробел, либо &, либо AND

Логическое И (в пределах фрагмента текста, по умолчанию состоящего из 40 слов)

«зелёная карета» - будут найдены документы, в которых слова «зелёная» и «карета» встречаются в пределах фрагмента, состоящего не более из 40 слов

 

 

/ либо OR

Логическое ИЛИ

план/ абрис/ кроки/ карта - будут найдены документы, содержащие хотя бы одно из перечисленных в запросе слов

 

 

( )

Группирование слов

(технология/ изготовление) (сыра/ творога) – будут найдены документы, касающиеся технологии изготовления сыра и творога

 

 

!

Бинарный оператор И НЕ

модем! внутренний – будут найдены документы, содержащие информацию о внешних, кабельных и других модемах, но не о внутренних

 

 

 

(n, выражение)

Оператор контекстной близости NEAR; разница в порядковых номерах слов должна быть меньше указанного n

(2, поставщики кофе) – между словами «кофе» и «поставщики» не должно быть ни одного другого слова; разница в порядковых номерах равна 1, что меньше 2

«…»

Поиск фразы

«зелёная карета» - эквивалентно (2, зелёная карета)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приложение 2.

 

Таблица 2. Логические операторы, используемые Yandex

Синтаксис

Что означает оператор

Пример запроса

 

 

Пробел либо &

Логическое И (в пределах предложения)

«зелёная карета» - будут найдены документы, в которых слова «зелёная» и «карета» встречаются в одном предложении

 

 

&&

Логическое И (в пределах документа)

«коктейли && (кровавая Мэри)» - будут найдены документы, в которых встречаются словосочетания «коктейли» и «кровавая Мэри»

 

 

/

Логическое ИЛИ

«план/ абрис/ кроки/ карта» - будут найдены документы, содержащие хотя бы одно из перечисленных в запросе слов

 

 

+

Обязательное наличие слова в найденном документе (работает также в применении к стоп словам)

«быть + или + не быть» – могут быть найдены документы с гамлетовским вопросом

 

 

( )

Группирование слов

«(технология/ изготовление) (сыра/ творога)» - будут найдены документы, касающиеся технологии изготовления сыра и творога

 

 

~

Бинарный оператор И НЕ (в пределах предложения)

«модем ~ внутренний» - будут найдены документы, содержащие информацию о внешних, кабельных и других модемах, но не о внутренних

 

 

~~ либо знак «минус»

Бинарный оператор И НЕ (в пределах документа)

«путеводитель по Парижу» ~~(агентство|тур) - интересует именно путеводитель по Парижу, турагенствам просьба не беспокоиться

 

 

 

/(n, m)

Указывает допустимое «расстояние» между ключевыми словами, «измеряемое» в словах (-назад + вперёд)

«музыкальное/ (2,4) образование - будут найдены документы, в которых слово «музыкальное» находится по отношению к слову «образование» в интервале расстояний от 2 слов до 4 слов справа

 

«…»

Поиск фразы

«зелёная карета» (эквивалентно запросу «зелёная/ +1 карета»)

 

 

&&/(n, m)

Указывает допустимое «расстояние» между ключевыми словами, «измеряемое» в предложениях (-назад + вперёд)

«банк &&/ 1 налоги» - будут найдены документы, в которых слово «налоги» находится в том же самом либо в соседнем со словом «банк» предложении

 

 

 

 

 

 

 

 

 

Приложение 3.

 

Таблица 3. Логические операторы, используемые Yahoo

Синтаксис

Что означает оператор

Пример запроса

« »

Поиск точной фразы

«белый пароход»

+ или пробел между словами

Логический оператор И

белый + пароход

-

Логическое И НЕ

белый – пароход

 

t: слово

Поиск документов, в которых указанное слово встречается в заголовке

t: футбол – будут найдены страницы, содержащие слово «футбол» в заголовке

 

 

u: слово

Поиск документов, в URL которых встречается указанное слово

u: football – будут найдены страницы, в адресе которых содержится слово «football», например: www.domain.com/football.html

Информация о работе Организация хранения и поиска информации в сети Internet