Автор работы: Пользователь скрыл имя, 22 Марта 2012 в 21:09, курсовая работа
Цель курсовой работы заключается в изучении основных принципов хранения и поиска данных сети Интернет.
Главная задача состоит в рассмотрении:
1. понятия и значения гипертекстового документа;
2. видов графических файлов сети Интернет;
3. основных правил поиска информации.
ВВЕДЕНИЕ 3
1 ХРАНЕНИЕ ДАННЫХ В СЕТИ ИНТЕРНЕТ 5
1.1 ГИПЕРТЕКСТОВЫЕ ДОКУМЕНТЫ, ВИДЫ ФАЙЛОВ 5
1.2 ГРАФИЧЕСКИЕ ФАЙЛЫ , И ИХ ВИДЫ И ОСОБЕННОСТИ 9
1.3 ПОИСКОВЫЕ СИСТЕМЫ И ПРАВИЛА ПОИСКА ИНФОРМАЦИИ 14
2 ОБЗОР И ХАРАКТЕРИСТИКА ПОИСКОВЫХ СИСТЕМ СЕТИ ИНТЕРНЕТ 17
2.1 RAMBLER 17
2.2 YANDEX 18
2.3 YAHOO 21
2.4 ALTAVISTA 23
ВЫВОДЫ И ПРЕДЛОЖЕНИЯ 25
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЯ
МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА
РОССИЙСКОЙ ФЕДЕРАЦИИ
ФГОУ ВПО «ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ ИМЕНИ К.Д. ГЛИНКИ»
КАФЕДРА ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ И МОДЕЛИРОВАНИЯ АГРОЭКОНОМИЧЕСКИХ СИСТЕМ
Курсовая работа
на тему «Организация хранения и поиска информации в сети Internet»
ВОРОНЕЖ 2008
2
Содержание
Введение
1 Хранение данных в сети Интернет
1.1 Гипертекстовые документы, виды файлов
1.2 Графические файлы , и их виды и особенности
1.3 Поисковые системы и правила поиска информации
2 Обзор и характеристика поисковых систем сети Интернет
2.1 Rambler
2.2 Yandex
2.3 Yahoo
2.4 AltaVista
Выводы и предложения
Список использованной литературы
Приложения
Интернет (Internet) – это международная глобальная компьютерная сеть электронной связи, объединяющая региональные, национальные, локальные и другие сети и отдельные компьютеры. WWW (World Wide Web – «всемирная паутина») - самый популярный и интересный сервис Интернет, удобное средство работы с информацией. Информация хранится в ней на огромном множестве объединенных в сеть серверов – компьютерах с соответствующим программным обеспечением. Пользователи, или клиенты, имеющие доступ к сети, могут получать эту информацию, используя специальное программное обеспечение – программы просмотра WWW-документов (так называемые, WWW-броузеры). Информация представлена в виде документов, которые содержат ссылки на другие документы, хранящиеся как на том же самом сервере, так и на других, т.е. образуют гипертекст. На экране компьютера элементы, имеющие ссылки на другие документы, тем или иным образом (цветом, подчеркиванием) выделены. Пользователь, работающий с программой просмотра, может связаться с соответствующим сервером сети и получить документ, на который имелась ссылка. Для этого ему достаточно переместить указатель мыши на выделенный элемент и нажать клавишу мыши. Программа просмотра при этом посылает запрос серверу, хранящему документ.
Взаимодействие клиент - сервер при работе на WWW происходит по протоколу, который называется HyperText (или Transfer) Protocol – сокращенно HTTP. Для получения WWW-документов с сервера в запросе обязательно указывается протокол, адрес сервера, имя директории на сервере и файла с необходимым документом. Эта комбинация получила название Uniform Resource Locator (сокращенно – URL или просто Location).
Для поиска информации в «паутине» имеется развитая сеть поисковых WWW - серверов, использующих различные методы индексации информации в сети для быстрого контекстного поиска. Причем поиск может выполняться для всех видов серверов сети - WWW, FTP, GOPHER и др. Одними из самых популярных остаются следующие поисковые серверы: Yahoo, AltaVista, Rambler, Yandex.
Цель моей курсовой работы заключается в изучении основных принципов хранения и поиска данных сети Интернет. Главная задача состоит в рассмотрении:
1. понятия и значения гипертекстового документа;
2. видов графических файлов сети Интернет;
3. основных правил поиска информации.
Кроме того, особое внимание следует уделить обзору поисковых систем Интернет.
Данная курсовая работа выполнена с использованием технических и программных (Microsoft World, Internet Explorer) средств.
Термин гипертекст был введен Тедом Нельсоном (Ted Nelson) еще в шестидесятых годах. Так называется текст, в который включены интерактивные ссылки на другие документы. С их помощью читатель, указав на какое-либо слово или фразу, немедленно получает дополнительную информацию по соответствующему предмету. Гипермедиа - более широкое понятие, которым обозначают документы, включающие в себя мультимедиа-информацию, например, звук или видео.
Таким образом, гипертекстовая база данных в концепции Web — это набор текстовых файлов, размеченных средствами языка HTML, который определяет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки).
Гипертекст принадлежит к системам автоматизации деятельности по обработке информации и служит для облегчения поиска нужной информации. Идея гипертекста состоит в том, чтобы дать возможность человеку воспринимать информацию в последовательности, отвечающей его интересам. Сегодня гипертекстовой документ представляет собой множество фрагментов информации (статей), объединенных в некоторую сетевую структуру. В качестве информационных фрагментов могут выступать текст, графический образ, анимация, видео ролики и даже программа. Гипертекстовые документы получили широкое распространение в электронных изданиях.
Идея гипертекста широко использовалась при составлении справочников и энциклопедий. Например, в тексте статьи энциклопедии по какому-либо вопросу встречаются ссылки типа "смотри статью такую-то", содержащую дополнения и пояснения к текущей проблеме. В настоящее время используемая технология гипертекста обеспечивает доступ к большим массивам текстовой информации, не поддающейся упорядочиванию обычными способами.
Наиболее популярным направлением применения гипертекстовых технологий в сети Интернет являются web-публикации организованные в локальные архивы, сайты или web-страницы.
Согласно словарю гипертекст рассматривается как мультимедийное приложение с использованием текста и графики. Гипертекст допускает такое представление документов, которое имитирует ассоциативное структурирование понятий человеком в противопоставление линейному порядку следования понятий в книгах, фильмах и в речи.
Фактически гипертекст - это технология работы с текстовыми данными, позволяющая устанавливать ассоциативные связи (гиперсвязи или гиперссылки между фрагментами, статьями и графикой в текстовых массивах). Благодаря этому становится доступной не только последовательная, линейная работа с текстом, как при обычном чтении, но и произвольный ассоциативный просмотр в соответствии с установленной структурой связей, а также с учетом личного опыта, интересов и настроения пользователей.
С точки зрения реализации, гипертекст представляет собой множество именованных фрагментов (страниц, статей или других элементов) информации, объединенных в сетевую структуру с помощью системы связей между фрагментами.
Эти связи в гипертекстовых документах выступают как гиперссылки - связи между различными фрагментами гипертекста, представляющие собой ссылки на конкретное место в публикации, куда осуществляется переход при активизации данной гиперссылки. Обычно гиперссылки выделяются в тексте документа и активизируются путем однократного нажатия курсором мыши или нажатия определенной функциональной клавиши. Гиперссылка может быть оформлена, например, как подчеркнутый фрагмент текста, рисунок, фрагмент рисунка. Особого внимания заслуживает способ осуществления гиперсвязей путем сопоставления различным частям графического изображения (например, карты) различных гиперссылок. Все гиперссылки можно разделить на две принципиально разные категории.
Локальные гиперссылки - это ссылки на другие части того самого документа, откуда они осуществляются (например, ссылки из «содержания» на главы публикации, ссылки из одной главы на другую, от какого-либо термина на его определение, расположенное в словаре терминов данной публикации и т.п.).
Глобальные гиперссылки - это ссылки на другие документы, в общем случае на какие-либо ресурсы, расположенные вне данного документа, например в другом файле, логически не связанном с документом и существующем независимо от него, либо на странице удаленного Web-сервера.
При этом если локальные гиперссылки практически всегда выполнимы, т.е. выполнение данной ссылки приводит к появлению той части документа, куда должен осуществляться переход по ссылке, то для глобальных гиперссылок возможны случаи, когда требуемый ресурс, на который производится ссылка, по тем или иным причинам отсутствует. Таким образом, при использовании в электронных публикациях подобных ссылок необходимо обновлять публикации при изменениях, связанных с теми документами, на которые производится ссылка.
В Интернет чаще всего встречаются файлы следующих типов:
1. Выполняемые файлы - содержат программы, которые могут быть выполнены на компьютере. Для запуска такого файла достаточно дважды щёлкнуть на его имени в окне программы Проводник.
2. Текстовые файлы:
-TXT, ASC – простые текстовые файлы без элементов форматирования. Могут быть прочитаны стандартной программой Windows Блокнот.
-DOC – документы, созданные в редакторе Microsoft Word. Поскольку у этого редактора множество версий, на самом деле файлы с одним и тем же расширением .doc могут иметь разные форматы. Иногда такое расширение бывает и у файлов формата TXT.
3. Графические файлы:
-JPEG;
-GIF;
-PNG;
-PCX;
-TIFF;
-BMP (см. пункт 1.2).
4. Смешанные текстово-графические файлы:
-PS – документ формата PostScript, часто используется для хранения научных статей, отчётов и диссертаций;
-PDF(Portable Documents Format) – позволяет сохранять тексты, сопровождаемые изображениями, в виде единого файла.
5. Звуковые файлы можно разделить на две большие группы: обычные, используемые для хранения музыки прочих звуков на компьютере (а также для передачи их в виде файлов через Интернет), и файлы, используемые для потокового вещания. К первым относятся файлы теперь уже редко используемых форматов WAV, AU и AIF, а также чрезвычайно популярные файлы формата MP3 (см. ниже), ко вторым – файлы формата RA.
-MP3 – формат звукозаписи, используемый в видеозаписях формата MPEG, название которого образовалось в результате сокращения аббревиатуры «MPEG уровня 3». Приобрёл большую популярность, во-первых, потому что именно в этом формате на Web-узлах Интернета хранится огромное количество музыкальных записей; во-вторых, потому что появились портативные, очень надёжные (поскольку они не имеют движущихся частей) плейеры, в память которых можно загружать музыку из Интернета и потом слушать её «на ходу»;
-RA (RealAudio) – первый формат для распространения через Интернет передач радиостанций; был предложен в 1995 году компанией RealNetworks. Одноимённый стандарт регламентировал методы передачи и приёма потокового радиовещания через модемные линии со скоростью 28 Кбит/c и выше;
SDMI (Secure Digital Initiative) - этот формат был разработан звукозаписывающими компаниями с целью воспрепятствовать нелегальному копированию музыкальных записей. Естественно, его появление не вызвало энтузиазма у Интернет-сообщества.
6. Мультимедийные и видеофайлы:
-RM и RAM – форматы мультимедийных файлов, предназначенных для потоковой передачи через Интернет; предложены компанией RealNetworks;
-AVI (Audio/video Interleave) – формат компании Microsoft, используется для хранения видеофайлов, не предназначенных для потокового вещания;
-WMA и его модификация ASF/ASX – разработаны компанией Microsoft специально для потокового вещания. Формат ASF/ASX хорошо подходит для передачи звука, как по низкоскоростным каналам, так и по каналам со скоростью передачи 64-128 Кбит/с;
-MPEG-4 – формат, созданный специально для сжатия и потоковой передачи видеофильмов. Позволяет передавать полноэкранные видеоизображения, сопровождаемые стереозвуком приемлемого качества, по каналам с пропускной способностью 400 Кбит/с, т. е. по спутниковым каналам доступа к Интернету. Широко используется также для хранения видеофильмов на сайтах и записи на компакт-диски.
7. Сжатые файлы:
-ZIP, ARJ и RAR – конкурирующие форматы, часто используемые для хранения сжатых файлов в системе Windows;
-GZ, Z – сжатые файлы в системе UNIX. Если перед сжатием они были заархивированы программой Tar, то расширение файла может быть таким: tar.gz либо tag.z.
Компьютерная графика - одна из важнейших информационных технологий. Существует огромное множество графических форматов, однако для публикаций в Интернет используются, в основном, только два - GIF (Graphics Interchange Format) и JPEG (Joint Photographic Experts Group). Web-броузер несложно настроить и на другие форматы, такие как TIFF (Tagged Image File Format) и PNG.
Файловый растровый формат GIF (Graphics Image Format) был предложен фирмой CompuServe Inc. для протокола передачи цветных изображений в глобальных сетях. С его помощью организуется обмен графическими и содержащими элементы графики файлами. Этот формат используется для хранения нескольких растровых изображений в одном файле и применяется для обмена растровыми данными между платформами и системами.
Таблица 1.
Взгляд на GIF |
|
Имя: | GIF, Graphics Interchange Format |
Расширения: | .gif |
Используется для: | Обмена 8-разрядной графикой |
Ссылки: | CompuServe`s Defenitions of the GIF format |
CD: | Разнообразные программы просмотра графики, конверторы и GIF спецификации |
Информация о работе Организация хранения и поиска информации в сети Internet