Поиск информации в сети Интернет

Автор работы: Пользователь скрыл имя, 03 Мая 2013 в 00:03, курсовая работа

Краткое описание

Цель работы - получить более глубокую теоретическую и практическую подготовку по специальности на основе самостоятельного изучения и обобщения научной, учебной литературы и нормативных документов, а также формирования умений и навыков по работе в сети.
Задачами работы являются:
1. ознакомиться с всемирной компьютерной сетью Интернет и используемыми в ней технологиями;
2. освоить приемы эффективного поиска необходимой информации в сетевых ресурсах;

Содержание работы

ВВЕДЕНИЕ 3
1. ПОИСК ИНФОРМАЦИИ В СЕТИ 5
1.1. Поиск по тематическим каталогам 5
1.2. Поиск с помощью поисковых систем 7
2. ПОИСК МАТЕРИАЛОВ ПО ТЕМЕ МАГИСТЕРСКОЙ ДИССЕРТАЦИИ В ИНТЕРНЕТЕ 11
ЗАКЛЮЧЕНИЕ 18
СПИСОК ЛИТЕРАТУРЫ 19
ПРИЛОЖЕНИЕ 21

Содержимое работы - 1 файл

BLACK_DEVIL.doc

— 888.50 Кб (Скачать файл)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ  РЕСПУБЛИКИ БЕЛАРУСЬ

УЧРЕЖДЕНИЕ ОБРАЗОВАНИЯ

“ПОЛОЦКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ”

 

 

 

Факультет информационных технологий

Кафедра информационных технологий

 

 

 

 

 

КУРСОВАЯ РАБОТА

по дисциплине

 

“Основы информационных технологий”

 

на тему:

“Поиск информации в сети Интернет”

 

 

 

 

Выполнил: магистрант   Бездель А.О.

 

 

Проверил:      Оськин А.Ф.

кандидат технических наук, доцент

 

 

 

 

 

 

Полоцк, 2012

Содержание

 

 

 

ВВЕДЕНИЕ

Internet – всемирная информационная  компьютерная сеть, представляющая  собой объединение множества  региональных компьютерных сетей  и компьютеров, обменивающих друг  с другом информацией по каналам  общественных телекоммуникаций (выделенным телефонным аналоговым и цифровым линиям, оптическим каналам связи и радиоканалам, в том числе спутниковым линиям связи).

 Информация в Internet хранится  на серверах. Серверы имеют свои  адреса и управляются специализированными  программами. Они позволяют пересылать почту и файлы, производить поиск в базах данных и выполнять другие задачи.

 Обмен информацией между  серверами сети выполняется по  высокоскоростным каналам связи  (выделенным телефонным линиям, оптоволоконным  и спутниковым каналам связи). Доступ отдельных пользователей к информационным ресурсам Internet обычно осуществляется через провайдера или корпоративную сеть.

 Провайдер - поставщик сетевых  услуг – лицо или организация  предоставляющие услуги по подключению  к компьютерным сетям. В  качестве провайдера выступает некоторая организация, имеющая модемный пул для соединения с клиентами и выхода во всемирную сеть.

 Основными ячейками глобальной  сети являются локальные вычислительные  сети. Если некоторая локальная  сеть непосредственно подключена к глобальной, то и каждая рабочая станция этой сети может быть подключена к ней.

Существуют также компьютеры, которые  непосредственно подключены к глобальной сети. Они называются хост - компьютерами (host - хозяин). Хост – это любой  компьютер, являющийся постоянной частью Internet, т.е. соединенный по Internet – протоколу с другим хостом, который в свою очередь, соединен с другим, и так далее.

Для подсоединения линий связи  к компьютерам используются специальные  электронные устройства, которые  называются сетевыми платами, сетевыми адаптерами, модемами и т.д.

 Практически все услуги Internet построены на принципе клиент-сервер. Вся информация в Интернет  хранится на серверах. Обмен информацией  между серверами осуществляется  по высокоскоростным каналам  связи или магистралям. Серверы, объединенные высокоскоростными магистралями, составляют базовую часть сети Интернет.

 Отдельные пользователи подключаются  к сети через компьютеры местных  поставщиков услуг Интернета, Internet - провайдеров (Internet Service Provider - ISP), которые имеют постоянное подключение к Интернет. Региональный провайдер, подключается к более крупному провайдеру национального масштаба, имеющего узлы в различных городах страны. Сети национальных провайдеров объединяются в сети транснациональных провайдеров или провайдеров первого уровня. Объединенные сети провайдеров первого уровня составляют глобальную сеть Internet.

 Передача информации в Интернет  обеспечивается благодаря тому, что каждый компьютер в сети  имеет уникальный адрес (IP-адрес), а сетевые протоколы обеспечивают взаимодействие разнотипных компьютеров, работающих под управлением различных операционных систем.

В основном в Интернет используется семейство сетевых протоколов (стек) TCP/IP. На канальном и физическом уровне стек TCP/IP поддерживает технологию Ethernet, FDDI и другие технологии. Основой семейство протоколов TCP/IP является сетевой уровень, представленный протоколом IP, а также различными протоколами маршрутизации. Этот уровень обеспечивает перемещение пакетов в сети и управляет их машрутизацией. Размер пакета, параметры передачи, контроль целостности осуществляется на транспортном уровне TCP.

Прикладной уровень объединяет все службы, которые система предоставляет  пользователю. К основным прикладным протоколам относятся: протокол удаленного досткпа telnet, протокол передачи файлов FTP, протокол передачи гипертекста HTTP, протоколы электронной почты: SMTP, POP, IMAP, MIME [1].

Цель работы - получить более глубокую теоретическую и практическую подготовку по специальности на основе самостоятельного изучения и обобщения научной, учебной литературы и нормативных документов, а также формирования умений и навыков по работе в сети.

Задачами работы являются:

  1. ознакомиться с всемирной компьютерной сетью Интернет и используемыми в ней технологиями;
  2. освоить приемы эффективного поиска необходимой информации в сетевых ресурсах;
  3. получить практический опыт поиска информации по заданной теме;
  4. освоить методы создания Web- документов;
  5. получить практический опыт создания  Web- страниц на основе найденных в сети документов;
  6. сделать обзор литературы по теме диссертации, используя ресурсы сети Интернет.

 

  1. Поиск информации в сети

1.1. Поиск по тематическим каталогам

Каталог можно представить в виде данных, которые структурированы по темам. Обычно принцип построения данных - иерархичный. Это означает, что каждый шаг поиска является выбором соответствующего подраздела с более конкретным содержанием нужной информации. На главной странице поискового каталога расположен сокращенный список крупных тематических категорий. Любая запись в списке тематических категорий является гиперссылкой.

Работать с поисковыми каталогами очень просто. В них поиск информации завершается более или менее плодотворно. Несмотря на простоту работы для пользователя создание и ведение каталога является очень сложным процессом, поскольку каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что, по их мнению, представляет общественный интерес и заносят адреса в каталог.

Однако очевидно, что учесть и предусмотреть все возможные варианты просто невозможно. Поэтому, несмотря на всю свою наглядность и открытость, каталоги - это далеко не всегда кратчайший путь к искомому результату. К тому же, нельзя не признать, что именно привычная тематическая каталогизация является причиной недостаточно высоких темпов обработки сайтов, которых к тому же становится все больше.

Предметные каталоги предоставляют и возможность автоматического поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях, хранящихся в каталоге.

Несмотря на столь низкий коэффициент охвата, поисковые каталоги пользуются огромной популярностью. Их принято использовать для первичного, реферативного поиска информации по заданной теме. Если для пользователя тема является совершенно новой и неисследованной, то он вряд ли нуждается в расширенных результатах поиска. Прежде всего ему нужны указатели на классические, наиболее содержательные ресурсы, а именно это и обеспечивают поисковые каталоги. Человеческий фактор, связанный с тем, что над составлением каталога работают люди, а не программы, обеспечивает качественный отбор наиболее важных ресурсов по каждой из тем.

Количество поисковых каталогов в мире невелико, что связано с высокой трудоемкостью их содержания и обслуживания, а также с недостатком квалифицированных кадров-редакторов.

Каталоги могут быть специализированными и универсальными.

Специализированные каталоги включают только ссылки на сайты определенной тематики. Подобные каталоги удобны для поиска информации по конкретной тематике.

Универсальные же каталоги позволяют производить поиск по различным темам. Информация сгруппирована по разделам, а каждый раздел в свою очередь имеет несколько подразделов.

Как известно, в мире нет ничего абсолютно совершенного. Поэтому каталоги имеют как преимущества, так и недостатки.

Преимуществами каталогов являются следующее:

  • структура каталогов древовидная, а это позволяет быстро найти сайты по искомой информации;
  • перечисление Web-узлов происходит в порядке значимости (конечно понятно, что значимость определяется с точки зрения редакторов). Возможно применение сортировки по посещаемости или по дате открытия и тому подобных критериев;
  • в каталоге представлены наиболее популярные Web-узлы, связанные с той или иной темой;
  • существует высокая вероятность быстро найти наиболее «информированный» сайт по заданной теме.

Как уже было отмечено, у каталогов есть и недостатки, которые заключаются в следующем:

  • так как отбор ресурсов, которые упоминаются в каталоге, ведут редакторы, то появляется такой фактор как объективность при «ранжировании» сайтов;
  • в каталогах содержатся далеко не все существующие сайты, поскольку редакторы просто не в состоянии просмотреть миллионы Web-узлов, для того чтобы включить в каталог наиболее интересные ссылки;
  • каталоги обновляются достаточно медленно, а это приводит к тому, что найденные сайты и ссылки могут поменять адрес, а зачастую и вовсе исчезнуть.

Итак, при использовании каталога пользователь имеет преимущество в том, что каждый ресурс в нем был просмотрен и отобран человеком. Кроме того, группировка сайтов по определенным темам позволяет увидеть рядом сайты близкой тематики, причем совершенно не является фактом, что клиент найдет все эти сайты, просто набрав в поисковой службе название их категории в каталоге. Понятно, что хорошие каталоги обеспечивают дополнительный сервис. Это может быть поиск по ключевым словам, автоматическое оповещение по e-mail о свежих поступлениях, списки наиболее интересных поступлений и т.д. Такая организация делает использование коллекций информации очень удобным.

Несмотря на это, в каталогах отсутствует единая классификация ресурсов и единое для всех критериев отнесение их к той или иной категории. В итоге названия и содержание разделов различных Web-каталогов хоть в целом и похожи, но могут также обладать некоторой спецификой. Таким образом, Web-каталоги хорошо подходят для первого знакомства с какой-либо предметной областью по заранее отобранным и, как правило, качественным Интернет-ресурсам. Другое применение – это поиск по самым общим вопросам - у пользователя есть возможность попутешествовать по разделам категорий и определиться с тем, что именно ему необходимо в данный момент [2].

Наиболее популярными  и серьезными каталогами считаются следующие: www.mail.ru находится по адресу list.mail.ru, каталог поисковой системы «Яндекс» находится по адресу yaca.yandex.ru, weblist.ru, www.vsego.ru, www.myweb.ru. Среди англоязычных ресурсов наиболее популярным является каталог Yahoo! (www.yahoo.com). Самым авторитетным в мире каталогом веб-страниц признан открытый каталог dmoz.org.

Страницы каталога Yahoo! содержат множество тематических категорий, организованных по иерархическому принципу. Категории на всех уровнях разветвляются на подкатегории. Корнем служит начальная страница каталога, содержащая 14 тематических ветвей. Перемещаться по тематическому дереву вверх или вниз можно посредством щелчков на именах страниц. На страницы Yahoo! встроены индексы всех Web-ресурсов, относящихся к данной теме. Все каталоги и подкатегории выделены полужирным шрифтом, а гиперссылки на существующие Web-сайты выделены подчёркиванием. Главная страница тематического каталога Yahoo! находится по адресу dir.yahoo.com (Рис. 1.1).

Одним из лучших универсальных тематических каталогов русскоязычной части Интернета является российский Яндекс. Он имеет типичное для WWW строение и способ функционирования, и на его примере мы ознакомимся с общими приемами работы с каталогами. Главная страница тематического каталога Яндекс находится по адресу http://yaca.yandex.ru/ (Рис. 1.2).

    1. Поиск с помощью поисковых систем

Одним из эффективных способов поиска необходимой информации в Интернете  являются поисковые машины. Поисковые  машины - это полностью автоматизированные системы, которые сканируют сеть Интернет. Поисковая машина - это достаточно сложный комплекс, состоящий из большого количества программ, которые обеспечивают оперативное обновление информации о Web-узлах Интернета.

Поисковая машина состоит из двух частей: робота и поискового механизма. Робот в основном сам формирует свою базу и в существенно меньшей степени это делают владельцы ресурсов, зарегистрировавшие свои сайты в поисковой машине. В периоды, когда линии связи и Web-узлы менее загружены, программы-роботы индексируют Web-страницы и документы, которые размещены в сети, и заносят о них информацию в свою базу данных.

Глубина проводимой индексации может  быть различной. Если идет речь о Web-странице, то в этом случае робот обследует  такие элементы как заголовок, ключевые слова, краткое описание страницы, составленное ее разработчиками, и собственно содержимое Web-страницы.

Полный текст документов, который  размещен на страницах, в базу данных копируют не все роботы. Некоторые  из них ограничиваются лишь названием  документа.

Когда пользователь формирует запрос, то поисковая машина обрабатывает свою базу данных и выдает перечень Web-страниц, на которых содержатся ключевые слова. Количество найденных страниц может  быть очень велико. Поэтому задача поисковой машины состоит в том, чтобы отобрать страницы, в наибольшей степени отвечающие запросу пользователя и в числе первых указать ссылки на них.

Информация о работе Поиск информации в сети Интернет