Поиск информации в сети Интернет в школьном курсе информатики

Автор работы: Пользователь скрыл имя, 29 Марта 2012 в 15:43, дипломная работа

Краткое описание

Цель исследования конкретизируется в следующих основных задачах:
 изучить теоретические аспекты указанной проблемы и дать общую характеристику существующего подхода к изучению основ работы глобальной сети Интернет и ее сервисов (на примере поиска информации) в рамках базового курса информатики;
 проанализировать методические аспекты преподавания раздела «Поиск информации в сети Интернет» на уроках информатики;
 провести отбор учебного материала по данному разделу и представить его в гипертекстовом формате;
 разработать поурочные методические рекомендации для преподавания раздела «Поиск информации в сети Интернет».

Содержание работы

Введение
3
Глава 1. Теоретические основы функционирования сети Интернет ……………………………………………………..

7
1.1. Развитие глобальной сети Интернет: историческая справка .………………………………………………………..
7
1.2. Представление информации в сети Интернет………….
11
1.3. Классификация средств поиска….………………………
16
Глава 2. Тема «Поиск информации в сети Интернет» в школьном курсе информатики……………………………
34
2.1. Роль и место темы «Поиск информации в сети Интернет» в авторских программах ………………………….
34
2.2. Методические рекомендации: обобщенный алгоритм обучения поиску информации ….…………………………….
44
2.3. Дидактическое обеспечение темы «Поиск информации в сети Интернет»……………………………………………….
57
Заключение…………………………………………………………….
92
Литература……………………………………………………………..
94

Содержимое работы - 1 файл

ДИПЛОМ.doc

— 6.63 Мб (Скачать файл)

      ошибка при вводе адреса;

      известный адрес оказался неверным;

      интересующий ресурс отсутствует (находится на реконструкции или вообще больше не существует);

      изменилась структура сайта, и маршрут доступа к конкретному ресурсу тоже изменился [5].

Навигация по сайту. Несмотря на существенную свободу в выборе стиля оформления  и структуры сайта, на сегодняшний день сформировались определенные правила создания сайтов. На сайте  существует как минимум один из четырех способов навигации:

      навигационная панель (navigation bar);

      встроенная система поиска (search service);

      карта сайта (site map);

      меню перехода (jump menu).

Навигационная панель может выглядеть по-разному, обычно она оформляется в виде набора кнопок или закладок и размещается либо в верхней части страницы, либо слева. Хотя  на многих современных страницах используются совместно оба вида панелей: верхняя (горизонтальная) обычно обеспечивает навигацию по крупным разделам сайта, а вертикальная – по страницам внутри раздела.

Встроенная система поиска имеется практически на всех более или менее крупных сайтах. Чтобы воспользоваться ее услугами, достаточно указать в текстовом поле цель поиска (ключевое слово) и щелкнуть на расположенной рядом кнопке (она может называться и выглядеть по-разному).

Карта сайта позволяет получить общее представление о содержании сайта. Раньше она оформлялась в виде графической схемы, с помощью которой можно было не только получить представление о содержании ресурса, но и увидеть взаимосвязь между страницами сайта. Теперь же на большинстве сайтов карта реализована в виде иерархии текстовых гиперссылок. Как правило, карта сайта помещается на отдельной странице, ссылка на которую входит в навигационную панель сайта.

Меню перехода обычно делают в виде раскрывающегося списка, в котором перечислены основные разделы сайта. Выбрав пункт в списке, пользователь переходит в соответствующий раздел. Меню перехода используется на крупных сайтах с большим числом страниц. Основное его преимущество – экономия места на странице.

При поиске  требуемого ресурса на малознакомом сайте желательно воспользоваться следующими советами:

      чтобы разобраться в структуре незнакомого сайта, изучите его навигационную панель, а еще лучше – постарайтесь открыть страницу с картой сайта;

      прежде чем щелкнуть на заинтересовавшей вас ссылке, взгляните на ее URL, отображенный в строке состояния окна браузера;

      если вы «потерялись» на сайте, вернитесь на его главную страницу;

      чтобы выбраться с «тупиковой» страницы или попробовать отыскать «переехавший» или переименованный ресурс, используйте последовательное усечение URL справа налево [5].

FTP-архивы. Протокол FTP (File Transfer Protocol – протокол передачи файлов) был разработан задолго до появления WWW – «Всемирной паутины». Серверы FTP стали наиболее важным средством хранения, накопления и распространения файлов и программ.

Структура FTP-сервера аналогична древовидной структуре каталогов и файлов компьютера пользователя: корневой каталог и его подкаталоги, многие из которых, в свою очередь, содержат подкаталоги. В них хранятся файлы двух типов: двоичные и текстовые. При работе со старыми клиентскими программами нужно было указать тип получаемого файла, современные определяют тип автоматически [7].

Например, чтобы получить доступ к богатому FTP-архиву новосибирской компании РИНЕТ, достаточно ввести в адресной строке браузера его URL (ftp://ftp.nsk.su) и в окно браузера будет загружен каталог папок и файлов архива.

Для работы с FTP-архивами существуют специальные программы, которые называются FTP-клиентами [5]. Несколько FTP-клиентов можно найти на сайте Tucows (www.tucows.com). С узла www.ipswitch.com можно загрузить популярный FTP-клиент WS_FTP.

В мире FTP активно используются специальные поисковые серверы. Один из самых популярных  российских FTP-поисковиков – FTPindexer.ru (www.reliz.ru). В его базе данных сейчас свыше полутора тысяч FTP-серверов (в основном российских) [7]. Еще один пример машины FTP-поиска – русскоязычный ресурс FileSearch.ru (www.filesearch.ru). Это поисковый сервер, индексирующий несколько тысяч FTP-серверов по всему миру и осуществляющий поиск по их содержимому. В настоящее время в базе поиска находится более 70 миллионов файлов [5].

Каталоги. Всемирная паутина поначалу ориентировалась на работу с популярными в Интернете  файловыми архивами (FTP и  Gopher) и первые поисковые системы предназначались для работы с каталогами.

Информация в каталоге упорядочена по темам  и организована в виде древовидной структуры. Такое дерево обычно называют классификатором [5].

Поисковые каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог [4].

Идея поиска состоит в том, что посетитель просматривает классификатор и отыскивает интересующий его раздел. Разделы самого нижнего уровня иногда называют рубриками. Каждая рубрика  содержит перечень адресов ресурсов Интернета (обычно в виде гипертекстовых ссылок), отвечающих, по мнению авторов каталога, данной тематике. Чтобы попасть на страницу с искомым материалом, достаточно щелкнуть мышкой на соответствующей ссылке в рубрике. Таким образом, названия разделов и рубрик  играют роль ключевых слов, по которым ведется поиск, а составители каталога (систематизаторы) являются посредниками между посетителем и поисковой системой.  И в этом  случае посетитель формулирует свой запрос мысленно,  что снижает требования к его точности и корректности, но и процесс поиска  он во многом берет на себя.

Поскольку создатели каталогов понимают, насколько трудно учесть все возможные запросы посетителей и их образ мышления, в каталогах широко применяются такие приемы, как отсылка и ссылка. Эти приемы используются в ситуации, когда документ можно отнести к нескольким  разделам классификатора, а лицо, осуществляющее поиск, может не знать, к какому именно.

Отсылка используется тогда, когда создатели классификатора могут отнести документ к одному из разделов классификатора, а посетитель с высокой вероятностью может обратиться в другой раздел в поисках этого документа. Тогда в этом другом разделе помещается отсылка на тот раздел классификатора, в котором действительно размещена информация о документах данного типа.

Ссылка используется в менее однозначной ситуации, когда даже  создатели классификатора не в состоянии отнести документ к определенному разделу классификатора.

Стремясь увеличить число посетителей, создатели каталогов дополняют свои сайты другими сервисами Интернета, такими как бесплатная электронная почта, каналы новостей и т. д., что делает поисковые системы (не только каталоги, но и другие их виды) все больше похожими на порталы [5].

К преимуществам поисковых каталогов можно отнести следующие:

      каталоги  имеют удобную древовидную  структуру, позволяющую быстро найти сайты на заданную тему;

      Web-узлы на заданную тему перечисляются в порядке их значимости (с точки зрения редакторов каталогов). Возможна сортировка по посещаемости, дате открытия и другим критериям;

Но есть у каталогов и недостатки. Наиболее серьезные из них:

      поскольку отбор ресурсов Internet, упоминаемых в каталоге, ведут его редакторы, это сказывается на объективности «ранжирования» сайтов;

      в каталоги попадают далеко не все сайты. Владельцы некоторых не афишируют свои детища, а редакторы каталога не в состоянии просмотреть сотни тысяч Web-узлов Сети, чтобы включить в свой каталог наиболее интересные;

      обновление каталогов происходит достаточно медленно [7].

Самый крупный каталог Интернета –Yahoo (www.yahoo.com). В нем работают более 150 квалифицированных редакторов. Это большая организация, но ее усилий хватает лишь на то, чтобы поддерживать каталог на уровне примерно 1 миллиона ресурсов. Так как Yahoo! система англоязычная, то достаточно удобно использовать Интернет-переводчик, такой как «Сократ Интернет» (http://www.arsenal.ru). Российский вариант Yahoo – http://www. yahoo.ru/ [18].

Поисковые машины (указатели). С развитием Интернета  и с лавинообразным увеличением объема его ресурсов  каталоги уже не могут в полной мере удовлетворить запросы пользователей, и поэтому в состав  многих из них включаются другие механизмы поиска, в частности, поисковые машины [5].

Web-узел, специализирующийся на поиске информации, принято называть поисковым сервером, или информационно-поисковой системой (ИПС) [7].

Работа поисковых машин основана на использовании так называемой индексной базы данных (или просто индекса). В ней хранятся ключевые слова и адреса документов, в которых эти слова встречаются. В зависи­мости от профиля специализации поисковой машины используемые в ней ключевые слова могут либо относиться к какой-то конкретной предметной области, либо охватывать все области человеческой дея­тельности, представленные в Интернете [5].

Если человек способен понимать чужую речь, исходя из контекста, то технические сис­темы предпочитают работать с формализованными данными. Возникает необходимость представления информационной потребности в виде набора определенных понятий, которые должны выступить в качестве ключевых понятий. При составлении данного набора значение имеют не только слова, но и отношения между ними. Данную совокупность принято называть запросом [18].

При обработке запроса поисковой машиной содержащиеся в нем ключевые слова сравниваются с ключевыми словами, хранящимися в базе дан­ных машины. Очевидно, что успешность поиска зависит от «словарно­го запаса» системы. Упрощенная структура поисковой машины показа на рис. 3.

Рис. 3. Упрощенная структура поисковой машины

 

Основные элементы:

      пользовательский интерфейс (user interface) — средства и пра­вила взаимодействия пользователя с поисковой системой, реали­зованные в виде веб-страниц, отображаемых браузером на компью­тере пользователя. Элементами пользовательского интерфейса являются, в частности, правила написания запросов и способ пред­ставления результатов поиска.

      механизм поиска (search engine) — программный алгоритм об­работки запроса посредством поиска в индексной базе данных. Обычно алгоритм поиска, как и способ организации самой базы данных, является «секретом фирмы» и ее гордостью. Программа обработки запроса выполняется на сервере, предоставляющем со­ответствующую услугу.

      индексная база данных (Index database) — основной информа­ционный ресурс поисковой системы; обеспечивает хранение и по­иск адресов ресурсов Интернета. Структура индекса выбирается таким образом, чтобы поиск происходил максимально быстро и при этом можно было бы оценить ценность каждого из найденных ин­формационных ресурсов Сети.

      библиотека запросов пользователя (Queries) — личная база данных пользователя. На отладку каждого запроса уходит доста­точно много времени, и поэтому чрезвычайно важно запоминать запросы, на которые система дает хорошие ответы.

      робот (Index robot, crawler) — специальный программный компонент по­исковой машины, который служит для просмотра ресурсов Интер­нета с целью оперативного обновления индексной базы данных. Эта программа является основным источником информации о со­стоянии информационных ресурсов Сети [5].

После ввода запроса поисковая система осуществляет выборку документов, с последующим формированием результата по определенным кри­териям которые внесены в параметры поиска. Совокупность документов, которая соответствует запросу (выдача, отклик), характеризуется свойст­вом релевантности (relevance), т. е. показателем уровня соответствия отклика запросу [18].

Как сказал Ф. И. Тютчев, «мысль изреченная ложь». То, что пользователь на самом деле хочет найти (его реальная информационная потребность) и то, что он поручает найти ИПС (формализованная информационная потребность) – вещи существенно разные. Соответственно разными будут и релевантности.

Различают смысловую и формальную релевантность, когда соответствие рассматривается либо относительно информационной потребности потре­бителя, либо относительно запроса.

Поисковая система в состоянии определять лишь формальную реле­вантность документа, когда наличие или отсутствие ключевых слов в до­кументе в заданном соотношении является основным параметром поиска [7].

Большинство поисковых машин упорядочивают список документов, отвечающих запросу, по релевантности. Иногда релевантность документа имеет числовое выражение в виде так называемого коэффициента релевантности, который может принимать значения в диапазоне от 0 до 1. Чем «релевантнее» документ, тем больше этот коэффициент [9].

Другими важными характеристиками результатов поиска являются полнота и точность. Полнота отражает отношение релевантных откликов к количе­ству всех возможных документов, удовлетворяющих информационную потребность. Точность выражает отношение совокупности релевантных откликов, к количеству всех выданных документов [18].

Операция сортировки полученных результатов называется ранжированием. При ранжировании документов обычно оцениваются следующие их характеристики:

      количество вхождений ключевой фразы;

      расположение слов запроса в тексте документа (в заголовке, в се­редине, в подрисуночных подписях и т. д.);

      формы слов запроса — преимущество отдается вхождениям, в ко­торых слова имеют тот же падеж, число, склонение и т. д., что и в запросе пользователя;

      расстояние между словами запроса — если запрос состоит из не­скольких слов, то в найденных документах оценивается, насколько близко друг от друга расположены эти слова; преимущество отдается документам, в которых слова запроса находятся ближе друг к другу;

Информация о работе Поиск информации в сети Интернет в школьном курсе информатики