Автор работы: Пользователь скрыл имя, 07 Октября 2011 в 19:16, курсовая работа
Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.
Введение………………………………………………………….
Глава 1. Хранение данных в сети Internet………………………….
1.1. Гипертекстовые документы, виды файлов………………
1.2. Графические файлы, их виды и особенности…………………….
1.3. Поисковые системы и правила поиска информации…………..
Глава 2. Обзор и характеристика поисковых систем сети Internet…………
2.1. Rambler……………………………………………………………..
2.2. Yandex…………………………………………………………….
2.3. Yahoo……………………………………………………………….
2.4. Altavista…………………………………………………………..
Выводы и предложения……………………………………………………
Список использованной литературы………………………………….
Содержание
Введение…………………………………………………………
Глава 1. Хранение
данных в сети Internet………………………….
1.1.
Гипертекстовые документы, виды файлов………………
1.2.
Графические файлы, их виды и особенности…………………….
1.3.
Поисковые системы и правила поиска информации…………..
Глава 2. Обзор
и характеристика поисковых систем
сети Internet…………
2.1.
Rambler……………………………………………………………
2.2.
Yandex…………………………………………………………….
2.3.
Yahoo……………………………………………………………….
2.4.
Altavista………………………………………………………
Выводы и предложения…………………………
Список использованной
литературы………………………………….
Введение
Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.
Сегодня даже создатели российской электронной паутины и активные пользователи российского Интернет часто слабо представляют его границы, содержание и степень упорядоченности. В течение последних 6 – 7 лет внедрение Интернет технологий и услуг в России идёт достаточно высокими темпами. В целом в развитии Интернет в России наблюдаются те же, что и во всём мире. Однако в России имеются некоторые национальные особенности такие как: уровень общего экономического развития, развития сетей связи, покупательная способность населения, покупательная способность населения, и др.
Глобальная сеть Интернет практически проникла как в производственные, учебные заведения, так и в повседневный быт человека и вызывает особый интерес у подрастающего поколения. А ведь именно благодаря произвольному обучению человек в течение своей жизни приобретает наибольшую часть знаний и навыков. Таким путем он осваивает родной язык, основные культурные ценности, общие установки и модели поведения, передаваемые через семью, общественные организации, средства массовой информации, музеи, игры и все другие культурные институты общества. Бурное развитие и в рост влияния современных средств массовой информации, особенно, таких как телевидение и Интернет, имеющих широкие возможности воздействия на процессы становления личности, становятся ощутимыми в процессах произвольного и непрерывного образования личности. Необходимо взять эти процессы под контроль педагогической науки и по возможности заняться их координацией для более целевого создания информационных культурно-образовательных ресурсов и их эффективного использования при формировании процессов становления и развития личности современного информационного общества
В данной курсовой работе рассматриваются теоретические основы хранения и поиска информации в сети Интернет, классификация и разновидности информационно поисковых систем. Представлен материал по применяемым в настоящее время информационно - поисковым каталогом полнотекстовыми и гипертекстовым поисковым системам.
В силу огромного числа документов, а по некоторым оценкам число Web-страниц достигло 2,1 млрд., проблема поиска нужной информации в Интернете приобретает все большую остроту. Поэтому одной из основных задач является формирование у студентов знаний и навыков организации поиска информации в сети Интернет.
При появлении сети Интернет проблема поиска становилась более актуальной. Интернет - всемирная компьютерная сеть, представляющая собой единую информационную среду и позволяющая получить информацию в любое время. Но с другой стороны в Интернете храниться очень много полезной информации, но для поиска её требуется затрачивать много времени. Эта проблема послужила поводом к появлению поисковых машин. В данной курсовой работе будут рассмотрены поисковые машины в Интернете.
На сегодняшний день мы не можем представить себя без выхода во всемирную паутину. Интернет имеет такие уникальные характеристики:
Глава 1. Хранение данных в сети Internet
1.1.
Гипертекстовые документы,
виды файлов
HTML - основной рабочий формат всемирной паутины. Разработан Тимом Бернерсом-Ли в 1993 году, на компьютере NeXT (в операционной системе NeXTstep, одном из предков Mac OS X). Основное предназначение этого формата - гиперссылки. Конструкции, позволяющие быстро переходить к другим местам в тексте, где бы они не находились (внутри самого документа, в другом документе той же файловой системы, где-то на планете Земля, а скоро к ним добавится и «где-то в Солнечной системе»). По сути это еще один «богатый текстовый формат», но с рядом важных отличий. Он «богаче» (может ссылаться на графику и мультимедия, каскады форматов (CSS), поддерживает с десяток языков скриптования и программирования (JavaScript, Python, Ruby, AppleScript, Visual Basic и другие). Помимо текстов, на HTML вполне можно программировать несложные «программы» - например, на Всероссийской Коференции Маковских Разработчиков весной 1998 года, аспирантка одного из Московских медицинских институтов продемонстрировала программу диагностирования рака молочной железы, написанную исключительно на HTML (совместимую с любым интернет-браузером в мире), и, тем не менее, очень эффективную и полезную. Файлы в формате HTML можно использовать для передачи самого сложного и богатого «контента», но для этого приходится использовать большое число различных вспомогательных файлов. Большинство современных почтовых клиентов поддерживают, помимо «чисто текстового» формата сообщений, еще и сообщения в HTML. И почти у всех почтовых клиентов в мире с чтением таких почтовых сообщений есть те или иные проблемы. Прикреплять документы в виде HTML к почтовым сообщениям... можно. Но с умом. Следует помнить, что иллюстрации, диаграммы и прочая графическая информация, отображаемая на HTML-страницах в интернет-браузере, существует в виде отдельных файлов, на которые в теле таких документов должна быть «жесткая» ссылка. Большинство браузеров умеет работать с кодировками, и позволяет (если в документе не указана правильная кодировка, или она не указана вообще) выбрать кодировку интерпретации данных из списка.
PDF-формат
документов распространен
PDF – универсальный формат для обмена документами. PDF-файлы одинаково отображаются на всех компьютерах, их можно защищать паролями от несанкционированных действий, их удобно хранить в электронных архивах.
Электронные публикации удобны для распространения информации, так как они становятся доступными широкой аудитории, использующей универсальные программы просмотра. При этом формат файла зависит от характера документа.
PDF
(Portable Document Format) - это формат представления
документов, независимый от приложения
и компьютерной системы.
PDF
является развитием языка
PDF
имеет множество технических
достоинств. При просмотре на
экране компьютера большинство
документов выглядит
PDF предоставляет пользователю много возможностей, включая создание гиперссылок (как внутри документа, так и на внешние URL). Программа просмотра PDF снабжена возможностями поиска слов в тексте, хотя поиск между документами проблематичен. Поддерживаются аннотации. Поддержка принтеров великолепна. Существует даже возможность воспрепятствовать распечатке или иному использованию документа пользователем способами, которые не одобрены создателем документа.
После некоторых колебаний в начале, фирма Adobe проницательно повела маркетинговую политику, частью которой стало создание прекрасных программ для просмотра PDF файлов на любых типах компьютеров, которые свободно доступны в Интернете. Фирма зарабатывает деньги на продаже средств создания PDF файлов. Adobe является собственником спецификации на PDF, однако - будучи заинтересованной в максимальном распространении этого формата в качестве универсального средства обмена - она свободно выдает разрешения на создание PDF файлов, разработку приложений, предусматривающих выдачу результатов в PDF формате и на написание программного обеспечения для чтения и обработки файлов. Конкуренты могут создавать продукты, которые будут соперничать с Adobe, но фирма сознательно идет на такой риск.
PDF публикация (документ) содержит одну или более страниц. Каждая страница может содержать любые компоненты электронного издания: текст, графику и иллюстрации, анимацию и видео и аудио информацию в аппаратно-независимом формате, в виде, так называемого, страничного описания (page description). PDF-публикация может также содержать информацию, обеспечивающую навигацию в гипертекстовой электронной публикации.
Кроме того, публикация содержит версию спецификации PDF, использованную в конкретном файле, и информацию о расположении структуры файла.
OpenDocument Format (ODF – от OASIS Open Document Format for Office Application – открытый формат документов для офисных приложений) – открытый формат файлов документов для хранения и обмена редактируемыми офисными документами, в том числе текстовыми документами (такими, как заметки, отчеты и книги), электронными таблицами, рисунками, базами данных, презентациями.
Стандарт был разработан индустриальным сообществом OASIS и основан на XML-формате. 1 мая 2006 г. принят как международный стандарт ISO/IEC 26300.
Стандарт был совместно разработан различными организациями, доступен для всех и может быть использован без ограничений. OpenDocument представляет собой альтернативу частным закрытым форматам, включая DOC, XLS и PPT (форматы, используемые в Microsoft Office 97 – 2007), а также формату Microsoft Office Open XML.
Формат TXT. Простые текстовые файлы содержат текст, только текст и ничего кроме текста. О том, какая кодировка использовалась при создании документа, можно только догадываться. Если пересылаемые по электронной почте данные можно, без потери важной информации, представить в виде текста, этот формат отлично подходит. Но, только если отправитель уверен в том, что операционные системы получателей используют в своей работе те же кодировки, что и он. В Windows, юниксах (например, Ubuntu) и на Mac OS X русскоязычные тексты кодируются по-разному. К «чисто текстовым» файлам относятся, например, исходные тексты на различных языках программирования (с самыми разными расширениями, например, «c», «h», «rb», «m», «mm» и т.п.), «сложные» текстовые форматы (например, RTF, HTML или PostScript), разнообразные служебные и специальные файлы (например, XML, INI и многие другие). Считается, что исходные тексты программ можно пересылать именно в их исконном виде... это правильно, но только если (а) компьютер получателя использует ту же кодировку, что и компьютер отправителя или (б) комментарии в исходном тексте на английском языке. Иначе получателю, чтобы прочитать комментарии, придется прибегать к всевозможным трюкам. Кстати, в Mac OS X и в Windows кодировка большинства «маленьких» букв совпадает (кроме «я», «ь», «ъ» и «ё»). «Большие» все разные. Это может пригодиться. Для пересылки небольших по размеру текстов по электронной почте иногда лучше всего просто впечатать (или скопировать) текст в тело сообщения. Почтовые клиенты умеют позаботиться о кодировках. Почти всегда полученный текст удается прочитать (иногда попробовав для этого несколько кодировок из списка предлагаемых почтовым клиентом).