Хранение данных в сети Internet

Автор работы: Пользователь скрыл имя, 07 Октября 2011 в 19:16, курсовая работа

Краткое описание

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.

Содержание работы

Введение………………………………………………………….
Глава 1. Хранение данных в сети Internet………………………….
1.1. Гипертекстовые документы, виды файлов………………
1.2. Графические файлы, их виды и особенности…………………….
1.3. Поисковые системы и правила поиска информации…………..
Глава 2. Обзор и характеристика поисковых систем сети Internet…………
2.1. Rambler……………………………………………………………..
2.2. Yandex…………………………………………………………….
2.3. Yahoo……………………………………………………………….
2.4. Altavista…………………………………………………………..
Выводы и предложения……………………………………………………
Список использованной литературы………………………………….

Содержимое работы - 1 файл

Курсовая работа_Глотов.doc

— 474.00 Кб (Скачать файл)

      Первым  шагом к успеху стало новое, запоминающееся название – Yahoo! Следуя пожеланиям пользователей, создатели www.Yahoo.com, стали преобразовывать сайт. Появились новые категории, и разделы «What's New» и «What's Cool». К концу 1994 Янг и Фило забросили свои диссертации и полностью отдались работе над поисковиком Yahoo.

      В это  время на дороге появилась  компания Netscape, предложившая ресурсы  для содержания поисковой системы Yahoo!. В результате у Yahoo! появился свой домен - yahoo.com, и каталог переехал на 10 станций Silicon Graphics Indy. Примерно в это же время Yahoo! получил и первого инвестора - инвестиционный фонд «Seqouia Capital». Джерри и Янг обзавелись офисами и наняли энергичную команду web-серферов. Темп роста составил, в среднем, 1000 страниц в день.

      12 апреля 1996 года www.Yahoo.com выпустил свои  акции.  При номинальной цене  в 12 долларов  за штуку к  концу дня они  продавались  уже по 33 доллара. Создатели Yahoo первыми стали применять рекламу своего ресурса в печатных СМИ и на телевидении.

Новый управляющий поисковой системы Yahoo! - Тим Кугл решил развить Yahoo  из простого перечня упорядоченных линков до настоящего портала. А из финансовых новостей сделать аукционы, добавляя к ядру Yahoo.com элементы онлайнового доступа.

      Следующие вложения в поисковик Yahoo! составили 560 миллионов долларов. Yahoo.com взрослеет  и начинает действовать на рынке  как самостоятельная акула капиталистического мира. Конкуренты, в лице America Online и Microsoft, сбиваются в различные корпоративные альянсы, чтобы укреплять свои позиции в бизнесе. Подсмотрев у «врагов» методы, Yahoo в 1999 году покупают поставщика бесплатной электронной почты rocketmail.com. В то время на просторах Интернета появляются различные сайты, претендующие на звание Портал. С конкурентами расправляются по-разному. Webring.com покупают, с остальными ведут войну на бирже.

      В 2000 году поисковая система Yahoo запустили  проект под названием Corporate Yahoo! и купили тайваньский бизнес-сайт Kimo, чем заявили о желании двигаться на обширный китайский Интернет-рынок.

На сегодняшний  день Yahoo.com одна из основных поисковых  систем в Интернет, предоставляющая  услуги 200 миллионам человек в месяц.

      Нынешнее  развитие Yahoo можно определить как движение в он-лайн, интерактивность. Yahoo быстро осваивает эту область интернет-услуг, но возникает одна проблема: ядро Yahoo! не было на это рассчитано. Не была в 1994 году заложено в него «он-лайновая» составляющая, ее «приклеил» Тим Кугл несколькими годами позже. Естественно возникает угроза хакерских атак через эту незащищенную область.

      Одно  из новшеств поисковой системы Yahoo - панель задач для браузера Firefox,. Этот инструмент помогает пользоваться поиском Yahoo, не заходя на официальный сайт, а лишь используя функциональные кнопки панели.

      1 сентября 2005 года поисковик Yahoo, которому  принадлежит более 200 миллионов   адресов электронной почты по  всему миру, анонсировал запуск  новой системы поиска текстов,  фотографий и других документов, содержащихся в письмах.

      Необходимость такого нововведения возникла вслед  за увеличением объёма хранимых данных, ведь некоторые пользователи создают  целые почтовые архивы. Подгоняемый  конкурентом Google и его почтовым сервисом Gmail, Yahoo для хранения почты предлагает отныне 1 гигабайт бесплатного места, или 2 гигабайта по годовому абонементу. «Как только вы получаете возможность хранить больше информации, вам необходимы и расширенные поисковые возможности», - объясняет Эрик Петерсон, аналитик компании JupiterResearch».

      Пользователи  поисковой системы Yahoo, в свою очередь, смогут теперь использовать возможности  детализированного поиска слов в  названии или непосредственно в  тексте письма, а также в присоединенных документах, не открывая их. Результат поиска отражается в трёх строках с указанием всех атрибутов. На панели справа отображаются все похожие документы. Найденные фотографии выводятся на экран в уменьшенном виде, что значительно облегчает поиск. Система также учитывает орфографические ошибки, позволяя искать слова лишь по первым буквам.

Для начала www.Yahoo.com планирует предложить новую  систему небольшому числу американских пользователей, а затем распространить её по всему миру. Со стороны клиентов это не потребует никаких дополнительных усилий. «Когда услуга станет доступна, в левом верхнем углу страницы вашего почтового ящика появится соответствующий баннер», - обещает компания Yahoo.

      По  данным comScore Media Metrix на июль этого года, домену Yahoo принадлежит 219 миллионов адресов электронной почты, что составляет 31,5% мирового рынка, уступая лишь Microsoft с 221 миллионом пользователей сервиса Hotmail (35,5% рынка).

      11 октября  2005 года, стремясь ни  в чем не  отстать от крупнейшего конкурента, компания Yahoo объявила о намерении создать цифровую библиотеку. Причем не слишком успешный опыт Google, погрязшего в судебных разбирательствах с правообладателями, компанию не пугает, а скорее напротив — подстегивает.

      Напомним, что Google некоторое время тому назад  заключила договор на оцифровку книг в крупнейших европейских и американских университетах и библиотеках, но попытка создать крупнейшую в мире библиотеку электронных текстов вызвала яростное сопротивление опасающихся за свои доходы издателей и авторов.

      Целями  же Yahoo стали книги из библиотеки Калифорнийского университета, от издательства О`Рейли, прославившегося своими учебниками, и Национального Архива Великобритании. Войдут в «стартовый пакет» и книги из фонда Европейского Архива. Избежать затяжных судов компания намерена путем предложения потребителям получить разрешение на просмотр данных текстов от правообладателей перед переходом на «полновесный» текст. При этом поисковая система Yahoo рассчитывает поделиться с другими поисковыми сервисами возможностью проводить поиск в этой «библиотеке», в то время как Google возможности своей несостоявшейся библиотеки делить ни с кем не планировала.

      В середине 2005 года, компания Yahoo, официально объявила о достижении важного преимущества в борьбе со своим главным конкурентом на рынке сетевого поиска — компанией Google. Менеджеры считают, что поисковик Yahoo позволяет найти в два раза больше документов, чем Google. По их мнению, база данных поисковой системы Yahoo включает в себя 20,5 млрд. объектов — 19 миллиардов текстовых документов и 1,5 миллиардов изображений. Таким образом, ее поисковый индекс (число объектов, которые пользователь может найти в интернете при помощи поисковика), почти в два раза превышает аналогичный показатель поисковой системы интернет-корпорации Google — 11,3 миллиардов объектов, из которых 8,2 миллиардов текстовых документов и 3,1 миллиардов изображений.

      Ранее Yahoo никогда не раскрывала значение индекса своей поисковой системы. Отраслевые аналитики не были единодушны в оценках ее базы данных. По мнению различных экспертов, поисковик Yahoo охватывал от 6 до 8 миллиардов объектов в сети. Согласно официальному сообщению, впервые в истории Yahoo, качественный прорыв в конкурентной борьбе с Google обеспечила последняя, весьма успешная модернизация поисковой системы. «У пользователей интернета появилась очень веская причина обратить на нас внимание, — заявляет вице-президент корпорации Yahoo Экхарт Уолтер. — Наша поисковая система охватывает намного больше информации, чем любые другие».

      «Yahoo заставила  пользователей усомниться в том, что Google — самая мощная поисковая система. Это дает компании Yahoo дополнительное преимущество в борьбе за лидерство на рынке. Бренд Google для многих стал синонимом поиска информации в интернете. Задача Yahoo заключается в том, чтобы пошатнуть доверие к этому бренду», — считает аналитик компании Forrester Research Карлин Ли.

      Вот чем  живет www.Yahoo.com сегодня, когда  стоимость  одной акции уже  подкралась к $200. Сейчас поисковая система Yahoo! достигла критического размера - команде серверов с трудом удается поддерживать ее актуальность и добавлять тысячи новых сайтов ежедневно. 

    1. Altavista
 

     Одна  из наиболее популярных поисковых систем Altavista Search появилась в декабре 1995 года. Первоначально она задумывалась как демонстрация мощи 64-разрядного сервера Alpha APX корпорации Digital Equipment, однако быстро приобрела самостоятельное значение как эффективное и мощное средство поиска. По последним данным, на сегодняшний день в индексе Altavista зарегистрировано до 100 миллионов URL. Система поражает своим быстродействием - в сутки она обслуживает более 20 миллионов запросов, при этом она отвечает на запросы незамедлительно, без всякого «притормаживания». Благодаря таким характеристикам система используется не только конечными пользователями, но и другими службами поиска, в частности, каталогом Yahoo. Система обновления индекса - краулер - посещает WWW сервера во всем мире, не испытывая проблем с языковым многообразием, поскольку Altavista поддерживает поиск на 25 языках. Странички, обновляемые редко, посещаются краулером реже, чем популярные и часто обновляющиеся страницы. К сожалению, автоматически из индекса никогда не удаляются «мертвые» ссылки, поэтому по некоторым запросам количество недействующих ссылок может быть довольно велико (до 12 %). Дизайн у системы простой и удобный - в центре экрана находится окно с полем ввода запроса и кнопками «Search» и «Refine», немного ниже - ссылки на расширенный поиск, помощь, информацию о системе и страницу с настройками. Сервер не перегружен рекламой и графикой, поэтому все странички загружаются очень быстро. Даже начинающий пользователь мгновенно освоит технологию построения простого запроса к Altavist'e. К сожалению, на этом список преимуществ системы Altavista для неискушенного пользователя заканчивается. На простой запрос она выдает огромное количество результатов, многие из которых совершенно не имеют отношения к интересующей пользователя теме, а составление сложных (расширенных) запросов требует освоения специального языка, что для многих пользователей неприемлемо. Результаты поиска отсортированы с учетом частоты встречаемости ключевых слов в документе, учитывается также раздел, в котором встречается ключевое слово (заголовок, название страницы, и т. д.), однако не производится сортировка по тематике - Altavista попросту не поддерживает концепцию темы. Поэтому, например, в результатах поиска по слову Scala будут соседствовать странички, посвященные известной бухгалтерской программе и странички об одноименной мультимедийной системе. Несколько улучшает ситуацию с простым поиском имеющаяся в системе Altavista функция Refine (уточнить). На страничке с результатами поиска нужно нажать Refine, после чего появится список терминов, которые наиболее часто встречаются в одном контексте с ключевым словом. Возле каждого термина есть выпадающий список, в котором можно выбрать, относится ли это слово к теме поиска или нет. После такого уточнения, как правило, релевантность верхних ссылок в результатах поиска резко повышается. Из всего вышесказанного следует, что Altavista не является оптимальным средством для простого поиска. Хотя результат, безусловно, будет достигнут, затраты времени на его получение будут довольно велики. Сильные стороны этой системы проявляются, когда пользователю необходимо осуществить сложный поиск с указанием многих критериев отбора или поиск редких терминов (например, поиск слова Antropomorphic). В этом случае Altavista предоставляет наиболее мощные и изощренные средства поиска среди всех рассматриваемых систем, среди которых такие уникальные средства как поиск документов на конкретном языке, поиск по названию страницы, поиск среди гиперссылок (можно узнать, например, есть ли в WWW ссылки на вашу страницу и если есть, то где), поиск объектов Java/ActiveX, поиск в «якорях» и т.д. Кроме того, Altavista обеспечивает набор более стандартных, но очень ценных критериев отбора, таких как логические операции над ключевыми словами, поиск с учетом вариантов написания слов, поиск целых фраз, поиск документов только на определенных серверах (или доменах), ограничения по дате создания документа, и т.д. Многие из этих возможностей доступны даже с основной страницы.

     Индексирование  в этой системе осуществляется при  помощи робота. При этом робот имеет  следующие приоритеты:

  • слова, содержащиеся в теге title имеют высший приоритет; ключевые фразы в Meta тэгах;
  • ключевые фразы, находящиеся в начале странички;
  • ключевые фразы в ALT - ссылках
  • ключевые фразы по количеству вхожденийприсутствия словфраз;

     Если  тэгов на странице нет, использует первые 30 слов, которые индексирует и показывает вместо описания (tag description)

     Наиболее  интересная возможность AltaVista - это  расширенный поиск. Здесь стоит  сразу оговориться, что, в отличие  от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который  реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок и ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском.

Выводы  и предложения 

     Подводя итог можно отметить, что оценивать  состояние ресурсов Интернета можно по разному: в последние годы 20 столетия российской социологией были сделаны первые шаги по пути освоения всемирной электронной сети, и потому возникли перспективы перехода от разрозненной, робкой, малопродуктивной практики использования Интернета к построению российской социологической сети, принципиально обогащающей процесс научной деятельности, повышающей ценность прикладных проектов, качественно меняющей процесс профессионального образования и всех форм коммуникаций.

      В условиях развития современного общества информационные технологии глубоко  проникают жизнь людей. Они очень быстро превратились в жизненно важный стимул развития не только мировой экономики, но и других сфер человеческой деятельности. Сейчас трудно найти сферу, в которой сейчас не используются информационные технологии. Так, в промышленности информационные технологии применяются не только для анализа запасов сырья, комплектующих, готовой продукции, но и позволяют проводить маркетинговые исследования для прогноза спроса на различные виды продукции, находить новых партнеров и многое другое.

Информация о работе Хранение данных в сети Internet