Программные средства обработки текстовой информации

Автор работы: Пользователь скрыл имя, 16 Февраля 2012 в 08:13, контрольная работа

Краткое описание

Под информацией первоначально понимались сведения, передаваемые людьми устным, письменным или другим способом с помощью условных сигналов, технических средств и т.п. С середины ХХ века информация является общенаучным понятием, включающим в себя обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом; обмен сигналами в животном и растительном мире; передачу признаков от клетки к клетке, от организма к организму и т.д. Об информации говорят в смысле соответствия высказываний действительности относительно определенной взаимосвязи, событий или состоянии реального мира.

Содержание работы

ГЛАВА I. ПРОГРАММЫ ДЛЯ ОБРАБОТКИ ИНФОРМАЦИИ 4
1.1 Средства обработки текстовой информации 4
1.2. Средства табличной обработки информации 10
Области применения электронных таблиц 10
1.3. Среда табличного процессора 11
Система команд: 13
Табличные данные: 15
ГЛАВА II. КОМПЬЮТЕРНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ 18
2.1. Классификация баз данных 18
2.2. Офисное ПО 21
2.3. Классификация программных систем 24
ЗАКЛЮЧЕНИЕ 26
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 27
СПИСОК ЛИТЕРАТУРЫ: 29

Содержимое работы - 1 файл

информатика.docx

— 77.21 Кб (Скачать файл)

          В режиме относительной  адресации всякие изменения в  местоположении формулы путем копирования  блока, переноса блока, вставки или  удаления строк или столбцов приводят к автоматическому изменению  адресов переменных в формулах, находящихся  в смещенных ячейках. Иначе говоря, формулы модифицируются в соответствии со своим новым положением. При  отмене режима относительной адресации  устанавливается режим абсолютной адресации. В этом случае при смещении клеток модификации формул не происходит.

          Очень часто в  числовых таблицах подсчитываются различные  итоговые данные: суммы, средние значения, наибольшие, наименьшие значения. Получение  таких данных называется статистической обработкой таблицы. Во всех табличных процессорах имеются для этого соответствующие функции. Представление табличных данных в графической форме используется на практике. Графическая обработка придает наглядность, обозримость результатам расчетов. Табличные процессоры предоставляют пользователю на выбор множество типов диаграмм (гистограмм, графиков). Такие графические средства принято называть деловой графикой.   
 
 
 
 
 

 

ГЛАВА II. КОМПЬЮТЕРНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

2.1. Классификация баз  данных

          Компьютерные информационные системы позволяют хранить большие  объемы данных, осуществлять их обработку. Основой всякой информационной системы  является база данных.

          На рисунке 3 представлена схема компьютерных систем.

    

Рис. 3 Схема  компьютерных систем 

      База  данных - совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации.

          База данных - это  единое, большое хранилище данных, которое однократно определяется, а  затем используется одновременно многими  пользователями из разных подразделений. Вместо разрозненных файлов с избыточными  данными, здесь все данные собраны  вместе с минимальной долей избыточности. Причем база данных хранит не только рабочие  данные, но и их описания. По этой причине  базу данных еще называют набором  интегрированных записей с самоописанием. В совокупности, описание данных называется системным каталогом или словарем данных, а сами элементы описания принято называть метаданными, т.е. "данными о данных".

          При анализе информационных потребностей организации следует  выделить сущности, атрибуты и связи. Сущностью называется отдельный тип объекта организации (человек, место или вещь, понятие или событие), который нужно представить в базе данных. Атрибутом называется свойство, которое описывает некоторую характеристику описываемого объекта. Связь - это то, что объединяет несколько сущностей.

          Базы данных можно  классифицировать по следующим признакам:

      По характеру хранимой информации:

      - фактографические - хранят краткую информацию в строго определенном формате;

      - документальные - хранят всевозможную документацию;

      По  способу хранения данных

      - централизованные - вся информация хранится на одном компьютере

      - распределенные - разные части базы хранятся на разных компьютерах, соединенных в сети.

      По  структуре организации данных:

      - реляционные(relation - отношение) - хранят данные в табличном виде, причем каждая запись в таблице содержит информацию, относящуюся только к одному конкретному объекту;

      - иерархические - характерна подчиненность объектов нижнего уровня объектам верхнего уровня;

      - сетевые - характерна взаимосвязь различных объектов в базе;

    Наиболее  распространенными на практике являются реляционные БД.

      Система управления базами данных (СУБД) - это программное обеспечение, с помощью которого пользователи могут определять, создавать и поддерживать базу данных, а также осуществлять к ней контролируемый доступ.

          Основными функциями  СУБД являются:

      Определение базы данных, что обычно осуществляется с помощью языка определения данных (DDL - Data Defenition Language). Язык DDL предоставляет пользователям средства указания типа данных и их структуры, а также средства задания ограничений для информации, хранимой в базе данных.

      Вставка, обновление, удаление и извлечение информации из базы данных, что обычно осуществляется с помощью языка управления данными (DML - Data Manipulation Language). Наличие централизованного хранилища всех данных и их описаний позволяет использовать язык DML как общий инструмент организации запросов, который иногда называют языком запросов (query language).

      Существует  две разновидности языков DML - процедурные и непроцедурные языки, - которые отличаются между собой способом извлечения данных. Основное отличие между ними заключается в том, что процедурные языки обычно обрабатывают информацию в базе данных последовательно, запись за записью, а непроцедурные оперируют сразу целыми наборами записей. Поэтому с помощью процедурных языков обычно указывается, как можно получить желаемый результат, тогда как непроцедурные языки используются для описания того, что следует получить.

      Наиболее  распространенным типом непроцедурного языка является язык структурированных  запросов (Structured Query Language - SQL), который в настоящее время определяется специальным стандартом и фактически является обязательным языком для любых реляционных СУБД.

      Предоставление  контролируемого  доступа к базе данных с помощью перечисленных ниже средств:

      - системы обеспечения безопасности, предотвращающей несанкционированный доступ к базе данных со стороны пользователей;

      - системы поддержки целостности данных, обеспечивающей непротиворечивое состояние хранимых данных;

      - системы управления параллельной работой приложений, контролирую щей процессы их совместного доступа к базе данных;

      - системы восстановления, позволяющей восстановить базу данных до предыдущего непротиворечивого состояния, нарушенного в результате сбоя аппаратного или программного обеспечения;

      - доступного пользователям каталога, содержащего описание хранимой в базе данных информации.

          К реляционным СУБД относится целый ряд программных продуктов для персональных компьютеров. Исторически одной из первых таких систем была dBASE. Используемые в этой системе форматы представления данных, язык обработки данных стали стандартом для ряда последующих СУБД. К ним относятся FoxPro, Paradox. Простейшим для изучения вариантом реализации баз данных является СУБД Access из пакета Microsoft Office.

                  2.2. Офисное ПО

 

          Помимо рассмотренных  программных средств, возникает  много трудноклассифицируемого  по способам применения ПО. Многие из них  роднит среда их применения - в делопроизводстве, в различных аспектах управления мелкими и средними предприятиями. Эти программы можно назвать  офисными. Сюда можно отнести следующие виды программ:

            Средства  разработки презентаций  и публикаций

          Компьютерная презентация  представляет собой набор слайдов (электронных страниц), последовательность показа которых может меняться в процессе демонстрации презентации, т.е. презентация является интерактивным документом. Презентация является мультимедийным документом, т.к. каждый слайд может включать в себя различные формы представления информации (текст, таблицы, диаграммы, изображения, звук, анимацию и др.). Презентации обычно используют в процессе выступлений на конференциях, для рекламы товаров на выставках, при объяснении нового материала на уроке и т.д. Наиболее популярными программами для создания презентаций являются Microsoft Power Point, StarOffice Impress.

          Компьютерная публикация представляет собой набор электронных  документов, который может использоваться как для показа и рекламирования своей продукции как на компьютере, так и в сети. Наиболее часто  используются такие публикации в  сети Интернет. Они могут быть представлены в виде Web-сайтов, бюллетеней, буклетов. Характерным примером такой программы является программа Microsoft Publisher, входящая в расширенную версию пакета Microsoft Office.

            Автоматизация ввода информации в компьютер

          Основным методом  перевода бумажных документов в электронную  форму является сканирование, в результате которого создается графический образ бумажного документа.

          Принцип действия сканирующих  устройств или сканеров одинаков. Документ освещается светом от специального источника, а отраженный свет воспринимается светочувствительным элементом. В результате сканирования получается графическое изображение, состоящее из точек, т.е. растровое изображение. Количество точек определяется как размером изображения, так и разрешением сканера.

          Существуют специальные  стандарты программного интерфейса, обеспечивающего связь между  сканерами и операционной системой. Этот интерфейс основан на специальном  протоколе TWAIN.

          Графический образ, получаемый после сканирования документа, чаще всего необходимо перевести  в текст. Для этого используются специальные программные средства, называемые средствами распознавания образов. Многие из программ используют совершенно различные алгоритмы распознавания, но при этом распознавание не зависит ни от шрифтов, ни от алфавита. Из программ, способных распознавать текст на русском языке наиболее известными являются программы Fine Reader и Cunei Form.

          Преобразование документа  в электронный вид происходит в три основных этапа. Каждый из этих этапов может выполнятся программами  как автоматически, так и под  контролем пользователя.

      Сканирование.

        Запускается сканирующий модуль, настраиваются параметры сканирования (разрешение, размер, тип сканирования) и происходит собственно сканирование.

      Сегментация и распознавание  текста. Прежде чем получить готовый текст, необходимо разбить фрагменты документа на блоки (текст, рисунок, таблица и т.д.), для того, чтобы правильно их распознать(превратить в текст).

      Проверка  орфографии и передача текста в нужное приложение для дальнейшей работы или сохранение в файл.

      Автоматизация перевода документов

          Идея автоматического  перевода текстов с одного языка  на другой зародилась с появлением первых компьютеров. Если бы полноценный  перевод был бы возможен, то значительно  упростилось бы общение между  народами. Но это очень сложная  задача, о полном решении которой  пока говорить рано.

          Программы автоматического  перевода позволяют переводить отдельные  слова и строить смысловые  связи в предложениях, не всегда учитывая те или иные особенности  языка. Поэтому они предназначены  лишь для общего ознакомления с содержанием документа.

          Программные средства автоматического перевода можно условно разделить на две основные категории:

      Компьютерные  словари. Назначение их - предоставить значения неизвестных слов быстро и удобно для пользователя. Из отечественных разработок веделяются тройка словарей - МультиЛекс от «МедиаЛингва», Лингво от ABBYY Software House и Полиглоссум от ETS Publishing House.

      Системы автоматического  перевода - позволяют выполнять автоматический перевод связного текста. В ходе работы программа использует огромные словари, наборы грамматических правил, обеспечивающих наилучшее качество перевода. Самым популярным разработчиком таких систем является компания "Promt". Наиболее универсальным продуктом, который тесно интегрируется с Microsoft Office, является программа Promt XT.

Информация о работе Программные средства обработки текстовой информации