Представление и измерение информации

Основной формой представления информации являются данные (зарегистрированные сигналы).

Физический метод регистрации может быть любым:

· механическое перемещение физических тел,

· изменение их формы или параметров качества поверхности,

· изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей,

· изменение состояния электронной системы и т.п.

В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов:

1. Самым распространенным носителем данных, хотя и не самым экономичным, является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности.

2. Изменение оптических свойств (изменение коэффициента отражения поверхности в определенном диапазоне длин волн) используется также в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (CD-ROM).

3. В качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски.

4. Регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии.

5. Накопление и передача данных в живой природе происходит на биохимическом уровне.

Любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность и достоверность.

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. В структуре возможных операций с данными можно выделить следующие методы:

сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решений;

формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, т.е. повысить уровень их доступности;

фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений, при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

сортировка данных – упорядочение данных по заданному признаку с целью удобства использования, что повышает доступность информации;

архивация данных – организация хранения данных в удобной и легкодоступной форме, служащая для снижения экономических затрат на хранение данных и повышающая общую надежность информационного процесса в целом;

защита данных – комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

транспортировка данных – прием и передача данных между удаленными участниками информационного процесса; в этом случае источник данных в информатике принято называть сервером, а потребителя – клиентом;

преобразование данных – перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных.

Логической формой представления информации (в экономической информационной сфере) является документ – информационное сообщение на естественном языке, зафиксированное ручным или печатным способом на бланке установленной формы и имеющим юридическую силу.

Документ содержит в зафиксированном виде набор реквизитов (полей), обладает смысловым содержанием и структурой данных.

Информация относительно ее возникновения и последующих преобразований проходит три этапа, которые, собственно, и определяют ее семантический, синтаксический и прагматический аспекты. Человек сначала наблюдает некоторый факт окружающей действительности, который отражается в его сознании в виде определенного набора данных. Здесь проявляется синтаксический аспект. Затем после структуризации этих данных в соответствии с конкретной предметной областью человек формирует знание о наблюдаемом факте: Это семантический аспект полученной информации. Информации в виде знаний имеет высокую степень структуризации, что позволяет выделять полную информацию об окружающей действительности и создавать информационные модели исследуемых объектов. Новые знания человек затем использует в своей практике для достижения поставленных целей, что и отражает прагматический аспект информации.

Информацию можно измерить. Для оценки и измерения количества информации применяют различные методы и подходы.

1. При синтаксическом подходе принято употреблять термин данные и для измерения информации используется понятие объема данных (число экземпляров документов, количество документострок, записей файлов, символов, байтов, битов и т.п.).

Объем данных сообщения измеряется количеством элементов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и в соответствии с ним меняется единица измерения данных:

• в двоичной системе счисления единица измерения – бит (bit – binary digit – двоичный разряд);

• в десятичной системе счисления единица измерения – дит (десятичный разряд).

Данные – это «сырье» для получения информации. Термин информация означает устранение неопределенности путем преобразования данных. Противоположный по смыслу термин – энтропия, является мерой этой неопределенности. Информативность сообщений (количество передаваемой информации) тем выше, чем более определенным становится для получателя информации состояние системы.

Энтропия системы, имеющей N возможных состояний, согласно формуле Шеннона,

H(а) = –ΣPilogaPi,

где Pi вероятность того, что система находится в i -м состоянии; а основание логарифма, определяющее систему единиц измерения количества информации – бит для двоичной и дит для десятичной систем.

Энтропия H равна нулю только тогда, когда все вероятности Pi, кроме одной, равны нулю, а эта единственная вероятность равна единице (полная определенность состояния системы). При заданном числе состояний системы N величина H максимальна и равна log aN, в случае, когда все Pi равны.

2. Семантический подход характеризует «содержательность» информации, основан на наличии тезауруса системы. Тезаурус включает взаимоувязанные понятия, термины, определения, согласованные структуры данных логического уровня представления (базы данных, формы документов, технико-экономические показатели). Тезаурус выражает «знания» о системе. Новая информация воспринимается через тезаурус, который может пополняться новыми элементами. Информативность сообщений (количество содержательной информации I c) зависит во многом от получателя, способного расширить свой тезаурус.

3. Прагматический подход определяет количество информации, как меру, способствующую достижению цели (определяет полезность информации (ценность) для достижения пользователем поставленной цели). Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

После преобразования информации в машинную форму ее аналитический и прагматический аспекты как бы уходят в тень, и дальнейшая обработка информации происходит по «машинным законам», одинаковым для информации любого смыслового содержания.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: