Кодирование информации в ЭВМ

Для представления символьной информации в двоичной форме используются таблицы кодировки. При длине кода один байт (8 бит) можно закодировать 256 (то есть 28) различных символов. Этого достаточно для кодирования символов любого национального алфавита, но недостаточно, чтобы представить в одной таблице символы всех алфавитов. Уровня международного стандарта достигла система ASCII (American Standard Code for Information Interchange — Американский стандартный код для обмена информацией). Эта система устанавливает две таблицы кодирования: базовую и расширенную. В базовой таблице закреплены значения кодов от 0 до 127. Первые 32 кода являются управляющими, они предназначены для управления устройствами вывода данных и определяются производителями. Большинство значений кодов базовой таблицы ASCII представлено в Приложении.

Расширенная таблица определяет значения кодов со 128 по 255 и используется национальными системами кодирования. Например, в России наибольшее распространение получили три разных системы: ГОСТ-альтернативная (на компьютерах, работающих в операционной системе MS-DOS); Windows-1251; КОИ-8 (код обмена информации, восьмизначный).

В настоящее время всё большее распространение получает универсальная система кодирования (UNICODE). В ней используется шестнадцатиразрядный код, позволяющий представить 65 536 (то есть 216) символов. Этого достаточно для кодирования символов большинства языков планеты. Однако текст в кодировке UNICODE занимает вдвое больший объем в памяти ЭВМ или на машинном носителе информации, по сравнению с этим же текстом в кодировке ASCII или любой другой восьмиразрядной системе кодирования.

Существует множество способов представления графики, звука, видео, других видов данных и их совокупностей, и оно постоянно расширяется. Таким образом, многообразие систем кодирования ставит одну из важнейших задач информатики – задачу межсистемного преобразования данных.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: