Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии
Посмотреть оригинал

Представление информации в ЭВМ

Компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видеоинформацию. Вся информация в ЭВМ представлена в виде двоичных кодов. В 1946 году американский ученый- статистик Джон Тьюки (советник пяти президентов США) предложил название «бит» (Binary digiT — двоичная цифра). Это наименьшая единица информации для обозначения одного двоичного разряда, способного принимать значение 0 или 1.

Биты нумеруются справа налево, начиная с нулевого разряда. С помощью набора битов можно представить любой символ (число, букву или знак). Однако отражать данные в такой форме не совсем удобно, поэтому биты группируются в пакеты по 8 бит.

В 1956 году при проектировании первого суперкомпьютера IBM 7030 Вернер Бухгольц ввел в обращение термин «байт» {byte) для пучка одновременно передаваемых в устройствах ввода-вывода битов (6 штук), позже в рамках того же проекта байт расширили до 8 бит.

По одной из версий, слово byte произошло как сокращение фразы Binary digiTEight («двоичное число восемь»), причем в получившемся «bite» букву «/» заменили на «у». Это было сделано во избежание путаницы с уже существовавшим термином bit. Другая гипотеза гласит, будто byte — аббревиатура BinarY ТЕгт («двоичный термин»).

Обычно информация представляется байтами. Комбинируя возможные комбинации из 8 бит (байт), можно получить 256 (28) различных кодов. Для кодирования символов в ЭВМ используют кодовые таблицы. На сегодняшний день стандартом де-факто является таблица ASCII {American Standard Code for Information Interchange — американский стандартный код для обмена информацией), в которой каждый символ закодирован десятичным числом (от 0 до 255):

  • • коды 0...31 — для специальных (управляющих) клавиш;
  • • коды 32... 127 — для цифр, латинских букв и стандартных знаков;
  • • коды 128...255 — для букв национальных алфавитов и специальных знаков.

Кодировка согласно таблице ASCII (код принят в 1963 г.) используется в операционных системах семейства Windows, и ее часто называют кодировкой CP-1251 {Code Page — кодовая страница). Также существуют кодировки СР-866 (для DOS) и КОИ-81 (для Unix). В настоящее время широко распространилась альтернативная кодовая таблица (в стандарте Unicode), позволяющая представить большее количество символов. В ней на каждый символ отводится 2 байта, поэтому можно закодировать 65 536 (216) различных символов.

Графическая информация (в отличие от текстовой) представляется на экране в виде растрового изображения, которое формируется из определенного количества строк, содержащих определенное количество точек {пикселей), имеющих свой цвет, заданный специальным кодом. В процессе кодирования изображения производится его пространственная дискретизация — построение изображения из большого количества отдельных цветных точек.

Качество кодирования изображения определяется разрешением изображения и глубиной цвета. Разрешение изображения (количество пикселей в единице длины или в устройстве) может принимать различные значения, например 300 точек на дюйм[1] [2] у фотографий. Глубина цвета (количество бит, используемых для кодирования цвета пикселя) влияет на количество различных оттенков цветов. Наиболее распространены четыре глубины цвета:

  • • 8 бит — 256 (28) цветов;
  • • 16 бит (режим High color) — 65 536 (216) цветов;
  • • 24 бит (режим True color) — 16 111 216 (224) цветов;
  • • 32 бит — 4 294 967 296 (232) цветов.

Например, фотография (глубина цвета — 32 бит) размером 1 квадратный дюйм в закодированном виде будет занимать 360 000 байт[3]:

32 (бит) • 1 (дюйм2) • 300Л2 (dpi) = 2 880 000 (бит).

Иначе кодируется звуковая информация. Любая звуковая водна имеет непрерывно меняющиеся частоту и амплитуду. При увеличении амплитуды сигнала усиливается громкость звука, а при увеличении его частоты повышается тональность. Для обработки в ЭВМ звуковая (аналоговая) информация кодируется в виде последовательности цифровых импульсов в процессе дискретизации звука. Дискретизация — это преобразование непрерывных звуков (или изображений) в набор дискретных значений в закодированной форме.

Качество кодирования звука определяется глубиной кодирования, частотой дискретизации и количеством звуковых каналов. Современные звуковые системы обеспечивают 16-битную глубину кодирования звука, при этом количество различных уровней сигнала составляет 65 536 (216). Частота дискретизации (количество изменений уровня сигнала в единицу времени) может лежать в диапазоне от 8 до 48 кГц. Частота 8 кГц соответствует качеству радиотрансляции, а частота 44,1 кГц — качеству звукового компакт-диска. Количество звуковых каналов может лежать в диапазоне от 1 (монозвук) или 2 (стереозвук) до 6 (кинотеатральный звук).

Например, стереозвук с аудио-CD продолжительностью 1 с в закодированном виде будет занимать 176 400 байт:

2 (стерео) • 16 (бит) • 44 100 (Гц) = 1 411 200 (бит).

Для представления числовой информации используется двоичная система счисления. В ЭВМ применяются две формы представления чисел:

в естественной форме (с фиксированной запятой) все числа изображаются в виде последовательности цифр с постоянным положением запятой, отделяющей целую часть от дробной, например 12 345,6789. Эта форма наиболее проста, естественна, но имеет небольшой диапазон представления чисел и поэтому не всегда применима при вычислениях;

в вещественной форме (с плавающей запятой) каждое число изображается в виде двух групп цифр: мантиссы (абсолютная величина которой должна быть меньше 1) и порядка (целое число). Например, числу 2 000 000 в естественной форме соответствует число 0,2Е7 в вещественной форме, где 0,2 — мантисса числа, а 7 — порядок числа (степень, в которую надо возвести основание системы счисления (в нашем примере — 10) для получения исходного числа — 0,2 • 107 = 2 000 000). Эта форма представления имеет огромный диапазон отображения чисел и является основой в современных ЭВМ.

В общем виде число в форме с плавающей запятой представляется следующим образом:

где Р — основание системы счисления, М — мантисса (М < 1), г — порядок числа.

Например: +0,35 • 10-2 (0,0035) или —0,246 • 104 (—2460).

В персональном компьютере могут обрабатываться поля постоянной и переменной длины. Размеры полей постоянной длины: полуслово — 1 байт; слово — 2 байта; двойное слово — 4 байта; расширенное слово — 8 байт.

Числа с фиксированной запятой чаще всего имеют формат полуслова или слова, числа с плавающей запятой — формат двойного или расширенного слова. Поля переменной длины могут иметь любой целый размер от 1 до 256 байт.

Для измерения «емкости» памяти используются биты и байты. В современных ЭВМ используются производные единицы измерения информации:

  • • 1 килобайт (КБайт — КБ) = 210 байт = 1024 байта;
  • • 1 мегабайт (МБайт — МБ) = 220 байт = 1024 КБ = 1 048 576 байт;
  • • 1 гигабайт (ГБайт — ГБ) = 230 байт = 1024 МБ;
  • • 1 терабайт (ТБайт — ТБ) = 240 байт = 1024 ГБ;
  • • 1 петабайт (ПБайт — ПБ) = 250 байт = 1024 ТБ;
  • • 1 экзабайт (ЭБайт — ЭБ) = 260 байт = 1024 ПБ;
  • • 1 зеттабайт (ЗБайт — ЗБ) = 270 байт = 1024 ЭБ;
  • • 1 йоттабайт (ЙБайт — ЙБ) = 280 байт = 1024 ЗБ.

В физике термин «кило» означает 1000, а в информатике — 1024, так как это число более естественно для вычислительных машин, которые в основе своей арифметики используют число 2 (как человек применяет 10). Поэтому числа 10, 100, 1000 и т.д. удобны для человека, а числа 2, 4, 8, 16,1024 (210) и т.д. «удобны» для ЭВМ.

Например, одна страница стандартного машинописного текста формата А4 содержит примерно 3 КБ информации, а цветная фотография размером 10 • 15 см — около 8 МБ (в несжатом виде).

  • [1] КОИ — код обмена информацией (8-разрядный код для каналов передачи информации).
  • [2] 1 дюйм (обозначается 1") приблизительно равен 25,4 мм.
  • [3] 360 000 байт = 2 880 000 бит (1 байт = 8 бит).
 
Посмотреть оригинал
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы