Кратные байту единицы измерения количества информации вводятся следующим образом:
1 Килобайт (Кбайт) = 2 10байт = 1024 байт,
1 Мегабайт (Мбайт) = 2 10Кбайт = 1024 Кбайт,
1 Гигабайт (Гбайт) = 2 10Мбайт = 1024 Мбайт,
1 Терабайт (Тбайт) = 2 10Гбайт = 1024 Гбайт,
1 Петабайт (Пбайт) = 2 10Тбайт = 1024 Тбайт,
1 Экзабайт (Эбайт) = 2 10Пбайт = 1024 Пбайт.
Единицы измерения количества информации, в названии которых есть приставки «кило», «мега» и т. д., с точки зрения теории измерений не являются корректными, поскольку эти приставки используются в метрической системе мер, в которой в качестве множителей кратных единиц используется коэффициент 10 n, где п = 3, 6, 9 и т. д. Для устранения этой некорректности международная организацией International Electrotechnical Commission, занимающаяся созданием стандартов для отрасли электронных технологий, утвердила ряд новых приставок для единиц измерения количества информации: киби (kibi), меби (mebi), гиби (gibi), теби (tebi), пети (peti), эксби (exbi). Однако пока используются старые обозначения единиц измерения количества информации, и требуется время, чтобы новые названия начали широко применяться.
Вероятностный подход используется и при определении количества информации, представленной с помощью знаковых систем. Если рассматривать символы алфавита как множество возможных сообщений N, то количество информации, которое несет один знак алфавита, можно определить по формуле (1.1). При равновероятном появлении каждого знака алфавита в тексте сообщения для определения количества информации можно воспользоваться формулой (1.2).
Количество информации, которое несет один знак алфавита, тем больше, чем больше знаков входит в этот алфавит. Количество знаков, входящих в алфавит, называется мощностью алфавита. Количество информации (информационный объем), содержащееся в сообщении, закодированном с помощью знаковой системы и содержащем определенное количество знаков (символов), определяется с помощью формулы:
где V – информационный объем сообщения; / = log 2N, информационный объем одного символа (знака); К – количество символов (знаков) в сообщении; N – мощность алфавита (количество знаков в алфавите).
Поясним вышесказанное в п. 1.2 на примерах.
Пример 1.1
Определим, какое количество информации можно получить после реализации одного из шести событий. Вероятность первого события составляет 0,15; второго – 0,25; третьего – 0,2; четвертого – 0,12; пятого – 0,12; шестого – 0,1, т. е. Р 1= 0,15; Р 2= 0,25; Р 3 = 0,2; Р 4= 0,18; Р 5= 0,12; Р 6= 0,1.
Решение.
Для определения количества информации применим формулу (1.1)
Для вычисления этого выражения, содержащего логарифмы, воспользуемся сначала компьютерным калькулятором, а затем табличным процессором Microsoft (MS) Excel, входящим в интегрированный пакет программ MS Office ХР.
Для вычисления с помощью компьютерного калькулятора выполним следующие действия.
С помощью команды: [Кнопка Пуск– Программы – Стандартные – Калькулятор] запустим программу Калькулятор. После запуска программы выполним команду: [Вид – Инженерный] (рис. 1.3).
Рис. 1.3. Инженерный калькулятор
Кнопка logкалькулятора производит вычисление десятичного (по основанию 10) логарифма отображаемого числа. Поскольку в нашем случае необходимо производить вычисления логарифмов по основанию 2, а данный калькулятор не позволяет этого делать, то необходимо воспользоваться известной формулой:
log bN = М · log aN,
где
В нашем случае соотношение примет вид: log 2N = M log 10N,
где
т. е log 2N = 3,322 · log 10N, и выражение для вычисления количества информации примет вид:
При вычислении на калькуляторе используем кнопки: +/-(изменение знака отображаемого числа), ()(открывающие и закрывающие скобки), log(логарифм числа по основанию 10) и т. д. Результат вычисления показан на рис. 1.3. Таким образом, количество информации I = 2,52 бит.
Читать дальше
Конец ознакомительного отрывка
Купить книгу