Электронный учебник по информатике
 
8 класс

 

 

 
Измерение информации

А теперь обсудим вопрос о том, как можно измерять информацию, Существует несколько подходов к измерению информации. Здесь мы рассмотрим только один, который называется алфавитным подходом.

Алфавитный подход к измерению информации

Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эталонные единицы. Для расстояния — это метр, для массы — килограмм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с эталонной единицей, Сколько раз эталонная единица укладывается в измеряемой величине, таков Й результат измерения. Следовательно, и для измерения информации должна быть введена своя эталонная единица.

Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.

Алфавит. Мощность алфавита

Под алфавитом мы будем понимать набор букв, знаков препинания, цифр, скобок и др. символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.

Полное число символов в алфавите принято называть мощностью алфавита.

Будем обозначать эту величину буквой N. Например» мощность алфавита из русских букв и отмеченных дополнительных символов равна 54: 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Информационный вес символа

При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами «0» и «1». Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита. Так один символ из четырехсимвольного алфавита (N = 4) «весит» 2 бита. Объяснение этому можно дать следующее: все символы такого алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. Комбинацию из нескольких (двух, трех и т. д.) знаков двоичного алфавита назовем двоичным кодом.

"Информационный вес каждого символа" выраженный в битах (b) и мощность алфавита (N) связаны между собой формулой:

Информационный объем текста и единицы информации

Информационный объем текста складывается из информацонных весов составляющих его символов. Например, следующий текст, записанный с помощью двоичного алфавита: 1101001011000101110010101101000111010010 содержит 40 символов, следовательно, его информационный объем равен 40 битам.

Сегодня для подготовки текстовых документов чаще всего применяются компьютеры. Алфавит, из которого составляется такой "компьютерный текст", содержит 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: строчные и прописные латинские и русские буквыт цифры, знаки арифметических операций, всевозможные скобки, знаки препинания и пр.

Поскольку 256 равно 2 в 8 степени, то один символ компьютерного алфавита "весит" 8 битов. Причем 8 битов информации — это настолько характерная величина, что ей даже присвоили свое название — байт.

8 бит = 1 байт

Легко подсчитать информационный объем текста, если известно, что информационный вес одного символа равен 1 байту. Надо просто сосчитать число символов в тексте. Полученное значение и будет информационным объемом текста, выраженным в байтах.

Например, небольшая книжка, подготовленная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов (включая пробелы между словами). Значит, страница содержит 40 * 60 = 2400 байтов информации. Для вычисления информационного объема всей книги нужно полученную величину умножить на число страниц: 2400 байтов * 150 = 360 000 байтов.

Уже на таком примере видно, что байт — «мелкая» единица. А представьте, если нужно, например, измерить информационный объем целой библиотеки? В байтах это окажется громадным числом! Для измерения больших информационных объемов используются более крупные единицы:

1 килобайт = 1 Кб =1024 байта

1 мегабайт = 1 Мб = 1024 килобайта

1 гигабайт = 1 Гб = 1024 мегабайта



Электронный учебник создан профильной группой 10 класса МОУ - СОШ № 1 г. Асино Томской области
ТБ и санитарные нормы || Человек и информация || Компьютер || Текстовая информация || Графика || Технология мультимедиа
Создание сайтов ЕкатеринбургШаблоны сайтовПоиск товаров - справочник цен, каталог магазинов, прайс-листыБесплатные шаблоны дизайна компьютерных сайтов
Hosted by uCoz