УРОК  "Кодирование текстовой информации"

 

Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером, компьютером и компьютером и так далее.

 

 

      Кодирование — преобразование информации из одной формы представления (знаковой системы) в другую.

 

  Декодирование - обратный процесс, когда  из компьютерного кода знак преобразуется в его графическое изображение.

 

        

 

В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. При вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на клавиатуре происходит кодирование знака, то есть преобразование его в компьютерный код.

 

При вводе в компьютер текстовой и числовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код.

 

 

Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает один байт.

Например, слово «МАМА» кодируется 32-разрядным двоичным числом:

МАМА    ®   11101101    11100001  11101101  11100001

 

Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.

Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

Пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы:

 

ASCII, КОИ-8

Unicode

1 символ - 1 байт

1 символ - 2 байта

 

ПРИМЕЧАНИЕ! В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не N = 28 = 256 символов, а N = 216 = 65536 различных символов. Эту кодировку поддерживают последние версии платформы Microsoft Windows&Office (начиная с 1997 года).

 

     Кодирование информации в ПК заключается в том, что каждому символу ставится в соответствие уникальный двоичный код. Таким образом, человек различает символы по их начертаниям, а компьютер — по их кодам.

 

 

 

Алфавит – это набор букв, символов препинания, цифр, пробел и т.п.

Полное число символов в алфавите называют мощностью алфавита

 

Например, мощность алфавита из русских букв = 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел = 54 символа

 

 

ПРИМЕР 1.  Сколько места в памяти надо выделить для хранение предложения: Привет, Вася!

                   а)  в КОИ-8                             б) в UNICODE

 

РЕШЕНИЕ:

Считаем все символы, включая знаки препинания (здесь 13 символов).

а) В кодировке КОИ-8  1 символ занимает 1 байт, следовательно V = k * i  = 13 * 1 байт = 13 байт.

 

б) В кодировке UNICODE   1 символ занимает 2 байта, следовательно V = k * i  = 13 * 2 байта = 26 байт.

 

Ответ:  а) 13 байт                б) 26 байт

 

ПРИМЕР 2.   Определите информационный объем документа в килобайтах, если известно, что в нем 32 страницы. На каждой странице по 64 строки и каждая строка содержит 56 символ, при этом 1 символ кодируется восьмибитовым  способом. (Ответ записать в виде целого числа.)

 

РЕШЕНИЕ:

1) Считаем все символы: k = 64 строки * 56 символов * 32 страницы = 114 688 символов  в документе

2) V = k * i  = 114 688 * 1 байт {умножаем на 1 байт, т.к. 8 бит = 1 байт}

                    = 114 688 байт / 1024 {т.к. ответ нужно записать в Кбайтах }

                    = 112 Кбайт {Ответ записать в виде целого числа}

 

Ответ:  112 Кбайт  

 

        Задача 3* Сколько дискет объемом 1,4 Мбайт необходимо для хранения полной энциклопедии из 60 томов по 250 страниц, на каждой из которых две полосы по 80 строк из 45 знаков?

 

Решение:  V = k * i 

  1)  k = 80 строк * 45 знаков * 2 полосы *  250 страниц * 60 томов = 108000000      {символов  в энциклопедии}

  2)  108000000 символов  *  1 байт  = 108000000 байт     {т.к. не упомянут Unicode, считаем в КОИ-8}

  3)  108000000 байт / 1024 = 105469 Кб / 1024 = 103 Мб     {Объем всей энциклопедии}

  4) 103 Мб /1.4 Мб = 74 дискеты

          Ответ: 74

 

  Домашнее задание:

1.Закодируйте слово «ИНФОРМАТИКА» с помощью ASCII-кода и Unicode.
2.Решите задачи:

а)  Оцените информационный объем в КОИ-8 и Unicode сообщения:      Без труда не вынешь рыбку из пруда!

б) Текст занимает полных 5 страниц. На каждой странице размещается 40 строк по 70 символов в строке. Какой объем памяти в КБ займет этот  текст?

в) Вариант теста в кодировке Unicode имеет объем 20 Кбайт. На каждой странице теста 40 строк по 64 символа в каждой строке. Сколько страниц в тесте?