Различные кодировки кириллицею

Тема урока: "Кодирование текстовой информации"

1. Человек различает символы по их начертаниям, а компьютер - по кодам. Каждому символу ставится в соответствие уникальный код. В традиционных кодировках для кодирования одного символа используется 8 бит. Такой 8-разрядный код позволяет закодировать 256 различных символов.

Присвоение символу определенного числового кода – это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).

Международная кодировка ASCII

Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений, а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки.

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

От начала 90-ых годов, времени господства операционной системы MS DOS, остается кодировка CP866.

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Кодировка русских букв ISO 8859-5


В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Последовательности десятичных кодов слова «ЭВМ» в различных кодировках на основе кодировочных таблиц:

Кодовые таблицы при объяснении демонстрируются через проектор.

2. Коды символов можно найти и с помощью MS Word. (Вставка - Символ ... ) . Найти несколько числовых кодов и сравнить их значение со значением в таблице кодов.CP1251.


3. Открываю Блокнот и таблицы кодов CP866 и CP1251. Учащиеся называют любое короткое слово и это слово набирается в Блокноте с помощью кодов CP866 и CP1251 при нажатой клавише Alt в одной, затем в другой кодировке. Коды называют учащиеся, отыскивая их в таблице кодов (в кодировке CP866 набирается код, в кодировке CP1251 набирается перед кодом ноль, например, код "Ж" - 198. При нажатой клавише Alt набираем 0198). Буквы всегда можно ввести и без кодов, но если в текстовом редакторе типа Блокнот нужно получить таблицу, то без кодов не обойтись. Элементы таблицы имеются в кодовой таблице.CP866. Показываю пример. Но здесь важно выбрать шрифт. Он указан ниже таблицы.

4. Открываю любую Web-страницу или сайт на русском языке, например, сайт школы. Меняю кодировки, сравниваем вид страницы.

IV. Закрепление

Перед началом выполнения заданий на компьютере вспомним, каким должно быть расстояние от экрана монитора до глаз. (60-70 см.). Как избежать вредного влияния от монитора? (Экран монитора должен быть чистым. Нельзя прикасаться к нему пальцами)

Вопросы и задания:
1. Во сколько раз уменьшится информационный объем страницы текста при его преобразовании из кодировки Unicode (таблица кодировки содержит 65536 символов) в кодировку Windows CP1251(таблица кодировки содержит 256 символов)? (В 2 раза)

2. Каков информационный объем текста, содержащего слово ИНФОРМАТИКА, в 8-ми битной кодировке? в 16-битной кодировке? (11 байтов, 22 байта)

3. Декодируйте следующие тексты, заданные десятичным кодом:
а) 087 111 114 100; (Word)
б) 068 079 083; (DOS)
в) 080 097 105 110 116 098 114 117 115 104. (Paintbrush)

4. Как будет выглядеть слово «диск», записанное в кодировке CP1251, в других кодировках?
(КОИ8-Р : ДХЯЙ ; CP866 : фшёъ ; Mac : диск ; ISO: фшёъ )

5. В текстовом режиме экран обычно разбивается на 25 строк по 80 символов в строке. Определите объем текстовой информации, занимающей весь экран монитора. (25 х 80 = 2000 байт)

Тексты заданий имеются на каждом компьютере ученика в файле "Кодирование. Задания.doc"

Дополнительно. Создать любую таблицу в Блокноте. Шрифт Lucida Console.

В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др.

Традиционно, для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):

К = 2 I = 2 8 = 256,

т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.

Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255 (часто код представляют также в 16-ричном виде 00-FF) .

Соответствие между символом и его кодом, вообще говоря, может быть выбрано совершенно произвольно. Однако на практике необходимо иметь возможность прочесть на одном компьютере текст, созданный на другом. Поэтому таблицы кодировок стараются стандартизовать. Практически все использующиеся сейчас таблицы основаны на коде ASCII (American Standard Code for Information Interchange). Этот стандарт определяет значения для нижней половины кодовой таблицы - первых 127 кодов (32 управляющих кода, основные знаки препинания и арифметические символы, цифры и латинские буквы). В результате, эти символы отображаются верно, какая бы кодировка не использовалась на конкретном компьютере. Хуже обстоит дело с "национальными" символами и "типографскими" знаками. А особенно не повезло языкам, использующим кириллический алфавит (русскому, украинскому, белорусскому, болгарскому и т.д.). Например, для русского языка сейчас широко используются пять таблиц кодировок:

· CP1251 (Windows-кодировка) - на PC-совместимых при работе под Windows 3.1 и Windows 9x

· KOI-8r - самая старая из использующихся до сих пор кодировок. Применяется на компьютерах, работающих под UNIX, является фактическим стандартом для русских текстов в сети Internet.

· CP866 (DOS-альтернативная) - на PC-совместимых компьютерах при работе с операционными системами DOS и OS/2, а также в любительской международной сети Фидо (Fidonet).

· Macintosh Cyrillic - как видно из названия, предназначена для работы со всеми кириллическими языками на Макинтошах (кроме украинского).

· ISO-8859 - эта кодировка задумывалась как международный стандарт для кириллических текстов, однако на территории России практически не применяется.

Впрочем, в большинстве случаев о перекодировке текстовых документов заботится не пользователь, а специальные программы - конверторы, которые встроены в приложения.

Начиная с 1997 г. последние версии Microsoft Windows & Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а поэтому, можно закодировать не 256 символов, а 65536 различных символов.

Конец работы -

Эта тема принадлежит разделу:

Лекция 1. Введение. Понятие информатики

Структура информатики... Информатика в широком смысле представляет собой единство разнообразных... Информатику в узком смысле можно представить как состоящую из трех взаимосвязанных частей технических средств...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Понятие информатики
Термин информатика возник в 60-х гг. во Франции для названия области, занимающейся автоматизированной обработкой информации с помощью электронных вычислительных машин. Французский

Информационное общество
Информационная культура - умение целенаправленно работать с информацией и использовать для ее получения, обработки и передачи компьютерной информационную технологию, современные те

История развития рынка информационных услуг
С середины 50-х гг. началось формирование устойчивого рынка информационных услуг. Основными поставщиками информационных услуг являлись: информационные службы академических, профессиональных и научн

Лекция 2. Информация, сообщения, сигналы
Информация наряду с материей и энергией является первичным понятием нашего мира и поэтому в строгом смысле не может быть определена. Можно лишь перечислить ее основные свойства, например такие как:

Синтаксическая мера информации
Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. На синтаксическом уровне учитываются тип носителя и способ представления информаци

Семантическая мера информации
Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со сп

Прагматическая мера информации
Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цепи. Эта мера также величина относительная, обусловленная особенностями использования этой информации

Качественные характеристики информации
Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточн

Кодирование графической информации
Графическую информацию можно представлять в двух формах: аналоговой или дискретной. Живописное полотно, цвет которого изменяется непрерывно - это при

Растровое изображение
При помощи увеличительного стекла можно увидеть, что черно-белое графическое изображение, например из газеты, состоит из мельчайших точек, составляющих определенный узор - растр. Во Франции в 19 ве

Модель CMYK
В основе этой модели лежит субтрактивное цветовоспроизведение (характерное для отражающих объектов). Каждому из основных цветов ставится в соответствие дополнительный цвет (дополняющий основной до

Графические режимы
Различают несколько режимов представления цветной графики: · полноцветный (True Color) - для кодирования яркости каждой из составляющих используют по 256 значений (восемь двоичных разрядов

Векторное и фрактальное изображения
Векторное изображение - это графический объект, состоящий из элементарных отрезков и дуг. Базовым элементом изображения является линия. Как и любой объект, она обладает

Кодирование звуковой информации
На слух человек воспринимает упругие волны, имеющие частоту где-то в пределах от 16 Гц до 20 кГц (1 Гц - 1 колебание в секунду). В соответствии с этим упругие волны в любой среде, частоты которых л

Цифро-аналоговое и аналого-цифровое преобразование звуковой информации
Звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Он попадает в аналого-цифровой преобразователь (АЦП) - устройство, которое переводит сигнал в цифровую

Параметры семплирования
Частота - количество измерений амплитуды аналогового сигнала в секунду. Если частота семплирования не будет более чем в два раза превышать частоту верхней грани

Сжатие информации
Кодирование делится на три большие группы - сжатие (эффективные коды), помехоустойчивое кодирование и криптография. Коды, предназначенные для сжатия информации, делятся, в свою очередь, на

Сжатие без потерь
Один из самых простых способов сжатия информации – групповое кодирование. В соответствии с этой схемой серии повторяющихся величин (например, число) заменяются единственной величин

Сжатие с потерей информации
используется для упаковки графических изображений. Этот метод основан на особенности человеческого восприятия изображений. Для человеческого глаза яркость более существенна, чем информация о цветов

Информационные революции
В истории развития цивилизации произошло несколько информационных революций - преобразований общественных отношений из-за кардинальных изменений в сфере обработки информации. Следствием этих преобр

Понятие информационной системы
Под системой понимают любой объект, который одновременно рассматривается и как единое целое, и как объединённая в интересах достижения поставленных целей совокупность разнородных элементов. Системы

Этапы развития информационных систем
История развития информационных систем и цели их использования на разных периодах представлены в таблице 1: Таблица 1. Изменение подхода к использованию информационных систем

Процессы в ИС
Процессы, обеспечивающие работу ИС любого значения, условно можно представить в виде схемы. ИС состоит из блоков: · ввод информации из внешних или внутренних источников;

Структура информационной системы
Общую структуру ИС можно рассматривать как совокупность подсистем независимо от сферы применения. Таким образом, структура любой ИС может быть представлена следующим образом.

Устаревание ИТ
Для ИТ является вполне естественным то, что они устаревают и заменяются новым. Пример. На смену технологии пакетной обработки программ на большой ЭВМ в вычислительном центре пришла техноло

Методология использования ИТ
Централизованная обработка информации на ЭВМ вычислительных центров была первой исторически сложившейся технологией. Создавались крупные вычислительные центры (ВЦ) коллективного использовани

Система команд некоторой ЭВМ – это совокупность команд, которую может выполнить данная ЭВМ.
Последовательность команд, предложенную ЭВМ для исполнения, называют программой. Несмотря на разнообразие современных ЭВМ, их структура основана на общих логических

Основные блоки ПК и их значение
Рис. Структурная схема персонального компьютера Микропроцессор (МП). Это центральны

Шины расширений
Шина ISA (Industry Standard Architecture–архитектура промышленного стандарта) – 16-разрядная шина данных и 24-разрядная шина адреса, рабочая частота 16 МГц, но мож

Локальные шины
Локальные шины подключаются непосредственно к шине МП, работают на тактовой частоте МП и обеспечивают связь с некоторыми скоростными внешними по отношению к МП устройствами: основной и внешней памя

Назначение и типы МП
МП выполняет следующие функции: · чтение и дешифрацию команд из ОП; · чтение данных из ОП и регистров адаптеров ВУ; · прием и обработку запросов и команд от адаптеров на

Структура МП
Микропроцессоры состоят из двух частей: · операционной, содержащей УУ, АЛУ и МППС, за исключением нескольких адресных регистров; · интерфейсной, содержащей адресные регистры МПП,

Кэш-память
Кэш-память – высокоскоростная память, являющаяся буфером между ОП и МП и позволяющая увеличить скорость выполнения операций. Регистры кэш–памяти недоступны для пользователя; отсюда и название «кэш»

Физическая структура ОП
ОП содержит RAM и ROM, т. е. ОЗУ и ПЗУ. ОЗУ предназначено для хранения информации (программ и данных), непосредственно участвующей на текущем этапе функционирования ПК.

Логическая структура ОП
Распределение одномегабайтовой области ОЗУ приведено на рис. 3.4. Логическая структура всей ОП показана на рис. 3.5. Каждая ячейка памяти имеет свой уникальный (отличный от всех других) адрес.

Дисковые накопители внешней памяти
Устройства памяти на дисках относятся к устройствам с прямым доступом. Быстрый доступ к любой части диска обеспечивается: · быстрым вращением диска (гибкий – около 300 об/мин, жесткий – ок

Видеотерминальные устройства
Видеотерминал состоит из видеомонитора (дисплея) и видеоконтроллера (адаптера). Видеоконтроллеры входят в состав системного блока ПК (находятся на видеокарте, устанавливаемой в разъем материнской п

Принтеры
Принтеры (печатающие устройства) - это устройства вывода данных из ЭВМ, преобразующие информационные ASCII-коды в соответствующие им графические символы (буквы, цифры, знаки и т.п.) и фиксирующие э

Сканеры
Сканер - это устройство ввода в ЭВМ информации непосредственно с бумажного документа. Можно вводить тексты, схемы, рисунки, графики, фотографии и другую графическую информацию. Сканеры вес

СуперЭВМ.
К суперЭВМ относятся мощные многопроцессорные вычислительные машины с быстродействием сотни миллионов - десятки миллиардов операций в секунду. Типовая модель суперЭВМ 2000 г имеет

ПЕРЕНОСНЫЕ КОМПЬЮТЕРЫ.
Переносные компьютеры - быстроразвивающийся подкласс персональных компьютеров. По прогнозу специалистов, в 1998 г. более 50% пользователей будут использовать именно переносные машины, а к

Процесс передачи информации
Любая коммуникационная сеть должна включать следующие компоненты: передатчик, средства передачи, приемник. Передатчик – устройство, являющееся источником данных.

Формы взаимодействия абонентских ЭВМ
Существуют следующие основные формы взаимодействия абонентских ЭВМ. 1. Терминал-удаленный процесс – предусматривает обращение с терминала одной из абонентских ЭВМ к процес

Модель взаимодействия открытых систем
Многообразие производителей ВС сетей и сетевого ПО породило проблему объединения сетей различных архитектур. Для этого была разработана модель архитектуры открытых систем. Открытая

Протоколы компьютерной сети
При обмене информацией в сети каждый уровень модели взаимодействия открытых систем реагирует на свой заголовок, то есть происходит взаимодействие между однолинейными уровнями модели в различных або

Локальные вычислительные сети
Основное назначение любой компьютерной сети - представление информационных и вычислительных ресурсов подключенным к ней пользователям. С этой точки зрения ЛВС можно рассматривает как совок

Основные топологии ЛВС
Топология ЛВС – это усредненная геометрическая схема соединений узлов сети. ВС можно рассматривать как совокупность узлов – устройств, непосредственно подключенных к перед

Физическая передающая среда ЛВС
Физическая передающая среда ЛВС может быть представлена тремя типами. 1. Витая пара. Состоит из двух изолированных проводов, свитых между собой. Скручивание проводов уменьшает влияние внеш

Методы доступа к передающей среде
Метод доступа к передающей среде – метод, обеспечивающий выполнение совокупности правил, в соответствии с которыми узлы сети получают доступ к ресурсу сети. Существуют два основных класса

Способы объединения ЛВС
Причины применения различных способов объединения ЛВС следующие: исчерпаны технические возможности ЛВС, нужно создать еще одну ЛВС, подключив новых пользователей и объединив ее с уже существующей Л

Глобальная сеть Internet
Internet – это сеть, объединяющая отдельные сети. Логическая структура Internet представляет собой некое виртуальное объединение, имеющее свое виртуальное пространство. Основные яч

Системное программное обеспечение
Системное ПО – совокупность программ и программных комплексов для обеспечения работы компьютера и вычислительных сетей. Системное ПО направлено: · на создание операционной среды ф

Инструментарий технологии программирования
Инструментарий технологии программирования обеспечивает процесс разработки программ и включает специализированное ПО, которое является инструментальными средствами разработки. ПО данного класса при

Пакеты прикладных программ
Прикладное ПО служит программным инструментарием для решения функциональных задач и являются самым многочисленным классом ПО. В данный класс входят программные продукты, выполняющие обработку инфор

Защита программного обеспечения
Защита ПО преследует следующие цели: · ограничение несанкционированного доступа к программам или их преднамеренное разрушение и хищение; · исключение несанкционированного копирова

  • Создание и редактирование документов

  • Форматирование документа

  • Таблицы

  • Компьютерные словари и системы машинного перевода текстов

  • Системы оптического распознавания документов



  • Текстовая информация

    • Текстовая информация – информация, выраженная с помощью естественных и формальных языков в письменной форме

    • Текст состоит из:

    • букв (прописные и строчные буквы русского и английского алфавитов )

    • цифр (1, 2, … 9 )

    • знаков (! , @ ? # % ^ & . )

    • математических символов (+ - * / = )



    двоичной знаковой системе

    • Для обработки текстовой информации на компьютере необходимо представить её в двоичной знаковой системе

    • N=2i , где

    • N – количество символов;

    • i – количество информации, отводимое на кодирование одного символа



    • Для кодирования каждого знака необходимо 8 бит информации (N=28 → N=256)

    • Каждому символу соответствует уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255 )



    Коды с 0 по 32

    • Коды с 0 по 32 – соответствуют операциям (перевод строки, ввод пробела и т.д.)

    • Коды с 33 по 127 – интернациональные, соответствуют знакам латинского алфавита, цифрам, знакам препинания и арифметических операций

    • Коды с 128 по 255 – национальные, т.е. в различных национальных кодировках одному и тому же коду соответствуют разные знаки





    • Для русских букв существует 5 различных 8-ми битовых кодовых таблиц: Windows, MS-DOS, КОИ-8, Mac, ISO



    Unicode

    • Unicode – новый международный стандарт кодирования текстовых символов, который отводит на каждый символ 2 байта (16 битов)

    • По этому стандарту можно закодировать 65 536 символов (N=216 → N= 65 536)

    • В таблицу Unicode вошли русский и латинский алфавиты, цифры, знаки и математические символы, греческий, арабский, иврит и другие алфавиты



    • В текстовом режиме экран монитора компьютера обычно разбивается на 25 строк по 80 символов в строке. Определить объем текстовой информации, занимающей весь экран монитора, в кодировке Unicode

    • Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Какое количество информации может ввести пользователь за одну минуту в кодировке Windows? Кодировке Unicode?



    • Для выполнения задания использовать:

    • OpenOffice Writer

    • Программу Калькулятор

    • Файл сохранить в своей папке под именем «Кодирование русских букв»





    Какой объём памяти ASCII ?

    • Какой объём памяти займёт приведённый ниже текст, если известно, что в нём используется кодировочная таблица ASCII ?

    • Happy New Year, dear friends!

    • Сколько символов содержится в тексте, использующем таблицу ASCII , если известно, что он занимает 24 576 бит памяти?



    Материалы

    • Материалы

    • → Семакин

    • → 8 класс

    • → 13. Представление текстов в памяти компьютера

    • → 89. Интерактивный задачник

    • → Тренировка





    Текстовые редакторы

    • Текстовые редакторы – приложения общего назначения, позволяющие:

    • создавать,

    • редактировать,

    • форматировать,

    • сохранять,

    • распечатывать документы.



    Простые текстовые редакторы

    • Простые текстовые редакторы – позволяют редактировать текст и форматировать шрифт (Блокнот);

    • Текстовые процессоры – позволяют вставлять списки и таблицы, формулы, проверяют орфографию, работают с графикой (MS Word, OpenOffice Writer);





    • Настольные издательские системы – мощные программы обработки текста, позволяющие создавать макеты изданий книг, журналов и газет (Microsoft Publisher, Adobe PageMaker);

    • Web-редакторы – используются для подготовки к публикации в Интернете Web-страниц и Web-сайтов (Microsoft Publisher, Microsoft FrontPage).





    С помощью Мастера

    • С помощью Мастера –для создания документов со сложной структурой (письма, резюме, факсы, календари и т.д.);

    • разработка документа с помощью мастера производится путем внесения необходимых данных в последовательно появляющиеся диалоговые панели.



    С помощью шаблонов

    • С помощью шаблонов – используются пустые заготовки;

    • шаблоны задают структуру документа, которую пользователь заполняет (визитная карточка, факс, письмо и т.д.).



    3. Создание Нового документа

    • 3. Создание Нового документа – пользователь использует пустой шаблон, который заполняет содержанием по своему усмотрению.



    Формат страницы – определяет ее размер:

    • Формат страницы – определяет ее размер:

    • А3 (42 ×29,7 см) – для объявлений, плакатов;

    • А4 (21×29,7 см) – для рефератов, писем, заявлений;

    • А5 (21 ×14,8 см) – для справок и т.д.

    • Ориентация страницы – задает расположение текста и вид страницы на экране монитора:

    • книжная ориентация – для обычных текстов;

    • альбомная ориентация – для таблиц с большим количеством столбцов.

    • Поля – определяют расстояния от краев страницы до границ текста



    Колонтитулы

    • Колонтитулы – применяются для вывода на каждой странице документа одинакового текста (№ страницы, имя автора, название документа и т.д.)



    текст , изображения , формулы , таблицы и диаграммы , звуковые и видеофайлы .

    • Современные документы могут содержать текст , изображения , формулы , таблицы и диаграммы , звуковые и видеофайлы .



    • К редактированию относятся такие операции с символами или фрагментами текста, как:

    • копирование;

    • перемещение;

    • удаление.



    Файл – Сохранить

    • Для сохранения документа необходимо применить команду Файл – Сохранить , в появившемся диалоговом окне выбрать диск и папку, имя файла и формат файла



    .txt

    • .txt – универсальный текстовый формат, файлы имеют небольшой информационный объем и могут быть прочитаны различными приложениями, не сохраняется форматирование текста;

    • .rtf - универсальный расширенный текстовый формат, сохраняются результаты форматирования, большой информационный объем файлов;



    .doc

    • .doc – оригинальный формат текстового редактора Word, понимается всеми текстовыми редакторами;

    • .htm (.html ) - формат Web-страница, используется для хранения Web-страниц в компьютерных сетях.



    • Печать документа – вывод текстовый информации на бумажный носитель

    • Параметры печати : номера страниц для печати, количество копий и др.

    • Рекомендуется осуществить предварительный просмотр документа



    • С помощью Мастера создайте календарь на следующий месяц.

    • С помощью Шаблона создайте своё резюме.

    • Сохраните созданные документы в своей папке Текстовые документы





    произвольный фрагмент текста

    • произвольный фрагмент текста – поставить указатель мыши в начале фрагмента и при нажатой ЛК перемещать его по тексту, выделяя букву за буквой;

    • одно слово – 2 ЛК по слову;

    • одно предложение – 1 ЛК по предложению при нажатой клавише Ctrl;

    • одна строка – 1 ЛК в полосе выделения напротив нужной строки (на левом поле документа, вид указателя мыши - );

    • абзац – 2 ЛК в полосе выделения;

    • весь документ – 1 ЛК в полосе выделения при нажатой клавише Ctrl;

    • вертикальный фрагмент текста – при нажатой ЛК и нажатой клавише Alt перемещать указатель мыши вниз и вправо.



    Задание:

    • Задание:

    • Создать текстовый файл и вставить в него формулу

    • Файл сохранить в своей папке в формате odt, под именем: «Вставка в документ формул»







    Форматирование форме .

    • Форматирование – процесс представления внешнего вида документа или отдельных его объектов в требуемой форме .





    • Параметры форматирования символов:

    • шрифт;

    • размер;

    • начертание;

    • цвет.



    • шрифт – это полный набор символов определенного рисунка:

      • название шрифта (Times New Roman, Arial, Courier New);
      • способ представления (растровый, векторный);
      • ширина символов (моноширинные шрифты);
      • шрифты с засечками и рубленые (Times New Roman, Arial).


    Измеряется в пунктах (1 пункт (пт) = 0,376 мм), от 1 до 1638 пт

    • Измеряется в пунктах (1 пункт (пт) = 0,376 мм), от 1 до 1638 пт



    Начертание символов:

    • Начертание символов:

      • - обычное; - курсивное;
      • - полужирное; - полужирное курсивное;


    Абзац

    • Абзац выделяет часть текста, представляющую законченную мысль

    • Форматирование абзаца:

    • выравнивание;

    • отступ первой строки;

    • отступы слева и справа;

    • расстояние между строками.



    • Нумерованные, маркированные и многоуровневые списки – применяются для размещения в документе различных перечней



    «Форматирование документов»

    • «Форматирование документов»

    • (Материалы →Практические работы)





    данных

    • Таблицы используются при создании текстовых документов, содержащих большое количество однотипных названий (расписание уроков), числовых данных (таблица Менделеева), изображений с текстовой подписью (алфавит в букваре).



    • Таблицы состоят из строк и столбцов, на пересечении которых образуются ячейки



    • Операции над числами проводятся с помощью формул.



    • Последовательность создания таблицы:

    • При дальнейшем изменении таблицы доступны:

    • вставка и удаление строк, столбцов, ячеек;

    • изменение ширины столбцов, высоты строк (с помощью мыши или заданием их точных значений в сантиметрах или процентах);

    • изменение размеров отдельных ячеек, разделение на несколько или объединение с соседними.



    Основные параметры ячеек:

    • Основные параметры ячеек:

    • ширина, высота;

    • цвет границ;

    • цвет фона (заливка).







    Гипертекстовый документ

    • Гипертекстовый документ – документ, содержащий ссылки на другие документы

    • Гиперссылка – выделенный объект, связанный с другим файлом при помощи скрытого адреса и реагирующий на щелчок мыши.

    • Гиперссылка может указывать на закладки, размещенный в том же документе и на закладки в других документах.







    «Таблицы»

    • «Таблицы»

    • Практическая работа № 2.5, стр.207-211 учебника.

    • Пример таблицы представлен на слайде 57



    • Создать таблицу «Расписание уроков на неделю»

    • Таблица должна отражать следующую информацию:

      • день недели;
      • порядковый номер урока;
      • название предмета;
      • время начала урока;
      • время окончания урока;
      • домашнее задание.
    • Выполняется в приложении MS Word





    • Многоязычность (англо-русский, испанско-русский и т.д.)

    • Быстрый поиск

    • Возможность ввода словосочетаний

    • Словари являются мультимедийными



    • Высокая скорость перевода многостраничных документов (1 стр/с)

    • Высокое качество перевода технической документации, деловой переписку и других специализированных текстов







    для перевода текста из бумажного в цифровой компьютерный формат

    • Системы оптического распознавания символов используются для перевода текста из бумажного в цифровой компьютерный формат



    • Определение структуры размещения текста (колонки, таблицы, изображения и т. д.)

    • Разделение фрагментов текста на изображения отдельных символов

    • Сравнение изображений символов с шаблонами





    • Растровые – для документов типографского качества

    • Векторные – для документов низкого качества



    • Пример: Распознаваемый символ «Б» накладывается на растровые шаблоны символов



    • Пример: Распознаваемый символ «Б» накладывается на векторные шаблоны символов



    Первые компьютеры были созданы для обработки число­вой информации. Начиная с конца 60-х годов XX века, компьютеры стали использовать для обработки текстовой информации. В настоящее время практически все пользова­тели персональных компьютеров работают с текстами, испо­льзуя специальные программы - текстовые редакторы.

    Человек различает символы по их начертанию, а компью­тер - по их кодам. В мире в качестве стандарта кодирова­ния символьной информации принята таблица ASCII (American Standard Code for Interchange). В ней для кодирования одного символа используется количество информации, равное 1 байту (8 битов). Всего с помощью одного байта можно закодировать: N = 28 = 256 символов. Этого вполне достаточно для представления текстовой информации на компьютере. Таблица разделена на две части по 128 символов. Первая (основная) часть содержит буквы латинского алфавита, десятичные цифры, знаки пунктуации, арифметических действий и др. Вторая часть (расширение) предназначена, в основном, для кодирования национальных алфавитов. Ко­дирование заключается в том, что каждому символу ставит­ся в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) обозначают не символы, а операции (новая строка - код 10, возврат каретки - код 13, ввод пробела - код 32, и т. д.).

    В настоящее время существует пять различных кодовых таблиц для русских букв: КОИ-8, СР1251 (для Windows), СР866 (ASCII, MS DOS), Mac (для Macintosh), ISO (International Standards Organization, код, используемый в языке HTML). Такое количество кодировок затрудняет чтение текстов в Интернете и отображение в тестовых редакторах. Одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы. Например, в ASCII русская буква А имеет код - 10000000, КОИ-8 - 11100001, СР1251 - 11000000.

    Для того чтобы правильно прочесть текст, присланный в другой кодировке, необходимо:

    • в текстовом редакторе Microsoft Word в меню Сервис - Параметры - Общие активизировать флажок подтверждать преобразование при открытии , выбрать нужную кодировку;
    • при работе в браузере, например IE, в меню Вид - Вид кодировки выбрать нужную кодировку.

    При вводе в компьютер текстовой информации происхо­дит ее двоичное кодирование. Пользователь нажимает на клавиатуре клавишу с символом - ив компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера. В процессе вывода симво­ла на экран монитора производится обратный процесс - де­кодирование, т. е. преобразование кода символа в его изображение, которое хранится в памяти компьютера.

    Новый международный стандарт Unicode (Юникод) отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N = 216 = = 65 536. Кодировка Unicode поддерживает все знаки всех языков и пригодна для чтения в Microsoft Internet Explorer, начиная с версии 4.0, и Microsoft Office с 1997 г.

    Основные приемы преобразования текстов: редактирование и форматирование

    Текст, созданный в текстовом редакторе, может быть пре­образован, т. е. отредактирован и отформатирован. Редакти­рование - это преобразование документа, обеспечивающее вставку, удаление, перемещение его фрагментов (объектов). Объект - это и весь текст в целом, и абзац, и строка, и сло­во, и символ, и таблица, и ее составляющие. Редактирова­ние может быть применено к любому объекту документа, который предварительно выделен.

    Возможны следующие операции редактирования:

    • удаление, перемещение, копирование;
    • отмена или возврат выполнения последних операций;
    • поиск и замена фрагментов текста;
    • вставка необходимого объекта (рисунок, файл, содер­жимое буфера обмена, гиперссылку, объект OLE - формулу, диаграмму, таблицу из приложения Excel, анимацию, звук).

    Всё, что позволяет делать с текстом или его фрагментами меню Правка -Вставка и некоторые кнопки панели инстру­ментов Стандартная , и будет являться редактированием.

    Форматирование - это изменение вида документа, т. е. такое его преобразование, которое меняет форму представле­ния документа. Форматирование может быть применено к любому выделенному объекту документа (см. схему).

    Возможны следующие виды форматирования:

    1) Задание параметров страницы (размер, поля, ориента­ция и др.).

    2) Форматирование абзаца:

    Выравнивание (по ширине, центру, правому и лево­му краям);

    Установка отступа первой строки;

    Установка отступов и интервалов между строками и абзацами.

    3) Форматирование символов:

    Изменение шрифта - растровый (Comic Sans MS) или векторный (Bookman Old Style), моноширинный (Courier), рубленый (Arial) или с засечками (Times New Roman);

    Изменение начертания шрифта (обычное, полужирное , курсивное , полужирное курсивное , варианты подчеркивания , цвет символов, нижний или верхний индексы);

    Изменение размера символов (единицей измерения размера шрифта является пункт (пт), 1 пт = 0,376 мм. Например, 10 пт - размер, 14 пт - размер).

    4) Формирование списков.

    5) Оформление границ и заливки.

    6) Организация колонок.

    7) Форматирование таблиц (направление текста, объединение ячеек, ширина столбцов и высота строк и т. д.).

    Большую помощь при форматировании оказывает инструмент Формат по образцу , находящийся на панели инстру­ментов Форматирование .

    При сохранении текстовых документов в текстовых редак­торах (процессорах) можно задавать различные форматы.

    Кодирование текстовой информации

    Двоичное кодирование текстовой информации в компьютере. Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией .

    Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

    N = 2 i => 256 = 2 i => 2 8 = 2 i => I = 8 битов.

    Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255) (табл. 3.1).

    Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака). Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.

    В процессе вывода знака на экран компьютера производится обратное перекодирование, т. е. преобразование двоичного кода знака в его изображение.

    Различные кодировки знаков. Присваивание знаку конкретного двоичного кода - это вопрос соглашения, которое фиксируется в кодовой таблице. В существующих кодовых таблицах первые 33 кода (десятичные коды с 0 по 32) соответствуют не знакам, а операциям (перевод строки, ввод пробела и т. д.).

    Десятичные коды с 33 по 127 являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

    Десятичные коды с 128 по 255 являются национальными, т. е. в различных национальных кодировках одному и тому же коду соответствуют разные знаки. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO (табл. 3.1 и 3.2)), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

    Например, в кодировке Windows последовательность числовых кодов 221, 194, 204 образует слово "ЭВМ", тогда как в других кодировках это будет бессмысленный набор символов.

    К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в операционную систему и приложения.

    В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту:

    N = 2 i = 2 16 = 65 536.

    Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

    Контрольные вопросы

      1. Почему при кодировании текстовой информации в компьютере в большинстве кодировок используется 256 различных символов, хотя русский алфавит включает только 33 буквы?
      2. С какой целью ввели кодировку Unicode, которая позволяет закодировать 65 536 различных символов?
    Похожие статьи

    © 2024 dvezhizni.ru. Медицинский портал.