Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 1.
Понятие и способы обработки
информации
1
ТЕХНОЛОГИИ ОБРАБОТКИ ИНФОРМАЦИИ
к.т.н., доцент Буряченко Владимир Викторович
Л304, кафедра ИВТ. buryachenkoVV@gmail.com
Содержание лекции
2
Понятие информации.
2. Цели, задачи и виды обработки информации.
3. Представление информации в ЭВМ.
4. Способы и технологии обработки информации.
1.
Теория информации
3
Создателем
общей
теории
информации
и
основоположником цифровой связи считается Клод
Шеннон, американский инженер и математик основатель
теории
информации,
обосновал
возможность применения двоичного кода для передачи
информации.
Объектом
изучения теории информации является
абстрактное понятие инфоpмации.
Понятие информации
4
Информация
- данные, которые помещены в
значащий и полезный контекст и представлены
получателю для реализации процесса принятия
решения.
Обмен информацией предполагает взаимодействие и
получение сведений или знаний.
Цикл обработки информации
5
Цели, задачи и виды обработки информации
6
Информационные процессы: сбор, обработка и
передача информации.
Сбор информации - это деятельность субъекта, в
ходе которой он получает сведения об интересующем
его объекте.
Обмен информацией - это процесс, в ходе которого
источник информации ее передает, а получатель принимает.
Виды обработки информации
7
Накопление
информации - это процесс
формирования
исходного,
несистематизированного массива информации.
Хранение
информации - это процесс
поддержания исходной информации в виде,
обеспечивающем выдачу данных по запросам
конечных пользователей в установленные сроки.
Обработка информации - это упорядоченный
процесс ее преобразования в соответствии с
алгоритмом решения задачи.
Цель обработки информации
8
Цель
обработки
информации
в
целом
определяется целью функционирования некоторой
системы,
с
которой
связан
рассматриваемый
информационный процесс.
Начальная
рецепция.
стадия
информационного
процесса
-
Схема процесса обработки информации
9
Общая схема процесса обработки
информации.
Постановка задачи обработки.
Исполнитель обработки.
Алгоритм обработки.
Типовые задачи обработки информации.
Методы обработки информации
10
На
сегодняшний
день
компьютеры
способны
обрабатывать числовую, текстовую, графическую,
звуковую и видео информацию.
Большинство существующих компьютеров способно
хранить и обрабатывать только дискретную
информацию.
Следовательно, любой вид информации, подлежащий к
обработке на ЭВМ необходимо закодировать в
числовом виде.
Виды информации
11
По способу кодирования и хранения:
числовая;
текстовая;
графическая или изобразительная;
звуковая;
видеоинформация;
Представление текстовой информации
12
В случае текстовой информации, каждому символу
сопоставляется двоичное
число, образуя таблицу
кодировок символов.
Существует различные стандарты кодировок: ASCII,
UCS-2, UCS-4, UTF-8.
Например, в таблице ASCII одним байтом кодируются
256 символов (включая управляющие символы).
Представление информации в ЭВМ
Таблица кодировок ASCII
13
ASCII (англ. American standard code for information interchange) — название
таблицы (кодировки, набора), в которой некоторым распространённым печатным и
непечатным символам сопоставлены числовые коды. Таблица была разработана и
стандартизована в США в 1963 году.
оказалось удобнее использовать 8-битовые кодировки (кодовые страницы), в
которых нижнюю половину кодовой таблицы (0-127) занимают символы US-ASCII,
а верхнюю (128-255) — дополнительные символы, включая набор национальных
символов.
Представление информации в ЭВМ
Юникод (Unicode)
14
Кодировка Unicode направлена на решение следующих проблем:
1.
2.
3.
4.
Проблема кракозябр (Mojibake) (отображения документов в
неправильной кодировке).
Проблема ограниченности набора символов.
Проблема преобразования одной кодировки в другую.
Проблема дублирования шрифтов.
Юникод (Unicode)
15
Юнико́д
– стандарт кодирования символов, позволяющий
представить знаки почти всех письменных языков.
Стандарт предложен в 1991 году некоммерческой организацией
«Консорциум Юникода».
Применение этого стандарта позволяет закодировать очень
большое число символов из разных письменностей: в документах
Unicode
могут
соседствовать
китайские
иероглифы,
математические
символы,
буквы
греческого
алфавита, латиницы и кириллицы, при этом становится
ненужным переключение кодовых страниц.
Первая версия Юникода представляла собой кодировку с
фиксированным размером символа в 16 бит, то есть общее число
кодов было 216 (65 536). Отсюда происходит практика обозначения
символов
четырьмя
шестнадцатеричными
цифрами
(например, U+04F0).
Представление информации в ЭВМ
Плоскости Юникода (кодовое
пространство)
16
Кодовое пространство разбито на 17 плоскостей (planes) по
216 (65 536) символов.
Нулевая плоскость (plane 0) называется базовой и содержит
символы наиболее употребительных письменностей. Остальные
плоскости — дополнительные.
Для обозначения символов Unicode используется запись вида
«U+xxxx» (для кодов 0…FFFF), или «U+xxxxx» (для кодов
10000…FFFFF), или «U+xxxxxx» (для кодов 100000…10FFFF),
где xxx — шестнадцатеричные цифры.
Например, символ «я» (U+044F) имеет код 044F16 = 110310.
Представление информации в ЭВМ
Обработка текстовой информации
17
Большинство
текстовых процессоров поддерживает
концепцию составного документа - контейнера,
включающего различные объекты.
Используемая при этом технология связи и внедрения
объектов называется OLE (Object Linking and
Embedding - связь и внедрение объектов).
Для автоматизации выполнения часто повторяемых
действий в текстовых процессорах используют
макрокоманды.
Разновидностью текстовых процессоров являются
настольные издательские системы.
Обработка табличных данных
18
Пользователям
в процессе работы часто
приходится иметь дело с табличными данными в
процессе создании и ведении бухгалтерских книг,
банковских счетов, смет, ведомостей, при
составлении планов и распределении ресурсов
организации,
при
выполнении
научных
исследований.
Такие
программные
средства
называют
табличными процессорами или электронными таблицами.
Представление графической информации
19
Для
кодирования графической информации все
изображение делится на равные участки – пиксели
(пикселы, pixels).
Каждый пиксел задается двоичным кодом цвета
единичной области изображения.
В основном применяют кодировки:
RGB (Red-Green-Blue) - для устройств, работающих по
принципу излучения (мониторы),
CMYK (Cyan-Yellow-Magenta-Black)
- для устройств,
работающих по принципу отражения от белого (печать на
бумагу),
YUV, HLS, и т.д.
Представление информации в ЭВМ
Цветовая модель RGB
20
В системе RGB при глубине цвета 24 бита, состояние
пикселя задается 24 битами, из которых 8 бит
используется для задания интенсивности красного, 8
бит – интенсивности зеленого и последние 8 бит интенсивности синего.
Для хранения изображения разрешением 800х600 точек на
экране монитора при глубине цвета 24 бит необходимо:
800*600*24бита=1440000 байт=1.44 Мбайт.
Представление информации в ЭВМ
Форматы сжатия изображений
21
Сжатие изображений - применение алгоритмов
сжатия данных к изображениям, хранящимся
в цифровом виде.
Сжатие изображений подразделяют на сжатие с
потерями качества и сжатие без потерь.
Форматы изображений, в которых применяется
сжатие без потерь: BMP, GIF, RAW и т.д.
Алгоритмы сжатия с потерями при увеличении
степени сжатия как правило порождают хорошо
заметные человеческому глазу артефакты.
Сжатие с потерями применяется
изображений JPEG, JPEG2000 и т.д.
Представление информации в ЭВМ
в
форматах
Артефакты JPEG-сжатия
22
Потеря чёткости на границах цвета;
общая нерезкость;
шумовые ореолы вокруг резких границ;
блочный эффект.
Представление информации в ЭВМ
Представление звуковой информации
23
В электронных устройствах регистрации звука
формируется непрерывно меняющиеся во
времени напряжение или ток, т.е. аналоговый
электрический сигнал.
Для
записи этого сигнала в компьютер
необходима дискретизация этого сигнала по
уровню и по времени.
Эту
функцию
выполняют
специальные
электронные устройства – аналогово-цифровые
преобразователи.
Представление информации в ЭВМ
Представление звуковой информации
24
Через каждый короткий промежуток времени в виде
двоичного числа регистрируется уровень сигнала.
Таким образом, звуковой сигнал представляет собой поток
двоичных чисел.
• Обычно глубина кодирования
(дискретизация по уровню)
составляет 16 бит (65536
уровней), а частота
дискретизации 24000 раз в
секунду.
• При таком качестве звука поток
информации будет равен:
16 бит*24000 с-1=48 Кбайт/с
Представление информации в ЭВМ
Представление видео-информации
25
Видео
представляет собой поток последовательно
сменяющихся кадров изображений.
Следовательно, представление видео в ЭВМ сводится к
представлению потока графической информации.
Телевизионный
формат воспроизведения видео
использует разрешение кадра 720*576 точек с 24
битовой глубиной цвета. Скорость воспроизведения
составляет 25 кадров в секунду.
Объем передаваемой при этом информации составляет:
24бита*720*576*25 ~ приблизительно 30 Мбайт/с.
Представление информации в ЭВМ
Представление видео-информации
26
Для хранения и передачи видеоданных используются
специальные форматы и алгоритмы сжатия: AVI,
MPEG4, - H.264, DivX, H265.
Для того, чтобы компьютер смог распознать и воспроизвести
сжатое видео требуется соответствующий видеокодек.
Видеокодек
— программа/алгоритм
восстановления видеоданных.
сжатия
и
В отличие от форматов сжатия изображений, сжатие
видеоданных использует межкадровую информацию для
более эффективной экономии занимаемого места.
Представление информации в ЭВМ
Схема обработки информации
27
Исходная информация -> исполнитель обработки ->
итоговая информация.
Различают два типа обработки информации.
Обработка,
связанная
с
получением
новой
информации, нового содержания знаний (решение
математических задач, анализ ситуации и др.).
Обработка, связанная с изменением формы, но не
изменяющая содержания (например, перевод текста с
одного языка на другой).
Виды обработки информации
28
Кодирование
- преобразование информации в
символьную форму, удобную для ее хранения,
передачи, обработки.
Структурирование данных (внесение определенного
по рядка в хранилище информации, классификация,
каталогизация данных).
Поиск в некотором хранилище информации нужных
данных, удовлетворяющих определенным условиям
поиска (запросу).
Технологии реализации обработки
информации
29
Пакетный режим.
Диалоговый (запросный) режим.
Режим реального масштаба времени.
Пакетный режим обработки данных
30
При использовании этого режима пользователь не
имеет непосредственного общения с ЭВМ.
Сбор и регистрация информации, ввод и обработка не
совпадают по времени.
Вначале
пользователь
собирает
информацию,
формируя ее в пакеты в соответствии с видом задач или
каким-то др. признаком.
Диалоговый режим
31
При
этом существует возможность пользователя
непосредственно взаимодействовать с вычислительной системой в процессе работы пользователя.
Программы обработки данных находятся в памяти
ЭВМ в течение определенного промежутка времени,
когда ЭВМ доступна пользователю.
Взаимодействие пользователя с вычислительной
системой в виде диалога может быть многоаспектным и определяется различными факторами
Режим реального масштаба времени
32
Способность вычислительной системы взаимодейст-
вовать с контролируемыми или управляемыми
процессами с учетом времени выполнения этих
процессов.
Время реакции ЭВМ должно удовлетворять темпу
контролируемого
процесса
или
требованиям
пользователей и иметь минимальную задержку.
Как
правило, этот режим используются при
децентрализованной и распределенной обработке
данных, а также для выполнения производственных
задач.
Способы обработки данных
33
Различаются следующие способы обработки данных:
централизованная, децентрализованная, распределенная и интегрированная.
Централизованная
предполагает
наличие
вычислительного центра (ВЦ).
При этом способе пользователь доставляет на ВЦ
исходную информацию и получают результаты
обработки в виде результативных документов.
Способы обработки данных
34
Децентрализованная обработка.
Этот
способ связан с появлением ПЭВМ, дающих
возможность автоматизировать конкретное рабочие место.
Архитектура файл-сервер.
Предполагает выделение одной из машин сети в качестве
центральной (главный сервер файлов), где хранится совместно
используемая централизованная база данных.
Архитектура клиент-сервер.
Каждый из подключенных к сети и составляющих эту
архитектуру компьютеров играет свою роль: сервер владеет и
распоряжается информационными ресурсами системы, клиент
имеет возможность пользоваться ими.
Способы обработки данных
35
Распределенный способ обработки данных основан
на распределении
функций обработки между
различными ЭВМ, включенными в сеть.
Этот способ может быть реализован двумя путями:
первый предполагает установку ЭВМ в каждом узле
сети (или на каждом уровне системы), при этом
обработка
данных
осуществляется
одной
или
несколькими ЭВМ в зависимости от реальных
возможностей системы и ее потребностей на текущий
момент времени.
Второй путь - размещение большого числа различных
процессоров внутри одной системы.
Способы обработки данных
36
Интегрированный
– предусматривает создание
распределенной
базы
данных,
обеспечивает
максимальное удобство для пользователя.
Базы
данных
предусматривают
коллективное
пользование и централизованное управление.
Объем информации, разнообразие решаемых задач
требуют распределения базы данных.
Технология интегрированной обработки информации
позволяет улучшить качество, достоверность и скорость
обработки, т. к. обработка производится на основе
единого информационного массива, однократно
введенного в ЭВМ.