Данные и информация. Операции с данными
Выбери формат для чтения
Загружаем конспект в формате pptx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 3.
Представление о данных
"МАТИ - РОССИЙСКИЙ
ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ
УНИВЕРСИТЕТ имени К.Э. Циолковского"
Кафедра «Социология и управление персоналом»
«Институт менеджмента,
экономики и социальных технологий»
Информационные технологии управления
персоналом
Кузьминский А.Е,
Данны х и Информация
Данны е – это зарегистрированны е сигналы
Сигналы появляются при взаимодействие
физические объектов друг с другом, имеют
энергетическую природы и доступны для
регистрации.
Информация – это продукт взаимодействия
данны х
Информация возникает и существует в момент
взаимодействия объективных данных и субъективных
методов. Как и всякий объект, она обладает свойствами.
Операции с данны ми
В ходе информационного процесса данные
преобразуются из одного вида в другой.
Обработка данных включает в себя
множество различных операций.
Операции с данны ми
• сбор данных – накопление информации с
целью обеспечения достаточной полноты для
принятия решения
• форматизация данных – приведение
данных, поступающих из разных источников,
к одинаковой форме
• фильтрация данных – отсеивание данных, в
которых нет необходимости для принятия
решения
Операции с данны ми
• сортировка данных – упорядочение данных
по заданному признаку с целью удобства их
использования
• архивация данных – организация хранения
данных в удобной и легкодоступной форме
• преобразование данных – перевод данных
из одной формы в другую
• защита данных
• транспортировка данных
Виды данны х
• Числа
• Текст
• Мультимедия (графические объекты,
звуковые сигналы, цветные изображения).
Кодирование данны х двоичны м кодом
Для автоматизации работы с данными производится их
унификация – кодирование.
В вычислительной технике применяется система
кодирования двоичным кодом. (0. , 1. )
1 бит ( binary digit - двоичное число) - единица
измерения информационной емкости и количества
информации.
Бит является ячейкой памяти, которая в каждый
момент времени находится в одном из двух состояний.
0;1
Кодирование чисел
Двоичный код целого числа можно получить
путём деления числа на 2 до тех пор, пока
частное не будет равно 1.
Для кодирования целых чисел от 0 до 255
достаточно 8 разрядов двоичного кода (8 бит).
Для кодирования чисел от 0 до 65 535
потребуется 16 разрядов (16 бит).
24 бита: от 0 до 16 777 216
32 бита: от 0 до 4 294 967 295
64 бита: до 18 446 744 073 709 551 616 значений.
Кодирование текстовы х данны х
Если каждому символу присвоить порядковый номер
(целое число), то с помощью двоичного кода можно
кодировать любые текстовые данные.
8 битов достаточно для кодирования 256 различных
символов.
Этого хватит, чтобы закодировать комбинациями 8
битов все символы английского и русского алфавитов
(строчные и прописные), арабские цифры, знаки
препинания, символы арифметических действий и
некоторые общепринятые специальные символы.
Таблицы кодировки символов
ASCII - стандартный код информационного обмена США.
В системе ASCII закреплены две таблицы кодирования –
базовая от 0 до 127 и расширенная от 128 по 255
0 - 31 управляющие коды, которым не соответствуют
никакие символы, ими можно управлять работой
технических устройств..
32 - 127 кодирования символов английского алфавита,
знаков препинания, цифр, арифметических действий.
128 - 255 символы русского алфавита и другие
специальные символы
Таблицы кодировки
символов
Существуют
пять
различных
кодировок
кириллицы (КОИ8-Р, Windows. MS-DOS,
Macintosh и ISO). Из-за этого часто возникают
проблемы с переносом русского текста с одного
компьютера на другой, из одной программной
системы в другую.
С конца 90-х годов проблема стандартизации
символьного кодирования решается введением
нового международного стандарта Unicode. Это
16-разрядная кодировка, т.е. в ней на каждый
символ отводится 2 байта памяти
Таблица кодов ASCII
Основны е структуры данны х
• Линейные структуры –списки.– это простейшая
структура данных, отличающаяся тем, что каждый
элемент данных однозначно определяется своим
уникальным номером в массиве.
• Табличные структуры данных подразделяются на
двумерные и многомерные.
• Двумерные
табличные структуры
данных
(матрицы) – это упорядоченные структуры, в
которых адрес элемента определяется номером
столбца и номером строки, на пересечении которых
находится ячейка, содержащая искомый элемент.
Основны е структуры данны х
• Многомерные таблицы – это упорядоченные
структуры данных, в которых адрес элемента
определяется тремя и более измерениями. Для
отыскания нужного элемента в таких таблицах
необходимо знать параметры всех измерений
(размерностей).
• Иерархические структуры – это структуры,
объединяющие нерегулярные данные, которые
трудно представить в виде списка или таблицы. В
иерархической структуре адрес каждого элемента
определяется маршрутом, ведущим от вершины
структуры к данному элементу.
Измерение объема информации
Наименьшей единицей объема данных
является бит (двоичный разряд).
Байт – совокупность из 8 битов
1 Килобайт (Кбайт) = 1024 байт = 210 байт.
1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт.
1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.
1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт.
Единицы хранения данных
Файл – это последовательность произвольного
числа байтов, обладающая уникальным
собственным именем, объект переменной
величины.
Уникальность имени файла обеспечивается тем,
что полным именем файла считается собственное
имя файла вместе с путём доступа к нему.
Хранение файлов организуется в иерархической
структуре, которая называется файловой
структурой
Скорость передачи данных
Единицей измерения скорости передачи данных через
последовательные порты является: бит в секунду (bps (
бит/с ) – bits per second)
Единицей измерения скорости передачи данных через
параллельные порты является байт в секунду.
1 килобит kbit (kb) кбит (кб) = 1000 бит/c
1 килобайт KByte (KB) КБайт (KБ) = 1024 байта/c
1 мегабит mbit (mb) мбит (мб) = 1000 килобит /c
1 мегабайт MByte (MB) МБайт (МБ) = 1024 килобайта /c
1 гигабит gbit (gb) гбит (гб) = 1000 мегабит /c
1 гигабайт GByte (GB) ГБайт (ГБ) = 1024 мегабайта /c
Требования к передаче
данных
•
•
•
•
•
Данные должны быть соответственно обработаны,
подготовлены, форматированные.
Данные должны быть закодированы в принятой
системе.
Необходим подходящий канал передачи данных.
Объем данных и пропускная способность канала
должны соответствовать.
Получатель информации должен быть в той же системе
кодировки, что и отправитель
Схема передачи данных по
информационному каналу
Информационная энтропия
Состояние информационной системы,
характерное непредсказуемостью и
неопределенностью получения данных.
Возникает, когда количество данных
пропускаемых через информационный канал,
превышает пропускную способность канала.
Классы и аспекты данных
По семантическому восприятию
Message Мессадж (послание) – основная
смысловая идея, заложенная в данных,
предназначенная реципиенту получателю.
Явный мессадж – предназначенный для
быстрого осознания широким кругом
получателей.
Скрытый и не явный мессадж – не должен быть
ясен при первичном анализе полученных
данных.
Классы и аспекты данных
По перцептивному (чувственному) восприятию.
Pattern – паттерн – часть целого узнаваемого
образа, различимого в закодированных данных.
По типу информационного канала паттерны
делятся на визуальные и аудиальные.
Паттерн является основой для выстраивания
образа целиком.
Классы и аспекты данных
Мета данные – технические данные, «данные о
данных», говорящие о положении данных в
информационной системе и процессе их передачи через
канал.
Артефакты – данные полученные по каналу связи,
которых не было при отправлении. Результат
воздействия шумов и помех в канале.
Крипто-данные - данные зашифрованные в особой
системе, для их распознавания необходим
шифровальный ключ – декодирующий алгоритм.
Контрольные вопросы
1. В чём состоит отличие между данными и информацией
(понятие данных, понятие информации)?
2. Какие основные операции можно осуществлять с
данными?
3. Какие достоинства и недостатки присущи основным
структурам данных?
4. Как осуществляется кодирование двоичным кодом?
5. Что собой представляет система кодирования ASCII
(базовая и расширенная таблицы кодов).
6. Как называются единицы представления, измерения,
хранения и передачи данных? Какова их размерность?
7. Какие есть требования к передаче данных?
8. В чем заключается явление информационной
энтропии?
9. Какие выделяются классы и аспекты данных?