Классификация видов информации
Под классификацией понимается подразделение некоторого набора объектов на различные подмножества по некоторым условиям, определяющим однотипность объектов. Классификация позволяет зафиксировать выявленные связи, существующие между типами объектов, чтобы определить место данного объекта в системе согласно его свойствам. В данном случае, объектом может быть любое событие, действие, предмет.
Если рассматривать информацию как объект классификации, то эти классы будут называться информационными объектами. Классификация информационных данных выступает самым важным способом формирования систем обнаружения и сохранения данных, без чего нельзя обеспечить нормальную работу по управлению. При классификации технической и другой информации, применяются методы:
- Иерархический. Это общеизвестный способ. При его применении поочерёдно подразделяют множества объектов на подчинённые группы (группировки).
- Фасетный способ. Выполняется подразделение множества объектов на независимые группы (группировки) параллельно. При этом не формируются изначально жёсткие структуры классификации.
Требования к кодированию данных
Кодирование – это трансляция информационных данных из одного формата обозначений, в иной системный формат, иными словами, - преобразование текста из обычного, понятного людям, формата, в форму записи посредством кодов. Кодовое обозначение - это знак или несколько знаков, которые обозначают данный объект согласно некоторым законам, предписанным кодовой системой.
Требования, предъявляемые к кодовым системам:
- Необходимо, чтобы они охватывали все объекты, которые надо закодировать, и давали эти объектам однозначное определение.
- Необходима возможность увеличения количества объектов кодирования при неизменных общих правилах их обозначений.
- Коды используются одни и те же для различных задач в одном экономическом объекте (к примеру, коды материальных ресурсов, технических подразделений должны быть одинаковыми для бухгалтерии и технических производственных отделов).
- Коды должны быть стабильны, удобны в восприятии и запоминании символов кодирования, что обеспечивает лёгкость записи, прочтения и переработки.
- Желательно, чтобы коды обладали большой информативностью при малом количестве знаков.
- Должна быть возможность применения кодов при автоматическом формировании общих итогов и автоматическом контроле кодирования на предмет нахождения ошибок.
Предназначение кодов:
- Обеспечить группирование информации в электронной вычислительной машине.
- Формирование итоговых результатов по всем групповым признакам.
- Осуществление процессов нахождения, сохранения и работы с данными.
- Возможность коммуникации по каналам для связи.
Методики кодирования
Методы кодирования, которые имеют статус самостоятельных, называются регистрационными методами кодирования. Методы, основанные на первоначальной классификации объектов, называются классификационными методами кодирования. В свою очередь, регистрационное кодирование делится на два типа:
- Порядковый тип.
- Серийно-порядковый тип.
Порядковый метод использует для кодирования наборы натуральных чисел. При этом все объекты множества получают свой порядковый номер. Данный метод кодировки имеет небольшую избыточность информации, даёт значительную долговечность классификатора и при этом очень прост, применяет самые короткие кодовые комбинации и позволяет обеспечить однозначное определение каждого классифицируемого объекта. Плюс ко всему, достаточно просто присвоить коды вновь появившемся при классификации объектам. Главным недостатком порядкового способа кодирования можно считать то, что в нём нет данных, описывающей свойства объекта, и достаточно сложно выполнить автоматизированную работу с данными при формировании результатов по элементам одной группы и с совпадающими описаниями. Порядковый метод кодирования не имеет возможности размещать новые объекты, которые надо классифицировать, в требуемом месте классификатора, потому что зарезервированные коды находятся в самом конце. Поэтому, порядковый метод создания классификатора почти никогда не используется самостоятельно, а только вместе с другими способами.
Серийно – порядковый метод кодирования основывается на применении в качестве кодов натуральных чисел, но с резервированием некоторых наборов таких чисел (фрагментам натурального ряда) для объектов классификации с совпадающими признаками. Во всех сериях чисел, кроме кодирования уже существующих объектов классификации, фиксируется некоторое число резервных кодов. Резервные коды могут быть расположены в середине или в окончании кодового набора. По этой причине, лучше использовать серийно-порядковый метод кодирования, чем просто порядковый. Он имеет все преимущества и недостатки порядкового метода кодировки. Но чаще всего он применяется совместно с классификационными методами кодирования, которые также делятся на два типа:
- Последовательное кодирование.
- Параллельное кодирование.
Последовательное кодирование основано на формировании кодов группировки или объекта с использованием кодов, идущих друг за другом, зависимых группировок, образованных иерархическим методом кодировки. Его главным достоинством можно считать логичность формирования кодов и значительную ёмкость. Но при этом, у него есть все недостатки, которыми обладает иерархический метод классификации, и у него ограничена возможность идентификации объекта.
При параллельном методе кодирования коды классификационной группировки или классифицируемого объекта формируются с применением свободных группировок, которые получены с помощью фасетного метода классификации.