Методы сжатия цифровой информации — это способы уменьшения объёма памяти, который занимает цифровая информация.
Введение
Файлы большого объёма, в частности звук, графика и видео, практически всегда сохраняются в компьютерах или транслируются в упакованном формате. Чтобы уменьшить их размер, применяются универсальные или специализированные методики информационного сжатия. Универсальные методы можно использовать для сжатия практически любого типа данных и они дают возможность полного восстановления исходной информации. По этой причине универсальные методы также именуются обратимыми. Но у них есть недостаток, который состоит в том, что универсальные методы не учитывают при сжатии характер сжимаемых информационных данных, и по этой причине степень сжатия файлов не очень высокая. Специальные методы сжатия принимают во внимание тип данных, в частности особенности восприятие звуковых или видео файлов человеком, и могут удалить при сжатии незначительные для восприятия информационные данные. Это позволяет достичь значительного уменьшения размера файла при незначительной потере качества. Недостатком таких методов является невозможность полного восстановления исходной информации.
Универсальные методы сжатия цифровой информации.
Известно немало универсальных, то есть обратимых, методов сжатия, но все они базируются на относительно малом числе теоретических алгоритмов. Одним из таких методов является метод упаковки. При кодировании информационных данных всем объектам, то есть символам, пикселям, звуковым единицам, должен быть поставлен в соответствие двоичный код определённого размера, длину которого обозначим i. В этом случае объём всего цифрового информационного файла может быть определён как:
$V = I ⋅ k$
где $k$ является числом таких объектов в информационном потоке.
Смысл метода упаковки состоит в сокращении числа битов, которые отводятся для кодировки одного объекта, учитывая, что в информационных данных, подлежащих сжатию, есть не все возможные типы объектов, а лишь небольшая их часть. Одним из достоинств метода упаковки является тот факт, что все фрагменты сжимаемых информационных данных могут быть распакованы с полным восстановлением исходного формата и без применения предшествующих данных.
Однако метод упаковки может показать хорошие итоговые результаты, только когда набор применяемых знаков (символов, других объектов), относительно их полного возможного набора, сравнительно небольшой. Когда же, к примеру, в тексте применяются почти все знаки и символы алфавита, то степень сжатия будет незначительной, а иногда и вовсе не будет возможности сжатия данных.
Специальные методы сжатия цифровой информации
Самыми популярными методами сжатия цифровой информации с возможностью регулировки размера информационных потерь считаются следующие:
- Метод JPEG предназначен для выполнения сжатия графической информации.
- Метод МР3 (сегодня уже МР4) предназначен для сжатия звуковых файлов.
- Метод МРЕG является группой методик, предназначенных для сжатия видео файлов.
JPEG является одним из наиболее распространенных графических форматов, используемых для сохранения фотографий и аналогичных им изображений. Файлы, которые содержат данные в формате JPEG, как правило, обладают расширением .jpeg, .jfif, .jpg, .JPG или .JPE. Но самым употребляемым из них на всех платформах считается .jpg.
Алгоритм JPEG даёт возможность сжатия изображений как с наличием потерь, так и с их отсутствием. Могут поддерживаться изображения с разрешением не больше, чем 65535 × 65535 пикселей.
Алгоритм JPEG считается наиболее пригодным для выполнения сжатия фотоизображений и картин, которые содержат реалистичные изображения с плавными градациями яркостных и цветовых параметров. Самое большое распространение JPEG обрёл в сфере цифровых фотографий и для сохранения и трансляции изображений с применением сети Интернет.
Однако следует отметить, что JPEG не следует использовать для сжатия чертёжной, а также текстовой и знаковой графики, поскольку резкие перепады яркости и цвета среди соседних пикселей ведут к возникновению явных дефектов изображения. Такие изображения лучше хранить в других форматах, к примеру, TIFF, GIF или PNG. Кроме того, JPEG, как, впрочем, и иные типы сжатия с наличием потерь, не может использоваться для сжатия файлов с применением многоступенчатой обработки, поскольку с каждым этапом обработки в изображение вносятся искажения, сохраняемые при промежуточных итогах. JPEG также не следует применять и тогда, когда нельзя допустить даже небольших потерь, к примеру, при сжатии изображений из сферы астрономии или медицины.
Далее рассмотрим алгоритм MPEG и его разновидности. MPEG (Moving Picture Experts Group, что означает экспертная группа по движущемуся изображению) является группой специалистов, которая сформирована международной организацией ISO, чтобы выработать стандарты сжатия и трансляции цифровых видео и аудио файлов.
MPEG-1 audio layer 3 является полным именем очень известного формата сжатия аудио информации MP3. MPEG-1 включает в свой состав следующие компоненты, определяющие три уровня звукового сжатия:
- MP1 или MPEG-1 часть 3 уровень 1 (MPEG-1 Audio Layer 1).
- MP2 или MPEG-1 часть 3 уровень 2 (MPEG-1 Audio Layer 2).
- MP3 или MPEG-1 часть 3 уровень 3 (MPEG-1 Audio Layer 3).
MPEG-1 видео изначально разрабатывался для обеспечения требуемого качества видео при потоках 1,5 Мегабит/cек при разрешении 352x240.
MPEG-2 является транспортным, аудио и видео стандартом, предназначенным для широковещательных телевизионных каналов.
MPEG-3 проектировался коллективом MPEG в качестве стандарта для кодирования аудио и видео информации для телевидения высокой чёткости (High-definition television), которое имеет скорость информационной трансляции в границах от двадцати до сорока Mбит/сек.
MPEG-4 является международным стандартом, применяемым в основном для сжатия цифровых аудио и видео файлов. Данный стандарт применяется главным образом для потокового видео и записи фильмов.