Общие сведения
Видеоинформация - достаточно новый вид информации, которая с каждым днем все интенсивнее проникает во все сферы человеческой деятельности. По официальной статистике, каждый пятый человек в России ежедневно воспринимает видеоинформацию либо посредством телевизора, либо посредством персонального компьютера.
Под видеоинформацией можно понимать:
Рисунок 1.
Любой видеоряд можно разложить на две составляющие: звуковую и графическую.
Наверняка у вас появился вопрос: какое отношение графическая информация имеет к видео? Необходимо очень хорошо уяснить следующий факт: для создания на экране эффекта движения применяется дискретная технология, обеспечивающая быструю смену статических картинок.
Научные исследования доказали, что если в течение одной секунды сменить около $15$ статических изображений, которые похожи друг на друга, то человеческий глаз воспринимает подобные изменения на них как аналоговые, то есть как непрерывные. На данном эффекте и реализуется любое современное видео.
Поскольку видеоинформация состоит из звуковой и графической компоненты, то и для обработки видеоматериалов требуется очень мощный персональный компьютер. Под обработкой видеоматериалов понимается процесс оцифровки, то есть кодирования видеоинформации.
После кодирования видеоинформация будет находиться в двоичном формате, а, как известно, процессор персонального компьютера только и способен взаимодействовать с любой информацией, которая является двоичным кодом. Двоичный код -- последовательность бит, состоящая из $0$ и $1$.
Алгоритм кодирования видеоинформации
Итак, представим, что в нашем распоряжении есть какая-либо видеоинформация. Как было ранее сказано, любую видеоинформацию можно дифференцировать, то есть разложить на две ключевые составляющие: звуковую и графическую. Следовательно, операция кодирования видеоинформации будет заключаться в сочетании операций кодирования звуковой информации и кодирования графической информации.
Как мы ранее узнали, видео - быстрая смена, как правило, похожих друг на друга статических изображений, называемых кадрами. Но в современном мире данный процесс стандартизирован, и все поставщики видеоконтента придерживается данных стандартов.
Не будем приводить все существующие стандарты, касающиеся частоты смены кадров, а лишь опишем два ключевых эталона в этой области:
-
В процессе киносъемок используют частоту смены кадров, равную $25$ раз в секунду. Подобным стандартом пользуются при производстве телепрограмм, телешоу, телерепортажей.
-
В процессе создания широкоформатного видеоконтента прибегают к частоте смены кадров, равной $30$ раз в секунду.
В первую очередь происходит разложение аналогового видеосигнала на две дорожки: звуковую и графическую. Давайте в качестве эксперимента примем частоту смены кадров $25$ раз в секунду. Это означает, что одна секунда видеопотока состоит из $25$ быстросменяющих друг друга статических изображения.
Рисунок 2.
По сути, нет как такового отдельного алгоритма~кодирования видеоинформации, а есть симбиоз алгоритмов кодирования отдельно звука и отдельно графики.
После проведения операции цифрования звука и изображений на выходе получается бинарный, двоичный код, который будет понятен процессору персонального компьютера. Именно в формате двоичного кода наша видеоинформация и будет храниться на электронных носителях.
Если мы захотим проиграть видеоконтент на нашем персональном компьютере или другом устройстве, то нам придется провести операцию восстановления информации, то есть осуществить преобразование информации, записанной в двоичном коде в формат понятный человеку.
Единственное, на чем хотелось бы акцентировать внимание, это на том, что при просмотре видеоинформации мы одновременно и видим «картинку» и слышим звук.
Чтобы добиться синхронного исполнения звука и смены графических изображений процессор персонального компьютера выполняет эти операции в различных потоках. За счет этого происходит запараллеливание двух сигналов: звукового и графического, которые в совокупности образуют видеопоток.
Как найти информационный объем видеофайла
После проведения операции кодирования видеоинформации получается двоичный поток битов. Следовательно, операционной системе необходимо выделить некое пространство для хранения данного двоичного кода (этот двоичный код является дискретным форматом нашего аналогового видеофайла).
Общая формула расчета объема памяти, необходимой для хранения закодированного видеофайла:
Рисунок 3.
Рассмотрим конкретный пример. Дан видеофайл, который длится $52$ секунды. Известно также, что частота смены кадров составляет $25$ раз в секунду. Каждый кадр представляет собой изображение, имеющее разрешение $1280$ на $1024$ пикселя. Также известно, что цвет кодируется в $24$-х битной RGB-модели. Частота дискретизации звука составляет $44.1$ КГц, а разрядность звуковой карты равна $2$ байта. Необходимо найти информационный объем данного видеофайла.
Решение:
Определим информационный объем звукового сигнала.
$V_{зв}= [Время \ звучания] \cdot [Разрядность \ звука] \cdot [Частоту \ дискретизации] = 52 \cdot 16 \cdot 44100 = 36691200 [бит] = 4586400 [байт] = 4478.90 [Кбайт] = 4.37 [Мбайт]$.
Определим информационный объем одного кадра.
$V_k= [Количество \ пикселей \ изображения] \cdot [Глубину \ цвета] = 1280 \cdot 1024 \cdot 24 = 31457280 [бит] = 3932160 [байт] = 3840 [Кбайт] = 3.75 [Мбайт]$.
Определим информационный объем заданного видеофайла.
$V_в= [Память, \ занимаемая \ звуковым \ сигналом] \cdot [Память, \ занимаемая \ одним \ кадром] \cdot [Количество \ кадров] = 4.37 \cdot 3.75 \cdot 25 = 409.69 [Мбайт] = 0.4 [Гбайт].$
То есть информационный объем заданного видеофайла составляет около $0.4$ Гигабайта. Файлы с видеоконтентом всегда были и будут «тяжелыми», следовательно, необходимо предусматривать пространство для их хранения.
Кстати, сам процесс кодирования видеоинформации занимает значительное время и зависит от характеристик процессора персонального компьютера. Среди всех земных профессий можно выделить профессию видеомонтажера, который наиболее интенсивно из всех занимается обработкой и отвечает за правильность кодирования видеоинформации.