Человек сталкивается с технологиями оцифровки каждый раз, когда что-нибудь заправляет в сканер, делает фотографию, снимает видео (если камера не аналоговая, разумеется), разговаривает по сотовому телефону, пользуется Skype или Google Talk.
Оцифро́вка (англ. digitization) - это описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители.
Для оцифровки объект подвергается дискретизации (в одном или нескольких измерениях, например, в одном измерении для звука, в двух для растрового изображения) и аналогово-цифровому преобразованию конечных уровней.
Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.
Иногда термин «оцифровка» используется в переносном смысле при переводе информации из аналогового вида в цифровой. Например:
- оцифровка звука;
- оцифровка видео — перенос видеосигнала из внешнего источника с видеокассетой на цифровое устройство с последующей обработкой (сжатием, перекодировкой) и записью на цифровой носитель (dvd-диск, флеш-носитель, внешний жесткий диск);
- оцифровка киноплёнки;
- оцифровка изображения;
- оцифровка книг — как сканирование, так и (в дальнейшем) распознавание.
То есть оцифровывать можно какой угодно звук, любое изображение, чертёж, фотографию, рисунок, практически любое видео. Процесс представляет собой дискретизацию — разбиение всего на крошечные элементы, кванты или пиксели, описываемые нулями и единицами. В смысле, битами и байтами.
Отдельный вид оцифровки — сканирование с распознаванием текста. То есть, сканер может узнавать буквы и представлять результат не в виде картинки, а как обычный электронный документ, словно его с клавиатуры напечатали, нередко даже с ошибками.
О том, что оцифровывается само (звук в телефоне, изображение в камере), особо заботиться не нужно. Достаточно подобрать качественные товары. Если же в биты и байты информация автоматически не превращается, то необходимо предпринять некоторые действия по самостоятельному осуществлению такого процесса.
Рассмотрим некоторые практические рекомендации, которые не помешают каждому.
Оцифровка звука
В простейшем случае линейный выход аналогового устройства (проигрывателя виниловых пластинок, например) подключается к микрофонному входу звуковой карты компьютера. Там происходит дискретизация — разбивка на кванты.
Каждый квант описывается битами, т.е. вышеупомянутыми нулями и единицами. Считывая эти биты, воспроизводящее устройство понимает, какие именно частоты нужно переводить обратно в аналоговый вид. Соответственно, чем больше битов выделено на каждый квант и каждую секунду, тем точнее описание.
Что касается программного обеспечения, в случае ограниченности бюджета, возможно, подойдёт кросс-платформенный свободный аудиоредактор Audacity.
Микрофоны, встроенные в карманные плееры, ноутбуки, сотовые телефоны, прицепленные к гарнитурам с наушниками, предназначены для передачи речи. Можно записать разговор и потом даже что-то разобрать при прослушивании, но особого качества звука не добьётесь.
Если вы оборудуете домашнюю студию, и вам требуется микрофон для пения (для по-настоящему качественной передачи частот звукового диапазона), можно приобрести конденсаторный, подключаемый к порту USB. У него на борту есть собственный аналого-цифровой преобразователь. Старайтесь при обработке звука в аудиоредакторе никогда не снижать частоту дискретизации и глубину описания звука (её ещё называют «разрешением»).
То есть, если вы оцифровали музыку с виниловой пластинки с глубиной описания $24$ бита, то при изготовлении CD Audio это значение снизится до стандартных $16$ бит. При этом появится такой паразитный сигнал как шум квантования (если софт не дорогой и не применялось сглаживание — «Dithering»).
Значит, для будущего создания музыкального компакт-диска, во избежание лишних проблем, целесообразнее оцифровывать звук сразу с $16$-битной глубиной.
Оцифровка видео
Завалялись старые видеокассеты с семейным видео? Плёнка ещё не размагнитилась окончательно? Значит, понадобится пишущий DVD-плеер или TV-тюнер — устройство с аналого-цифровым преобразователем, способное осуществлять захват сигнала с аналоговых телевизора, видеомагнитофона, камеры.
TV-тюнер, как правило, даёт более качественный результат и позволяет осуществлять настройки параметров видео. Он может быть:
- внутренним, т.е. в виде платы, вставляемой в системный блок;
- внешним, т.е. в виде отдельного устройства (для подключения к ноутбукам).
В комплекте с тюнером предоставляется софт для операционных систем Windows и Mac OS. Устанавливать его можно смело — будут и драйверы, и нужные пользовательские приложения.
Более того, при наличии драйверов оцифровку в разных форматах (используя разные кодеки) можно производить с помощью любого толкового видеоредактора, необязательно «родной» программы.
А вот пользователям Ubuntu повезло не так сильно. По крайней мере, на данном этапе развития свободных ОС.
Самым продвинутым приложением для GNU/Linux, умеющим осуществлять аудио- и видеозахват, считается TVTime. Однако прежде чем приобретать дополнительное «железо», следует изучить раздел «supported cards» на сайте разработчиков tvtime.sourceforge.net. Там рассказывается, какие платы как работают, какие драйверы в каком ядре Linux есть и хорошо ли они функционируют с теми или иными моделями.
Обладателям портативных устройств (ноутбуков и нетбуков) жить легче. Установили TVTime, отправились с компьютером в магазин — и проверили прямо там, поддерживает ли ядро Linux что-нибудь из предлагаемого ассортимента внешних TV-тюнеров.
В настройках программы желательно указать частую расстановку ключевых кадров (это полноценные картинки, между ними — только информация об их изменении, о движениях.) Пусть файл получится чуть больше, но прокручивать видео (и особенно редактировать) будет удобнее.
Впрочем, только на компьютере. Пишущий DVD-плеер и без дополнительных подсказок изготовит файлы со стандартными параметрами, вполне пригодные к употреблению.
Оцифровка изображений
Недостаточно положить картинку под крышку сканера и нажать на кнопку. Необходимо выставить хорошее разрешение.
Дело в том, что изображения при оцифровке разбиваются на пиксели (цветные точки), при этом изображения становятся зернистыми, как очень мелкая мозаика. И чтобы потом на принтере они отпечатались нормально, требуется как минимум $300$ таких точек на каждый дюйм. Параметр обозначается как «$300$ dpi» («dots per inch»).
Что касается софта. Для коммерческих операционных систем, как обычно, всё необходимое имеется на лазерных дисках, поставляемых в комплекте со сканером или многофункциональным устройством (МФУ), которое представляет собой гибрид принтера, сканера и ксерокса. Качественные программы есть и для GNU/Linux. В первую очередь, Simple Scan (для дистрибутивов с KDE —SkanLite). Выставили разрешение 300 dpi — и сканируйте сколько угодно.
Множеством параметров можно управлять в более сложной XSane (Sane с графическим интерфейсом). Тоже весьма качественная программа. Для распознавания текста обычно ищут пиратские копии коммерческих изделий. Но почему бы не использовать что-нибудь легальное? С 2008-го года программный комплекс CuneiForm является свободным (исходные коды открыты под лицензией BSD). Правда, это только ядро системы распознавания, нужен ещё и графический интерфейс (например, YAGF).
Итак, оцифровка представляет собой процесс разбиения чего-либо визуального или аудиовизуального на крошечные элементы и описание этих кусочков огромным количеством нулей и единиц.