Формы текстовых файлов — это форматы информационных файлов, в которых содержатся текстовые данные.
Введение
Под текстовым файлом понимается файл компьютера, который содержит информационные данные в виде текста.
Текстовым файлам можно противопоставить файлы в двоичном формате, которые могут содержать другую информацию, не текстовую. К примеру, это может быть тот же текст, но в виде кода или архива в спрессованном виде, а может быть и видеоизображение, звуки или другие данные. Терминология «текстовый файл» соотносится именно с файлом как хранилищем, которое содержит эти данные. В отличие от термина «текстовый формат данных» (текстовые данные), который характеризует содержание информации.
Текстовые файлы: сущность, достоинства и недостатки
В состав текстового файла входит последовательный набор символьных знаков, как правило, печатных, которые принадлежат какому-либо символьному набору. Набор символов состоит обычно из строк, которые в сегодняшних системах отделены друг от друга строковыми разделителями.
Основными преимуществами текстовых файлов считаются:
- Текстовые файлы обладают универсальностью, то есть они могут считываться в любой операционной системе. Это в частности относится к самым известным однобайтным кодам типа ASCII, не подверженным проблемам, присущим другим форматам файлов. То есть они не чувствительны к разнице в очерёдности байтов или размеру машинных слов в различных системах.
- Свойство устойчивости. Все символьные знаки и слова в текстовом файле являются самодостаточными, и при повреждении части данных в этом файле, они могут быть восстановлены или можно выполнить действия с остальными данными. Как известно, у архивных (сжатых) или бинарных файлов такие даже незначительные повреждения могут полностью уничтожить файл.
- Текстовые файлы имеют очень простой формат, который возможно менять с помощью программ редактирования, входящих в состав всех операционных систем.
К недостаткам следует отнести:
- Не архивированные (не сжатые) текстовые файлы требуют больше памяти, чем необходимый минимум. Но благодаря этой избыточности они мало подвержены потерям данных при их передаче и приёме с различных носителей.
- Низкая эффективность отдельных операций с текстовыми файлами. К примеру, когда в файле попадается число, компьютеру, вернее его операционной системе, перед началом действий над ним нужно преобразовать его в формат, с которым работает система. Эта операция, которая конвертирует числовые данные, достаточно сложна. Для перехода на строку с номером тысяча, необходимо прочитать девятьсот девяносто девять строк, которые расположены перед ней. Есть сложности при замене одной строки на другую и так далее. Это является причиной того, что при обработке значительных объёмов информации, текстовые файлы используют лишь в качестве промежуточного формата.
Формы текстовых файлов
Простота текстовых файлов позволяет их довольно часто применять для сохранения служебных данных, таких как логи, поскольку процедура прибавления в окончание текстовых файлов новой информации не связана с затратой больших компьютерных мощностей. И она не зависит от уже присутствующего объёма информации в файле и типа прибавляемых текстовых данных. Текстовые форматы являются базой для некоторых специальных форматов, типа HTML, XML, некоторых других, а также исходных текстов программных языков.
Наиболее известным и простым форматом текстовых файлов является TXT. Он появился практически в одно время с появлением термина персональный компьютер. В таких файлах хранится только текст, изображения и другие данные в txt не хранятся. Этот формат считается самым универсальным, он используется огромным количеством программных приложений для разного оборудования. Самым известным из таких приложений является «Блокнот», встроенный в Windows. Он считается самым простым средством для работы с текстовыми данными. Блокнот даёт возможность ввода и корректировки текстовой информации, хранить данные в памяти. Это приложение и сегодня актуально, так как при обработке текстов часто нет необходимости в применении больших текстовых процессоров. Ещё одним текстовым редактором, работающим с форматом TXT, является WordPad, который тоже входит в состав операционной системы Windows. Этот редактор обладает хорошим инструментарием, но всё же не дотягивает до Writer или Word.
В дальнейшем формы текстовых документов получили существенный прогресс в своём развитии, и фирма Microsoft выпустила в свет новый формат Rich Text Format – RTF. Он представляет из себя формат на базе кросс-платформы, который может сохранять текстовые данные. Формат RTF может сохранять форматирование и делать вставки в текст разнообразных объектов, таких как сноски, формульные выражения, табличные данные. Этот формат использует возможности технологии слов управления. Эти слова обозначаются специальной символикой и по этой причине документу требуется больше места в памяти. Документы в формате RTF можно редактировать следующими программами:
- Microsoft Works. Его инструментальный набор даёт возможность формировать разные документы. Имеется инструментарий, который позволяет работать на карманном персональном компьютере, воспроизводить презентации. Есть так же графический менеджер, ежедневный календарь, электронные таблицы.
- AbiWord. Бесплатная программа, которая может распространяться согласно лицензионному соглашению GNU. Экспорт документов в данной программе обладает некоторыми особенностями. В частности, при применении опции «Сохранить как», документ получает специальный формат AbiWord, применяемый не столь широко. Но есть опция «Сохранить копию», которая не имеет таких особенностей.
- Nuance OmniPage является компактным приложением, которое имеет возможность распознавать символы. Требуемые документы можно легко найти, используя Google Desktop Search. Требуется лишь указать ключевые слова, которые есть в документе.