Файл
Слово file (файл) впервые применилось к компьютерному хранилищу данных в $1950$ году. В рекламе памяти фирмы RCA в журнале «Popular Science» ($1950$г.) гласила:
…результаты бесчисленных вычислений можно держать «в картотеке» (on file) и получать снова. Эта «картотека» теперь существует в запоминающей трубке, разработанной в лабораториях RCA. Она электрически сохраняет цифры, отправленные в вычислительную машину, и держит их в хранилище, заодно запоминая новые — ускоряя интеллектуальные решения в лабиринтах математики.
В $1952$ году file стали называть колоду перфокарт. Сначала файлом называли не содержимое, а само устройство памяти. Например, диски IBM $350$, назывались disk files. Некоторые системы, подобные Compatible Time-Sharing System использовали файловую систему для работы с виртуальными устройствами памяти, после чего слово «файл»приняло уже современное значение и понимание среди программистов. Имена файлов в CTTS состояли из двух частей, «основного имени» и «дополнительного имени» (последнее существует и поныне как расширение имени файла).
Рисунок 1. Первые перфокарты Жаккарда
Рисунок 2. Колода перфокарт 1960г.
Файл в современном понимании
Файл – логически связанная совокупность данных или программ, для размещения которой во внешней памяти выделяется именованная область.
Файл служит в качестве учетной единицей информации в операционных системах. Все действия с информацией в операционных системах осуществляются над файлами: это может быть ввод с клавиатуры, запись на диск, обработка данных, вывод на экран, печать, копирование и передача информации и пр.
Файл имеет имя и расширение. Имя файла придумывает пользователь. Расширение файла присваивается программой, при помощи которой этот файл создается. По расширению файла определяется формат данных в файле. Файлы могут содержать разнообразные виды и формы представления информации: числа, программы, тексты, рисунки, таблицы, чертежи и т.п. Особенности файлов определяются их форматом.
Формат – элемент языка, в символическом виде описывающий представление информации в файле.
Текстовая информация хранится в файле в кодах ASCII или в Unicode (так называемом текстовом формате). Текстовые файлы можно просмотривать с помощью разных программных средств, содержащих текстовые редакторы.
Любой другой файл с нетекстовой информацией открыть и просмотретьпри помощи текстовых редакторов невозможно. При просмотре таких файлов на экране будут отображаться абсолютно непонятные символы.
Файл характеризуется следующими параметрами:
- полным именем;
- объемом в байтах, килобайтах, мегабайтах и т.д.;
- датой создания файла с указанием времени создания или модификации файла;
- специальными атрибутами:
- Н (Hidden) – скрытый (невидимый для пользователя) файл;
- R (Read only) – только для просмотра и чтения, но не для изменения;
- S (System) – системный файл или файлы ОС;
- A (Archive) – архивированный (архивный) файл;
- SUID – дает возможность выполненять программу только от имени владельца (для Unix-like);
- SGID - дает возможность выполненять программу от имени группы (для Unix-like);
- Sticky Bit - предписывает ядру ОС не выгружать завершившуюся программу из памяти компьютера сразу, а лишь спустя некоторое время. Атрибут используется для того, чтобы часто используемые программы постоянно оставались в оперативной памяти и не тратилось время на их повторную загрузку (для Unix-like).
В современных операционных системах атрибуты файлов не влияют на возможность доступа к файлам, для чего существуют права доступа, контролируемые политикой безопасности ОС на компьютере.
К файлу можно обращаться по имени, по полному имени или спецификации.
Маска или шаблон имени файла – специальная форма, в которой в полях имени и расширения файла используются символы *(звездочка) и ? (вопросительный знак).
- означает замену любой последовательности символов.
.doc – обращение ко всем текстовым файлам типа .doc; .* - обращение ко всем файлам текущего каталога. - ? означает замену только одного символа. Шаблон может содержать несколько символов «?».
RT??.PAS - обращение ко всем файлам типа .PAS, имя файла состоит из обязательных четырех символов, причем первые два символа обязательно RT, а третий и четвертый – любые, например RT_1.PAS;
ver.mp* - в имени содержится «ver», символов до «ver» может быть сколько угодно или вообще не быть и так же после «ver», а расширение должно начинаться с «.mp» после «mp» могут быть любые символы или не быть ни одного, например verew.mp3, gtver.mp; rever_1.mp56;
??????.mp - имя состоит не менее, чем из 6 символов, расширение начинается с «.mp» и в имени между первыми и вторыми тремя символами может быть любое количество символов и может их вообще не быть, например слава_1.mp, dsrtyu.mp3, fddd456.mprt, vepsrf123.mpytr;
a.a - в имени есть буква «a», в расширении тоже есть буква «a», имя должно состоять из хотя бы одной буквы, как и рассширение, например a.a, куaку.вaе, вывыa.dat;
a.p - в имени есть буква «a», в расширении – буква «p» и она не обязательно должна быть первой после точки, например a.p, укaг.rps, саaр.ffptt, цаaт.ddp.
Основное:
- все данные на дисках хранятся в виде файлов;
- файлы группируются в каталоги для классификации и удобства поиска (в OS Windows каталоги называются «папками»);
- каталоги могут иметь вложенные каталоги;
- каталоги организованы в многоуровневую (иерархическую) структуру, которая называется «деревом каталогов»;
- полный адрес файла состоит из адреса каталога, в котором он находится, символа «\» и имени файла, например:
- С:\Мои документы\Мои работы\Фото\Киса.jpg
- шаблон или маска служит для обозначения (выделения или поиска) группы файлов, имена которых имеют общие свойства, например, общее расширение или одинаковые символы в названии;
- маски файлов, кроме «обычных» символов (допустимых в именах файлов) используются два специальных символа: звездочка «*» и знак вопроса «?»;
- звездочка «*» обозначает любой количество любых символов, в том числе, может обозначать пустую последовательность символов;
- знак вопроса «?» обозначает ровно один любой допустимый символ;
- при выводе списка имен файлов на компьютере можно отсортировать файлы по имени, по типу (расширению), по дате последнего изменения, по размеру;
- если установлена сортировка по имени или типу, сравнение идет по кодам символов, входящих в имя или в расширение.