Файл определение

Файл

У этого термина существуют и другие значения, см. Файл (значения).

Файл (англ. file) — именованная область данных на носителе информации.

Работа с файлами реализуется средствами операционных систем. Многие операционные системы приравнивают к файлам и обрабатывают сходным образом и другие ресурсы:

  • области данных (необязательно на диске);
  • устройства — как физические, например, порты или принтеры, так и виртуальные (/dev/null, /dev/random, /dev/urandom);
  • потоки данных (именованный канал);
  • сетевые ресурсы, сокеты;
  • прочие объекты операционной системы.

История

Файл перфокарт Два жёстких диска машины IBM 305[en]

Слово file впервые применено к компьютерному хранилищу в 1950 году. Реклама памяти на запоминающих ЭЛТ фирмы RCA в журнале «Popular Science»[1] гласила:

« …результаты бесчисленных вычислений можно держать «в картотеке» (on file) и получать снова. Эта «картотека» теперь существует в запоминающей трубке, разработанной в лабораториях RCA. Она электрически сохраняет цифры, отправленные в вычислительную машину, и держит их в хранилище, заодно запоминая новые — ускоряя интеллектуальные решения в лабиринтах математики. »

В 1952 году слово file отнесли к колоде перфокарт.[2] Поначалу словом file называли само устройство памяти, а не его содержимое (см. Регистровый файл). Например, диски IBM 350, использовавшиеся, например, в машине IBM 305, назывались disk files.[3] Системы наподобие Compatible Time-Sharing System ввели концепцию файловой системы, когда на одном запоминающем устройстве существует несколько виртуальных «устройств памяти», что и дало слову «файл» современное значение. Имена файлов в CTTS состояли из двух частей, «основного имени» и «дополнительного имени» (последнее существует и поныне как расширение имени файла).[4][5]

Файловая система

Основная статья: Файловая система

По мере развития вычислительной техники файлов в системах становилось всё больше. Для удобства работы с ними, их, как и другие данные, стали организовывать в структуры (тогда же появились символьные имена). Вначале это был простой массив, «привязанный» к конкретному носителю информации. В настоящее время наибольшее распространение получила древовидная организация с возможностью монтирования и вставки дополнительных связей (то есть ссылок). Соответственно, имя файла приобрело характер пути к файлу: перечисление узлов дерева файловой системы, которые нужно пройти, чтобы до него добраться.

Файл как объект API операционной системы

Операционная система предоставляет приложениям набор функций и структур для работы с файлами. Возможности операционной системы накладывают дополнительные ограничения на ограничения файловой системы. С точки зрения API файл — объект, по отношению к которому могут быть применены функции этого API. На уровне API уже не существенно, существует ли файл как объект файловой системы или является, например, устройством ввода-вывода.

Свойства файла

В зависимости от файловой системы, файл может обладать различным набором свойств.

Имя файла

Основная статья: Имя файла

В большинстве файловых систем имя файла используется для указания, к какому именно файлу производится обращение. В различных файловых системах ограничения на имя файла сильно различаются: в FAT16 и FAT12 размер имени файла ограничен 8.3 знаками (8 на имя и 3 на расширение); в других системах имя файла ограничено обычно в 255 байт; в NTFS имя ограничено в некоторых ОС 256 символами Unicode 1 (по спецификации — 32 768 символов).

Помимо ограничений файловой системы, интерфейсы операционной системы дополнительно ограничивают набор символов, который допустим при работе с файлами.

  • Для MS-DOS в имени файла допустимы только заглавные латинские буквы, цифры. Недопустимы пробел, знак вопроса, звёздочка, символы больше и меньше, символ вертикальной черты.[6] При вызове системных функций имена файлов в нижнем или смешанном регистре приводятся к верхнему регистру.
  • Для Windows в имени файла разрешены заглавные и строчные буквы, цифры, некоторые знаки препинания, пробел. Запрещены символы >, , |, ?, *, /, \, :, ".
  • Для GNU/Linux (с учётом возможности маскировки) разрешены все символы, кроме / и нуль-символа.

Большинство операционных систем требуют уникальности имени файла в одном каталоге, хотя некоторые системы допускают файлы с одинаковыми именами (например, при работе с ленточными накопителями).

В некоторых файловых системах можно создавать и использовать файлы без имени. Такие файлы всегда являются временными. Их основные преимущества: при создании не может возникнуть конфликта имён и их нельзя найти в их каталоге по имени. В остальном это полноценные файлы.

Расширение имени файла

Основная статья: Расширение имени файла

Расширение имени файла (часто: расширение файла или расширение) как самостоятельный атрибут файла существует в файловых системах FAT16, FAT32, NTFS, используемых операционными системами MS-DOS, DR-DOS, PC DOS, MS Windows и используется для определения типа файла. Оно позволяет системе определить, каким приложением следует открывать данный файл. По умолчанию в операционной системе Windows расширение скрыто от пользователя.

В остальных файловых системах расширение — условность, часть имени, отделённая самой правой точкой в имени (суффикс).

Основные атрибуты

В некоторых файловых системах, таких как NTFS, предусмотрены атрибуты (обычно это бинарное значение «да»/«нет», кодируемое одним битом). Во многих современных операционных системах атрибуты практически не влияют на возможность доступа к файлам, для этого в некоторых операционных и файловых системах существуют права доступа.

Название атрибута перевод значение файловые системы операционные системы
Read only только для чтения в файл запрещено писать FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
System системный критический для работы операционной системы файл FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
Hidden скрытый файл скрывается от показа, пока явно не указано обратное FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
Archive архивный (требующий архивации) файл изменён после резервного копирования или не был скопирован программами резервного копирования; при изменении файла ОС автоматически устанавливает этот атрибут FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
SUID Установка пользовательского ID выполнение программы от имени владельца ext2 Unix-like
SGID Установка группового ID выполнение программы от имени группы (для каталогов: любой файл созданный в каталоге с установленным SGID, получит заданную группу-владельца) ext2 Unix-like
Sticky Bit липкий бит изначально предписывал ядру не выгружать завершившуюся программу из памяти сразу, а лишь спустя некоторое время, чтобы избежать постоянной загрузки с диска наиболее часто используемых программ, в настоящее время в разных ОС используется по-разному ext2 Unix-like

Время

Для файла могут быть определены временные метки создания, последней модификации, последнего доступа и другие.

Владелец и группа файла

В некоторых файловых системах предусмотрено указание на владельца файла и группу-владельца.

Права доступа

В некоторых файловых системах предусмотрена возможность для ограничения доступа пользователей к содержимому файла. В UNIX-подобных операционных системах для файлов ранее обычно выделяли три типа прав: на запись, чтение и выполнение. Каждое право задаётся раздельно для владельца, для группы и для всех остальных. ACL позволяет использовать более детальное разделение и прав, и пользователей.

В операционных системах Windows NT при работе с файловой системой NTFS права доступа задаются явно для пользователей или групп или наследуются от вышестоящих объектов. Права в себя включают право на чтение, запись, исполнение, удаление, смену атрибутов и владельца, создание и удаление подпапок (для папок) и чтение прав доступа и другие как в POSIX. Каждое право может быть задано как разрешением, так и запретом. Запрет имеет больший приоритет, чем разрешение в отличие от POSIX.

Операции с файлом

Условно можно выделить два типа операций с файлом — связанные с его открытием и выполняющиеся без его открытия. Операции первого типа обычно служат для чтения и записи информации или подготовки к чтению или записи. Операции второго типа выполняются с файлом как с «объектом» файловой системы, в котором файл является наименьшим элементом структурирования.

Операции, связанные с открытием файла

В зависимости от операционной системы те или иные операции могут отсутствовать.

Обычно выделяют дополнительные сущности, связанные с работой с файлом:

  • Дескриптор файла (хэндлер, описатель). При открытии файла (в случае, если это возможно), операционная система возвращает число (или указатель на структуру), с помощью которого выполняются все остальные файловые операции. По их завершении файл закрывается, а хэндлер теряет смысл.
  • Файловый указатель. Число, являющееся смещением относительно нулевого байта в файле. Обычно по этому адресу осуществляется чтение/запись, в случае, если вызов операции чтения или записи не предусматривает указание адреса. При выполнении операций чтения или записи файловый указатель увеличивается на число прочитанных или записанных байт. Последовательный вызов операций чтения таким образом позволяет прочитать весь файл последовательно, не заботясь о позиционировании.
  • Файловый буфер. Операционная система или библиотека языка программирования осуществляет кэширование файловых операций в специальном буфере (участке памяти). При закрытии файла буфер сбрасывается.
  • Режим доступа. В зависимости от потребностей программы, файл может быть открыт на чтение или запись. Кроме того, некоторые операционные системы и библиотеки предусматривают режим работы с текстовыми файлами. Режим обычно указывается при открытии файла.
  • Режим общего доступа. В случае многозадачной операционной системы возможна ситуация, когда несколько программ одновременно хотят открыть файл на чтение или запись. Для регулирования этого существуют режимы общего доступа, указывающие на возможность осуществления совместного доступа к файлу (например, файл, в который производится запись, может быть открыт для чтения другими программами — это стандартный режим работы с файлами регистрации).
Операции
  • Открытие файла (обычно в качестве параметров передается имя файла, режим доступа и режим совместного доступа, а в качестве результата выступает файловый дескриптор), кроме того обычно имеется возможность в случае открытия на запись указать на то, должен ли размер файла изменяться на нулевой.
  • Закрытие файла. В качестве аргумента выступает значение, полученное при открытии файла. При закрытии все файловые буферы сбрасываются.
  • Запись — в файл помещаются данные.
  • Чтение — данные из файла помещаются в область памяти.
  • Перемещение указателя — указатель перемещается на указанное число байт вперёд или назад или перемещается по указанному смещению относительно начала или конца. Не все файлы позволяют выполнение этой операции (например, файл на ленточном накопителе может не «уметь» перематываться назад).
  • Сброс буферов — содержимое файловых буферов с не записанной в файл информацией записывается. Используется обычно для указания на завершение записи логического блока (для сохранения данных в файле на случай сбоя).
  • Получение текущего значения файлового указателя.

Операции, не связанные с открытием файла

Операции, не требующие открытия файла, оперируют с его «внешними» признаками — размером, именем, положением в дереве каталогов. При таких операциях невозможно получить доступ к содержимому файла, файл является минимальной единицей деления информации.

Возможные операции с файлами: создание, удаление, переименование, копирование, перенос на другую файловую систему, создание символьной ссылки или жёсткой ссылки, получение и изменение атрибутов.

В зависимости от файловой системы, носителя информации, операционной системы часть операций может быть недоступна.

Типы файлов

По способу организации файлы делятся на файлы с произвольным доступом и файлы с последовательным доступом.

В различных операционных и файловых системах могут быть реализованы различные типы файлов, кроме того, реализация различных типов может различаться.

  • «Обыкновенный файл» — файл, позволяющий операции чтения, записи, позиционирования внутри файла, изменения размера, иногда работу с атрибутами.
  • Каталог (англ. directory — алфавитный справочник) или директория (также «папка») — файл, содержащий записи о входящих в него файлах. Каталоги могут содержать записи о других каталогах, образуя древовидную структуру, а при наличии ссылок — сетевую структуру.
  • Жёсткая ссылка (англ. hardlink, часто используется калька «хардлинк») — в общем случае, одна и та же область информации может иметь несколько имён. Такие имена называют жёсткими ссылками (хардлинками). После создания жёсткой ссылки сказать где «настоящий» файл, а где жёсткая ссылка невозможно, так как имена равноправны. Сама область данных существует до тех пор, пока существует хотя бы одно из имён. Жёсткие ссылки возможны только в пределах одного экземпляра ФС.
  • Символьная ссылка (симлинк, софтлинк, символическая ссылка) — файл, содержащий в себе ссылку на имя нужного файла любого типа. Может ссылаться на любой элемент файловой системы, в том числе, и расположенный на другом физическом носителе. В некоторых ФС может ссылаться на несуществующий файл, образовывать циклы, ссылаться на себя.

Особенности реализации

В операционной системе UNIX процессы (обычно находятся в каталоге /proc) и устройства (/dev) представляются в виде файлов особого типа, что позволяет использовать некоторые файловые операции для манипуляции этими объектами.

В некоторых файловых системах (например, в файловой системе OS VAX VMS) файлы имеют версию, что позволяет открывать более старые варианты данного файла. В файловой системе Mac OS (HFS) у файлов есть два «потока»: поток данных (где хранится содержимое файла) и поток ресурсов, хранящий информацию о программе, предназначенной для открывания данного файла и, возможно, некоторую информацию для этой программы. В NTFS файл может содержать, кроме основного, сколько угодно именованных потоков.

Проблема точного определения понятия «файл»

Так как файл в разных операционных системах обладает различным набором атрибутов, свойств и методов доступа, универсального определения, которое бы учитывало все особенности, сформулировано не было[источник не указан 580 дней].

  • Временный файл
  • Разрежённый файл
  • Исполнимый модуль
  • Заголовочный файл
  • Пакетный файл
  • Файл конфигурации
  • Файл регистрации
  • README-файл
  • Метафайл

ru.wikipedia.org

Что такое файлы? Типы файлов

Компьютеры сейчас занимают серьезную часть нашей жизни. Именно поэтому, каждому сейчас необходимо знать хотя бы самые основные понятия и термины. Одним из самых основных понятий, которое должен знать каждый пользователь – файл.

Что такое файлы? Любая информация, которая хранится на компьютере, хранится именно в виде файлов. Файл – это наименьшая единица измерения информации, грубо говоря, цифровой «предмет». Каждый раз, сохраняя рисунок, песню, фильм, текст, вы создаете файл. На каждом компьютере содержится огромное количество файлов. Даже на новом компьютере, куда только что поставили операционную систему их порядка ста тысяч.

Как же разобраться в таком количестве файлов? Во-первых, каждый файл имеет индивидуальное имя, а, кроме того, расширение. Расширение указывает на то, какого типа этот файл, для чего предназначен. Во-вторых, файлы не свалены в одну кучу, а разложены по специальным местам, которые называют папками. Каждая группа файлов, объеденная общей функцией, темой или еще чем-либо, лежит в своей папке. Таким образом, благодаря индивидуальному имени, расширению и тому, что каждый файл лежит в строго определенном месте, во всем разнообразии файлов на вашем компьютере можно легко разобраться.

Как расшифровать файлы? Что значит то или иное расширение? Условно все файлы можно разделить на несколько групп:

  • документы – файлы, содержащие, преимущественно, текстовую информацию, эти файлы создают сами пользователи в специально созданных для этого программах;
  • файлы-библиотеки – эти файлы содержат различные алгоритмы, которые используют программы;
  • исполняемые фалы – файлы, запуск которых вызывает к работе ту или иную программу.

Чтобы сходу понять, к какой из этих групп относится тот или иной файл, необходимо знать самые распространенные расширения, типы файлов. Тогда при одном взгляде на файл его назначение становится очевидным. Расширением называются три или четыре последних буквы в имени файла, перед расширением всегда стоит точка. В отличие от имени файла, которое может содержать как русские, так и английские буквы, расширение всегда записано только латиницей.

  • exe – в просторечии эти файлы часто называют экзэшники. Что такое файлы-экзешники? Они относятся к группе исполняемых файлов. При их запуске начинается работа программы, например, игра или текстовый редактор.
  • com – сегодня эти файлы не используются, их можно встретить только в очень старых программах. Фактически, это аналоги экзэшных файлов под операционную систему MS DOS.
  • bat – файлы с таким расширением запускают сразу несколько других файлов в заданной последовательности. Самым часто используемым файлом такого типа является autoexec.bat, который выполняется во время загрузки компьютера и запускает все программы, которые необходимы сразу, после окончания загрузки.
  • cfg – в этих файлах содержатся параметры работы конкретной программы.
  • dll – файлы-библиотеки.
  • hlp – в файлах с таким расширением содержатся справки к программам.
  • dat – файлы, содержащие данные о работе программ.

Все нижеследующие расширения характерны для исполняемых файлов. Сами они не являются частью той или иной программы, в отличие от первых трех расширений, но они привязаны каждый к своей программе, в которой и запускаются открываемые файлы. Например, открывая текстовый файл, вы автоматически запускаете и текстовый редактор, а с аудио или видеофайлом запускается проигрыватель. Поэтому для того, чтобы запускать такие файлы, необходимо, чтобы на вашем компьютере стояли необходимые программы.

  • txt, doc, docx – это расширения текстовых файлов, используемые различными текстовыми редакторами.
  • htm,html – документы с гиперссылками. Что такое файлы с гиперссылками? От остальных они отличаются тем, что навигация по ним осуществляется при помощи специальных перекрестных ссылок.
  • mp3, mid, wav – распространенные аудио форматы.
  • avi, mpeg4, dvix, mkv, mov – под такими расширениями скрываются видеозаписи.
  • jpg, bmp, png, gif – самые часто используемы расширения для картинок, фоторгафий и других изображений.
  • rar, zip – архивные файлы. Что такое файлы-архивы? Такие файлы создаются при помощи программ-архиваторов. Архивируют файлы для того, чтобы они занимали меньше места на жестком диске.

С понятием файл неразрывно связанно еще одно понятие - файловая система. Для флешки и жесткого диска обязательно необходимо выбирать подходящую файловую систему.

fb.ru

Файл (значения)

Файл:

  • Файл (в информатике) — логическая единица информации, хранимая на носителе;
  • Файл-вкладыш, или Мультифора — тонкий прозрачный пакет для бумаги, имеющий отверстия для подшивания в папку-скоросшиватель;
  • Файл-папка, или Скоросшиватель — тонкая папка для подшивания бумаг, обычно вставляемая в папку-регистратор;
  • Файл: — пространство имён в Википедии; подробнее см. Викисклад
  • Файл — район в Португалии;
  • Файл — стоматологический инструмент для обработки каналов зубов, похожий на большую булавку с ручкой или шило небольшого размера.
  • file — утилита Unix-подобных операционных систем

ru.wikipedia.org

Что такое файл? дайте пожалуйста определение "что такое файл"? пожалуйста срочно надо по информатике

Илья орловский

ФАЙЛ — наименование (имя) совокупности данных, в т. ч. документа (1) на машиночитаемом носителе (напр. , дискете) , осн. элемент хранения данных в компьютере, позволяющий отличать эту совокупность данных от других, находить, изменять, удалять или выполнять с ней другие операции.

Женя шакина

Файл (англ. file — папка, скоросшиватель) — концепция в вычислительной технике: сущность, позволяющая получить доступ к какому-либо ресурсу вычислительной системы и обладающая рядом признаков:
фиксированное имя (последовательность символов, число или что-то иное, однозначно характеризующее файл) ;
определённое логическое представление и соответствующие ему операции чтения/записи.
Может быть любой — от последовательности бит до базы данных с произвольной организацией или любым промежуточным вариантом.
Первому случаю соответствуют операции чтения/записи потока и/или массива (то есть последовательные или с доступом по индексу) , второму — команды СУБД. Промежуточные варианты — чтение и разбор всевозможных форматов файлов.

В информатике используется следующее определение: файл — поименованная совокупность байтов произвольной длины, находящихся на носителе информации.

Что такое файл?

Алёночка

Файлом называется именованная часть жесткого диска или гибкой дискеты. Также файл – это логическое устройство, потенциальный источник или приемник информации. Длина каждого файла ограничивается только емкостью устройства внешней памяти компьютера.

Файловая система - регламент, определяющий способ организации, хранения и именования данных на носителях информации. Она определяет формат физического хранения информации, которую принято группировать в виде файлов. Тип файловой системы определяет свойства, которыми могут обладать файлы, ограничения на имена файлов, количество файлов и максимальный размер файла.

Файл - запись на носителе, указывающая на блок (или блоки) информации на этом же носителе. В самом тривиальном случае файловой системы может и не быть (например, весь носитель представляет собою файл, структура которого определяется приложением) . В наиболее сложных случаях файловая система может содержать в себе информацию о нескольких версиях файла, наличии пустых мест в файле, сжатии, шифрации, правах доступа к файлу. Точная интерпретация значений атрибутов зависит от операционной системы.

Файл (англ. file — папка, скоросшиватель) — концепция в вычислительной технике: сущность, позволяющая получить доступ к какому-либо ресурсу вычислительной системы и обладающая рядом признаков:

* фиксированное имя (последовательность символов, число или что-то иное, однозначно характеризующее файл) ;
* определённое логическое представление и соответствующие ему операции чтения/записи.

Может быть любой — от последовательности бит до базы данных с произвольной организацией или любым промежуточным вариантом.
Первому случаю соответствуют операции чтения/записи потока и/или массива (то есть последовательные или с доступом по индексу) , второму — команды СУБД. Промежуточные варианты — чтение и разбор всевозможных форматов файлов.



В информатике используется следующее определение: файл - поименованная совокупность байтов произвольной длины, находящихся на носителе информации.

В отличие от переменной, файл (в частности, его имя) имеет смысл вне конкретной программы. Работа с файлами — по крайней мере, в «простейшем» представлении — реализуется средствами операционных систем, а до их появления реализовывалась их предшественниками — мониторами и библиотеками подпрограмм.

Ресурсами, доступными через файлы, в принципе, может быть что угодно, представимое в цифровом виде. Чаще всего в их перечень входят:

* области данных (необязательно на диске) ;
* устройства (как физические, так и виртуальные) ;
* потоки данных (в частности, вход или выход процесса) ;
* сетевые ресурсы;
* объекты операционной системы.
Файлы первого типа исторически возникли первыми и распространены наиболее широко, поэтому часто «файлом» называют и область данных, соответствующую имени.

Белка

Файл (англ. file — папка, скоросшиватель) — концепция в вычислительной технике: сущность, позволяющая получить доступ к какому-либо ресурсу вычислительной системы и обладающая рядом признаков:
фиксированное имя (последовательность символов, число или что-то иное, однозначно характеризующее файл) ;
определённое логическое представление и соответствующие ему операции чтения/записи.
Может быть любой — от последовательности бит до базы данных с произвольной организацией или любым промежуточным вариантом.
Первому случаю соответствуют операции чтения/записи потока и/или массива (то есть последовательные или с доступом по индексу) , второму — команды СУБД. Промежуточные варианты — чтение и разбор всевозможных форматов файлов.

Wild

Любой, изучавший информатику, знает что такое бит - наименьшая единица представления информации (от английского binary digit - двоичный знак) , обозначаемая двоичным числом 1 или 0.
Восемь последовательно расположенных бит могут содержать уже 256 различных значений (от 0 до 255) и позволяют кодировать и обрабатывать информацию (буквы и цифры) . Такая группа из восьми бит называется байтом. Можно сказать, что байт - это наименьшая единица обработки и передачи информации вычислительной техникой.
Наименьшей единицей хранения информации является файл - это сохраненная (записанная) последовательность байтов, имеющая собственное имя. По имени файла компьютер определяет, где находится файл (путь к файлу) , какая информация в нем записана, в каком формате и какими программами ее можно обработать.

Читайте также