Понятие языка программирования
Язык программирования – формальная знаковая система, которая предназначена для написания кодов компьютерных программ. Языком программирования определяется набор лексических, синтаксических и семантических правил, которые описывают внешний вид программы и действия, которые выполняет компьютер под её управлением.
За все временя существования программирования было разработано более 8 000 языков программирования различных типов. С каждым годом количество возрастает. Некоторые языки доступны только небольшому числу их разработчиков, другие стали известны огромному количеству пользователей. Профессиональные программисты могут программировать на десятках различных языков программирования.
Язык программирования используется для написания компьютерных программ, представляющих собой набор правил, которые позволяют компьютеру выполнить какой-либо вычислительный процесс, организовать управление различными объектами и т. п. Отличие языка программирования от естественного языка в том, что он предназначен для взаимодействия человека с ЭВМ, а естественный язык – для общения людей между собой. У большинства языков программирования для определения и манипулирования структурами данных и управления процессом вычислений используются специальные конструкции.
Чаще всего язык программирования существует в нескольких видах, которые существенно отличаются между собой:
- Стандарт языка – набор спецификаций, которые определяют его синтаксис и семантику; стандарт языка может исторически развиваться.
- Воплощения (реализации) стандарта – сами программные средства, которые обеспечивают работу соответственно определенному варианту стандарта языка. Они отличаются производителем, маркой и вариантом (версией), временем выпуска, полнотой воплощения стандарта, дополнительными возможностями; зачастую имеют определённые ошибки или особенности воплощения, которые влияют на практику использования языка или даже на его стандарт.
Стандартизация языков программирования
Для большинства широко распространённых языков программирования разработаны международные стандарты. Специальными организациями проводится регулярное обновление и публикация спецификаций и формальных определений для соответствующего языка. Подобные комитеты продолжают разработку и модернизацию языков программирования и решают вопросы о расширении или поддержке уже существующих или новых языковых конструкций.
Способы реализации языков
Языки программирования могут быть реализованы в виде компилируемых, интерпретируемых и встраиваемых.
-
Компилируемый язык. Программа при помощи особой программы, коорая называется компилятором, преобразуется (компилируется) в машинный код (набор инструкций) для данного типа процессора и образует исполнимый модуль, который можно запустить на выполнение как отдельную программу. Таким образом, компилятор преобразует исходный текст программы с языка программирования высокого уровня в двоичный код инструкций процессора.
Преимуществом скомпилированных программ является меньшее время их выполнения и ненужность для их выполнения дополнительных программ, т. к. они уже переведены на машинный язык. В то же время, при каждом изменении текста программы необходима ее перекомпиляция, что влияет на скорость процесса разработки. Также, скомпилированная программа может быть выполнена только на том типе компьютеров и, как правило, под управлением той операционной системы, на которую был рассчитан компилятор. Для создания исполняемого файла для машины другого типа необходима новая компиляция.
-
Интерпретируемый язык. Интерпретатором непосредственно выполняется (интерпретируется) исходный текст без предварительного перевода. При этом программа запоминается на исходном языке и не может быть запущена без интерпретатора. С этой позиции процессор компьютера можно назвать интерпретатором машинного кода.
Разделение на компилируемые и интерпретируемые языки довольно условно. Так, например, для языка Pascal, который традиционно считается компилируемым языком, можно написать интерпретатор. Кроме того, большинством современных «чистых» интерпретаторов не исполняются конструкции языка непосредственно, а компилируются в некоторое высокоуровневое промежуточное представление (например, с разыменованием переменных и раскрытием макросов).
Для любого интерпретируемого языка можно создать компилятор. Например, язык Lisp, являющийся изначально интерпретируемым, может компилироваться без любых ограничений. Код, который создается во время исполнения программы, может так же динамически компилироваться при выполнении.
Программы, разработанные на интерпретируемых языках, можно запускать сразу же после изменения, что приводит к облегчению процесса разработки. Зачастую программы на интерпретируемых языкахе могут быть запущены на разных компьютерах и операционных системах без дополнительных трудностей.
Вместе с тем, интерпретируемые программы выполняются гораздо медленнее, чем компилируемые, к тому же, они не могут быть выполнены без программы-интерпретатора.
Существуют языки (такие как Java и C#), которые находятся между компилируемыми и интерпретируемыми. Т.е. программа компилируется не в машинный язык, а в машинно-независимый код низкого уровня, который называется байт-кодом. Далее байт-код выполняет виртуальная машина. Виртуальная машина Java (Java Virtual Machine) выполняет байт-код для языка Java, а Common Language Runtime – для языка C#.
Для выполнения байт-кода обычно используется интерпретатор, хотя отдельные его части для ускорения работы программы могут транслироваться в машинный код непосредственно при выполнении программы по технологии компиляции «на лету» (Just-in-time compilation, JIT).
При таком подходе удобно использовать плюсы и интерпретаторов, и компиляторов. Существуют языки, которые имеют интерпретатор и компилятор (например, Форт).
Используемые символы
Современные языки программирования поддерживают использование ASCII, т. е. доступность всех графических символов ASCII является необходимым и достаточным условием для записи любых конструкций языка. Из управляющих символов ASCII допускается только использование возврата каретки CR, перевода строки LF и горизонтальной табуляции HT (иногда также вертикальной табуляции VT и перехода к следующей странице FF).
В ранних языках, которые возникли в эпоху 6-битных символов, использовался более ограниченный набор. Например, алфавит Фортрана включает 49 символов (включая пробел): 26 символов букв латинского алфавита, цифры от 0 до 9 и знаки «точка», «запятая», =, +, –, *, /, (, ), $, ', :. Исключительным отличием характеризуется язык APL, в котором можно использовать большое количество специальных символов. , ', :. Исключительным отличием характеризуется язык APL, в котором можно использовать большое количество специальных символов.
Возможно использование символов за пределами ASCII (например, символов KOI8-R или символов Unicode), только это зависит от реализации: иногда такие символы разрешаются только в комментариях и символьных/строковых константах, а иногда и в идентификаторах. В СССР существовали языки, в которых все ключевые слова записывались русскими буквами, но большой популярности подобные языки не обрели (за исключением встроенного языка программирования 1С:Предприятие).
Расширение набора символов, которые используются в языке программирования, не поддерживается, т. к. многие проекты по созданию программного обеспечения являются международными. Неудобно было бы работать с кодом, в котором имена одних переменных могут быть записаны русскими буквами, других – арабскими, а третьих – китайскими иероглифами. Вместе с тем, языки программирования нового поколения (например, Delphi, C#, Java) для работы с текстовыми данными поддерживают Unicode.