Информация и данные
Сведения о каком-либо объекте или процессе реального мира, которые могут быть переданы и восприняты, называются информацией.
В соответствии с этим определением информацией является книга, статья, сайт, финансовый отчет, любой документ, видеоматериал, аудиозапись и т.д. Этот список можно продолжать до бесконечности, потому что информация может быть представлена в самых разных формах. Но не всякая форма представления информации может быть легко и быстро обработана компьютерными средствами.
Информацию, которая фиксируется в строго формализованном виде, пригодном для хранения, передачи и обработки компьютерными средствами, называют данными
Таким образом, можно сказать, что информация может быть преобразована в данные и наоборот извлечена из данных. Для того чтобы информацию можно было преобразовать в данные, ее необходимо собрать, формализовать и перенести на компьютерные носители. Для того чтобы извлечь информацию из данных необходимо проанализировать данные и сделать на основе анализа выводы.
Формализация информации
Самым главным этапом в получении данных из информации является формализация.
Формализацией называется представление данных в виде какой-либо четкой структуры.
Прочитаем фрагмент текста: «Иван Степанович Белкин живет с 2005 года в Москве на улице Ленина. У него трехкомнатная квартира в сто двадцать девятом доме». Это информация. Но она не формализована. Теперь посмотрим на таблицу.
Эта таблица содержит те же самые сведения, что и текст, но они имеют четкую структуру. Таблица представляет собой формализованную информацию. Для того чтобы узнать номер дома Ивана Степановича из фрагмента текста, нужно прочитать этот текст и сделать из него выводы. Никакие компьютерные программы не сделают этих действий за человека, потому что современные компьютеры мало что могут сделать с неформализованной информацией. Но стоит разместить данные в таблице, сразу же можно применить, например, фильтры электронных таблиц и найти нужную информацию автоматически.
Таким образом, для того чтобы можно было использовать в работе с информацией компьютерные средства, информацию необходимо формализовать и превратить в данные.
Базы данных и СУБД
Формализованная информация не обязательно должна быть представлена именно в виде таблиц. Существуют различные способы формализации информации:
- таблицы,
- деревья,
- языки структурирования
- и т.д.
Логически связанные данные, формализованные каким-либо единым способом, таким образом, чтобы их можно было обрабатывать компьютером, называются базой данных.
Способ формализации данных называется моделью данных.
Базы данных создаются и управляются в специальных программах, которые называются системами управления базами данных (СУБД). СУБД дают возможность надежно хранить большие объемы данных, защищать их от несанкционированного доступа, быстро осуществлять поиск по заданным критериям, редактировать и удалять данные. Модель данных является самой главной характеристикой СУБД. В современных СУБД применяются следующие модели данных:
- Иерархическая;
- Сетевая;
- Реляционная;
- No SQL (нереляционная);
- Постреляционная;
- Объектно-ориентированная;
- Многомерная.
Иерархическая модель считается устаревшей, однако в некоторых информационных системах ее продолжают использовать. Как правило, это старые информационные системы, где накоплены огромные объемы данных, используемых в научных целях. Замена таких систем стоит очень дорого, потому они продолжают работать на основе устаревшей модели. На сегодняшний день стандартом де-факто является реляционная модель данных. Ее поддерживает подавляющее большинство СУБД. Однако, постреляционная модель и no sql приобретают все больше популярности.