Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ЛЕКЦИЯ 1. ИНФОРМАЦИЯ, ДАННЫЕ, ЗНАНИЯ.
ИНФОРМАЦИОННЫЕ СИСТЕМЫ
ИНФОРМАЦИЯ
Термин информация происходит от латинского слова informatio, что означает «сведения, разъяснения, изложение».
Информация - это настолько общее и глубокое понятие, что его нельзя объяснить одной фразой. В это слово вкладывается различный смысл в технике, науке и в житейских ситуациях.
В обиходе информацией называют любые данные или сведения, которые кого-либо интересуют, например сообщение о каких-либо событиях, о чьей-либо деятельности и т. п. «Информировать» в этом смысле означает «сообщить нечто, неизвестное раньше».
Информация - сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые воспринимают информационные системы (живые организмы, управляющие машины и др.) в процессе жизнедеятельности и работы.
Одно и то же информационное сообщение (статья в газете, объявление, письмо, телеграмма, справка, рассказ, чертеж, радиопередача и т. п.) может содержать разное количество информации для разных людей в зависимости от их накопленных знаний, от уровня понимания этого сообщения и интереса к нему. Так, сообщение, составленное на японском языке, не несет никакой новой информации человеку, не знающему этого языка, но может быть высокоинформативным для человека, владеющего японским. Никакой новой информации не содержит и сообщение, изложенное на знакомом языке, если его содержание непонятно или уже известно.
Информация есть характеристика не сообщения, а соотношения между сообщением и его потребителем. Без наличия потребителя, хотя бы потенциального, говорить об информации бессмысленно.
В случаях, когда говорят об автоматизированной работе с информацией посредством каких-либо технических устройств, обычно в первую очередь интересуются не содержанием сообщения, а тем, сколько символов это сообщение содержит.
Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т. п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде.
Каждый новый символ в такой последовательности символов увеличивает информационный объем сообщения. Ключевое понятие здесь – смысловая нагрузка. Именно это отличает информацию от данных.
ДАННЫЕ
Данные - 1) сведения, факты, показатели, выраженные как в числовой, так и любой другой форме; 2) входной сигнал в любой форме, из которого потенциально получить информацию (так называемые «сырые данные» - raw data).
Данные часто путают с информацией, говоря, например, «финансовые данные», имея в виду экономический отчет, который на самом деле несет сводную информацию.
С целью смыслового разделения понятий "информация" и "данные" Ассоциация стандартов Франции (АФНОР) дает следующее определение: "Данные - факт, понятие или инструкции, представленные в условной форме, удобной для пересылки, интерпретации и обработки человеком или автоматизированными средствами".
Согласно другого важного для понимания этого термина определения: "Данные - некоторый факт, то на чем основан вывод или любая интеллектуальная система". Компонентами данных являются цифры и символы естественного языка или их кодированное представление в виде строки двоичных битов.
Двоичные данные. Информации здесь нет вообще
Данные и информация на одном рисунке. Здесь показаны связи между пользователями твиттера. использовавшими хештег #bigdata. http://whyfiles.org/2013/mining-data/
Данные на рисунке – это каждый отдельный пользователь с его именем в твиттере и твитами с хештегом #bigdata.
Информация – это связи между пользователями, которые можно увидеть на рисунке. Цвет – это тоже информация, он обозначает различные типы связей. Зеленый – «фолловеры», синий – ретвиты и упоминания одним пользователем другого. Любые выводы, которые вы сделаете по этой картинке, тоже будут информацией.
ЕЩЕ НЕМНОГО ИНФОРМАЦИИ =)
Чтобы стать информацией, данные должны правильно отражать объекты описания, в противном случае мы будем иметь дело с "дезинформацией " (ее англоязычные эквиваленты: false information, misleading information). Сама по себе "правильность отражения действительности" в соответствии с теорией познания всегда носит условный характер, поскольку связана с уровнем развития знаний на данном этапе развития общества или отдельных его социальных групп и индивидуумов. Так, состав и точность данных, которыми владеют или которые необходимы различным организациям и лицам об одном и том же объекте, будут существенно различаться в зависимости от образовательного, возрастного, социального статусов субъекта информирования а также целей их использования (например, для "повышения общей эрудиции" или для решения научных, технических, производственных, коммерческих и др. задач). В указанном плане данные, которые для одного субъекта будут представляться вполне точными, для другого - могут оказаться грубой "дезой".
Чтобы стать информацией, данные должны представлять для субъекта информирования "определенный интерес" и "новизну". Последнее означает, что они должны быть для него связаны с необходимостью решения каких-либо практических или других задач и сокращать "степень неопределенности" об объекте "интереса". В указанном плане информация помимо того, что она адресно "прибавляет знания" об интересующем объекте, должна доставляться своевременно. К примеру, сообщение о том, что "Сегодня в городе проливной дождь, гололед (или другие напасти)", полученное нами после того, как мы успели выйти из дома и промокнуть или забуксовать на дороге - информацией не является, как не является информацией и сообщение о погоде, скажем, в Чили или деревне Гадюкино, если там не живут наши близкие родственники и мы не собираемся туда ехать. Для нас эти данные являются тем, что в информатике принято называть "информационным шумом". Однако для кого-то в зоне действия средств массовой информации (кто еще не вышел на улицу или живет в упомянутых местах) эти же сведения - информация.
"Информационным шумом" являются также сообщения и данные, не представляющие для субъекта информирования предмета новизны (другими словами - этими данными он уже владеет). Примеры информационного шума: реклама, нерелевантные запросу результаты.
Основные свойства информации:
• Объективность – не зависит от чего-либо мнения
• Достоверность – отражает истинное положение дел
• Полнота – достаточна для понимания и принятия решения
• Актуальность – важна и существенна для настоящего времени
• Ценность (полезность, значимость) - обеспечивает решение поставленной задачи, нужна для того чтобы принимать правильные решения
• Понятность (ясность)– выражена на языке, доступном получателю
Кроме этого информация обладает еще следующими свойствами:
1) Атрибутивные свойства (атрибут – неотъемлемая часть чего-либо). Важнейшими среди них являются:- дискретность (информация состоит из отдельных частей, знаков) и непрерывность (возможность накапливать информацию)
2) Динамические свойства связаны с изменением информации во времени:
• копирование – размножение информации
• передача от источника к потребителю
• перевод с одного языка на другой
• перенос на другой носитель
• старение (физическое – носителя, моральное – ценностное)
3) Практические свойства - информационный объем и плотность
Представление информации осуществляется с помощью языков, как знаковых систем, которые строятся на основе определенного алфавита и имеют правила для выполнения операций над знаками.
Язык – определенная знаковая система представления информации. Существуют:
Естественные языки – разговорные языки в устной и письменной форме. В некоторых случаях разговорную речь могут заменить язык мимики и жестов, язык специальных знаков (например, дорожных);
Формальные языки – специальные языки для различных областей человеческой деятельности, которые характеризуются жестко зафиксированным алфавитом, более строгими правилами грамматики и синтаксиса. Это язык музыки (ноты), язык математики (цифры, математические знаки), системы счисления, языки программирования и т.д.
В основе любого языка лежит алфавит – набор символов/знаков. Полное число символов алфавита принято называть мощностью алфавита.
Носители информации – среда или физическое тело для передачи, хранения и воспроизведения информации. (Это электрические, световые, тепловые, звуковые, радио сигналы, магнитные и лазерные диски, печатные издания, фотографии и тд.)
Информационные процессы - это процессы, связанные с получением, хранением, обработкой и передачей информации (т.е. действия, выполняемые с информацией). Т.е. это процессы, в ходе которых изменяется содержание информации или форма её представления.
Для обеспечения информационного процесса необходим источник информации, канал связи и потребитель информации. Источник передает (отправляет) информацию, а приемник её получает (воспринимает). Передаваемая информация добивается от источника до приемника с помощью сигнала (кода). Изменение сигнала позволяет получить информацию.
ЗНАНИЯ
Знания - совокупность сведений (данных или программ), отражающих знания человека -специалиста (эксперта) в определенной предметной области и предназначенных для хранения в базах знаний. Знания отражают множество возможных ситуаций, связанных с состоянием и конкретной реализацией объектов определенного типа, способы перехода от одного описания объекта к другому. Для знаний характерны внутренняя интерпретируемость, структурированность, связанность и активность. Условно можно записать, что "знания = факты + убеждения + правила".
Различие информации и знания
Информация
Знания
• всегда связана с какими-либо данными;
• широко распространена, находится повсюду;
• может зависеть от контекста, а может и не зависеть;
• может генерироваться людьми, компьютерами, другими машинами;
• легко воспринимается и легко передается;
• как правило, статична;
• может быть легко взаимосвязана с другой информацией;
• обладает стоимостью, необходимой на создание и поддержку;
• в принципе может использоваться кем угодно и когда угодно.
• имеют отношения к данным и информации, но не всегда с ними связаны (не только обобщения, но и порождение новых сущностей, не следующих напрямую из исходной информации);
• дефицитны, их непросто добывать;
• всегда связаны с каким-то контекстом, существуют в его рамках;
• генерируются только людьми;
• трудны для восприятия;
• динамичны; любые знания обладают своей скоростью передачи и восприятия;
• для успешного восприятия требуют четких границ их понимания;
• могут быть очень дороги, цена при этом не фиксирована;
• обладают сроком и целью использования.
ИНФОРМАЦИОННЫЕ СИСТЕМЫ
Информационная система - это система работы с информацией.
1) организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе с использованием средств вычислительной техники и связи (закон об информации); 2) совокупность взаимосвязанных аппаратно-программных средств для автоматизации накопления и обработки информации.
Для создания ИС требуется формализация - перевод информации с естественного языка в более четкий, построенный по формальным правилам.
Классификация ИС по характеру использования информации
а) Информационно-поисковые системы - системы для накопления, обработки, поиска и выдачи интересующей пользователя информации (поисковые системы в Интернете)
б) Информационно-аналитические системы - предназначены для автоматизации аналитической обработки данных;
в) Системы принятия решений, осуществляющие накопление, обработку и переработку информации с использованием прикладного программного обеспечения:
– управляющие информационные системы;
– советующие экспертные информационные системы;
г) Ситуационные центры - информационно-аналитические комплексы, «заточенные» под сбор и обработку информации о конкретных типах ситуаций. Например, ситуационный центр г.Москвы, ситуационные центры МЧС и т.д.
В данном курсе рассматриваются информационно-поисковые, информационно-аналитические системы и системы принятия решений.
ИС должна обеспечивать: получение, хранение, поиск, передачу, обработку, анализ, выдачу информации и построение новой информации.
ПРИМЕРЫ СОВРЕМЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ
(для самостоятельного ознакомления)
ИАС Федерального казначейства (Росказна) http://budget.roskazna.ru/about.html
Как делает ситуационные центры компания КРОК http://habrahabr.ru/company/croc/blog/243699/
ИАС Мониторинга комплексного развития города Москвы (ИАС МКР) http://depr.mos.ru/systems-and-resource/systems-and-resources/.
Сравнение ИАС для обработки открытых источников информации http://www.mlg.ru/company/pr/1067/.
Система поддержки принятия решений ГАС «Управление» http://gasu.gov.ru/commoninformation.
Система поддержки принятия решений «Прогноз» http://www.pcweek.ru/upload/iblock/b42/prognoz.pdf.