Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
1
Лекция 6. Графическое представление данных
Введение 1
Из истории возникновения диаграмм 1
Основные типы диаграмм 2
Виды сравнений в построении диаграмм 9
Выбор типа диаграммы 9
Анализ диаграмм 10
На современном этапе развития информационного общества, в связи с ростом
обрабатываемой информации, возникает проблема восприятия и обработки больших
объёмов информации человеком. Диаграммы позволяют более наглядно выявить
различные соотношения между данными и позволяют легче воспринимать
представленный материал.
Давно известен тот факт, что сопровождение текстовой и числовой информации
наглядным представлением данных в виде разнообразных диаграмм, графиков и схем
оказывается намного эффективнее - информация быстрее воспринимается и легче
усваивается.
На сегодняшний момент практически каждый исследователь или аналитик на
определенном этапе анализа данных непосредственно сталкивается с необходимостью
представления полученных результатов в графическом виде: будь то отчет для
руководителя, подготовка журнальной статьи или просто процесс изучения. Графики
являются неотъемлемой частью большинства процедур статистического анализа данных –
факторного, кластерного, дисперсионного анализа, многомерного шкалирования, анализа
соответствий или построения деревьев классификации. В любом случае, эффектная и со
смыслом разработанная диаграмма является лучшим способом превратить строки и
колонки цифр в наглядное изображение и помочь, в итоге, аудитории быстрее
сориентироваться в представленных данных.
Графические методы в статистике применяются уже более 200 лет. Начало этому
применению положил "Коммерческий и политический атлас", выпущенный в 1786 г.
английским экономистом У. Плейфером. В этой книге впервые использовались
графические изображения статистических данных в виде линейных, секторных и
столбиковых диаграмм, хорошо выполненных и наглядных.
Сегодня диаграммы прочно вошли в практическую работу экономистов,
статистиков, работников учета, учителей информатики. При правильном построении
диаграмм, статистические показатели привлекают к себе внимание, становятся более
выразительными,
понятными,
лаконичными,
запоминающимися.
Применение
графического метода значительно упрощает работу. Работа с диаграммами одна из самых
популярных направлений использования персонального компьютера. Для сферы обучения
средства компьютерной графики открывают принципиально новые возможности: в
процессе анализа изображений учащиеся могут динамически управлять их содержанием,
формой, размерами и цветом, добиваясь наибольшей наглядности.
Из истории возникновения диаграмм
Во всех диаграммах используется функциональная зависимость как минимум двух
типов данных. Соответственно, первыми диаграммами были обыкновенные график
функций, в которых допустимые значения аргумента соответствуют значениям функций.
2
Идеи функциональной зависимости использовались в древности. Она
обнаруживается уже в первых математически выраженных соотношениях между
величинами, а также в первых правилах действий над числами, в первых формулах для
нахождения площади и объёма геометрических фигур. Вавилонские учёные, таким
образом, несознательно установили, что площадь круга является функцией от его радиуса
4-5 тыс. лет назад. Астрономические таблицы вавилонян, древних греков и индийцев яркий пример табличного задания функции, а таблицы, соответственно, являются
хранилищем данных для диаграмм.
В XVII веке французские учёные Франсуа Виет и Рене Декарт заложили основы
понятия функции и разработали единую буквенную математическую символику, которая
вскоре получила всеобщее признание. Также геометрические работы Декарта и Пьера
Ферма проявили отчётливое представление переменной величины и прямоугольной
системы координат вспомогательных элементов всех современных диаграмм.
Первые статистические графики начал строить английский экономист У. Плейфер
в работе "Коммерческий и политический атлас" 1786 года. Это произведение послужило
толчком для развития графических методов в общественных науках.
Microsoft Office Excel является хорошим инструментом для построения возможных
графиков и диаграмм, наглядно отображающих содержащиеся в таблице данные. В
Microsoft Office Excel можно создавать диаграммы различного типа.
Основные типы диаграмм
1) Диаграммы-линии (графики)
Диаграммы - линии или графики это тип диаграмм, на которых полученные данные
изображаются в виде точек, соединённых прямыми линиями. Точки могут быть как
видимыми, так и невидимыми (ломаные линии). Также могут изображаться точки без
линий (точечные диаграммы). Для построения диаграмм - линий применяют
прямоугольную систему координат. Обычно по оси абсцисс откладывается время (годы,
месяцы и т.д.), а по оси ординат размеры изображаемых явлений или процессов. На осях
наносят масштабы.
3
Диаграммы-линии целесообразно применять тогда, когда число размеров (уровней)
в ряду велико. Кроме того, такие диаграммы удобно использовать, если требуется
изобразить характер или общую тенденцию развития явления или явлений. Линии удобны
и при изображении нескольких динамических рядов для их сравнения, когда требуется
сравнение темпов роста. На одной диаграмме такого типа не рекомендуется помещать
более трёх-четырёх кривых. Их большое количество может усложнить чертёж, и линейная
диаграмма может потерять наглядность.
Основной недостаток диаграмм - линий равномерная шкала, позволяющая
измерить и сравнить только абсолютные приросты или уменьшения показателей в течение
периода исследований. Относительные изменения показателей искажаются при
изображении их с равномерной вертикальной шкалой. Также в такой диаграмме может
быть невозможным изображение рядов динамики с резкими скачками уровней, которые
требуют уменьшения масштаба диаграммы, и показатели в ней динамики более
"спокойного" объекта теряют свою точность. Вероятность присутствия в этих типах
диаграмм резких изменений показателей возрастает с увеличением длительности периода
времён на графике.
2) Диаграммы-области.
Диаграммы-области - это тип диаграмм, схожий с линейными диаграммами
способом построения кривых линий. Отличается от них тем, что область под каждым
графиком заполняется индивидуальным цветом или оттенком. Преимущество данного
метода в том, что он позволяет оценивать вклад каждого элемента в рассматриваемый
процесс. Недостаток этого типа диаграмм также схож с недостатком обычных линейных
диаграмм- искажение относительных изменений показателей динамики с равномерной
шкалой ординат.
3) Столбчатые и линейные диаграммы (гистограммы).
Классическими диаграммами являются столбчатые и линейные (полосовые)
диаграммы. Также они называются гистограммами. Столбчатые диаграммы в основном
используются для наглядного сравнения полученных статистических данных или для
анализа их изменения за определённый промежуток времени. Построение столбчатой
диаграммы заключается в изображении статистических данных в виде вертикальных
прямоугольников или трёхмерных прямоугольных столбиков. Каждый столбик
4
изображает величину уровня данного статистического ряда. Все сравниваемые показатели
выражены одной единицей измерения, поэтому удаётся сравнить статистические
показатели данного процесса.
Разновидностями столбчатых диаграмм являются линейные
диаграммы. Они отличаются горизонтальным расположением столбиков.
(полосовые)
Столбчатые и линейные диаграммы взаимозаменяемы, рассматриваемые в них
статистические показатели могут быть представлены как вертикальными, так и
горизонтальными столбиками. В обоих случаях для изображения величины явления
используется одно измерение каждого прямоугольника высота или длина столбика.
Поэтому и сфера применения этих двух диаграмм в основном одинакова.
Столбчатые диаграммы могут изображаться и группами (одновременно
расположенными на одной горизонтальной оси с разной размерностью варьирующих
признаков). Образующие поверхности столбчатых и линейных диаграмм могут
представлять собой не только прямоугольники, но также квадраты, треугольники,
трапеции и т.д.
4) Круговые (секторные) диаграммы.
Достаточно распространённым способом графического изображения структуры
статистических совокупностей является секторная диаграмма, так как идея целого очень
5
наглядно выражается кругом, который представляет всю совокупность. Относительная
величина каждого значения изображается в виде сектора круга, площадь которого
соответствует вкладу этого значения в сумму значений. Этот вид графиков удобно
использовать, когда нужно показать долю каждой величины в общем объёме. Сектора
могут изображаться как в общем круге, так и отдельно, расположенными на небольшом
удалении друг от друга.
Круговая диаграмма сохраняет наглядность только в том случае, если количество
частей совокупности диаграммы небольшое. Если частей диаграммы слишком много, её
применение неэффективно по причине несущественного различия сравниваемых
структур. Недостаток круговых диаграмм малая ёмкость, невозможность отразить более
широкий объём полезной информации.
5) Радиальные (сетчатые) диаграммы.
В отличие от линейных диаграмм, в радиальных или сетчатых диаграммах более
двух осей. По каждой из них производится отсчёт от начала координат, находящегося в
центре. Для каждого типа полученных значений создаётся своя собственная ось, которая
исходит из центра диаграммы. Радиальные диаграммы напоминают сетку или паутину,
поэтому иногда их называют сетчатыми. Преимущество радиальных диаграмм в том, что
они позволяют отображать одновременно несколько независимых величин, которые
характеризуют общее состояние структуры статистических совокупностей. Если отсчёт
производить не с центра круга, а с окружности, то такая диаграмма будет называться
спиральной диаграммой.
6
6) Картодиаграммы.
Картодиаграммы это сочетания диаграмм с географическими картами или схемами.
В качестве изобразительных знаков в картодиаграммах используются обычные
диаграммы (гистограммы, круговые, линейные), которые размещаются на контурах
географических карт или на схемах каких-либо объектов.
7
Картодиаграммы дают возможность географически отразить более сложные
статистико-географические построения, чем обычные типы диаграмм.
Недостатком картодиаграмм могут служить сложности в рисовании контуров карт,
а также значительная разница в размерах областей географических карт и размеров
диаграмм на них.
7) Биржевые диаграммы.
График "Японские свечи" валютной пары доллар США - швейцарский франк
8
Биржевые диаграммы отражают наборы данных из нескольких значений
(например: цена открытия биржи, цена закрытия, максимальная и минимальная цена
определённого временного интервала). Применяются для отображения биржевых данных:
котировок акций или валют, данных спроса и предложения.
8) Пространственные (трёхмерные) диаграммы
Пространственные, или трёхмерные диаграммы являются объёмными аналогами
пяти основных типов двухмерных диаграмм: линейных, диаграмм-областей, гистограмм
(столбчатых и линейных), круговых.
9) Анимированные диаграммы
В некоторых случаях стандартных свойств обычных неподвижных диаграмм и
графиков бывает недостаточно. С целью повышения информативности, возникла идея: к
обычным свойствам статичных диаграмм (формам, цветам, способам отображения и
тематики) добавить свойство подвижности и изменения с течением времени. То есть,
представить диаграммы в виде анимаций.
По словам разработчиков, построение графиков с помощью анимированных
диаграмм, должно позволить человеку быстрее воспринимать информацию с них путём
привлечения внимания пользователя диаграммой и быстрой передачей данных в мозг.
9
Виды сравнений в построении диаграмм
Любая диаграмма строится по данным, и выявление неких закономерностей в этих
данных основывается на их сравнении.
Выделяют следующие виды сравнений:
•
покомпонентное,
•
позиционное,
•
временное,
•
частотное,
•
корреляционное
Пример описания покомпонентного сравнения.
В основном при таком сравнении показывают размер каждого компонента в
процентах от некого целого.
Например:
• фактические затраты на обновление подвижного состава в ОАО «РЖД» в
2011 г. составили 16,8 % от общих затрат;
• доля рынка клиента в 2013 г. составляет менее 10 % рынка отрасли;
• в мае продажи продукции А составили наибольшую долю в общем объеме
продаж компании;
• доля поставок «Роснефти» в экспорте нефти в 2012 г. составила 36 %.
Ключевые слова при покомпонентном сравнении: доля, составляет, составило X %
и др.
Выбор типа диаграммы
Выбор правильного типа диаграммы — это ключевой фактор, влияющий
на убедительность иллюстрации и правильное понимание идеи, которую доносят
с помощью диаграммы. Четких требований к выбору типа диаграммы для
визуального показа данных нет, есть только рекомендации .
10
Анализ диаграмм
Пример возможного анализа
- На диаграмме показан объем грузовых перевозок по восьми видам
сырья, совершенных ОАО «РЖД» в 2010 г.
- Наибольший объем перевозок приходится на каменный уголь. Второе
место занимают нефть и нефтепродукты. Перевозки такого вида сырья, как
кокс, черные металлы, лом черных металлов, химические и минеральные
удобрения, цемент, составляют менее 100 млн тонн по каждому виду.
- Если сравнивать объемы перевозок за два года, то по рассматриваемым
видам сырья в 2010 г. наблюдается увеличение объема.
- Наибольший скачок роста приходится на пере возки лома черных
металлов — увеличение составляет более чем 25 % .
- Наименьшее увеличение наблюдается по перевозкам каменного угля —
его значение не превышает 5 %.
Приведем шаблоны фраз, которые можно использовать в речи при
проведении анализа:
•
из диаграммы/графика видно, что...;
•
на диаграмме/графике наблюдаем...;
•
на диаграмме мы показали...;
•
на основе данных таблицы создана диаграм ма...;
•
цель построения диаграммы — показать...;
•
показана динамика...;
•
наблюдаем тенденцию к повышению/снижению...;
•
проанализировав данные диаграммы, можно сделать вывод...;
•
снижение погрузок наблюдается в период с ...;
•
доля погрузки угля составляет...;
•
объем производства .... превышает/не превышает...;
•
в течение года объем ежемесячно увеличивался...;
•
наибольший скачок увеличения произошел в ...;
•
максимальный минимальный объем продаж наблюдается в ...;
•
прирост погрузки обеспечен за счет...;
•
доля продаж в первом отделе увеличилась на ... процентов;
•
погрузка угля в 2011 г. составила ... тыс. тонн, что составляет ... %
от общего объема
11
К вопросу о средствах построения диаграмм
У большинства пользователей процесс создания диаграмм обычно ассоциируются с
пакетом Microsoft Excel. Однако статистические диаграммы, приводимые в аналитических
отчетах и разного рода презентациях, и эффектные диаграммы, появляющиеся на
страницах популярных журналов, обычно сделаны совсем не в Excel, а в других
программных решениях.
В данном курсе мы также будем строить различные диаграммы с помощью пакета
Microsoft Excel. Процесс построения диаграмм будет рассмотрен на практических
занятиях.
Дополнительный материал. С практическими примерами неправильного
использования диаграмм и графиков, анализом причин появления ошибок,
рекомендациями по их недопущению можно познакомиться в статье Н. А. Чупина
«Диаграммы и графики. Ошибок прошлых мы уже не повторим» (см. журнал
ИНФОРМАТИКА
И
ОБРАЗОВАНИЕ
•
2015
•
№
4
(263)
С.26-34
12