Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Лекция 1.
Основные понятия
математической
статистики
Лектор
Поторочина Ксения Сергеевна
К.п.н., доцент
Основные понятия математической статистики
Поторочина К.С.
Задачи математической статистики
• указать способы сбора и группировки (если
данных очень много) статистических сведений.
• разработать методы анализа статистических
данных в зависимости от цели исследования.
Основные понятия математической статистики
Поторочина К.С.
• Стандартная задача: изучить совокупность
однородных объектов относительно некоторого
качественного или количественного признака,
характеризующего эти объекты.
Например, для партии деталей:
качественный признак - стандартность детали,
количественный - контролируемый размер детали.
Основные понятия математической статистики
Поторочина К.С.
Основные понятия статистики
• Выборочной совокупностью, или просто
выборкой, называют совокупность случайно
отобранных объектов.
• Генеральной совокупностью называют
совокупность объектов, из которых проводится
выборка.
• Объемом совокупности (выборочной или
генеральной) называют число объектов этой
совокупности.
Основные понятия математической статистики
Поторочина К.С.
Первичная обработка результатов
эксперимента
Пусть интересующая нас случайная величина Х
принимает в выборке значение х1 п1 раз,
х2 – п2 раз, …,
хк – пк раз,
причем
k
nk = n, где п – объем выборки.
i =1
Основные понятия математической статистики
Поторочина К.С.
Первичная обработка результатов эксперимента
Значения случайной величины х1, х2,…, хк
называют
вариантами,
А
п1, п2,…, пк – частотами.
Если разделить каждую частоту на объем выборки, то
ni
w = .
получим относительные частоты i n
Основные понятия математической статистики
Поторочина К.С.
Первичная обработка результатов эксперимента
Последовательность вариант, записанных в порядке возрастания,
называют вариационным рядом,
а перечень вариант и соответствующих им частот или относительных
частот – статистическим рядом:
xi
x1
x2
…
xk
ni
n1
n2
…
nk
w1
w2
…
wk
wi
Вариационный
ряд
Основные понятия математической статистики
Поторочина К.С.
Вариации
• Вариация признака может быть дискретной и
непрерывной.
Дискретной называется вариация, при которой
отдельные значения признака (варианты)
отличаются друг от друга на некоторую конечную
величину (обычно целое число);
Например: количество детей в семье; оценки,
полученные студентами на экзамене; размеры
обуви, проданной за день фирмой.
Основные понятия математической статистики
Поторочина К.С.
Вариации
Непрерывной называется вариация, при которой
значения признака могут отличаться одно от
другого на сколь угодно малую величину.
Например: стоимость реализованной продукции;
процент занятости трудоспособного населения;
депозитная ставка коммерческих банков.
Основные понятия математической статистики
Поторочина К.С.
Непрерывная вариация
• При непрерывной вариации распределение
признака называется интервальным.
• Частоты относятся не к отдельному значению
признака, а ко всему интервалу.
• Часто значением интервала принимают его
середину, т. е. центральное значение.
Основные понятия математической статистики
Поторочина К.С.
Пример
• Уровень рентабельности предприятий
легкой промышленности характеризуется
следующими данными.
Основные понятия математической статистики
Поторочина К.С.
Замечание
• Нередко вместо абсолютных значений частот
используют относительные.
• Относительной частотой называется отношение
частоты иного варианты (а также интервала) к
объему выборки.
• Такая величина обозначается ω.
Основные понятия математической статистики
Поторочина К.С.
• В интервальном вариационном ряду в каждом
интервале различают нижнюю и верхнюю
границы интервала:
X min - нижняя граница интервала ;
X max - верхняя граница интервала
K = X max -X min - величина интервала .
Как правило, при построении интервальных
вариационных рядов в каждый интервал
включаются варианты,
числовые значения которых больше нижней границы
и меньше или равны верхней границе.
Основные понятия математической статистики
Поторочина К.С.
Для выбора количества интервалов используют
формулу Стерджесса:
n = 1 + 3, 22lg N = log 2 N + 1
• n - число групп
• N - число единиц совокупности
xmax − xmin
k
n
Основные понятия математической статистики
Поторочина К.С.
Пример
Если в совокупности 200 единиц, наибольший
вариант равен 49,961, а наименьший - 49,918, то
49,961 − 49,918 0,043
k
0,005.
1 + 3, 2lg 200
8,36
Следовательно, в данном случае оптимальной
величиной интервала может служить 0,005.
Основные понятия математической статистики
Поторочина К.С.
Полигон частот
Полигон частот: ломаная, отрезки которой соединяют
точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xi
откладываются на оси абсцисс, а ni – на оси ординат.
Если на оси ординат откладывать не абсолютные (ni), а
относительные (wi) частоты, то получим
полигон относительных частот.
Основные понятия математической статистики
Поторочина К.С.
Кумулята
• Распределение признака в вариационном ряду по
накопленным частотам изображается с помощью
кумуляты.
Основные понятия математической статистики
Поторочина К.С.
Гистограмма
Гистограмма
прямоугольников,
-
ступенчатая
основаниями
фигура,
которых
состоящая
служат
из
частичные
интервалы длиной h, а высотами – отрезки длиной ni /h
(гистограмма частот) или
wi /h (гистограмма относительных
частот). В первом случае площадь гистограммы равна объему
выборки, во втором – единице.
Основные понятия математической статистики
Поторочина К.С.
Гистограмма
Общая площадь гистограммы равна численности
совокупности, если построение проводится по
абсолютной плотности,
или единице, если гистограмма построена по
относительной плотности.
Основные понятия математической статистики
Поторочина К.С.
Пример
Выборочная функция распределения
Определение 1.1. Выборочной (эмпирической) функцией
распределения называют функцию F*(x), определяющую для
каждого значения х относительную частоту события
Таким образом,
nx
F * ( x) =
n ,
где пх – число вариант, меньших х, п – объем выборки.
X < x.
Основные понятия математической статистики
Поторочина К.С.
Выборочная функция распределения
Из определения эмпирической функции распределения видно,
что ее свойства совпадают со свойствами F(x), а именно:
0 ≤ F*(x) ≤ 1.
F*(x) – неубывающая функция.
Если х1 – наименьшая варианта, то F*(x) = 0 при х≤ х1;
если хк – наибольшая варианта, то F*(x) = 1 при х > хк .
Основные понятия математической статистики
Поторочина К.С.
Числовые характеристики выборки
Определение 1.2. Выборочным средним называется
среднее арифметическое значений случайной величины,
принимаемых в выборке:
k
х1 + х 2 + ... + х п n1 x1 + n2 x 2 + ... + nk x k
хВ =
=
=
п
n
где xi – варианты, ni - частоты.
n x
i
i =1
n
i
,
Основные понятия математической статистики
Поторочина К.С.
Числовые характеристики выборки
Определение 1.3. Выборочной дисперсией называется
n
DB =
( xi − x B )
i =1
n
k
2
=
2
n
(
x
−
x
)
i i B
i =1
n
,
а выборочным средним квадратическим отклонением –
В = DB .
Так же, как для случайных величин, можно доказать, что
справедлива формула для вычисления выборочной дисперсии:
D = x 2 − (x ) 2 .
Основные понятия математической статистики
Поторочина К.С.
- мода М0 – варианта, имеющая наибольшую частоту
- медиана Mе - варианта, которая делит вариационный ряд
на две части, равные по числу вариант.
Если число вариант нечетно ( n = 2k + 1 ), то
me = xk+1, а при четном n =2k
x k + x k +1
те =
.
2
Основные понятия математической статистики
Поторочина К.С.
Оценки начальных и центральных моментов (так называемые эмпирические моменты) определяются аналогично соответствующим теоретическим моментам:
- начальный эмпирический момент порядка k :
Mk =
В частности,
M1
nx
=
i
n
i
k
n
x
ii
= xB
n
.
, начальный эмпирический
момент первого порядка равен выборочному среднему.
Основные понятия математической статистики
Поторочина К.С.
- центральный эмпирический момент порядка k:
тk =
k
n
(
x
−
х
)
i i В
n
В частности, т2 =
.
2
n
(
x
−
х
)
i i В
n
= DB , то есть центральный
эмпирический момент второго порядка равен выборочной
дисперсии.
Основные понятия математической статистики
Поторочина К.С.
Пример
Пример 1. Найдем числовые характеристики выборки, заданной
статистическим рядом
xi
ni
2
3
5
8
7
8
7
2
2 3 + 58 + 7 7 + 8 2
= 5,55;
20
4 3 + 25 8 + 49 7 + 64 2
DB =
− 5,552 = 3,3475;
20
хВ =
B = 3,3475 = 1,83.
5+7
me =
= 6,
2
М0 = 5
Основные понятия математической статистики
Поторочина К.С.
СПАСИБО ЗА ВНИМАНИЕ!