Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Математические основы психологопедагогической деятельности
•
•
•
•
Лекции -6 (2) часов
Практических занятий -8 (4) часа
Зачет
Контрольная работа (материалы
выставлены в тамлайн)
Солдатова Гульнара Тагировна
gulnara.soldatova@yandex.ru
Разделы
• 1. Элементы теории вероятностей (задача 1)
• 2. Элементы математической статистики
(задача 2)
• 3. Основные методы математической
статистики (задача 3)
• 4. Бинарные отношения и графы (задача 4)
Раздел 1. Элементы теории
вероятностей
• ТЕОРИЯ ВЕРОЯТНОСТЕЙ - – это раздел
математики, изучающий закономерности
массовых случайных явлений
(статистические закономерности).
Основные понятия
• Изучение каждого отдельного явления с
выполнением определенного комплекса
условий называется испытанием (опытом,
экспериментом).
• Всякий результат или исход испытания
называется событием.
• События принято обозначать заглавными
буквами латинского алфавита A, B, C…
Случайным
событием
называется
событие, которое может произойти или не
произойти
в
результате
некоторого
испытания.
Достоверным
событием
называется
событие, которое обязательно произойдет
в результате испытания.
Невозможным
считается
событие,
которое не может произойти в результате
данного испытания.
• Возможность появления каждого события
определяется специальной величиной –
вероятностью наступления события – Р(А).
• Вероятность Р(А) – числовая характеристика
степени возможности появления какоголибо определенного случайного события А
при многократном повторении испытаний.
Классическое определение
вероятности
• Вероятность события А в данном
испытании –положительное число, равное
отношению числа элементарных исходов
благоприятствующих появлению этого
события (m) к общему числу (n)
элементарных исходов испытания.
𝑚
Р А =
𝑛
Свойства вероятности
• Вероятность достоверного события равна 1.
• Вероятность невозможного события равна
0.
• Вероятность любого события удовлетворяет
неравенству
0 ≤ Р(А) ≤ 1.
Пример 1
• Брошен наудачу шестигранный игральный кубик.
Найти: 1) вероятность появления цифры 3 на верхней
грани игральной кости, 2) вероятность появления
четного числа очков.
• Решение:
1) Элементарные исходы: 1, 2, 3, 4, 5, 6.
Пусть А – появление «3» на верхней грани кубика.
Тогда m=1, а n=6. Р
1
(А) =
6
2) Событие В – появление четного числа очков, тогда m=3.
3
6
Р (А) = =
1
2
Статистическое определение
вероятности:
• Относительная частота появления
события - отношение m/n , где n- число
опытов; m-число появления события.
• Вероятностью случайного события
называется предел, к которому стремится
относительная частота события (частость)при
неограниченном увеличении числа
испытаний:
Р(А) = lim m/n
n→∞
Сравнение определений
• В классическом подходе для нахождения
вероятности случайного события нет
необходимости проводить реальные
испытания, а достаточно теоретически изучить
особенности их проведения
• При статистическом подходе требуется
проведение таких испытаний
• Статистическую вероятность события нельзя
точно определить на основании конечного
числа испытаний, каким бы большим оно ни
было. Статистическую вероятность можно
оценить приближенно по величине
соответствующей относительной частоты
Пример 2
Пусть проведено 6 серий по 100 выстрелов в цель,
осуществленных одним и тем же спортсменом в
одинаковых условиях.
Количество выстрелов
Количество попаданий
в цель
Относительная частота
попаданий в цель
100
98
0,98
100
99
0,99
100
97
0,97
100
98
0,98
100
99
0,99
100
97
0,97
Из таблицы очевидно, что:
• Относительная частота попаданий в цель не
является величиной постоянной, а
изменяется от серии к серии.
• Эта относительная частота не изменяется
произвольно, а варьирует относительно
среднего значения, равного 0,98.
• Статистическую вероятность попадания в
цель можно принять примерно равной
0,98.
Виды событий
• а) Достоверные, невозможные и
случайные;
• б) Противоположные события (А и А )
Р (А) + Р (А) = 1
• в) Совместные и Несовместные
• г) Зависимые и Независимые
Действия над событиями:
1) Сумма событий А1, А2,…, Аn – событие В,
состоящее в наступлении хотя бы одного из
этих событий;
2) Произведение событий А1, А2,…, Аn –
событие С, состоящее в обязательном
наступлении всех этих событий;
3) Разность событий А и В– событие,
заключающееся в наступлении события А и
одновременном ненаступлении события В.
• В ряде случаев вычислить вероятность
события оказывается проще, если
представить его в виде комбинации более
простых событий.
• Этой цели служат некоторые теоремы
теории вероятностей.
1. Теорема сложения вероятностей
совместных событий
Вероятность суммы двух совместных
событий равна сумме вероятностей этих
событий без вероятности их
совместного появления:
Р(А+В)=Р(А)+Р(В)-Р(АВ)
Пример
• Рабочий обслуживает два станка, работающих независимо друг от
друга. Вероятность того, что в течение часа станок не потребует
внимания рабочего, равна для первого станка 0,8, а для второго 0,7.
Вычислить вероятность того, что хотя бы один из двух станков не
потребует внимания рабочего в течении часа.
• Решение:
Обозначаем интересующее нас событие С.
Событие С означает, что либо первый станок не потребует внимания
рабочего (событие А), либо второй станок не потребует внимания
рабочего (событие В), возможно, что оба станка одновременно не
потребуют внимания рабочего.
Следовательно, событие С=А+В, причем А и В – совместные события.
Поэтому по теореме: Р(С)=Р(А+В)=Р(А)+Р(В)–Р(АВ).
По условию Р(А)=0,8, Р(В)=0,7. Событие А и В – независимые, поэтому
Р(АВ)=Р(А)Р(В).
Таким образом, Р С = 0,8 + 0,7 − 0,8 ∙ 0,7 = 0,94
2. Теорема сложения вероятностей
несовместных событий
Вероятность суммы двух несовместных
событий равна сумме вероятностей этих
событий
Р (А +В) = Р(А) + Р(С)
• Например, вероятность выпадения
четного числа на верхней грани
игральной кости:
Р (2 или 4 или 6) = Р (2) + Р (4) + Р (6) =
= 1/6 + 1/6 + 1/6 = 3/6 = 1/2.
3. Теорема умножения вероятностей
событий (общий случай)
Вероятность появления двух событий
одновременно равна произведению
вероятности одного из них на условную
вероятность второго при условии, что
первое событие осуществилось.
Р (А ∙ В) = Р (А) . Р (В/А)
4. Теорема умножения вероятностей
независимых событий
Вероятность произведения двух
независимых событий равна произведению
их вероятностей.
Р А∙В =Р А ∙Р В
Пример. Студент пришел на экзамен, зная 40
вопросов из 50. Найти вероятность того, что он
ответит на 3 вопроса билета.
Решение.
• Вероятность того, что студент ответит на первый вопрос:
Р(А) = 40/50 = 4/5.
• Вероятность того, что он ответит на второй вопрос,
вычисленная при условии, что он ответил на первый
вопрос, т.е. условная вероятность, равна: Р (В/А) = 39/49.
• Вероятность того, что студент ответит на третий вопрос,
при условии, что он ответил на первые 2 вопроса:
Р (С/А∙В) = 38/48.
Р (А∙В∙С) = Р (А) ∙Р (В/А) ∙Р (С/А∙В) =
= 40/50∙39/49 ∙38/48 = 0,5.
Полная группа событий
• События H1 , H 2 ,..., H n
образуют полную
группу, если они
• 1) попарно несовместны
• 2) в результате эксперимента обязательно какоелибо одно из них наступит
H - гипотезы
i
Формула полной вероятности
Теорема.
• Если события H1 , H 2 ,..., H n образуют полную группу
то для любого события А справедлива формула
P( A) P( H1 ) P( A/ H1 ) ... P( H n ) P( A/H n )
n
P( A) P( H i ) P( A /H i )
i 1
Формула полной вероятности
R
• Пример
• Представьте себе странника,
идущего из некоторого пункта
«R» в пункт «H»,
• но он не может вспомнить, по
какой дороге идти.
• Какова вероятность того, что он
попадет в пункт «Н»?
H
Формула полной вероятности
• Решение.
H i (странник попал в пункт H i ) , i 1,2,3.4
1
P( H i )
4
R
H1
H4
• А=(странник попал в пункт Н)
1
P ( A / H1 )
3
P( A / H 3 ) 1
H2
1
P( A / H 2 )
2
P( A / H1 ) 0
H3
H
P( A) P( H1 ) P( A /H1 ) P( H 2 ) P( A /H 2 ) P( H 3 ) P( A /H 3 )
11 1
11
P( H 4 ) P( A /H 4 ) 1 0
0,46
43 2
24
Формула Байеса
Теорема.
• Пусть события H1 , H 2 ,..., H n
образуют полную группу.
• Пусть событие А наступило
Тогда вероятность того,
что при этом была реализована гипотеза
вычисляется по формуле
Hk
P ( H k ) P( A /H k )
P( H k ) P ( A /H k )
P( H k / A)
n
P( A)
P ( H i ) P( A /H i )
i 1
Формула Байеса
Пример .
Три бригады ведут укладку бетонных блоков.
Первая бригада выполняет 50% всего объема работ,
вторая - 30% и третья – все остальное.
Вероятность появление брака для первой бригады
равна 0,05, второй – 0,06 и третьей – 0,1.
Случайно выбранный и проверенный блок оказался
установлен с нарушением технологии.
Какова вероятность того, что он был уложен третьей
бригадой ?
Формула Байеса
Решение.
P( H 3 ) P( A /H 3 )
P( H 3 / A)
P( A)
P( A) P( H1 ) P( A /H1 ) P( H 2 ) P( A /H 2 ) P( H 3 ) P( A /H 3 )
P( H1 ) 0,5
P( H 2 ) 0,3
P( A /H1 ) 0,05
P( H 3 ) 0,2
P( A /H 2 ) 0,06 P( A /H 3 ) 0,1
P( A) 0,063 , P( H 3 ) P( A /H 3 ) 0,2 0,1 0,02
0,02
P ( H 3 / A)
0,317
0,063
Схема независимых испытаний.
Формула Бернулли
Вероятность того что в n независимых испытаниях в каждом из
которых вероятность появления события равна Р , событие
наступит К раз вычисляется по формуле Бернулли
к
Р (К ) С р q
к
n
nк
n
q=1-p ; q- вероятность противоположного
события
или
к
nm
n!
Рn ( К ) К!(n К )! р q
Асимптотические формулы
Если число испытаний велико, то использование формулы
Бернулли будет нецелесообразным в силу необходимости
выполнения громоздких вычислений. Теоремы Муавра-Лапласа,
дающая асимптотическую формулу , позволяет вычислить
вероятность приближенно.
Локальная формула Муавра-Лапласа
npq 10
где
1
Pn (k )
( x),
npq
k np
x
npq
33
Свойства функции
1
( x)
e
2
(x)
x2
2
1. Четная ( x) ( x) .
2. При
x 5, ( x) 0
34
Формула Пуассона
• Если npq 10 и p 0,1 , то
Pn (k )
где
35
np
k
k!
e ,
Интегральная формула МуавраЛапласа
Pn (k1 k k2 ) ( x2 ) ( x1 )
k1 np
k2 np
x1
; x2
npq
npq
36
Свойства функции Лапласа (x)
1. Нечетная
( x) ( x)
2. Возрастающая.
3. При
x 5, ( x)
1
2
.
Задача.
Известно, 80% специалистов в районе имеет
высшее образование. Найти вероятность
того, что из 100 наудачу отобранных человек
высшее образование имеет:
• а) 70 человек,
• б) от 65 до 90 человек.
Решение
npq 100 0,8 0,2 16 10
а)
Применяем локальную формулу Лапласа
1
Pn (k )
( x)
npq
x
k np 70 100 0,8 10
2,5
4
npq
100 0,8 0,2
1
P100(70)
0,0175 0,0044
16
Решение
• б) Применяем интегральную формулу Муавра - Лапласа
Pn (k1 k k2 ) ( x2 ) ( x1 )
x1
k1 np 65 100 0,8 15
3,75,
4
npq
100 0,8 0,2
x2
k 2 np 90 100 0,8 10
2,5
npq
100 0,8 0,2 4
P100(65 k 90) (2,5) (3,75) 0,49379 0,49991 0,9937
- наука, изучающая методы сбора,
систематизации, обработки и
использования статистических данных
для получения научно обоснованных
выводов и принятия решений
• Исходным понятием статистики является
понятие «совокупность» объединяющее
множество испытуемых (учащихся) по
одному или нескольким интересующим нас
признакам. Главное требование к выделению
изучаемой совокупности это ее качественная
однородность, например по уровню знаний,
росту, весу и др. признакам.
Понятие генеральной совокупности и выборки
• Генеральной совокупностью – называется
совокупность предметов, которые мы хотим
исследовать.
• Выборка — это часть или подмножество
генеральной совокупности.
• Выборка называется репрезентативной если она
адекватно отражает свойства генеральной
совокупности.
• Репрезентативность достигается методом
рандомизации, т. е. случайным отбором объектов
из генеральной совокупности.
Порядок исследования
1. Проводится наблюдение. Результаты
наблюдений заносятся в таблицу исходных
данных.
2. Результаты упорядочиваются по
возрастанию – вариационная таблица.
3. Таблица частот:
xi – значение наблюдаемой
xi
ni
характеристики;
ni – частота (сколько раз
встречается значение xi)
Если объем выборки большой и количество результатов велико, их делят на частотные интервалы.
[xi-1; xi]
~
хi
ni
ωi
ni – кол-во значений,
попавших в i-й интервал);
~
хi – среднее значение
интервала;
ni
ωi - относительная частота: i ;
n
По таблице частот строятся наглядные формы
представления:
4. Полигон частот
n2
n3
n1
5. Гистограмма
х0 ~х1
х1 ~
х3 х3
х2 х2 ~
6. Статистическая функция распределения
1
ω3
ω2
ω1
х1
х2
х3
хn
Основные характеристики выборки
1 n
Х хi ;
п i 1
1. Среднее арифметическое
(математическое ожидание)
2. Дисперсия (рассеивание)
По таблице частот:
1 n ~
Х хi пi ;
п i 1
3. Размах
1 n
2
Dx ( xi x ) ;
п i 1
1 n ~
Dx ( хi x ) 2 ni ;
п i 1
х хmax xmin ;
Задача 2. Из генеральной совокупности , заданной
таблицей, распределенной по нормальному закону,
извлечена выборка. Требуется:
1. Составить вариационный, статистический и выборочный
ряды распределения; найти размах выборки;
По полученному распределению выборки:
2. Построить полигон относительных частот;
3. Вычислить выборочную среднюю, выборочную
дисперсию, выборочное исправленное среднее
квадратическое отклонение, моду и медиану;
4. С надежностью
найти доверительные
интервалы для оценки математического ожидания
изучаемого признака генеральной совокупности.
5,6
5,8
5,0
5,4
5,2
5,8
5,2
5,6
5,6
5,6
5,4
5,0
5,4
5,8
5,4
5,6
5,4
5,2
5,4
5,4
5,6
5,0
6,0
5,8
5,2
5,8
5,6
5,8
6,0
5,2
5,8
6,0
6,2
5,4
6,2
5,6
6,0
5,6
5,2
5,6
1. Вариационный ряд
5,0
5,0
5,0
5,2
5,2
5,2
5,2
5,2
5,2
5,4
5,4
5,4
5,4
5,4
5,4
5,4
5,4
5,6
5,6
5,6
5,6
5,6
5,6
5,6
5,6
5,6
5,6
5,8
5,8
5,8
5,8
5,8
5,8
5,8
6,0
6,0
6,0
6,0
6,2
6,2
Статистический ряд
xi
ni
5,0 5,2 5,4 5,6 5,8 6,0 6,2
3
6
8
10
7
4
2
Объем выборки
7
n ni 3 6 8 10 7 4 2 40
i 1
xi
𝜔𝑖
5,0
3
40
5,2
5,4
5,6
5,8
6,0
6,2
6
40
8
40
10
40
7
40
4
40
2
40
R xmax xmin
R 6,2 5,0 1,2
2. Полигон относительных частот
3. Вычислить выборочную среднюю, выборочную
дисперсию, выборочное исправленное среднее
квадратическое отклонение, моду и медиану
7
Выборочная средняя
xi ni
x
7
1
x ni xi
n i 1
1
40
i 1
n
(3 5,0 6 5,2 8 5,4 10 5,6 7 5,8 4 6,0 2 6,2)
1
75 162,24 233,28 313,6 235,48 144 76,88 5,56
40
Выборочная дисперсия
7
x2
xi ni
Dв x x
2
2
2
i 1
n
3 25,0 6 27,04 8 29,16 10 31,36 7 33,64 4 36 2 38,44 31,012
40
Dв
31,012 5,56 2 31,012 30,914 0,10
Выборочное среднее квадратическое отклонение
в D 0,1 0,316.
в
«Исправленная» дисперсия S 2
S2
S2
n
Dв
n 1
40 0,10
401
0,103
«Исправленное» среднее квадратическое
отклонение
S S 2 0,103 0,321
Мода (варианта с наибольшей частотой):
M o 5,6
Медиана (варианта, которая делит
вариационный ряд на две части, равные по
числу вариант)
me 5,6
4. С надежностью =0,95 найти доверительные
интервалы для оценки математического ожидания
изучаемого признака генеральной совокупности
_ t b _ t b
; x
x
n
n
t определяется по таблице значений функции Лапласа
из равенства
(t )
2
(t )
0,95
0,475
2
Получаем t=1,96
t b 1,96 0,316
0,0979 0,098
6,325
n
I 0,95 (a) (5,56 0,098; 5,56 0,098)
I 0,95 (a) (5,462; 5,658)
Задача 3. Исследуется зависимость коэффициента усвоения
знаний, выраженного в процентах ( y %) от уровня
посещаемости занятий (x %) в группе из четырнадцати
учащихся ( i- порядковый номер учащегося). Статистические
данные приведены в таблице.
Требуется:
• 1) Найти оценки параметров линейной регрессии y
на x. Построить диаграмму рассеяния и нанести
прямую регрессии на диаграмму рассеяния.
• 2) На уровне значимости α=0,05 проверить гипотезу
о согласии линейной регрессии с результатами
наблюдений.
• 3) С надежностью найти доверительные интервалы
для параметров линейной регрессии.
i
1
2
3
4
5
6
7
8
9
10 11 12 13 14
xi
53 40 46 39 35 29 75 31 68 66 60 54 55 59
yi
36 30 32 29 27 23 47 19 44 42 40 39 33 37
1) Найти оценки параметров линейной регрессии y на x.
Построить диаграмму рассеяния и нанести прямую
регрессии
на диаграмму рассеяния.
i
Для уравнения прямой регрессии y b0 b1 x
по статистическим данным таблицы найдем точечные
статистические оценки 𝑏0 и 𝑏1 параметров регрессии b0 и b1
~ k xy
~
~
b1
, b0 y b1 x
k xx
k xy xy x y
где
n
x
n
k xx x x
n
xi
i 1
2
,
y
n
yi
i 1
n
2
,
xy
n
xi y i
i 1
n
,
x2
2
x
i
i 1
n
.
i
xi
yi
xi yi
x i2
yi2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
∑
∑/n
53
40
46
39
35
29
75
31
68
66
60
54
55
59
710
50,714
36
30
32
29
27
23
47
19
44
42
40
39
33
37
478
34,143
1908
1200
1472
1131
945
667
3525
589
2992
2772
2400
2106
1815
2183
25705
1836,071
2809
1600
2116
1521
1225
841
5625
961
4624
4356
3600
2916
3025
3481
38700
2764,286
1296
900
1024
841
729
529
2209
361
1936
1764
1600
1521
1089
1369
17168
1226,286
y 34,143
x 50,714
x 2 2764 ,286
xy 1836 ,071
y 2 1226 ,286
Вычисляем ковариации:
2
2
k xx x x 2764 ,286 50,714 2 192 ,376
k xy xy x y 1836 ,071 50,714 34,143 104 ,543
2
2
k yy y y 1226 ,286 34,143 2 60,542
~ k xy 104 ,543
b1
0,543
k xx 192 ,376
тогда
~
~
b0 y x b1 34,143 50,714 0,543 6,583
y 6,583 0,543 x
2) На уровне значимости 0,05 проверить
гипотезу о согласии линейной регрессии с
результатами наблюдений
Выдвигается гипотеза
Н0: линейная статистической связь отсутствует
Для проверки выдвинутой гипотезы используется
коэффициент детерминации R2 и применяется статистика
Фишера F.
2
2
2
k
k
104
,
543
xy
xy
R2
0,938
R2
k xx k yy 192 ,376 60,542
k xx k yy
R 2 (n 2)
F
1 R2
Fнабл
R 2 (n 2)
1 R2
0,938 12
181,55
1 0,938
Критическое значение Fкр статистики Фишера
находим по таблице квантилей
распределения Фишера, исходя из равенства
Fкр Fp (k1 , k 2 )
k1 1
k2 n 2
где p=1-
Fкр F0,95 (1,12) 4,75
Сравниваем между собой наблюдаемое и критическое
значения статистики Фишера.
Так как Fнабл Fкр , то выдвинутая гипотеза решительно
отвергается, статистическая связь есть
3) С надежностью найти доверительные
интервалы для параметров линейной
регрессии.
~
~
I (b0 ) (b0 0 , b0 0 )
x2
0 t (n 2) s
1
n k xx
2
t
1
s
~
n(k yy b1 k xy )
n2
(n 2) квантиль распределения Стьюдента
2
~
~
I (b1 ) (b1 1 , b1 1 )
1
1 t (n 2) s
1
n k xx
2
t
1
(n 2)
t 0,975 (12) 2,179
2
s
~
n(k yy b1k xy )
n2
0 2,179 2,10
14(60,54 0,543 104,543)
2,10
12
2764,29
4,64
14 192,376
1
1 2,179 2,10
0,088
14 192,376
~
~
I 0,95 (b0 ) (b0 0 , b0 0 ) (6,583 4,64; 6,583 4,64) 1,943; 11,223
~
~
I 0,95 (b1 ) (b1 1 , b1 1 ) (0,543 0,088; 0,543 0,088) (0,455; 0,631)