Статистические оценки параметров распределения

👀 801 просмотр
📌 768 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Статистические оценки параметров распределения», doc

Загружаем конспект в формате doc

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Статистические оценки параметров распределения», Word формат

Лекция 9-10 Тема: «Статистические оценки параметров распределения». При рассмотрении предмета и задач математической статистики было отмечено, что в большинстве случаев изучения некоторого количественного признака у исследователя имеется ограниченный объем данных и это связано с тем, что невозможно обследовать каждый объект совокупности. Например, партия зерна на элеваторе, партия электролампочек на количество часов горения и т.д. Поэтому сплошная проверка не всегда применима, в таких случаях ограниченным обследованием некоторой части совокупности – выборкой. По результатам выборочного обследования делается вывод о всей генеральной совокупности. Совокупность методов позволяющих сделать научно обоснованные выводы о числовых характеристиках распределения генеральной совокупности по случайной выборке, составляет содержание раздела математической статистики - статистической оценки параметров распределения. Определение 1. Точечной статистической оценкой параметра а распределения случайной величины называется приближенное значение а* этого параметра, вычисленного по статистическим данным. Замечание 1. Любая точечная статистическая оценка а* некоторого параметра а , вычисляемая на основе статистического ряда, должна удовлетворять трём требованиям: • математическое ожидание статистической оценки (а* ) (как случайной величины при изменении числа испытаний) равно оцениваемому параметру (свойство несмещенности); • при заданном объёме выборки статистическая оценка (а* ) имеет наименьшую дисперсию (свойство эффективности; · при увеличении числа испытаний она (а* ) должна сходиться по вероятности к оцениваемому параметру (свойство состоятельности). Проведем оценки двух основных числовых характеристик количественного признака: 1) средней генеральной совокупности по выборочной средней 2) генеральную дисперсию по выборочной дисперсии. Пусть Х – некоторый количественный (дискретный или непрерывный) признак, параметры которого надо найти. Признак Х подчиняется некоторому закону распределения F(X, θ), вид которого можно допустить известным. Например, пусть Х –( удой (ц) за год от одной коровы, глубина вспашки почвы, высотра всходов на определенную дату, количество загрязняющих частиц в атмосфере и т.д..), подчиняется нормальному закону распределения с дискретной функцией распределения: где и σ- параметры распределения. Тогда возникает задача определения параметров распределения генеральной совокупности, имея выборку объема n, где a - генеральная средняя (математическое ожидание), σ – генеральное среднее квадратическое (стандартное) отклонение. В общем виде оцениваемый параметр обозначим θ (θ может быть и a и σ ). Оценкой параметра θ некоторого дискретного или непрерывного количественного признака Х называют функцию θ*=f(xi) однозначно определенную по результатам выборки, где xi – случайные величины, каждая из которых распределена по закону F(X, θ). Поскольку xi – случайные величины, то и θ* - также является случайной величиной. Выбор θ*, которая является хорошим приближением оцениваемого параметра θ, является содержанием теории оценивания. Чтобы θ* была хорошей оценкой для θ она должна быть несмещенной, эффективной и состоятельной: • Оценка θ* является несмещенной для параметра θ, если ее математическое ожидание равно оцениваемому параметру θ, т.е. М(θ*)=θ. • Если несмещенная оценка θ* имеет наименьшую дисперсию среди всех возможных несмещенных оценок для θ, вычисленных по выборкам одного и того же объема, то она называется эффективной. • Оценка θ* является состоятельной оценкой для параметра θ, если P(|θ - θ*|<ε)=1 На практике подобрать оценку параметра θ, удовлетворяющую всем трем основным условиям бывает затруднительно, поэтому ограничимся проверкой несмещенности оценки генеральной средней и генеральной дисперсии. Средняя арифметическая (простая или взвешенная) в , найденная по выборке объема n, является несмещенной оценкой генеральной средней г (математического ожидания) М (в) = г Поэтому на практике: • за неизвестную среднюю количественного признака х принимают среднюю выборочную. Она в выступает как несмещенная, эффективная и состоятельная оценка генеральной средней. • Выборочная дисперсия σ2 является смещенной оценкой генеральной дисперсии, т.е. М(σ2) М(σг 2) Для получения несмещенной оценки генеральной дисперсии σг2 выборочную дисперсию σ2 умножают на коэффициент Бесселя , т.е. σг2 = σ2 При малом объеме выборки коэффициент Бесселя заметно отличается от единицы, а при больших значениях n отношение 1: Например, n =3 , тогда = = 1,5 n =15 , тогда = 15/14= 1,07 n =29 , тогда = 29/28= 1,04 n =35 , тогда = 35/34 = 1,03 n =65 , тогда = 65/64 = 1,02 n =200 , тогда =200/199= 1,005 Поэтому, при n больших практически нет разницы между σг2 и σ2 по выборке. Если объем выборки не превышает n=30 единиц, то выборка считается малой и для вычисления σг2 используется формула Бесселя. σ2 = , где σ2 – будет несмещенной оценкой для σг2. (Действительно, т.к. , то = = = /n/ = ) Для больших выборок (n30) несмещенную оценку дисперсии определяют по формуле σ2 = . Рассмотренные оценки и σ2 по выборке объема n являются точечными оценками неизвестной генеральной средней и неизвестной генеральной дисперсии, когда неизвестные параметры оценены одним числом. Понятие интервальной оценки Наряду с точечными оценками в практике оценок параметра используют интервальные оценки, особенно при малых выборках, когда точечные оценки являются случайными. При выборке малого объема n точечная оценка может значительно отличаться от оцениваемого параметра. Поэтому при небольшом объеме n выборки следует пользоваться интервальными оценками. Статистическая оценка называется интервальной, если она выражается двумя числами – концами интервала , покрывающего оцениваемый параметр Ө . Интервальное оценивание заключается в определении интервала, относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала “находится” оцениваемый параметр (т.к. оцениваемый параметр величина неслучайная, а концы интервала случайны и их значения зависят от объема выборки n и от надежности наших суждений, то следует говорить о том, что интервал накрывает неизвестный параметр). Уточнение понятия интервальной оценки требует введения ряда важных сопровождающих понятий: точность оценки; надежность оценки; доверительный интервал. Точность оценки Ө* Пусть Ө – неизвестный оцениваемый параметр теоретического распределения признака генеральной совокупности (Ө есть постоянное число), Ө* – его точечная статистическая оценка, найденная по данным выборки (Ө* – случайная величина, меняющаяся от выборки к выборке). Ясно, что оценка Ө* тем точнее определяет параметр Ө , чем меньше модуль разности . Если рассмотреть неравенство , то число будет характеризовать точность оценки (чем меньше , тем оценка точнее). Итак, точностью оценки называется такое положительное число , которое удовлетворяет неравенству . Надежность (или доверительная вероятность) оценки Ө* Поскольку точечная оценка Ө* является случайной величиной, мы не можем абсолютно доверительно утверждать, что оценка Ө* будет (при заданной точности ) удовлетворять неравенству . Это неравенство является случайным событием и, следовательно, оно может осуществляться лишь с некоторой вероятностью. Надежностью (или доверительной вероятностью) оценки Ө* называется вероятность γ , с которой выполняется неравенство , т.е. (1) На практике надежность γ назначается (задается наперед): это достаточно большая вероятность (0,95; 0,99; 0,999) – такая, чтобы событие с вероятностью γ можно было считать практически достоверным. Выбор величины γ диктуется особенностями каждой конкретно рассматриваемой задачи. Замечание: Вероятность γ называется надежностью (доверительной вероятностью), число α –уровнем значимости, ( γ=1-α) Выбор доверительной вероятности зависит от содержания задачи. Например: вероятность того, что удой от одной коровы составит 35ц. равна 0,90 (это приемлемо), вероятность раскрытия парашюта равна 0,90 (совершенно невозможна) Доверительный интервал для оцениваемого параметра Ө Так как неравенство равносильно неравенству , то формулу (1) можно истолковать следующим образом: с заданной надежностью γ интервал накрывает неизвестный оцениваемый параметр Ө . Таким образом, мы приходим к следующему основному определению: Доверительным интервалом для оцениваемого параметра Ө называется интервал вида , накрывающий неизвестный параметр Ө с заданной надежностью Границы и этого интервала называют доверительными границами. Найти доверительный интервал при заданной надежности γ– значит найти такое значение точности , для которого . Доверительный интервал для математического ожидания нормального распределения случайной величины Пусть в генеральной совокупности нас интересует некоторый признак C, имеющий нормальный закон распределения. Нормальный закон распределения, как мы знаем, содержит 2 параметра: и . Нам требуется найти интервальную оценку для параметра a этого распределения. (В данном случае неизвестный оцениваемый параметр Ө = a.) Для этого необходимо располагать выборочными данными. Пусть по данным некоторой выборки объема n вычислена выборочная средняя – точечная статистическая оценка для математического ожидания (здесь ). Назначим надежность . Задача состоит в нахождении доверительного интервала , накрывающего математическое ожидание a с заданной надежностью . Фактически нужно найти соответствующую точность . Следует различить 2 случая. 1) В случае "больших" выборок ( ) стандартными в теории вероятностей методами доказывается, что искомая точность вычисляется по формуле (2), где величина определяется по специальной таблице значений функции Лапласа, исходя из равенства . Сам же искомый доверительный интервал имеет вид . 2) В случае "малых" выборок ( ) доказывается, что точность оценивания находится по формуле: где величина определяется по специальной таблице Стьюдента значений функции 2. Доверительный интервал для среднего квадратического отклонения нормально распределенной случайной величины В отличие от предыдущей задачи, , здесь роль неизвестного оцениваемого параметра выполняет , а роль его точечной статистической оценки – "исправленное" среднее квадратическое отклонение S , вычисленное по данной выборке объема n . Требуется же найти доверительный интервал при заданной наперед надежности . Фактически нужно найти соответствующую точность . Стандартными методами в теории вероятностей устанавливается, что искомая точность оценивания вычисляется по формуле , где величина определяется по специальной таблице значений функции . Определение необходимого объема выборки Назначив (задав наперед) желаемые надежность и точность , из полученной выше формулы (2) можно рассчитать соответствующий (минимально необходимый) объем выборки: , при этом величина может быть найдена по результатам пилотажного обследования. Отметим теперь, что выборка может считаться репрезентативной, если она обеспечивает достижение желаемой точности и надежности получаемых на ее основе статистических оценок. Выбор доверительной вероятности зависит от содержания задачи. Например: вероятность того, что удой от одной коровы составит 35ц. равна 0,90 (это приемлемо), вероятность раскрытия парашюта равна 0,90 (совершенно невозможна). Пример №1. Найти точечные оценки генеральной средней и генеральной дисперсии, ограничившись первыми 20 единицами исходной совокупности 50 единиц (из задачи 1) 5,1,4,5,4,3,55,2,5,5,6,4,3,1,5,8,7,5,5 Найдем выборочную среднюю для выборки объема n=20 Следовательно, в качестве оценки генеральной средней используется выборочная средняя, т.е. г=4,4 (т.к. выб является несмещенной, эффективной и состоятельной оценкой генеральной совокупности). За оценку неизвестной генеральной дисперсии примем σв2 , т.к. объем выборки n<30. Вычислим σв2 = = = - 2 + =2 – 2 +()2= =2 – 2 ()2+()2=2 –()2 Этой формулой удобно пользоваться в практических расчетах. Составим таблицу: хi 1 2 3 4 5 6 7 8 хi2 1 4 9 16 25 36 49 64 mi 2 1 2 3 9 1 1 1 = 2= σв2 =2 –()2= 22.3-(4.4)2=22.3-19.36=2.94 σв = 1,746 Умножим выборочную дисперсию на коэффициент Бесселя и найдем точечную оценку генеральной дисперсии σг 2 = σв2 =2,94 =3,095 σг = 1,76 Пример №2. Найдем интервальную оценку генеральной средней г при доверительной вероятности γ=0,95 (в предположении нормального распределения количественного признака х) и известной средней квадратичной отклонения σв . Наилучшей оценкой генеральной средней является выборочная средняя , которая распределена нормально с параметрами М() = г, D()= Заданная оцениваемая величина распределена нормально с математическим ожиданием =0 и σ2 =1. поэтому вероятность любого отклонения |-г| Р= {||

ВЫСШАЯ МАТЕМАТИКА

#Лекция

Интервальные оценки параметров распределения. Точность и надёжность оценок числовых характеристик. Проверка статистических гипотез

ВЫСШАЯ МАТЕМАТИКА

#Лекция

Статистические оценки параметров распределения

Тебе могут подойти лекции