Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Краткие теоретические сведения




 

Грубые погрешности (промахи) относятся к числу погрешностей, изменяющимся случайным образом при повторных наблюдениях. Они явно превышают по своему значению погрешности, оправданные условиями проведения эксперимента. Под промахом понимается значение погрешности, отклонение которого от центра распределения существенно превышает значение, оправданное объективными условиями измерения. Поэтому с точки зрения теории вероятности появление промаха маловероятно.

Причинами грубых погрешностей могут быть неконтролируемые изменения условий измерений, неисправность, ошибки оператора и др.

Для исключения грубых погрешностей применяют аппарат проверки статистических гипотез.

В метрологии используются статистические гипотезы, под которыми понимают гипотезы о виде неизвестного распределения, или о параметрах известных распределений.

Примеры статистических гипотез:

· рассматриваемая выборка (или ее отдельный результат) принадлежит генеральной совокупности;

· генеральная совокупность распределена по нормальному закону;

· дисперсии двух нормальных совокупностей равны между собой.

В первых двух гипотезах сделано предположение о виде неизвестного распределения и принадлежности отдельных (подозрительных) результатов данному виду распределения, а в третьей - о параметрах двух известных распределений. Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Нулевой (основной) называют выдвинутую гипотезу. А конкурирующей (альтернативной) называют ту, которая противоречит нулевой.

При выдвижении и принятии гипотезы могут иметь место следующие четыре случая:

· гипотеза принимается, причем и в действительности она правильная;

· гипотеза верна, но ошибочно отвергается. Возникающую при этом ошибку называют ошибкой первого рода, а вероятность ее появления называют уровнем значимости и обозначают q(α);

· гипотеза отвергается, причем в действительности она неверна;

· гипотеза неверна, но ошибочно принимается. Возникающую при этом ошибку называют ошибкой второго рода, а вероятность ее появления обозначают β.

Величину 1 - β, т. е. вероятность, что гипотеза будет отвергнута, когда она ошибочна, называют мощностью критерия.

Следует заметить, что в нормативной документации по статистическому контролю качества продукции и учебниках по управлению качеством вероятность признать негодной партию годных изделий (т. е., совершить ошибку первого рода) называют “риском производителя”, а вероятность принять негодную партию - “риском потребителя”.

Все статистические критерии являются случайными величинами, принимающими определенные значения (таблицы критических значений). Областью принятия гипотезы (областью допустимых значений) называют совокупность значения критерия, при которых гипотезу принимают. Критической называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Область принятия гипотезы и критическая область разделены критическими точками, в качестве которых и выступают табличные значения критериев.

Область непринятия гипотезы, как показано на рисунке 1, может быть односторонней (правосторонней или левосторонней) и двух сторонней.

Правосторонней называют критическую область, определяемую неравенством

K набл > kкр, где kкр - положительное число (рисунок 1, а).

Левосторонней называют критическую область, определяемую неравенством

Kнабл < kкр, где kкр - отрицательное число (рисунок 1, б).

Двусторонней называют критическую область, определяемую неравенствами

Kнабл > k 1; Kнабл<k 2, где k2>k1.

Если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами: Kнабл<-kкр, Kнабл>kкр, или равносильным неравенством \Kнабл\>kкр (рисунок 1, в).

Рисунок 1 - Графическая интерпретация к распределению области принятия гипотезы

 

Основной принцип проверки статистических гипотез формулируется следующим образом: если наблюдаемое (опытное) значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.

Проверку статистической гипотезы проводят для принятого уровня значимости q (принимается равным 0,1; 0,05; 0,01 и т. д.). Так принятыйуровень значимости q = 0,05 означает, что выдвинутая нулеваястатистическая гипотеза может быть принята с доверительной вероятностью P = 0,95. Или есть вероятность отвергнуть эту гипотезу (совершить ошибку первого рода), равная P = 0,95.

Нулевая статистическая гипотеза подтверждает принадлежность проверяемого “подозрительного” результата измерения (наблюдения) данной группе измерений.

Формальным критерием аномальности результата наблюдений (а, следовательно, и основанием для принятия конкурирующей гипотезы: “подозрительный” результат не принадлежит данной группе измерений) при этом служит граница, отнесенная от центра распределения на величину tS , т. е.:

(1)

где xiпод – результат наблюдения, проверяемый на наличие грубой погрешности; t – коэффициент, зависящий от вида и закона распределения, объема выборки, уровня значимости; S - СКО.

Таким образом, границы погрешности зависят от вида распределения, объема выборки и выбранной доверительной вероятности.

При обработке уже имеющихся результатов наблюдений произвольно отбрасывать отдельные результаты не следует, так как это может привести к фиктивному повышению точности результата измерений. Группа измерений (выборка) может содержать несколько грубых погрешностей и их исключение производят последовательно, по одному.

Все методы исключения грубых погрешностей (промахов) могут быть разделены на два основных типа:

· методы исключения при известном генеральном СКО;

· методы исключения при неизвестном генеральном СКО.

В первом случае Xц. р. и СКО вычисляется по результатам всей выборки, во втором случае из выборки перед вычислением удаляются подозрительные результаты.

В случае ограниченного числа наблюдений и (или) сложности оценки параметров закона распределения рекомендуется исключать грубые погрешности, используя приближенные коэффициенты вида распределения. При этом исключаются значения xi < xr- и xi > xr+ , где xr- , xr+ – границы промахов, определяемые выражениями:

(2),(3)

где A – коэффициент, значение которого выбирается в зависимости от заданной доверительной вероятности в диапазоне от 0,85 до 1,30 (рекомендуется выбирать максимальное значение А равное 1,3); γ – контрэксцесс, значение которого зависит от формы закона распределения величины (ЗРВ).

После исключения промахов операции по определению оценок центра распределения и СКО результатов наблюдений и измерений необходимо повторить.

Поскольку на практике чаще встречаются измерения при неизвестном СКО (ограниченное число наблюдений), в пособии рассмотрены следующие критерии проверки подозрительных (с точки зрения погрешностей) результатов наблюдений: Ирвина, Романовского, вариационного размаха, Диксона, Смирнова, Шовене.

Поскольку критериальные требования (коэффициенты), определяющие границу, за которой находятся “грубые” (в смысле погрешностей) результаты наблюдений у разных авторов различны, то проверку следует выполнять сразу по нескольким критериям (рекомендуется использовать не меньше трех, из рассматриваемых ниже). Окончательное заключение о принадлежности “подозрительных” результатов рассматриваемой совокупности наблюдений следует делать по большинству критериев. Кроме этого выбор критерия для определения грубых погрешностей должен выполняться после построения гистограммы результатов наблюдений. По виду гистограммы выполняется предварительная идентификация вида закона распределения (нормальный, близкий к нормальному или отличный от него).

Критерий Ирвина.Для полученных экспериментальных данных определяют коэффициент по формуле:

(4)

где хn+ 1, xn – наибольшие значения случайной величины; S – среднее квадратическое отклонение, вычисленное по всем значениям выборки.

Затем этот коэффициент сравнивается с табличным значением λq, возможные значения которого приведены в таблице 1.

 

Таблица 1 - Критерий Ирвина λ q.

Если λ >λq, то нулевая гипотеза не подтверждается, т. е. результат ошибочный, и он должен быть исключен при дальнейшей обработке результатов наблюдений.

Критерий Романовского.Конкурирующая гипотеза о наличии грубых погрешностей в подозрительных результатах подтверждается, если выполняется неравенство:

 

(5)

 

где tp- квантиль распределения Стьюдента при заданной доверительной вероятности с числом степеней свободы k = п -kп(kn - число подозрительных результатов наблюдений). Фрагмент квантилей для распределения Стьюдента представлен в таблице 2.

Точечные оценки распределения и СКО S результатов

наблюдений вычисляется без учета knподозрительных результатов наблюдений.

 

Таблица 2 - Критерий Стьюдента tp (квантили Стьюдента)

Критерий вариационного размаха.Является одним из простых методов исключения грубой погрешности измерений (промаха). Для его использования определяют размах вариационного ряда упорядоченной совокупности наблюдений (x1≤x2≤...≤xk≤...≤xn):

(6)

Если какой-либо член вариационного ряда, например xk, резко отличается от всех других, то производят проверку, используя следующее неравенство:

 

(7)

где X - выборочное среднее арифметическое значение, вычисленное после исключения предполагаемого промаха; z - критериальное значение.

Нулевую гипотезу (об отсутствии грубой погрешности) принимают, если указанное неравенство выполняется. Если xk не удовлетворяет условию (7), то этот результат исключают из вариационного ряда.

Коэффициент z зависит от числа членов вариационного ряда n,что представлено в таблице 3.

Таблица 3 - Критерий вариационного размаха

 

 

Критерий Диксона. Критерий основан на предположении, что погрешности измерений подчиняются нормальному закону (предварительно необходимо построение гистограммы результатов наблюдений) и проверка гипотезы о принадлежности нормальному закону распределения. При использовании критерия вычисляют коэффициент Диксона (наблюдаемое значение критерия) для проверки наибольшего или наименьшего экстремального значения в зависимости от числа измерений. В таблице 4 приведены формулы для вычисления коэффициентов. Коэффициенты r10 , r11 применяют, когда имеется один выброс, а r21 и r22 - когда два выброса. Требуется первоначальное упорядочение результатов измерений (объема выборки). Критерий применяется, когда выборка может содержать более одной грубой погрешности.

 

Таблица 4 – Формулы коэффициентов Диксона

 

 

Вычисленные для выборки по формулам значения коэффициентов Диксона r сравнивают с принятым (табличным) значением критерия Диксона rq (таблица 5).

Нулевая гипотеза об отсутствии грубой погрешности выполняется, если выполняется неравенство r < rq .

Если r > rq , то результат признается грубой погрешностью и

исключается из дальнейшей обработки.

Таблица 5 – Критериальные значения коэффициентов Диксона (при принятом уровне

значимости q)

 

Критерии Райта.Критерий “правило трех сигм” является одним из простейших для проверки результатов, подчиняющихся нормальному закону распределения. Сущность правила трех сигм: если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения.

На практике правило трех сигм применяют так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведенном правиле, выполняется, то есть основания предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально. С этой целью для выборки (включая подозрительный результат) вычисляется центр распределения и оценка СКО результата наблюдений. Результат, который удовлетворяет условию

,

считается имеющим грубую погрешность и удаляется, а ранее вычисленные характеристики распределения уточняются.

Этому критерию аналогичен критерий Райта, основанный на том, что если остаточная погрешность больше четырех сигм, то этот результат измерения является грубой погрешностью и должен быть исключен при дальнейшей обработке. Оба критерия надежны при числе измерений больше 20…50. Их правомочно применять, когда известна величина генерального среднеквадратического отклонения (S).

Может оказаться, что при новых значениях и S другие результаты попадут в категорию аномальных.

Критерий Смирнова.Критерий Смирнова используется при объемах выборки п≥ 25 или при известных значениях генеральных среднего и СКО. Он устанавливает менее жесткие границы грубой погрешности. Для реализации этого критерия вычисляются действительные значения квантилей распределения (наблюдаемое значение критерия) по формуле:

(8)

Найденное значение сравнивается с критериальным βk , приведенным в таблице6

 

Таблица 6 – Квантили распределения βk

Критерий Шовене.Критерий Шовене применяется для законов, не противоречащих нормальному, и строится на определении числа ожидаемых результатов наблюдений nож, которые имеют столь же большие погрешности, как и подозрительный. Гипотеза о наличии грубой погрешности принимается, если выполняется условие:

Порядок проверки гипотезы следующий:

1) вычисляются среднее арифметическое и СКО S результатов наблюдений для всей выборки;

2) из таблицы нормированного нормального распределения (Приложение 1 – интегральная функция нормированного нормального распределения) по величине

определяется вероятность появления подозрительного результата в генеральной совокупности чисел n:

(9)

3) число ожидаемых результатов пож определяется по формуле:

(10)

Указанные выше критерии во многих случаях оказываются “жесткими”. Тогда рекомендуется пользоваться критерием грубой погрешности «, зависящим от объема выборки пи принятой доверительной вероятности Р.

 

Таблица 7 - Зависимость критерия грубой погрешности kот объема выборки п

и доверительной вероятности Р

 

 

Для распределений, отличных от нормального, таких классов, как двух модальных кругловершинных композиций нормального и дискретного распределения c эксцессом ε = 1,5 - 3,0; островершинных двумодальных; композиций дискретного двузначного распределения и распределения Лапласа с эксцессом ε = 1,5 - 6,0; композиций равномерного распределения с экспоненциальным распределением эксцесса ε = 1,8-6,0 и классом экспоненциальных распределений в пределах изменения эксцесса ε = 1,8-6,0 граница грубой погрешности определяется величиной ±(tгр . σ) или ±(t гр. S), где:

(11)

где γ - контрэксцесс;

(12)

 

Погрешности в определении оценок S СКО и tspявляются отрицательно коррелированными, т. е. возрастание СКО S сопровождается уменьшением tzp. Поэтому определение границ грубой погрешности для законов, отличных от нормального, с эксцессом ε <6 с помощью критерия tzpявляется достаточно точным и может широко использоваться на практике.

Оценки , S и εдолжны вычисляться после исключения подозрительных результатов из выборки. После расчета границ грубой погрешности результаты наблюдений, оказавшиеся внутри границ, возвращаются, а ранее найденные характеристики распределения уточняются.

Для равномерного распределения за границы грубой погрешности можно принять величину ±1,8 . S.

Рассмотрим пример применения критериев для исключения грубых погрешностей при измерении скорости ударной волны. Получены результаты, представленные в таблице 8.

Таблица 8 - Результаты наблюдений

Требуется определить, не содержит ли результат наблюдения V=3,50 км/с грубую погрешность.

Для графического определения вида закона распределения построим гистограмму. При построении разбиение на интервалы осуществляем таким образом, чтобы измеренные значения оказались серединами интервалов, что показано на рисунке 2.







Дата добавления: 2015-08-17; просмотров: 1320. Нарушение авторских прав

codlug.info - Студопедия - 2014-2017 год . (0.01 сек.) русская версия | украинская версия