Statistical interpretation of test results - Estimation of the mean - Confidence interval
Дата введения - 1 июля 2005 г.
Введен впервые
Предисловие
Задачи, основные принципы и правила проведения работ по государственной стандартизации в Российской Федерации установлены ГОСТ Р 1.0-92 "Государственная система стандартизации Российской Федерации. Основные положения" и ГОСТ Р 1.2-92 "Государственная система стандартизации Российской Федерации. Порядок разработки государственных стандартов"
1 Область применения
Настоящий стандарт устанавливает методы определения по результатам испытаний точечной оценки и доверительного интервала среднего (далее - среднее) генеральной совокупности.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ Р 50779.10-2000 (ИСО 3534-1-93) Статистические методы. Вероятность и основы статистики. Термины и определения (ИСО 3534-1:1993, IDT)
ГОСТ Р 50779.21-2004 Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным. Часть 1. Нормальное распределение (ИСО 2854:1976, NEQ)
Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю "Национальные стандарты", составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться замененным (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяют в части, не затрагивающей эту ссылку.
3 Термины и определения
В настоящем стандарте применены термины по ГОСТ Р 50779.10.
4 Условия применения методов
Результаты испытаний представлены результатами измерений непрерывной величины. Настоящий стандарт не охватывает обработку результатов испытаний, когда исследуемая величина является дискретной (например, наличие или отсутствие свойства, количество дефектов).
Распределение вероятностей, взятое как математическая модель для генеральной совокупности, - нормальное распределение, для которого параметры (среднее m и стандартное отклонение ) неизвестны.
Предположение о нормальности очень широко используют: распределение результатов, полученных в условиях испытаний, обычно нормальное или почти нормальное распределение.
Может быть, однако, полезным проверить предположение о нормальности распределения с помощью соответствующих методов. Вычисления могут быть упрощены изменением начала координат или единицы измерения результатов испытаний, но округлять эти результаты не рекомендуется. Недопустимо отбрасывать любые результаты наблюдений или применять любые корректировки к очевидно неопределенным наблюдениям, не подкрепленные доказательствами на экспериментальной, технической или какой-либо другой основе, которая должна быть четко установлена.
Метод испытаний может быть источником систематических ошибок, которые в настоящем стандарте не определены. Однако существование таких ошибок может сделать неприменимыми методы, изложенные далее.
В частности, если имеет место несистематическое смещение, увеличение выборки размера n не повлияет на смещение.
Методы, представленные в ГОСТ Р 50779.21, могут быть использованы в определенных случаях для идентификации систематических ошибок.
5 Точечная оценка среднего
5.1 Случай несгруппированных результатов
После отбрасывания сомнительных результатов серии включают в себя результаты n измерений (где i = 1, 2, 3,... n), некоторые из которых могут быть одинаковыми.
Среднее m основного нормального распределения оценивают как среднее арифметическое n результатов:
.
(1)
5.2 Случай сгруппированных в классы результатов
Когда число результатов достаточно велико (например, более 50), может быть выгодно сгруппировать их в классы одинаковой ширины. В определенных случаях результаты могут быть получены уже сгруппированными в классы.
Частоту в каждом классе, то есть число результатов в классе, обозначают .
Обозначая число классов k, имеют
.
(2)
Среднюю точку класса обозначают . Тогда среднее m оценивают как взвешенное среднее всех средних точек класс
.
(3)
6 Доверительный интервал для среднего
Доверительный интервал для среднего совокупности вычисляют на основе оценок среднего и стандартного отклонения.
Альтернативный метод вычисления доверительного интервала с использованием размахов дан в приложении А.
6.1 Оценка стандартного отклонения
6.1.1 Случай несгруппированных результатов
Оценку s стандартного отклонения , вычисляемую на основе квадратов отклонений от среднего арифметического, задают формулой
,
(4)
где - значение i-го измерения (i = 1, 2, 3,... n);
n - общее число измерений;
- среднее арифметическое n измерений, вычисленное по формуле (1).
Для упрощения вычислений рекомендуется использовать формулу
.
(5)
6.1.2 Случай сгруппированных результатов
В случае группирования в классы формула для оценки стандартного отклонения имеет вид
,
(6)
где - средняя точка в i-м классе (i = 1, 2, 3,... k);
k - число класс
n - общее число измерений;
- взвешенное среднее всех средних точек классов, вычисленное по формуле (3).
Для простоты вычислений рекомендуется использовать формулу
.
(7)
В случае сгруппированных данных вычисленное значение s может быть скорректировано (поправка Шеппарда). Поскольку эта поправка при правильно выбранной ширине класса невелика, ее вводят не всегда.
6.2 Доверительный интервал для среднего
Доверительный интервал определяется тем, какая выбрана доверительная вероятность (0,95 или 0,99), и тем, какой будет построен интервал (односторонний или двусторонний).
6.2.1 Двусторонний доверительный интервал
Двусторонний доверительный интервал для среднего m совокупности определяют по следующим формулам:
а) для доверительной вероятности 0,95:
;
(8)
б) для доверительной вероятности 0,99:
.
(9)
6.2.2 Односторонний доверительный интервал
Односторонний доверительный интервал для среднего m определяют по одной из следующих формул:
а) для доверительной вероятности 0,95:
(10)
или
;
(11)
б) для доверительной вероятности 0,99:
(12)
или
.
(13)
При этом , если необходимо, может быть заменен на в случае сгруппированных в классы результатов.
Здесь , , , - квантили распределения Стьюдента с степенями свободы.
Их значения даны в таблице 1. В таблице 1 указаны также значения отношений , , , .
Если значения n больше 60, предпочтительно вычислять значения t линейной интерполяцией , используя таблицу 2.
Пример:
n = 250;
= 0,48;
.
7 Представление результатов
7.2 Выражают доверительный интервал в форме неравенства (6.2.1, 6.2.2), устанавливая доверительную вероятность (0,95 или 0,99). Указывают количество результатов, исключенных из-за их сомнительности, и причины исключения.
Таблица 1 - Значения и отношения для одностороннего доверительного интервала и значения и отношения (для двустороннего доверительного интервала.
n |
Доверительная вероятность для двустороннего доверительного интервала |
Доверительная вероятность для одностороннего доверительного интервала |
n |
Доверительная вероятность для двустороннего доверительного интервала |
Доверительная вероятность для одностороннего доверительного интервала |
||||
0,95 |
0,99 |
0,95 |
0,99 |
0,95 |
0,99 |
0,95 |
0,99 |
||
2 3 4 5 6
7 8 9 10 11
12 13 14 15 16
17 18 19 20 21
22 23 24 25 26
27 28 29 30 40
50 60 |
12,71 4,303 3,182 2,776 2,571
2,447 2,365 2,306 2,262 2,228
2,201 2,179 2,160 2,145 2,131
2,120 2,110 2,101 2,093 2,086
2,080 2,074 2,069 2,064 2,060
2,056 2,052 2,048 2,045 2,024
2,008 2,000 |
63,66 9,925 5,841 4,604 4,032
3,707 3,499 3,355 3,250 3,169
3,106 3,055 3,012 2,977 2,947
2,921 2,898 2,878 2,861 2,845
2,831 2,819 2,807 2,797 2,787
2,779 2,771 2,763 2,756 2,707
2,680 2,664 |
6,314 2,920 2,353 2,132 2,015
1,943 1,895 1,860 1,833 1,812
1,796 1,782 1,771 1,761 1,753
1,746 1,740 1,734 1,729 1,725
1,721 1,717 1,714 1,711 1,708
1,706 1,703 1,701 1,699 1,682
1,676 1,673 |
31,82 6,965 4,541 3,747 3,365
3,143 2,998 2,896 2,821 2,764
2,718 2,681 2,650 2,624 2,602
2,583 2,567 2,552 2,539 2,528
2,518 2,508 2,500 2,492 2,485
2,479 2,473 2,467 2,462 2,430
2,404 2,393 |
2 3 4 5 6
7 8 9 10 11
12 13 14 15 16
17 18 19 20 21
22 23 24 25 26
27 28 29 30 40
50 60 |
8,985 2,484 1,591 1,242 1,049
0,925 0,836 0,769 0,715 0,672
0,635 0,604 0,577 0,554 0,533
0,514 0,497 0,482 0,468 0,455
0,443 0,432 0,422 0,413 0,404
0,396 0,388 0,380 0,373 0,320
0,284 0,258 |
45,013 5,730 2,920 2,059 1,646
1,401 1,237 1,118 1,028 0,956
0,897 0,847 0,805 0,769 0,737
0,708 0,683 0,660 0,640 0,621
0,604 0,588 0,573 0,559 0,547
0,535 0,524 0,513 0,503 0,428
0,379 0,344 |
4,465 1,686 1,177 0,953 0,823
0,734 0,670 0,620 0,580 0,546
0,518 0,494 0,473 0,455 0,438
0,423 0,410 0,398 0,387 0,376
0,367 0,358 0,350 0,342 0,335
0,328 0,322 0,316 0,310 0,266
0,237 0,216 |
22,501 4,021 2,270 1,676 1,374
1,188 1,060 0,966 0,892 0,833
0,785 0,744 0,708 0,668 0,651
0,627 0,605 0,586 0,568 0,552
0,537 0,523 0,510 0,498 0,487
0,477 0,467 0,658 0,449 0,384
0,340 0,309 |
Таблица 2 - Значения , , , при
n |
|||||
60 120 |
2 1 0 |
2,00 1,980 1,960 |
2,664 2,617 2,576 |
1,673 1,658 1,645 |
2,393 2,358 2,326 |
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Национальный стандарт РФ ГОСТ Р 50779.22-2005 (ИСО 2602:1980) "Статистические методы. Статистическое представление данных. Точечная оценка и доверительный интервал для среднего" (утв. приказом Федерального агентства по техническому регулированию и метрологии от 31 мая 2005 г. N 112-ст)
Текст ГОСТа приводится по официальному изданию Стандартинформ, Москва, 2005 г.
Дата введения - 1 июля 2005 г.
1 Подготовлен Техническим комитетом по стандартизации ТК 125 "Статистические методы в управлении качеством продукции" и Научно-исследовательским центром контроля и диагностики технических систем на основе собственного аутентичного перевода стандарта, указанного в пункте 4
2 Внесен Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии
3 Утвержден и введен в действие приказом Федерального агентства по техническому регулированию и метрологии от 31 мая 2005 г. N 112-ст
4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 2602:1980 "Статистическое представление результатов испытаний. Оценка среднего. Доверительный интервал" (ISO 2602:1980 "Statistical interpretation of test results - Estimation of the mean - Confidence interval", MOD) путем включения отдельных фраз, которые выделены в тексте курсивом, с целью гармонизации с национальными стандартами.
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ 1.5 (подраздел 3.6)
5 Введен впервые