Приложение Е (обязательное). Метод взвешенного линейного регрессионного анализа

Приложение Е
(обязательное)

Метод взвешенного линейного регрессионного анализа (см. 4.1.3)

Е.1 Пояснение для применения фиктивной переменной

Е.1.1 В общем случае две различные переменные Y_1 и Y_2 при построении графика зависимости относительно одной и той же независимой переменной X будут давать различные зависимости:

ФОРМУЛА Е.1 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Е.1.2 Допуская, что Y представляет комбинацию Y_1 и Y_2, строят график единой зависимости

ФОРМУЛА Е.2 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

где, как и прежде, коэффициенты b_1 оценивают с помощью регрессионного анализа. При сравнении уравнений (Е.1) и (Е.2) очевидно, что

ФОРМУЛА Е.3 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Поэтому

ФОРМУЛА Е.4 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Подобным образом

ФОРМУЛА Е.5 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Для исследования различия между b_10 и b_20 необходимо испытать только коэффициент b_2 как коэффициент, отличный от нуля. Подобным образом для выявления различия между b_11 и b_21 испытывают коэффициент b_3 как коэффициент, отличный от нуля.

Е.1.3 Для T_1 и Т_2 могут быть выбраны любые отличные от нуля значения. Тем не менее, в силу того, что показатель "воспроизводимость" является основой испытаний при контроле качества по спецификациям (разделы 8 и 9), выбором веса при оценивании зависимостей показателей прецизионности ("precision") следует отразить это положение. Следует применять "отношение важности" как 2:1 в пользу воспроизводимости путем установления T_1 = 1 и Т_2 = - 2, когда T_1 относится к графику зависимости лабораторного стандартного отклонения, а Т_2 относится к графику зависимости стандартного отклонения для повторных испытаний.

Е.2 Выбор используемых в регрессионном анализе весов

Е.2.1 Для того, чтобы учитывать относительную прецизионность переменных, полученных при подгонке, в регрессионном анализе следует использовать веса, обратно пропорциональные дисперсии переменных, полученных при подгонке.

Для переменной D, которая является оценкой стандартного отклонения генеральной совокупности сигма, основанной на ню(D) степенях свободы, формулу для дисперсий выражают как

      var(D) = сигма(2)/2 x ню(D).                                  (E.6)

При замене сигма(2) ее оценкой D(2) вес этой переменной приближенно описывают выражением

      w(D) = 2 x ню(D)/D(2)                                         (E.7)

Очевидно, при увеличении стандартного отклонения D вес будет соответствующим образом уменьшаться. По этой причине переменную, полученную при подгонке как взвешенную регрессию, следует заменить функцией стандартного отклонения, которая дает вес, не зависящий от полученной при подгонке переменной.

Е.2.2 В случаях, когда функция g (D) подгоняется легче, чем сама переменная D, формулу для дисперсии выражают как

ФОРМУЛА Е.8 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Поэтому для функции натурального логарифма

ФОРМУЛА Е.9 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Если теперь заменить сигма(2) ее оценкой D(2), то вес для log (D) приближенно будет описываться выражением

ФОРМУЛА Е.10 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Таким образом, при действиях с межлабораторным среднеквадратическим отклонением D и среднеквадратическим отклонением для повторных испытаний d регрессионный анализ следует выполнить в log(D) и log(d), так как тогда при выборе веса будет принято в расчет только количество данных, на которых основано среднеквадратическое отклонение. Зависимость, оцененная таким образом, будет в меньшей степени зависеть от выборок, в которых доля потерянных данных высока.

Е.2.3 Обозначая степени свободы как ню(D) для межлабораторного среднего квадратического отклонения D и как ню(d) для среднеквадратического отклонения для повторных испытаний d, формулу для расчета весов выражают как

ФОРМУЛЫ Е.11, Е.12 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Примечание - Простая (невзвешенная) регрессия соответствует взвешенной регрессии, в которой все веса имеют постоянное значение, равное единице.

E.3 Вычислительная процедура при выполнении регрессионного анализа

Е.3.1 Приемы для наилучшей подгонки к прямой линии по формуле (Е.2)

Е.3.1.1 Сначала составляют таблицу Е.1 значений переменных, которые используют для построения графика регрессионной зависимости, вместе с соответствующими весами. Функции g_1 и g_2 во всех случаях останутся натуральными логарифмами, которые соответствуют определенным преобразованиям, как установлено в приложении Д.2.

При использовании символов, установленных в таблице Е.1, формула Е.2 для модели, с помощью которой осуществляют подгонку, принимает вид

ФОРМУЛА Е.13 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Отрезок b_0, отсекаемый на ординате, можно исключить, переписав выражение в виде

ФОРМУЛА Е.14 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

ФОРМУЛА Е.15 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Таблица Е.1

Проба	Функция стандартного отклонения g_1	Функция выборочного среднего g_2	Фиктивная переменная Т	Tg_2	Bec
1 2 3 . . S	g_1 (D_1) g_1 (D_2) g_1 (D_3) . . g_1 (D_S)	g_2 (m_1) g_2 (m_2) g_2 (m_3) . . g_2 (m_S)	1 1 1 . . 1	g_2 (m_1) g_2 (m_2) g_2 (m_3) . . g_2 (m_S)	2ню(D_1) 2ню(D_2) 2ню(D_3) . . 2ню(D_S)
1 2 3 . . S	g_1 (d_1) g_1 (d_2) g_1 (d_3) . . g_1 (d_S)	g_2 (m_1) g_2 (m_2) g_2 (m_3) . . g_2 (m_S)	-2 -2 -2 . . -2	-2g_2 (m_1) -2g_2(m_2) -2g_2 (m_3) . . -2g_2(m_s)	2ню(d_1) 2ню(d_2) 2ню(d_3) . . 2ню(d_S)
Обозначение переменной	y_1	x_1i	x_2i	x_3i	W_i

Решение по формуле (Е.14) с помощью метода наименьших квадратов требует решения системы условных (нормализованных) уравнений в форме

ФОРМУЛА Е.16 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Примеры решений для элементов а_y и а_yi даны в терминах взвешенных средних x_i

РАСЧЕТ 1 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Получив решение уравнений относительно b_1, b_2 и b_3, рассчитывают отрезок, отсекаемый на ординате, в терминах взвешенных средних переменных

ФОРМУЛА Е.17 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Е.3.1.2 Оценки коэффициентов b_i могут быть суммированы в табличной форме, которые вместе со статистическими данными для испытаний представлены в таблице Е.2.

Таблица Е.2

Подгоняемые переменные

Оценки коэффициентов

Среднеквадратическое отклонение для оценок

Значение для испытания по f-критерию

Отрезок ординаты

Выборочное среднее

Фиктивная переменная

Взаимодействие "фиктивная переменная х среднее"

b_0

b_1

b_2

b_3

e_0

e_1

e_2

e_3

t_0

t_1

t_2

t_3

Для того, чтобы заполнить таблицу, необходимо рассчитать среднеквадратическое отклонение наблюдаемых значений у относительно линии регрессии. Эту оценку называют остаточным cреднеквадратическим отклонением и выражают формулой

ФОРМУЛА Е.18 ПРИЛОЖЕНИЯ К ГОСТ Р 8.580-2001

Тогда выражения для среднеквадратического отклонения оценок принимают вид

РАСЧЕТ 2 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

ФОРМУЛА Е.19 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Е.3.2 Значение t-критерия - это значение отношения (b_i - К) / е_i, где К- постоянная величина. Сравнением этих значений с критическими значениями t-критерия в таблице Г.5 возможно установить, отличается ли коэффициент b_i от К. Если t_i больше, чем критическое значение, соответствующее 5%-ному уровню значимости и (n - 4) степеням свободы, то данный коэффициент можно рассматривать как отличающийся от К. В частности, с помощью t_1 можно идентифицировать, является ли наклон b_1 подходящим, а с помощью t_3 определять, различаются ли наклоны для межлабораторного среднеквадратического отклонения и среднеквадратического отклонения для повторных определений. Так как обычно межлабораторное среднеквадратическое отклонение больше, чем среднеквадратическое отклонение для повторных определений при одном и том же значении среднего по пробе, то t_2 обычно будет указывать на то, что коэффициент b_2 отличается от нуля.

Е.3.3 Пример подгонки с помощью степенной функции (вид зависимости 2 в таблице Д.1) и взвешенной линейной регрессии

Округленные значения средних по пробам и среднеквадратических отклонений, полученных на основе данных по бромным числам из Г.2, приведены в таблице 1 настоящего стандарта.

Е.3.3.1 На рисунке Е.1 с помощью графика в билогарифмических координатах показано, что степенное преобразование согласуется с диаграммами рассеяния.

Е.3.3.2 Параметр преобразования В нет необходимости оценивать по графику на рисунке Е.1, так как его получают при регрессионном анализе следующим образом.

Е.3.3.3 Уравнение линии, для которой выполняют подгонку (таблица Д.1), имеет вид

РАСЧЕТ 3 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Значения, для которых выполняют подгонку (таблица Е.1), представлены в таблице Е.3.

Определение регрессионной зависимости по методу наименьших квадратов требует решения системы условных уравнений:

РАСЧЕТ 4 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Для расчета также необходимы следующие величины

РАСЧЕТ 5 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

Таблица Е.3

Проба	Логарифм среднеквадратического отклонения	Логарифм среднего значения по пробе	Фиктивная переменная Т	(Фиктивная переменная) х [log (среднее)]	Вес
1	-0,3158	0,7655	1	0,7655	16
2	0,7969	4,1804	1	4,1804	18
3	-2,7046	-0,2802	1	-0,2802	28
4	-1,5568	1,2932	1	1,2932	22
5	-1,2358	2,3888	1	2,3888	18
6	0,4029	3,8755	1	3,8755	18
7	1,0762	4,7378	1	4,7378	18
8	-1,8401	0,1975	1	0,1975	18
1	-2,0644	0,7655	-2	-1,5309	18
2	-0,2015	4,1804	-2	-8,3609	18
3	-2,9957	-0,2802	-2	0,5605	18
4	-2,1585	1,2932	-2	-2,5864	18
5	-2,3613	2,3888	-2	-4,7775	18
6	-0,6415	3,8755	-2	-7,7510	18
7	-0,0674	4,7378	-2	-9,4756	18
8	-2,8612	0,1975	-2	-0,3949	18
Обозначение неременной	y_1	x_1i	x_2i	x_3i	Wi

Результаты вычислений суммированы в таблице Е.4.

Таблица Е.4

Наименование переменных для подгонки	Оценки коэффициентов b_i	Среднеквадратическое отклонение для оценок b_1	t-критерий
Отрезок ординаты	-2,4064	-	-
log (среднее)	0,63773	0,07359	8,67
Фиктивная переменная	0,25496	0,13052	1,95
(Фиктивная переменная) х log (среднее)	0,02808	0,04731	0,59

При сравнении экспериментальных значений t-критерия с критическими значениями на 5%-ном уровне значимости для 12 степеней свободы (а именно 2,179), приведенными в таблице Г.5, можно видеть, что наклон b_1 значимо отличается от нуля (b_1 = 0,638). Это подтверждает то обстоятельство, что преобразование было необходимо. Кроме того, наклон b_3, а, следовательно, и преобразование является одинаковым и для межлабораторного среднеквадратического отклонения и для среднеквадратического отклонения для повторных испытаний, так как коэффициент b_3 не отличается значимо от нуля.

Е.3.3.4 Так как наклон b_1 (b_1 = 0,638) имеет среднеквадратическое отклонение 0,074, то приблизительно 66%-ная доверительная область (0,638 +- 0,074) содержит значение 2/3. Следовательно, округление, приводящее к этому значению, приводит к традиционному преобразованию

y = x(2/3)

Е.3.3.5 На рисунке Е.2 показаны диаграммы рассеяния, соответствующие условиям, полученным после применения преобразования и пересчета средних по пробам и среднеквадратических отклонений. Диаграммы показывают идентичные уровни и для межлабораторного среднеквадратического отклонения и для среднеквадратического отклонения по повторным испытаниям для всех проб, за исключением пробы 1. В случае последней пробы экстремальное значение обусловлено выбросами (см. пример в 4.2.2).

Диаграммы рассеяния

РИСУНОК Е.1 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

РИСУНОК Е.2 ПРИЛОЖЕНИЯ Е К ГОСТ Р 8.580-2001

<< Приложение Д (обязательное). Виды зависимостей и подходящие преобразования		Приложение >> Ж (обязательное). Правила округления результатов
	Содержание Государственный стандарт РФ ГОСТ Р 8.580-2001 "Государственная система обеспечения единства измерений. Определение и...

Приложение Е (обязательное). Метод взвешенного линейного регрессионного анализа

Откройте актуальную версию документа прямо сейчас