Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение Е
(обязательное)
Метод взвешенного линейного регрессионного анализа (см. 4.1.3)
Е.1 Пояснение для применения фиктивной переменной
Е.1.1 В общем случае две различные переменные Y_1 и Y_2 при построении графика зависимости относительно одной и той же независимой переменной X будут давать различные зависимости:
Е.1.2 Допуская, что Y представляет комбинацию Y_1 и Y_2, строят график единой зависимости
где, как и прежде, коэффициенты b_1 оценивают с помощью регрессионного анализа. При сравнении уравнений (Е.1) и (Е.2) очевидно, что
Поэтому
Подобным образом
Для исследования различия между b_10 и b_20 необходимо испытать только коэффициент b_2 как коэффициент, отличный от нуля. Подобным образом для выявления различия между b_11 и b_21 испытывают коэффициент b_3 как коэффициент, отличный от нуля.
Е.1.3 Для T_1 и Т_2 могут быть выбраны любые отличные от нуля значения. Тем не менее, в силу того, что показатель "воспроизводимость" является основой испытаний при контроле качества по спецификациям (разделы 8 и 9), выбором веса при оценивании зависимостей показателей прецизионности ("precision") следует отразить это положение. Следует применять "отношение важности" как 2:1 в пользу воспроизводимости путем установления T_1 = 1 и Т_2 = - 2, когда T_1 относится к графику зависимости лабораторного стандартного отклонения, а Т_2 относится к графику зависимости стандартного отклонения для повторных испытаний.
Е.2 Выбор используемых в регрессионном анализе весов
Е.2.1 Для того, чтобы учитывать относительную прецизионность переменных, полученных при подгонке, в регрессионном анализе следует использовать веса, обратно пропорциональные дисперсии переменных, полученных при подгонке.
Для переменной D, которая является оценкой стандартного отклонения генеральной совокупности сигма, основанной на ню(D) степенях свободы, формулу для дисперсий выражают как
var(D) = сигма(2)/2 x ню(D). (E.6)
При замене сигма(2) ее оценкой D(2) вес этой переменной приближенно описывают выражением
w(D) = 2 x ню(D)/D(2) (E.7)
Очевидно, при увеличении стандартного отклонения D вес будет соответствующим образом уменьшаться. По этой причине переменную, полученную при подгонке как взвешенную регрессию, следует заменить функцией стандартного отклонения, которая дает вес, не зависящий от полученной при подгонке переменной.
Е.2.2 В случаях, когда функция g (D) подгоняется легче, чем сама переменная D, формулу для дисперсии выражают как
Поэтому для функции натурального логарифма
Если теперь заменить сигма(2) ее оценкой D(2), то вес для log (D) приближенно будет описываться выражением
Таким образом, при действиях с межлабораторным среднеквадратическим отклонением D и среднеквадратическим отклонением для повторных испытаний d регрессионный анализ следует выполнить в log(D) и log(d), так как тогда при выборе веса будет принято в расчет только количество данных, на которых основано среднеквадратическое отклонение. Зависимость, оцененная таким образом, будет в меньшей степени зависеть от выборок, в которых доля потерянных данных высока.
Е.2.3 Обозначая степени свободы как ню(D) для межлабораторного среднего квадратического отклонения D и как ню(d) для среднеквадратического отклонения для повторных испытаний d, формулу для расчета весов выражают как
Примечание - Простая (невзвешенная) регрессия соответствует взвешенной регрессии, в которой все веса имеют постоянное значение, равное единице.
E.3 Вычислительная процедура при выполнении регрессионного анализа
Е.3.1 Приемы для наилучшей подгонки к прямой линии по формуле (Е.2)
Е.3.1.1 Сначала составляют таблицу Е.1 значений переменных, которые используют для построения графика регрессионной зависимости, вместе с соответствующими весами. Функции g_1 и g_2 во всех случаях останутся натуральными логарифмами, которые соответствуют определенным преобразованиям, как установлено в приложении Д.2.
При использовании символов, установленных в таблице Е.1, формула Е.2 для модели, с помощью которой осуществляют подгонку, принимает вид
Отрезок b_0, отсекаемый на ординате, можно исключить, переписав выражение в виде
Таблица Е.1
Проба |
Функция стандартного отклонения g_1 |
Функция выборочного среднего g_2 |
Фиктивная переменная Т |
Tg_2 |
Bec |
1 2 3 . . S |
g_1 (D_1) g_1 (D_2) g_1 (D_3) . . g_1 (D_S) |
g_2 (m_1) g_2 (m_2) g_2 (m_3) . . g_2 (m_S) |
1 1 1 . . 1 |
g_2 (m_1) g_2 (m_2) g_2 (m_3) . . g_2 (m_S) |
2ню(D_1) 2ню(D_2) 2ню(D_3) . . 2ню(D_S) |
1 2 3 . . S |
g_1 (d_1) g_1 (d_2) g_1 (d_3) . . g_1 (d_S) |
g_2 (m_1) g_2 (m_2) g_2 (m_3) . . g_2 (m_S) |
-2 -2 -2 . . -2 |
-2g_2 (m_1) -2g_2(m_2) -2g_2 (m_3) . . -2g_2(m_s) |
2ню(d_1) 2ню(d_2) 2ню(d_3) . . 2ню(d_S) |
Обозначение переменной |
y_1 |
x_1i |
x_2i |
x_3i |
W_i |
Решение по формуле (Е.14) с помощью метода наименьших квадратов требует решения системы условных (нормализованных) уравнений в форме
Примеры решений для элементов а_y и а_yi даны в терминах взвешенных средних x_i
Получив решение уравнений относительно b_1, b_2 и b_3, рассчитывают отрезок, отсекаемый на ординате, в терминах взвешенных средних переменных
Е.3.1.2 Оценки коэффициентов b_i могут быть суммированы в табличной форме, которые вместе со статистическими данными для испытаний представлены в таблице Е.2.
Таблица Е.2
Подгоняемые переменные |
Оценки коэффициентов |
Среднеквадратическое отклонение для оценок |
Значение для испытания по f-критерию |
Отрезок ординаты Выборочное среднее Фиктивная переменная Взаимодействие "фиктивная переменная х среднее" |
b_0 b_1 b_2
b_3 |
e_0 e_1 e_2
e_3 |
t_0 t_1 t_2
t_3 |
Для того, чтобы заполнить таблицу, необходимо рассчитать среднеквадратическое отклонение наблюдаемых значений у относительно линии регрессии. Эту оценку называют остаточным cреднеквадратическим отклонением и выражают формулой
Тогда выражения для среднеквадратического отклонения оценок принимают вид
и
Е.3.2 Значение t-критерия - это значение отношения (b_i - К) / е_i, где К- постоянная величина. Сравнением этих значений с критическими значениями t-критерия в таблице Г.5 возможно установить, отличается ли коэффициент b_i от К. Если t_i больше, чем критическое значение, соответствующее 5%-ному уровню значимости и (n - 4) степеням свободы, то данный коэффициент можно рассматривать как отличающийся от К. В частности, с помощью t_1 можно идентифицировать, является ли наклон b_1 подходящим, а с помощью t_3 определять, различаются ли наклоны для межлабораторного среднеквадратического отклонения и среднеквадратического отклонения для повторных определений. Так как обычно межлабораторное среднеквадратическое отклонение больше, чем среднеквадратическое отклонение для повторных определений при одном и том же значении среднего по пробе, то t_2 обычно будет указывать на то, что коэффициент b_2 отличается от нуля.
Е.3.3 Пример подгонки с помощью степенной функции (вид зависимости 2 в таблице Д.1) и взвешенной линейной регрессии
Округленные значения средних по пробам и среднеквадратических отклонений, полученных на основе данных по бромным числам из Г.2, приведены в таблице 1 настоящего стандарта.
Е.3.3.1 На рисунке Е.1 с помощью графика в билогарифмических координатах показано, что степенное преобразование согласуется с диаграммами рассеяния.
Е.3.3.2 Параметр преобразования В нет необходимости оценивать по графику на рисунке Е.1, так как его получают при регрессионном анализе следующим образом.
Е.3.3.3 Уравнение линии, для которой выполняют подгонку (таблица Д.1), имеет вид
Значения, для которых выполняют подгонку (таблица Е.1), представлены в таблице Е.3.
Определение регрессионной зависимости по методу наименьших квадратов требует решения системы условных уравнений:
Для расчета также необходимы следующие величины
Таблица Е.3
Проба |
Логарифм среднеквадратического отклонения |
Логарифм среднего значения по пробе |
Фиктивная переменная Т |
(Фиктивная переменная) х [log (среднее)] |
Вес |
1 |
-0,3158 |
0,7655 |
1 |
0,7655 |
16 |
2 |
0,7969 |
4,1804 |
1 |
4,1804 |
18 |
3 |
-2,7046 |
-0,2802 |
1 |
-0,2802 |
28 |
4 |
-1,5568 |
1,2932 |
1 |
1,2932 |
22 |
5 |
-1,2358 |
2,3888 |
1 |
2,3888 |
18 |
6 |
0,4029 |
3,8755 |
1 |
3,8755 |
18 |
7 |
1,0762 |
4,7378 |
1 |
4,7378 |
18 |
8 |
-1,8401 |
0,1975 |
1 |
0,1975 |
18 |
1 |
-2,0644 |
0,7655 |
-2 |
-1,5309 |
18 |
2 |
-0,2015 |
4,1804 |
-2 |
-8,3609 |
18 |
3 |
-2,9957 |
-0,2802 |
-2 |
0,5605 |
18 |
4 |
-2,1585 |
1,2932 |
-2 |
-2,5864 |
18 |
5 |
-2,3613 |
2,3888 |
-2 |
-4,7775 |
18 |
6 |
-0,6415 |
3,8755 |
-2 |
-7,7510 |
18 |
7 |
-0,0674 |
4,7378 |
-2 |
-9,4756 |
18 |
8 |
-2,8612 |
0,1975 |
-2 |
-0,3949 |
18 |
Обозначение неременной |
y_1 |
x_1i |
x_2i |
x_3i |
Wi |
Результаты вычислений суммированы в таблице Е.4.
Таблица Е.4
Наименование переменных для подгонки |
Оценки коэффициентов b_i |
Среднеквадратическое отклонение для оценок b_1 |
t-критерий |
Отрезок ординаты |
-2,4064 |
- |
- |
log (среднее) |
0,63773 |
0,07359 |
8,67 |
Фиктивная переменная |
0,25496 |
0,13052 |
1,95 |
(Фиктивная переменная) х log (среднее) |
0,02808 |
0,04731 |
0,59 |
При сравнении экспериментальных значений t-критерия с критическими значениями на 5%-ном уровне значимости для 12 степеней свободы (а именно 2,179), приведенными в таблице Г.5, можно видеть, что наклон b_1 значимо отличается от нуля (b_1 = 0,638). Это подтверждает то обстоятельство, что преобразование было необходимо. Кроме того, наклон b_3, а, следовательно, и преобразование является одинаковым и для межлабораторного среднеквадратического отклонения и для среднеквадратического отклонения для повторных испытаний, так как коэффициент b_3 не отличается значимо от нуля.
Е.3.3.4 Так как наклон b_1 (b_1 = 0,638) имеет среднеквадратическое отклонение 0,074, то приблизительно 66%-ная доверительная область (0,638 +- 0,074) содержит значение 2/3. Следовательно, округление, приводящее к этому значению, приводит к традиционному преобразованию
y = x(2/3)
Е.3.3.5 На рисунке Е.2 показаны диаграммы рассеяния, соответствующие условиям, полученным после применения преобразования и пересчета средних по пробам и среднеквадратических отклонений. Диаграммы показывают идентичные уровни и для межлабораторного среднеквадратического отклонения и для среднеквадратического отклонения по повторным испытаниям для всех проб, за исключением пробы 1. В случае последней пробы экстремальное значение обусловлено выбросами (см. пример в 4.2.2).
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.