Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение Е
(обязательное)
Метод
взвешенного линейного регрессионного анализа (см. 5.1)
Е.1 Пояснение для применения фиктивной переменной
Е.1.1 В общем случае две различные переменные и при построении графика зависимости относительно одной и той же независимой переменной X будут давать различные зависимости:
,
,
(Е.1)
где коэффициенты оценивают с помощью регрессионного анализа. Для того, чтобы сравнить две зависимости, фиктивная переменная Т может быть определена таким образом:
- постоянная величина для каждого наблюдения ;
- постоянная величина для каждого наблюдения ;
Е.1.2 Допуская, что Y представляет комбинацию и , строят график единой зависимости
,
(Е.2)
где, как и прежде, коэффициенты - оценивают с помощью регрессионного анализа. При сравнении уравнений (Е.1) и (Е.2) очевидно, что
;
.
(Е.3)
Поэтому
.
(Е.4)
Подобным образом
.
(Е.5)
Для исследования различия между и необходимо испытать только коэффициент как коэффициент, отличный от нуля. Подобным образом для выявления различия между и испытывают коэффициент как коэффициент, отличный от нуля.
Е.1.3 Для и могут быть выбраны любые отличные от нуля значения. Тем не менее в силу того, что показатель "воспроизводимость" является основой испытаний при контроле качества по спецификациям (разделы 9 и 10 настоящего стандарта), выбором веса при оценивании зависимостей показателей прецизионности ("precision") следует отразить это положение. Следует применять "отношение важности" как 2:1 в пользу воспроизводимости путем установления и , когда , относится к графику зависимости лабораторного стандартного отклонения, а относится к графику зависимости стандартного отклонения для повторных испытаний.
Е.2 Выбор используемых в регрессионном анализе весов
Е.2.1 Для того, чтобы учитывать относительную прецизионность переменных, полученных при подгонке, в регрессионном анализе следует использовать веса, обратно пропорциональные дисперсии переменных, полученных при подгонке.
Для переменной D, которая является оценкой стандартного отклонения генеральной совокупности , основанной на v (D) степенях свободы, формулу для дисперсии выражают как
.
(Е.6)
При замене ее оценкой вес этой переменной приближенно описывают выражением
.
(Е.7)
Очевидно, при увеличении стандартного отклонения D вес будет соответствующим образом уменьшаться. По этой причине переменную, полученную при подгонке как взвешенную регрессию, следует заменить функцией стандартного отклонения, которая дает вес, не зависящий от полученной при подгонке переменной.
Е.2.2 В случаях, когда функция g (D) подгоняется легче, чем сама переменная D, формулу для дисперсии выражают как
.
(Е.8)
Поэтому для функции натурального логарифма
.
(Е.9)
Если теперь заменить ее оценкой , то вес для log (D) приближенно будет описываться выражением
.
(Е.10)
Таким образом, при действиях с межлабораторным среднеквадратическим отклонением D и среднеквадратическим отклонением для повторных испытаний d регрессионный анализ следует выполнить в log (D) и log (d), так как тогда при выборе веса будет принято в расчет только количество данных, на которых основано среднеквадратическое отклонение. Зависимость, оцененная таким образом, будет в меньшей степени зависеть от выборок, в которых доля потерянных данных высока.
Е.2.3 Обозначая степени свободы как v (D) для межлабораторного среднего квадратического отклонения D и как v (d) для среднеквадратического отклонения для повторных испытаний d, формулу для расчета весов выражают как
,
(Е.11)
.
(Е.12)
Примечание - Простая (невзвешенная) регрессия соответствует взвешенной регрессии, в которой все веса имеют постоянное значение, равное единице.
Е.3 Вычислительная процедура при выполнении регрессионного анализа
Е.3.1 Приемы для наилучшей подгонки к прямой линии по формуле (Е.2)
Е.З.1.1 Сначала составляют таблицу Е.1 значений переменных, которые используют для построения графика регрессионной зависимости, вместе с соответствующими весами. Функции и во всех случаях останутся натуральными логарифмами, которые соответствуют определенным преобразованиям, как установлено в Д.2 (приложение Д).
При использовании символов, установленных в таблице Е.1, формула Е.2 для модели, с помощью которой осуществляют подгонку, принимает вид
.
(Е.13)
Отрезок , отсекаемый на ординате, можно исключить, переписав выражение в виде
,
(Е.14)
где y, , , изъявляются средними взвешенными значениями, например:
,
(Е.15)
где n - число точек (удвоенное число проб), по которым строят график.
Таблица Е.1
Проба |
Функция стандартного отклонения |
Функция выборочного среднего |
Фиктивная переменная T |
Вес |
|
1 |
1 |
||||
2 |
1 |
|
|||
3 |
1 |
||||
. |
. |
. |
|
.
|
.
|
. |
. |
. |
|
.
|
. |
S |
1 |
||||
1 |
-2 |
||||
2 |
-2 |
||||
3 |
-2 |
||||
|
. |
. |
. |
. |
. |
|
. |
. |
. |
. |
. |
S |
-2 |
||||
Обозначение переменной |
Решение по формуле (Е.14) с помощью метода наименьших квадратов требует решения системы условных (нормализованных) уравнений в форме:
(Е.16)
Примеры решений для элементов и даны в терминах взвешенных средних
Получив решение уравнений относительно , и , рассчитывают отрезок, отсекаемый на ординате, в терминах взвешенных средних переменных
.
(Е.17)
Е.3.1.2 Оценки коэффициентов могут быть суммированы в табличной форме, которые вместе со статистическими данными для испытаний представлены в таблице Е.2.
Таблица Е.2
Подгоняемая переменная |
Оценка коэффициентов |
Среднеквадратическое отклонение для оценки |
Значение для испытания по t-критерию |
Отрезок ординаты |
|||
Выборочное среднее |
|||
Фиктивная переменная |
|||
Взаимодействие "фиктивная переменная х среднее" |
Для того, чтобы заполнить таблицу, необходимо рассчитать среднеквадратическое отклонение наблюдаемых значений y относительно линии регрессии. Эту оценку называют остаточным среднеквадратическим отклонением и выражают формулой
.
(Е.18)
Тогда выражения для среднеквадратического отклонения оценок принимают вид
,
(Е.19)
где элементы соответствуют значениям обратной матрицы, содержащей элементы .
Е.3.2 Значение t-критерия - это значение отношения , где K - постоянная величина. Сравнением этих значений с критическими значениями t-критерия в таблице Г.5 (приложение Г) возможно установить, отличается ли коэффициент от K. Если больше, чем критическое значение, соответствующее 5%-ному уровню значимости и (n - 4) степеням свободы, то данный коэффициент можно рассматривать как отличающийся от K. В частности, с помощью можно идентифицировать, является ли наклон подходящим, а с помощью определять, различаются ли наклоны для межлабораторного среднеквадратического отклонения и среднеквадратического отклонения для повторных определений. Так как обычно межлабораторное среднеквадратическое отклонение больше, чем среднеквадратическое отклонение для повторных определений при одном и том же значении среднего по пробе, то обычно будет указывать на то, что коэффициент отличается от нуля.
Е.3.3 Пример подгонки с помощью степенной функции (вид зависимости 2 в таблице Д.1, приложение Д) и взвешенной линейной регрессии
Округленные значения средних по пробам и среднеквадратических отклонений, полученных на основе данных по бромным числам из Г.2 (приложение Г), приведены в таблице 1 настоящего стандарта.
Е.3.3.1 На рисунке Е.1 с помощью графика в билогарифмических координатах показано, что степенное преобразование согласуется с диаграммами рассеяния.
Е.3.3.2 Параметр преобразования В нет необходимости оценивать по графику на рисунке Е.1, так как его получают при регрессионном анализе следующим образом.
Е.3.3.3 Уравнение линии, для которой выполняют подгонку (таблица Д.1, приложение Д), имеет вид
.
Значения, для которых выполняют подгонку (таблица Е.1), представлены в таблице Е.3. Определение регрессионной зависимости по методу наименьших квадратов требует решения системы условных уравнений:
;
;
.
Для расчета также необходимы следующие величины
;
.
Таблица Е.3
Проба |
Логарифм среднеквадратического отклонения |
Логарифм среднего значения по пробе |
Фиктивная переменная T |
Вес |
|
1 |
-0,3158 |
0,7655 |
1 |
0,7655 |
16 |
2 |
0,7969 |
4,1804 |
1 |
4,1804 |
18 |
3 |
-2,7046 |
-0,2802 |
1 |
-0,2802 |
28 |
4 |
-1,5568 |
1,2932 |
1 |
1,2932 |
22 |
5 |
-1,2358 |
2,3888 |
1 |
2,3888 |
18 |
6 |
0,4029 |
3,8755 |
1 |
3,8755 |
18 |
7 |
1,0762 |
4,7378 |
1 |
4,7378 |
18 |
8 |
-1,8401 |
0,1975 |
1 |
0,1975 |
18 |
1 |
-2,0644 |
0,7655 |
-2 |
-1,5309 |
18 |
2 |
-0,2015 |
4,1804 |
-2 |
-8,3609 |
18 |
3 |
-2,9957 |
-0,2802 |
-2 |
0,5605 |
18 |
4 |
-2,1585 |
1,2932 |
-2 |
-2,5864 |
18 |
5 |
-2,3613 |
2,3888 |
-2 |
-4,7775 |
18 |
6 |
-0,6415 |
3,8755 |
-2 |
-7,7510 |
18 |
7 |
-0,0674 |
4,7378 |
-2 |
-9,4756 |
18 |
8 |
-2,8612 |
0,1975 |
-2 |
-0,3949 |
18 |
Обозначение переменной |
Результаты вычислений суммированы в таблице Е.4.
Таблица Е.4
Наименование переменных для подгонки |
Оценки коэффициентов |
Среднеквадратическое отклонение для оценок |
t-критерий |
Отрезок ординаты |
-2,4064 |
- |
- |
log (среднее) |
0,63773 |
0,07359 |
8,67 |
Фиктивная переменная |
0,25496 |
0,13052 |
1,95 |
0,02808 |
0,04731 |
0,59 |
При сравнении экспериментальных значений t-критерия с критическими значениями на 5 %-ном уровне значимости для 12 степеней свободы (а именно 2,179), приведенными в таблице Г.5, можно видеть, что наклон значимо отличается от нуля ( = 0,638). Это подтверждает то обстоятельство, что преобразование было необходимо. Кроме того, наклон , а следовательно, и преобразование, является одинаковым и для межлабораторного среднеквадратического отклонения и для среднеквадратического отклонения для повторных испытаний, так как коэффициент не отличается значимо от нуля.
Е.3.3.4 Так как наклон ( = 0,638) имеет среднеквадратическое отклонение 0,074, то приблизительно 66%-ная доверительная область (0,6380,074) содержит значение 2/3. Следовательно, округление, приводящее к этому значению, приводит к традиционному преобразованию
.
Е.3.3.5 На рисунке Е.2 показаны диаграммы рассеяния, соответствующие условиям, полученным после применения преобразования и пересчета средних по пробам и среднеквадратических отклонений. Диаграммы показывают идентичные уровни и для межлабораторного среднеквадратического отклонения, и для среднеквадратического отклонения по повторным испытаниям для всех проб, за исключением пробы 1. В случае последней пробы экстремальное значение обусловлено выбросами (см. пример в 5.2.2 настоящего стандарта).
Рисунок Е.1
Рисунок Е.2
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.