Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение В
(справочное)
Методика восстановления регрессионных зависимостей по эмпирическим данным
Для восстановления количественного соответствия между значениями показателей механических свойств проката и измеряемыми физическими параметрами в случае, когда выборки проводятся несогласованно и имеют различное число измерений, предлагается методика нахождения коэффициентов калибрующего уравнения, базирующаяся на восстановлении корреляционных зависимостей. Основанием применения метода восстановления является стабильность свойств, порождаемых данной технологией, и нормальный закон совместного распределения значений измеряемых показателей.
При восстановлении зависимостей различные постановки задач сводятся к математической схеме минимизации среднего риска по эмпирическим данным.
Считается, что показатели Y и X связаны регрессионной зависимостью, если каждому значению х показателя X ставится в соответствие число у, полученное с помощью случайного испытания над показателем Y согласно условной плотности вероятности P (y/x). Иначе говоря, каждому х ставится в соответствие закон S (y/x), согласно которому в случайном испытании реализуется выбор у.
Полное знание регрессионной зависимости требует восстановления условной плотности Р (у/х), но на практике, в задачах обработки результатов измерений, нужно знать одну из ее характеристик, функцию условного математического ожидания
, (В.1)
называемую регрессией.
Задача восстановления функции условного математического ожидания в этом случае формулируется как задача восстановления регрессии - одна из основных проблем прикладной статистики.
Постановка задачи состоит в следующем.
При проведении испытаний случайно и независимо появляются значения измерений х. В этой среде работает преобразователь S (x/y), который каждому х ставит в соответствие число у, полученное в результате реализации случайного испытания, согласно закону Р (у/х).
Свойства среды Р (х) и закон Р (у/х) неизвестны, однако известно, что существует регрессия
y = y(x). (В.1)
Требуется по паре случайных независимых выборок в общем случае различного объема
,
;
,
(В.3)
восстановить регрессию, то есть в классе функций F(x, a) отыскать функцию наиболее близкую к регрессии y (x).
Здесь m, n - объемы независимых выборок над показателями Y, X, a F - обозначение класса функций регрессии, отличающихся значениями параметров а, принадлежащих А - множеству значений.
Задача восстановления регрессии сводится к проблеме минимизации функционала
(В.4)
на множестве - интегрируемых с квадратом по мере Р(х) функций в ситуации, когда совместная плотность вероятности Р (х,у) = Р (у/х) Р (х) неизвестна.
Можно показать, что если регрессия у = у(х) принадлежит классу F (X,a), то она минимизирует функционал I (а). Если же регрессия не принадлежит F (x,a), то минимум достигается на ближайшей к регрессии функции F (x,a), то есть в любом случае решение будет оптимальным относительно сделанных предположений.
Близость функций понимается в смысле метрики (квадратичная мера):
. (В.5)
Записываем формулу (В.4) в общей форме
, (В.6)
где I (а) - средний риск;
Q (z,a) - функция потерь в задаче минимизации среднего риска при восстановлении регрессии по эмпирическим данным ,
...
Минимальное значение (В.6) достигается с доверительной вероятностью Р, называемой надежностью восстановления.
Практическое решение задачи, обеспечивающее минимизацию среднего риска восстановления регрессии с заданной надежностью на выборках конечного объема, состоит в построении уравнения выбранной -процентной области
совместного распределения значений показателей Y, X.
, (В.7)
где u - вектор параметров, включающий опорные значения совместного распределения измерений х, у, в том числе средние значения ,
, средние квадратические отклонения
,
и парный коэффициент корреляции
. Находится решение уравнения относительно
при выборочных значениях опорных величин. В частности,
-процентная доверительная область совместного попадания значений у, х определяется уравнением эллипсоида
(В.8)
с растяжением, соответствующим назначенной доверительной вероятности и объемам выборок.
Задавая статистические гипотезы о предельных значениях и
, находим решение уравнения (В.8) относительно
, что позволяет определить калибрующий коэффициент
(В.9)
и смещение
(В.10)
для восстановления регрессионной зависимости
y = a + bx (В.11)
между механической характеристикой и измеряемым физическим показателем.
Как правило, уравнения (В.7) являются нелинейными относительно , в связи с чем целесообразно использовать один из приближенных методов отыскания решений с итерацией на i-м шаге
u (i + 1) = u (i) + t (i) g (i), (В.12)
где g (i) - единичный вектор в направлении градиента;
t (i) - значение шага.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.