Приложение В (справочное). Метод логистической регрессии

Приложение В
(справочное)

 

Метод
логистической регрессии

 

Двучленная логистическая регрессия представляет форму, применяемую в тех случаях, когда зависимая переменная ограничена двумя состояниями (дихотомия), а независимая непрерывна (они также могут применяться к множественным непрерывным независимым переменным). Метод логистической регрессии предполагает оценку с максимальной степенью вероятности после преобразования зависимой переменной в вероятностную, несмотря на то, что натуральный логарифм является зависимой переменной. Таким образом, можно оценить вероятность определенного события при решении следующего уравнения:

 

 

(В.1)

 

или

 

,

 

(В.2)

где:

 

In - натуральный логарифм;

р - вероятность того, что произойдет событие Y, р (Y = 1);

р/(1-р) - вероятность успешного исхода;

(1-р) - вероятность того, что событие Y не произойдет;

In [р/(1-р)] - логарифм вероятности успешного исхода.

 

Примечание - Правая сторона уравнения является формой стандартной линейной регрессии.

Модель логистической регрессии - это нелинейное преобразование модели линейной регрессии. Логистическое распределение представляет собой S-образную функцию распределения, которая в какой-то мере сходна со стандартным нормальным. Оценки вероятности по логистическому распределению лежат в пределах от 0 до 1. В этом можно убедиться, преобразовав приведенные уравнения (В.2, В.3) и найдя решение для р:

 

 

(B.3)

 

или

 

 

(В.4)

 

Если (а+bx) становится большой величиной, то р стремится к 1, если малой величиной, то р стремится к 0, а когда (а+bx) = 0, р = 0,5 (значение, используемое для ЗЭТВ и в рамках этого метода). Значение 50-процентной вероятности идентично и при измерении ЗЭТВ будет представлять точку, пересекающую кривую Столл.

Этот метод анализа не делает допущений относительно линейности отношения независимой переменной к зависимой и не требует нормально распределенных переменных, не делает допущений о гомоскедастичности остаточных членов (вариативность зависимой переменной остается той же при различных значениях независимой переменной - критерии для обычной регрессии наименьших квадратов) и в целом выдвигает менее жесткие требования.

В рабочем порядке для представления того или иного состояния измеряемой зависимой величины используется фиктивная переменная 1 или 0. В приведенном примере ЗЭТВ кодирование зависимой переменной соответствует следующему:

Y = 1, если значение теплоты от калориметра превышает кривую Столл.

Y = 0, если значение теплоты от калориметра не превышает кривую Столл.

Независимой непрерывной переменной в этом случае является падающая энергия, возникающая при тепловом воздействии дуги.

Существуют несколько платных и бесплатных программных пакетов, которыми можно воспользоваться для данного анализа.

Логистическая регрессия выполняется на базе ряда измерений, причем определяются значения а и b (а также масса других описательных параметров: см. соответствующую документацию в используемом программном пакете). Затем устанавливают критерии Столл (или появление вскрытия) расчетом X при р = 0,5, т.е. 50-процентная вероятность представляет собой простой случай, когда (а+bx) = 0, или

 

 

(B.5)

 

Здесь используется абсолютное значение, поскольку в некоторых программных пакетах расчеты проводят в обратной форме (р - вероятность того, что событие не произойдет, и т.д.), что "опрокидывает" S-образное распределение. Вследствие этого у значения а или b может появиться знак минус, однако положение точки 50-процентной вероятности остается неизменным.

Откройте актуальную версию документа прямо сейчас или получите полный доступ к системе ГАРАНТ на 3 дня бесплатно!

Получить доступ к системе ГАРАНТ

Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.