Вы можете открыть актуальную версию документа прямо сейчас.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение G
(справочное)
Примеры
анализа данных для рейтингов
G.1 Общие положения
Данное приложение использует примеры, описанные в приложении Е. Первые два примера касаются проверки различия, где нулевую гипотезу Н0, можно определить как: два продукта А и В извлекают из двух множеств, которые имеют одинаковое среднее.
Последние два примера касаются испытания по типу "не хуже", где нулевая гипотеза Н0, может быть определена как: продукт А хуже продукта В на величину, по крайней мере, равную ; следовательно, продукт А не равноценен продукту B.
Для проверки различия данные примеры рассматриваются в двухсторонней гипотезе. В случае односторонней гипотезы необходимо консультироваться со специалистом в области статистики.
G.2 Пример 1 (случай 1 приложения Е): подтвердить, что два продукта А и В воспринимаются по-разному; каждый испытатель дает оценку только одному продукту
- После обсуждения с заказчиком лаборатория опросила 230 потребителей: 110 потребителей в отношении продукта А (nА = 110) и 120 потребителей в отношении продукта В (nB = 120). Для двух продуктов лаборатория получила средние значения и стандартные отклонения, а именно: mА = 7,23, sA = 1,85, mB = 6,87, and sB = 1,65.
- Значение tcal задается формулой (G.1):
,
(G.1)
где - стандартное отклонение в пределах испытанных продуктов.
рассчитывают по формуле (G.2):
,
(G.2)
Следовательно, в данном примере:
,
.
Значение .
Это значение сравнивают с заданным значением tthe для выбранного -риска. Это значение tthe задается квантилем (1 -
/2) t-распределения с nА + nВ - 2 степенями свободы. Для
-риска = 5 %, в данном примере оно равно 1,970.
Чтобы отвергнуть Н0, tcal должно быть > ttne. Поскольку 1,558 < 1,970, это условие не подтверждается в данном примере; лаборатория не может сделать заключение о том, что существует заметное различие между двумя средними значениями продуктов A и B.
- Поэтому лаборатория рассчитывает эффективную мощность критерия по формуле (G.3):
.
(G.3)
Значение рассчитывают по формуле (G.3):
,
(G.4)
где tthe - значение, ведущее к отвержению Н0;
- различие, выявляемое между двумя продуктами;
tcalden - знаменатель tcal [формула (G.1)].
.
Если < 0, значение
задается функцией распределения t-распределения при nА + nB - 2 степенях свободы при
. Функция распределения t-распределения с 110 + 120 - 2 степенями свободы при -0,195 равна 0,423. Таким образом, мощность критерия будет равна 1 -
= 1 - 0,423
0,58. Это неудовлетворительное значение гораздо меньше, чем требуемое значение: 90 %.
Примечание - Если > 0, то значение мощности напрямую задается функцией распределения t-распределения при
. Например, для
= 0,30,
= 1,970 - (0,30/0,231) = + 0,671; расчет функции t-распределения дает Р = 0,251
0,25.
G.3 Пример 2 (случай 2 приложения Е): подтвердить, что два продукта А и В воспринимаются по-разному; каждый испытатель дает оценку обоим продуктам
Лаборатория опросила 120 потребителей (n = 120). Получено mА = 6,33, mB = 6,66 и sd = 1,92, где sd - стандартное отклонение разностей между рейтингами, присвоенными двум продуктам каждым потребителем.
- Значение tcal задается формулой (G.5):
,
,
(G.5)
- Это значение сравнивают со значением tthe для выбранного -риска. Это значение tthe задается квантилем (1 -
/2) t-распределения с n - 1 степенями свободы. В этом примере для
-риска = 0,05 оно равно 1,980.
Чтобы отвергнуть Н0 и сделать вывод, что существует заметное различие между А и B, необходимо, чтобы абсолютное значение tcal было > tthe. Поскольку это условие не подтверждается в данном примере [abs(-1,886) < 1,980], лаборатория не может прийти к заключению о заметном различии между двумя рейтингами продуктов А и В.
- Поэтому лаборатория рассчитывает эффективную мощность критерия, который она применила, по формуле
,
(G.6)
где tthe - значение, ведущее к отвержению Н0;
- различие, выявляемое между двумя продуктами;
tcalden - знаменатель tcal [формула (G.5)].
= 1,980 - (0,50/0,175) = -0,873.
Поскольку правила, касающиеся расчета , одинаковы для формул (G.4) и (G.6), значение
задается функцией t-распределения с 120 - 1 степенями свободы при -0,873; оно равно 0,192. Мощность критерия поэтому близка к 1 - 0,192 = 0,808, т.е. 81 %, значение обычно считается удовлетворительным, поскольку оно выше 80 %.
G.4 Пример 3 (случай 3 из приложения Е): подтвердить, что продукт А не хуже продукта B; каждый потребитель оценивает только один продукт
Расчет, выполненный в приложении Е, дает n = 374 потребителя на продукт. Лаборатория опросила только 300 потребителей для А (nА = 300) и 316 потребителей для В (nB = 316). Получилось: mА = 7,01, sA = 1,95, mB = 6,87 и sB = 1,80.
- В испытании типа "не хуже" значение tcal задается формулой (G.7):
,
(G.7)
где ,
В нашем примере, ,
и .
Следовательно: .
- Это значение сравнивают со значением tthe для выбранного -риска. Это значение tthe задается квантилем (1 -
) t-распределения с nА + nB - 2 степенями свободы. Для
-риска = 5 % в данном примере оно равно 1,647.
Чтобы отвергнуть Н0 и сделать вывод о том, что продукт А не хуже продукта В, tcal должен быть > tthe. Поскольку это условие в данном примере верно (2,914 > 1,647), лаборатория может отвергнуть Н0 и сделать вывод, что продукт А подобен продукту В в отношении качества.
- Если лаборатория не может сделать заключение о заметном подобии в отношении критерия "не хуже", она должна рассчитать мощность этого критерия. Он задается формулой (G.8):
,
(G.8)
где tthe - значение, ведущее к отвержению Н0;
- разность, неприемлемая для того, чтобы считать
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.