Откройте актуальную версию документа прямо сейчас
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Приложение 4
к МУ 4.3.3939-23
Статистическая обработка результатов экспериментальных исследований
1. Статистическая обработка данных экспериментальных исследований направлена на выявление статистически значимых отличий между группами лабораторных животных в эксперименте по исследуемым параметрам, на выявление зависимости эффектов ЭМП.
2. Статистический анализ отражает цель исследования, план эксперимента, выявляет закономерности, позволяет провести проверку одной или нескольких гипотез. Выбор используемых статистических критериев, тестов и методов определяется исходя из задач исследования, оцениваемых параметров (количественные, качественные), характера распределения параметров, количества экспериментальных животных в группе, количества групп.
3. На первом этапе статистической обработки данных проводится оценка характера распределения параметров наблюдения и степень его отличия от нормального распределения в каждой выборке. Для данной цели могут быть использованы тест Шапиро-Уилка, критерий Колмогорова-Смирнова (рекомендуется при количестве наблюдений в выборке более 50).
4. Описательные статистики.
4.1. В случае анализа количественных данных и нормального распределения в выборке описательная статистика включает расчет среднего арифметического (М) и его 95 %-го доверительного интервала (95 % ДИ) или стандартного (среднеквадратического) отклонения (SD). Если отсутствует необходимость показать вариабельность данных, подчиняющихся нормальному распределению, и необходимо осуществить точечную оценку и оценить показатель точности среднего арифметического, допускается указывать стандартную ошибку среднего арифметического (m).
4.2. При анализе количественных данных и распределении в выборке, отличающемся от нормального, в качестве меры центральной тенденции используют медиану (Me), а в качестве мер рассеяния - нижний (Q1) и верхний (Q3) квартили (25-й и 75-й процентили), а также размах вариации (межквартильный диапазон). Кроме медианы для описания центральных тенденций используют моду (Мо).
4.3. Выборки с категориальными признаками (номинальными или ранговыми) считаются не обладающими нормальным распределением. Данные атрибуты могут быть описаны как "номинальные", когда они не имеют естественного порядка (например, род или порода животных). При наличии только двух категорий данные называются бинарными (дихотомическими). Данные описываются как "порядковые", когда они имеют естественный порядок (например, баллы, низкие, средние и высокие уровни дозы) и могут быть определены численно. Номинальные и ранговые признаки представляются в виде долей (процентов) с указанием 95 % ДИ, рассчитанного по методам Вальда, Уилсона. Допускается представление ранговых признаков как количественных данных, которые не подчиняются закону нормального распределения, то есть с помощью медианы и квартилей или процентилей.
5. При нормальности распределения параметра для сравнения групп рекомендуется использовать параметрические критерии. При распределении в одной сравниваемой выборке, отличающемся от нормального, рекомендуется использовать непараметрические критерии.
6. Параметрические методы.
6.1. Количественные данные, имеющие нормальное распределение, можно анализировать с помощью параметрических методов: одновыборочный t-критерий, t-критерий для двух независимых или парных выборок, а также однофакторного дисперсионного анализа ANOVA и ANOVA для повторных измерений при сравнении трех и более групп.
6.2. Параметрические тесты более универсальны, чем непараметрические, но зависят от допущений о том, что дисперсии примерно одинаковы в каждой группе, поэтому в дополнение к проверке нормальности распределения рекомендуется использовать критерий Ливеня для проверки равенства дисперсий.
6.3. Общепринятый критический уровень значимости нулевой гипотезы равен 0,05, и при р < 0,05 различия мер центральной тенденции признаются статистически значимыми. При проведении дисперсионного анализа подобный результат не дает ответа на вопрос, между какими из трех (или более) выборок будут статистически значимые отличия.
Для изучения различий между отдельными средними значениями можно использовать апостериорные сравнения, которые представляют собой попарные сравнения изучаемых групп для обнаружения различий между ними, а также ортогональные контрасты. Критический уровень значимости нулевой гипотезы при попарном сравнении выборок рекомендуется снижать (например, с использованием поправки Бонферрони).
7. Непараметрические методы.
7.1. Для проверки различий между двумя выборками парных или независимых измерений по уровню какого-либо количественного или рангового (порядкового) признака используют критерий Манна - Уитни (для 2 независимых выборок) и критерий Уилкоксона (для двух парных выборок). Для сравнения 3 и более независимых групп применяется критерий Краскела - Уоллиса, а для определения статистически значимых отличий в трех и более парных выборках используется критерий Фридмана. При уровне значимости критериев Краскела - Уоллиса или Фридмана менее 0,05 необходимо попарное сравнение выборок с помощью критериев Манна - Уитни или Уилкоксона. Рекомендуется корректировать критический уровень значимости нулевой гипотезы.
7.2. Для анализа различий между выборками с номинальными, а в отдельных случаях также и ранговыми данными, используются статистики на основе критерия хи-квадрат. Метод неточен, если числа в некоторых ячейках очень низкие. В таких случаях можно использовать критерий хи-квадрат с поправкой Йейтса (если количество ожидаемых наблюдений хотя бы в одной из ячеек менее 10). Если ожидаемое число наблюдений в любой из ячеек четырехпольной таблицы 2x2 будет меньше 5, то следует применять точный критерий Фишера. Для сравнения долей в двух зависимых выборках используется критерий Мак-Немара. Критерий хи-квадрат Пирсона также может быть применен для сравнения качественных данных в трех и более независимых группах, а для сравнения качественных данных в трех и более зависимых группах используется Q-критерий Кокрена. При обнаружении статистически значимых различий с помощью критерия Кокрена можно провести попарные сравнения с помощью критерия Мак-Немара с поправкой Бонферрони.
8. Вне зависимости от типа распределения и характера данных следует учитывать. что выраженное (захватывающее среднее или медиану соседней выборки) пересечение 95 % ДИ или межквартильного диапазона будет свидетельствовать о незначимых отличиях массивов данных даже при статистически значимых отличиях мер центральной тенденции.
9. Статистически значимые отличия не исключают отсутствия практической (клинической) значимости отличий. Отсутствие статистически значимых отличий, полученное при исследовании небольших выборок, как правило, не позволяет однозначно интерпретировать результат, и одновременно результат исследования может быть значим с практической (клинической) точки зрения.
10. Корреляция.
10.1. Направление корреляционной связи может быть прямое (положительное) или обратное (отрицательное). Виды корреляции по силе связи:
а) отсутствует: 0,00;
б) слабая: 0,01 - 0,29;
в) средняя: 0,30 - 0,69;
г) сильная: 0,70 - 0,99;
д) полная: 1,00.
10.2. Наиболее распространенный коэффициент корреляции - корреляция Пирсона, используется для оценки прочности линейной связи между двумя числовыми переменными А и В в выборках, обладающих нормальным распределением.
10.3. Существуют другие формы коэффициента корреляции в зависимости от того, являются ли переменные измерениями рангами или дихотомическими значениями. Для выборок количественных данных, не обладающих нормальным распределением, вычисляют коэффициент корреляции Спирмена.
10.4. Помимо расчета коэффициента корреляции определяют также статистическую значимость корреляции. Корреляция признается статистически значимой при р < 0,05.
10.5. Кросс-корреляция является мерой сходства двух рядов в зависимости от перемещения одного ряда относительно другого. Кросс-корреляция рассчитывается для двух переменных, одна из которых берется с определенным запаздыванием ("лагом").
10.6. Корреляция определяет силу и направление связи (взаимосвязи) между переменными, но не определяет причинно-следственную связь.
11. Регрессия.
11.1. Регрессионный анализ используют для количественной оценки связи между двумя непрерывными переменными X и Y, где предполагается, что изменение X вызывает изменение Y. Таким образом, регрессия является асимметричной по отношению к X и Y. Предполагается, что переменная X измеряется без ошибок. Линейную регрессию можно использовать для подбора прямой линии формы y=a+b·x, где а и b - константы, которые обычно определяются на основе данных с использованием метода наименьших квадратов. В этом случае "а" (отрезок) представляет значение Y, когда X равно нулю, а "b" - это наклон линии регрессии. Положительное значение b означает, что наклон увеличивается слева направо, а отрицательное значение означает, что он уменьшается. Доверительные интервалы могут быть получены для наклона и могут быть установлены вокруг линии регрессии, чтобы получить, например, 2, что интерпретируется как доля изменчивости данных, объясняемая регрессией. Данное значение может быть низким, если переменная X не имеет достаточно большого диапазона.
11.2. Одновременное влияние нескольких независимых переменных X на фактор Y можно оценить с помощью множественной регрессии. Данный анализ носит исследовательский характер с целью определения того, какие переменные оказывают влияние. Логистическую регрессию используют для изучения взаимосвязи между одной или несколькими переменными-предикторами и бинарным результатом.
11.3. Регрессия и дисперсионный анализ связаны, поэтому регрессия, например, реакции на уровень дозы, может быть включена как часть дисперсионного анализа с использованием ортогональных контрастов. Обычный статистический тест в регрессионном анализе состоит в проверке нулевой гипотезы об отсутствии линейной зависимости между X и Y. Другие тесты касаются того, имеют ли две линии регрессии одинаковый наклон b и/или одинаковую точку пересечения а. Тестом для определения наличия квадратичного отношения будет тест того, дает ли квадратичная кривая значительно лучшее соответствие, чем прямая линия.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.