Uploaded by Welcome to Odessa

Satanalys

advertisement
Тема 4. Направления и задачи статистического анализа в НИР
Цель: Научиться понимать результаты статистического анализа медикобиологических данных.
Студент должен знать: Задачи статистического анализа результатов
НИР, ключевые правила представления научной информации
Уметь: Понять в научной публикации смысл представленных фактических данных, возможность использования результатов исследования в практике здравоохранения.
Вопросы для самоподготовки:
1. Значение статистических методов в научных исследованиях.
2. Статистические показатели, характеризующие:
- явление (заболевание, факторы риска),
- значимость различий между группами сравнения,
- прогноз заболевания,
- риск развития заболевания,
- эффективность лечения,
- достоверность и точность диагностического теста.
3. Способы представления результатов НИР в описании, таблицах и
диаграммах.
Домашнее задание
1.
Изучите теоретический материал
2.
Продумайте решение задач, приведенных в рамочках
3.
Выполните письменно на отдельном листочке и сдайте перед занятием следующее задание:
 Определите, какой тип диаграмм необходим для представления фактических данных, представленных в таблицах 1-4.
 Выполните соответствующие диаграммы к каждой таблице.
 Сделайте заключение по каждой таблице.
Таблица 1. Заболеваемость сахарным диабетом в РФ, на 10 000 человек
2006
2007
2008
2009
2010
Частота случаев
146,7
152,2
158,1
166,0
176,0
Таблица 2. Распределение воспитанников детского дома по росту, %
Рост воспитанников
Низкий
Ниже среднего Средний
Выше среднего
Высокий
Доля детей
5
20
65
8
2
Таблица 3. Заболеваемость острыми вирусными гепатитами в РФ в 2010 году
Острые вирусные гепатиты,
Из них:
Гепатит А
Гепатит В
Гепатит С
Прочие формы
Всего случаев, на 100 тыс.
чел.
44,94
В % от общего числа
30,05
8,56
4,47
1,86
66,9
19,0
9,9
4,1
100,0
Таблица 4. Заболеваемость детей, подростков и взрослых в А-области, на 1000 чел.
Показатель
Дети
Подростки
Взрослые
Общая заболеваемость
1800
1503
980
Первичная заболеваемость
1478
1265
458
Задание для письменной контрольной работы
Проведите анализ медицинской публикации. Ответьте на следующие
вопросы:
1. Основной научный вопрос
2. Вид исследования
3. Объект исследования
4. Виды статистического анализа и используемые статистические показатели:
- Описание центральной тенденции и вариабельности количественных
данных
- Описание частот качественных данных
- Выявление эффектов, сходства и различия групп
- Описание величины изучаемого эффекта
- Показатели, характеризующие достоверность результатов
5. Способы представления результатов, с какой целью используются
6. Ключевые результаты
7. Значение для практики здравоохранения
Теоретический материал
Статистический анализ применяется для обработки собранной в ходе
исследования информации. Важнейшая цель статистического анализа – сделать вывод о существовании некой общей закономерности на основании анализа ограниченного числа наблюдений. Статистические методы дают возможность:
- компактно и информативно описывать результаты эксперимента или
наблюдения;
- устанавливать степень достоверности сходства и различия исследуемых объектов на основании результатов измерения их показателей;
- анализировать наличие или отсутствие зависимости между различными показателями;
- количественно описывать эти зависимости;
- выявлять информативные показатели;
- классифицировать изучаемые объекты;
- прогнозировать значение показателей и т.д.
В научных публикациях в разделе «Материалы и методы исследования»
следует обязательно указывать используемые методы математического и статистического анализа, применяемые пакеты статистических программ.
Выбор методов статистического анализа связан с несколькими условиями: характер решаемой научной задачи и дизайн исследования (описательное
или аналитическое исследование), вид данных (количественные или качественные) и особенности их распределения в исследуемой популяции (выборке) и др.
Наиболее часто в медицине статистика применяется для решения 4 типов задач:
1. Описание центральной тенденции и вариабельности количественных
данных.
2. Описание частот (абсолютных и относительных) качественных данных.
3. Выявление эффектов, сходства и различия групп.
4. Описание величины изучаемого эффекта.
В аналитических исследованиях могут решаться все типы задач, в описательных исследованиях – только задачи 1 и/или 2.
Задача 1. Описание центральной тенденции и вариабельности количественных данных.
В качестве центральной тенденции используются среднее арифметическое (М) – при нормальном (Гауссовском) распределении фактических данных, или медиана (Ме) – величина, соответствующая середине вариационного ряда изучаемого признака. При нормальном распределении М и Ме совпадают.
Мерой вариабельности при нормальном распределении признака выступает среднее квадратическое отклонение - сигма (σ), или стандартное отклонения (все термины означают одно и то же). Для любого распределения
(нормального или нет) применяют нижний и верхний квартили, или межквартильный размах – значения признака, отсекающие по 25% объектов выборки с левой и правой стороны распределения количественного признака.
Дополнительный показатель – вариационный размах – разница между максимальным и минимальным значением.
Задача: Как описать индекс массы тела (масса/рост2) среди призывников? Обследовано 200 человек, характер распределения показателя неизвестен. Выберите меры
для оценки центральной тенденции и вариабельности.
Задача 2. Описание частоты явления для качественных данных.
При решении данной задачи рассчитывают число случаев с тем или
иным значением качественного признака (абсолютные частоты), а затем их
количество, приходящееся на 100 (1000, 10000 и т.п.) наблюдений – относительные частоты.
При изучении заболеваемости выделяют 2 группы относительных показателей: интенсивные и экстенсивные. Интенсивные показатели заболеваемости характеризуют частоту случаев (вновь выявленных случаев или всех
зарегистрированных случаев) данной болезни в какой-то группе населения за
определенный период времени или в данный момент на конкретной территории. Интенсивный показатель рассчитывают по формуле:
ИП = (количество случаев / численность населения)* 1000.
В данном случае ИП характеризует частоту случаев заболеваний, приходящихся на 1000 человек.
Экстенсивные показатели оценивают величину какой-либо структурной
части по отношению ко всему явлению, например, какую долю составляют
болезни органов дыхания от всей совокупности зарегистрированных заболеваний. Экстенсивный показатель рассчитывается по формуле:
ЭП = (часть явления/явление)*100.
ЭП показатель обычно измеряется в процентах.
Задача: В городе А с численностью населения 50 000 человек зарегистрировано 50
больных, у 20 из них болезнь выявлена впервые в отчетном году. Рассчитайте интенсивный и экстенсивный показатель заболеваемости.
Задача 3. Выявление эффектов, сходства и различия.
При сравнении результатов, полученных в 2 или более группах, изменений, произошедших в 1 группе в течение какого-либо времени в силу естественных причин или направленных воздействий, приходится решать, являются ли существенными эти различия. Во всех выборочных исследованиях
изучают часть популяции (генеральной совокупности), поэтому следует ожидать появления некоторых различий между выборкой и реальной популяцией. Также в результат могут вмешиваться другие неучтенные исследователем
факторы и искажать его. Это называется ошибкой выборки. Поэтому прогностические оценки в выборочных исследованиях должны сопровождаться
оценкой их достоверности.
Эта задача может быть решена 2 способами:
1) Проверкой нулевой статистической гипотезы об отсутствии различий групп;
2) Построением доверительных интервалов для параметров центральной тенденции распределения либо для показателя величины эффекта
Проверка гипотез при сравнении групп осуществляется при использовании особых статистических критериев. Выбор их может быть сделан после
ответа на несколько вопросов:
1. Какие признаки сравниваются в группах – количественные или качественные (порядковые, номинальные, бинарные)?
2. В случае количественных признаков: каковы распределения этих
признаков в каждой из сравниваемых групп – нормальные или нет? Равны ли
дисперсии в группах?
3. Являются ли выборки независимыми (несвязанными) или зависимыми (связанными)?
4. Какое количество групп сравнивается – 2, 3 или более?
Наиболее распространенные статистические критерии,
используемые для сравнения групп
Тип признака
Количественный
признак, нормальное
распределение
Количественный
признак, любое распределение
Качественный порядковый признак
Качественный номинальный признак
Бинарный признак
2 независимые группы
t-критерий Стьюдента для независимых
групп
Критерий МаннаУитни
2 зависимые групп
Критерий МаннаУитни (при числе
значений признака
более 5), χ2
2
χ (хи-квадрат)
Критерий Вилкоксона
Критерий Кокрана
Точный критерий
Фишера
Критерий МакНемара
t-критерий Стьюдента для зависимых групп
Критерий Вилкоксона
3 независимые группы и более
ANOVA по Пирсону
ANOVA по КрускалуУоллису
ANOVA по КрускалуУоллису (при числе
значений признака
более 5), χ2
χ2
χ2
В процессе проверки гипотезы вычисляют значение статистического
критерия и уровень статистической значимости р, который сравнивают с заданным заранее пороговым уровнем значимости ро (в медико-биологических
исследования обычно ро принимается равной 0,05). При р< ро нулевая гипотеза (об отсутствии различий групп) отклоняется и принимается альтернативная гипотеза – о том, что различия групп существуют и являются статистически значимыми. Подчеркнем, что, если по результатам теста нулевая
гипотеза не отклоняется, это не означает, что различия групп отсутствуют.
Причин может быть 2: недостаточные объемы выборок и/или отсутствие эффекта.
Задача: Оцените результаты исследования умственной работоспособности. Какой
статистический критерий следует использовать для оценки достоверности различий?
Динамика работоспособности учащихся на протяжении недели
по результатам корректурного теста, М±m
Показатель
Вторник
Пятница
Число просмотренных знаков
246,1±13,7
264,1±10,8
Число ошибок на 500 знаков
9,3±2,8
6,9±1,4*
* - результат достоверно отличается от предыдущего исследования (р=0,015)
Построение доверительных интервалов (ДИ) – второй способ выявления
эффектов (различий групп, связей признаков). ДИ – интервал значений признака, рассчитанный для какого-либо параметра распределения или показателя величины эффекта и с определенной вероятностью (например, 95% 95%ДИ) включающий истинное значение этого параметра/показателя. Ширина ДИ зависит от объема выборки и вариабельности в ней. Чем шире ДИ,
тем менее точной является выборочная оценка. При увеличении числа
наблюдений (объектов исследования) ДИ сужается и точность оценки увеличивается. Применение ДИ основано на простых правилах:
- если 2 ДИ для параметров (например, для средних или медиан) 2 групп
пересекаются, то статистически значимых различий этих групп нет;
- если ДИ для коэффициента корреляции включает 0, то статистической
связи нет;
- если ДИ для относительного риска или отношения шансов включает 1,
то статистически значимого эффекта нет.
Задача: Оцените достоверность результатов. Относительный риск смерти мужчин от
сердечно-сосудистых заболеваний в зависимости от статуса курения (ОР, 95%ДИ):
не курят
– 1,0
курят нерегулярно – 1,30 (0,43 – 3,99)
курят регулярно
– 2,38 (1,34 – 4,24)
Задача 4. Описание величины изучаемого эффекта. Для разных типов
исследований в качестве меры эффекта воздействия (фактора риска, профилактического или лечебного вмешательства) используют абсолютный и относительный риск, отношение шансов и ряд других.
4.1.Исследование прогноза заболевания
Исход+
П
В
наблюдение
ИсходИсследование прогноза
Прогноз заболевания изучается в продольном когортном исследовании.
Он оценивается по наступлению изучаемого исхода болезни (потеря трудоспособности, снижение качества жизни, смерть…).
Три способа выражения исхода (на примере наступления смерти):
- % выживших к определенному моменту времени
- Медиана выживаемости – период времени, к которому у 50% исследуемых пациентов наступил исход
- Кривая выживаемости, изображающая в каждый конкретный момент
времени долю (%) исследуемой выборки, у которой исход еще не наступил.
Кривая выживаемости показывает, как с течением времени может измениться риск. Прогноз заболевания может изучаться и в группах сравнения, которые подвергаются определенным вмешательствам.
Задача: Сравните медиану и кривые выживаемости больных СПИДом. При какой
стадии вероятность смерти наиболее высокая?
4.2. Когортное исследование
З+
ФР+
ЗП
В
наблюдение
ФР-
З+
З-
Когортное (проспективное)
Группировка результатов в 4-польной таблице для оценки риска заболеваний
Группы сравнения
Воздействие Есть (основная гр.) – ФР+
фактора
Нет (контрольная гр.) – ФР-
Неблагоприятный исход
Есть – З+
Нет – Зa
c
b
d
Частота случаев
(первичная заболеваемость)
a*100/(a+b)
c*100/(c+d)
Ключевые показатели для оценки эффекта воздействия
Показатель
Относительный риск (ОР) – отношение частоты случаев (заболеваний) в основной группе к таковой в контрольной
Атрибутивный (добавочный риск) (АР)– разница в показателях
заболеваемости основной и контрольной группе, характеризует
дополнительное количество случаев, связанных с воздействием
фактора риска
Этиологическая доля (ЭД) – указывает удельный вес случаев
заболевания от изучаемого фактора риска в общем количестве
больных основной группы
Отношение шансов (ОШ) – показывает, во сколько раз шанс
заболеть в основной группе больше шанса заболеть в контрольной группе
Добавочный популяционный риск (ДПР) – дает оценку риска
возникновения предполагаемого исхода (болезни) при воздействии изучаемого фактора не на выборку, а на популяцию (заб
– заболеваемость в популяции)
Методика расчета
ОР = (а/[a+b]) / (c/[c+d])
АР=(а/[a+b]) - (c/[c+d])
ЭД= АР/ (a/[a+b])
ОШ = (a*b)/(c*d)
ДПР= (АР/заб)*100%
Задача: Оцените заболеваемость артериальной гипертонии (АГ) в группах сравнения, риск развития АГ у пациенток с гиперхолестеринемией (ХС+).
Таблица. Число новых случаев артериальной гипертонии в городе М. среди женщин
20-69 лет при наличии или отсутствии у них гиперхолестеринемии в 2000-2007гг
Группы сравнения
Новые случаи АГ
Всего
есть
нет
Основная группа – ХС+
64
79
143
Контрольная группа - ХС219
815
1034
Всего
283
894
1177
Показатели, рассчитанные на основе данных когортного исследования
Показатели
Группы сравнения
Основная группа – ХС+
Контрольная группа - ХСa*100/(a+b) =
c*100/(c+d)=
Частота случаев (пер64*100/(64+79)=44,8%
219*100/(219+815)=21,2%
вичная заболеваемость)
АР=(а/[a+b]) / (c/[c+d]) = 44,8/21,2 = 2,1
Относительный риск
ОР = (а/[a+b]) - (c/[c+d]) = 44,8-21,2 = 23,6%
Атрибутивный риск
ЭД= АР*100/ (a/[a+b]) = 23,6*100/44,8 = 52,7%
Этиологическая доля
ОШ = (a*b)/(c*d) = (64*815)/(79*219) = 3,01
Отношение шансов
4.3.Исследование «Случай – контроль» или поперечное исследование
ФР+
З+
ФР-
П
В
З-
ФР+
ФР-
Случай-контроль (ретроспективное)
З+ ФР+
П
З+ ФР-
В
З- ФР+
Поперечное
(одномоментное)
З- ФР-
Группировка результатов в 4-польной таблице для оценки шансов
Группы сравнения
Больные изучаемой болезнью (случай) / З+
Здоровые или больные
другой болезнью (контроль) / ЗВсего
Фактор риска в анамнезе
Есть / ФР+
Нет / ФРa
b
Всего
a+b
Частота воздействия
фактора риска
a/(a+b)
c/(c+d)
c
d
c+d
а+с
b+d
N= a+b+c+d
Ключевые показатели для оценки эффекта воздействия
Показатель
Отношение шансов (ОШ) – показывает, во сколько раз шанс
встретить фактор риска в основной группе больше, чем в контрольной группе
Этиологическая доля (ЭД) – указывает удельный вес случаев
воздействия искомого фактора риска, приводящего к изучаемой болезни
Методика расчета
ОШ = (a*d)/(b*c)
ЭД= (ОШ-1)*100%/ОШ
Другие критерии эффекта воздействия для когортного исследования, исследования «случай-контроль» и одномоментного исследования:
- Наличие зависимости «доза-эффект» - увеличение количество вредных эффектов при усилении воздействия фактора. Эту задачу можно решить при
выполнение корреляционно-регрессионного и дисперсионного анализа.
- Снижение количества неблагоприятных эффектов при прекращении действия фактора риска.
Задача: Среди больных ревматоидным артритом и в контрольной группе здоровых
лиц изучали заболеваемость ангинами в анамнезе по данным историй болезни в поликлинике. Оцените подверженность групп сравнения воздействию фактора риска и
рассчитайте отношение шансов.
Таблица. Подверженность частым ангинам
в группах больных ревматоидным артритом и здоровых лиц
Группы сравнения
Частые ангины (≥2 раз в год)
Всего
есть
нет
Больные ревматоидным артритом
54
30
84
Здоровые
1314
5904
7218
Всего
1368
5934
7302
Примечание. Различие в частоте встречаемости частых ангин у больных ревматоидным артритом и здоровых лиц достоверно (р<0,05)
4.4.Оценка эффективности лечения
(положительных или отрицательных исходов)
И+
Вм+
ИП
вмешательство
В
Вм-
И+
И-
Экспериментальное
Группировка результатов в 4-польной таблице для оценки исходов
Группы сравнения
Основная группа (ог) – препарат / Вм+
Контрольная группа (кг) –
плацебо или «стандарт» / ВмВсего
Результат лечения
Исход есть Исхода нет –
– И+
Иa
b
c
d
a+c
b+d
Всего
Частота исходов - ЧИ
a+b
ЧИог = a/(a+b)
c+d
ЧИкг = с/(c+d)
Ключевые показатели для оценки эффекта воздействия
Показатель
Относительный риск (ОР) – отношение риска в исследуемой группе к
таковому в контрольной
Снижение абсолютного риска (САР) – разница в частоте случаев в 2
сравниваемых группах
Снижение относительного риска (СОР) – процентное отношение САР к
риску случая в контрольной группе
Количество больных, которым необходимо лечение – мера пользы, показывает абсолютное количество пациентов, которых нужно лечить, чтобы
предотвратить развитие 1 неблагоприятного исход
Методика расчета
ЧИкг / ЧИог
ЧИкг - ЧИог
(ЧИкг–ЧИог)
ЧИкг
1 / САР
Задача: При проведении РКИ эффективности препарата арбидол среди детей в возрасте от 2 до 6 лет было сформировано 2 группы: основная группа численностью 143
человека и контрольная – 151 человек. В основной группе дети получали арбидол в
дозе 0,05г в течение 6 дней, в контрольной группе - плацебо. Затем в течение 3 месяцев наблюдали за появлением случаев гриппа и ОРВИ, а также их осложнениями. В
опытной группе заболели 66 человек, при этом осложнения были у 7 из них. В контрольной группе заболели 95 человек, в том числе 20 – с осложнениями. Оцените результаты.
Заболеваемость гриппом и ОРВИ в группах сравнения
Группы сравнения
Результат профилактики
Заболели
Не заболели
Основная группа / арбидол
66
77
Контрольная группа / плацебо
95
56
Всего
143
151
Показатели, рассчитанные на основе данных РКИ
Группы сравнения
Осн.группа / арбидол Контр.группа / плацебо
ЧИог = a/(a+b) =
ЧИкг = с/(c+d) =
Частота исхода
66/143 = 0,46
95/151 = 0,63
ОР = ЧИкг / ЧИог = 0,63/0,46 = 1,37
Относительный риск
САР = ЧИкг – Чиог = 0,63-0,46 = 0,17
Снижение абсолютного риска
СОР = (ЧИкг–ЧИог)/ ЧИкг = 0,17/0,63 = 0,27
Снижение относительного риска
Кол-во б-х на 1исход = 1 / САР = 1/0,17 = 5,9
Кол-во больных, которых нужно
лечить для предупреждения 1случ.
Показатель
4.5.Исследование диагностического теста
тест+
З+
тест-
ЗОценка метода
диагностики
диагностического теста)
тест+
тест-
Группировка результатов в 4-польной таблице
для оценки точности диагностического теста
Результат теста
Положительный / тест+
Отрицательный / тестВсего
Исследуемое заболевание
Есть / З+
Нет / Зa – истинно положительный
b – ложно положительный
c – ложно отрицательный
d – истинно отрицательный
Больные (a+c)
Здоровые (b+d)
Ключевые показатели для оценки эффекта
Показатель
1. Точность теста – тест определяет заболевание, когда оно есть, и не
определяет заболевание, когда его нет
1.1. Чувствительность – способность теста определять наличие заболевания у больного
1.2. Специфичность – способность теста определять отсутствие заболевания у здорового
2. Воспроизводимость – получение одинакового результата теста у разных
наблюдателей (в разных лабораториях)
Методика
расчета
a / (a+c)
d / (b+d)
Каппастатистика
Задача: Для оценки теста А, предназначенного для выявления заболевания Б, было
проведено экспериментальное исследование среди пациентов стационара. В ходе исследования тест был применен у 200 человек с подозрением на заболевание Б и у 300
человек с отсутствием данного заболевания. Было получено 175 положительных результатов в 1-й группе и 15 – во 2-й. Рассчитайте чувствительность и специфичность
этого теста.
Задача: Для выявления заболевания используют 2 теста: у теста А чувствительность
– 88%, специфичность – 95%; у теста В чувствительность 99% и специфичность
89%. Определите тест, который лучше походит для проведения скрининга с целью
выявления заболевания и его последующего лечения на ранних стадиях.
Представление результатов исследования в таблицах и диаграммах
Представление результатов исследования предусматривает целенаправленные и разнообразные действия по их оформлению, т.е. «организацию
данных». Элементами организации данных являются таблицы и диаграммы.
С их помощью создается возможность наглядно представить фактические
данные в систематизированном виде.
Таблица – перечень данных, приведенных в определенную систему и
разнесенных по графам (колонкам и строкам).
Диаграмма – графическое представление фактических данных. Для
разных видов фактических данных используют следующие диаграммы:
- линейная диаграмма или график – для отображения динамики процесса
или явления (например, изменения заболеваемости на протяжении нескольких лет);
- столбиковая диаграмма – для представления частоты явления в нескольких группах; данные представляются в виде параллельных столбиков,
высота которых пропорциональна частоте явления;
- гистограмма или полигон частот – иллюстрирует распределение величин;
- составная столбиковая или секторная диаграмма – для демонстрации
соотношения частей целого или структуры явления;
- картограмма – это географическая карта, на которой при помощи графических символов или раскраски отображают различия по какому-либо показателю.
Более подробно о правилах построения таблиц и диаграмм смотри в
публикации: Соловова М.Н. Таблицы и иллюстративный материал // Профилактическая медицина. 2011. № 4. С.37-44.
Дополнительная литература – для тех, кто выполняет исследовательскую работу и проводит статистическую обработку материалов
1.
Реброва О.Ю. Статистический анализ медицинских данных.
Применение пакета прикладных программ STATISTICA. М.: МедиаСфера,
2006. 312 с.
Download