Статьи по теме 'медицинская статистика'

Нашел в блоге медицинского статистика Сошникова видеоуроки Мичиганского университета о том как работать в программе SPSS.

Представлены практически все аспекты работы с SPSS – формирование таблиц с данными, сортировка, выборка, трансформация данных, работа с разными окнами SPSS, параметрические и непараметрические тесты, линейная и логистическая регрессии, кластерный и факторный анализы, анализ выживаемости (однофакторный Каплана-Майера и многофакторный Кокса), характеристическая кривая. Есть раздел по контролю качества данных на предмет выпадающих значений (которые подчас обусловлены неправильным вводом данных).

Немаловажно для начинающих, что к каждому видеоуроку можно скачать данные в формате SPSS, на основании которых он построен, и сравнить полученный результат с приведенным в ролике.

Все видеоуроки на английском.

Читать дальше »

В NEJM опубликована статья Solomon и соавт. с данными вторичного анализа исследования TREAT (в которое вошли 4038 пациентов с диабетической нефропатией, не требующие диализа). Отвлекаясь от содержания самой статьи, следует отметить что все публикации NEJM для жителей России доступны в полнотекстовом бесплатном режиме.

Авторы выделили группу больных с недостаточным ответом на терапию дарбэпоэтином (которая определялась как увеличение уровня гемоглобина менее 2% в течение первого месяца лечения дарбэпоэтином) и сравнили их начальные показатели и частоту исходов с другими группами пациентов с большим ростом уровня гемоглобина. Выяснилось, что у пациентов с недостаточным ответом на терапию в течении пятилетнего наблюдения чаще развивались кардио-васкулярные осложнения и была выше летальность. Эти же пациенты в целом имели более низкий гемоглобин, и им требовались более высокие дозы дарбэпоэтина для его достижения как в ранний период, так и после 12 недели терапии. Тогда как в группе с хорошим ответом на дарбопоэтин гемоглобин был в целом выше, а дозы дарбэпоэтина ниже. На этом основании авторы задаются вопросом в какой мере собственно уровень гемоглобина может быть ответственен за увеличение частоты осложнений при попытке его нормализации у больных с хронической болезнь почек (ХБП). Ответ на этот вопрос могут дать только дальнейшие исследования, и в настоящее время по-прежнему актуальной остается рекомендация по оптимальному уровню гемоглобина у больных с ХБП 110-120 г/л.

Есть несколько вопросов, которые в статье Solomon с соавторами не были освещены или в достаточной мере обсуждены. Приведенные ниже соображения ни в коем случае не умаляют важности статьи, а скорее являются примером критической оценки публикации в медицинской литературе.

(more…)

Читать дальше »

К числу наиболее важных показателей, которые характеризуют качество оказания медицинской помощи, относятся летальность и выживаемость, краткая сведения о расчете и интерпретации которых проведены в данной статье.

Летальность отражает долю умерших больных. Существует два способа расчета летальности. Первый способ – определение процента умерших от общего числа пролеченных пациентов. Процент умерших легко рассчитать, однако это приводит к занижению реальных показателей летальности у больных с малыми сроками наблюдения и высокой смертностью, к которым относятся и больные на ЗПТ. Другим способом выражения летальности является определение количества умерших больных в пересчете на суммарный срок их наблюдения. В этом случае он выражается в количестве умерших больных на 100 или 1000 пациенто-лет наблюдения, и этот показатель наиболее точно отражает реальную картину летальности у больных на ЗПТ.

Различия в расчете летальности этими способами демонстрирует следующий пример (рис. 1). На рис. 1а отражена длительность наблюдения 10 больных, лечившихся программным гемодиализом в 2003 г. Из них в течение года умерли 3 человека, и, таким образом, летальность составила 30,0% (100*3/10=30%). Однако необходимо учитывать, что часть пациентов на диализе находились под наблюдением в течение неполного года. Так, пациент 1 начал лечение начале лечение ГД 2/2/2003 и находится на ГД по сегодняшний день; т.о. срок его наблюдения в 2003 г. составил 11,1 мес (332 дня). Пациент 2 начал лечение ГД в 1998 г. и продолжает его до сих пор, т.о. в 2003 г. он наблюдался в течение 12 мес. Пациент 3 начал лечение ГД в 16/3/2003 и умер в 25/11/2003; т.о. срок его наблюдения в 2003 г. составил 8,5 мес (254 дня). Пациент 4 начал лечение ГД в 1999 г., а 30/4/2003 ему была выполнена трансплантация почки; т.о. срок его наблюдения в 2003 г. составил 4 мес (119 дней), и т.д. Суммарный срок наблюдения больных, данные о которых отражены на рис. 1а, составил 2641 день, или 7,2 года. При этом было зарегистрировано 3 смерти, т.о. в пересчете на 100 пациенто-лет летальность составила 41,7/100 пациенто-лет (100*3/7,2=41,7).

Обратимся теперь к рис. 1б, на котором отражена длительность наблюдения еще 10 больных, восемь из которых имеют такую же историю лечения, а двое (выделенные жирным шрифтом на рис. 1б) – более короткие сроки наблюдения. Суммарный срок наблюдения в данном случае составит 6,4 года, а число умерших (3 пациента) останется таким же. Тогда летальность в процентах останется прежней – 30,0%, а летальность в пересчете на 100 пациенто-лет весьма существенно изменится и составит 46,9/100 пациенто-лет (100*3/6,4=46,9).

Летальность больных на программном гемодиализе в первой группе больных

Летальность больных на программном гемодиализе во второй группе больных

Рис. 1. Летальность больных на программном гемодиализе в двух группах (пояснения см. в тексте)

Применительно к Российскому регистру ЗПТ различия между этими способами расчета летальности не менее существенны. В группу Российского регистра были представлены индивидуальные данные по 5755 больным, находившимся в течение 2003 года на программном гемодиализе. Суммарный срок их наблюдения в 2003 г. составил 4822,7 года. За время нахождения этих больных на программном гемодиализе умерли 468 пациента. Соответственно, летальность в процентах составила 8,1% (100*468/5755=8,1%), тогда как летальность в пересчете на 100 пациенто-лет составила 9,7/100 пациенто-лет.

Необходимо еще раз подчеркнуть, что показатель летальности в пересчете на 100 пациенто-лет, несмотря на несколько более сложную методику расчета, адекватно отражает реальную картину летальности больных на ЗПТ. Поэтому в данном отчете все показатели летальности приведены именно в пересчете на 100 пациенто-лет.

Выживаемость, в отличие от летальности, учитывает не только умерших больных, но и историю лечения всех пациентов. Выживаемость – это оценка вероятности того, что больной останется живым к конкретному моменту после начала лечения. При анализе выживаемости больные разделяются на две категории: первая – больные с летальным исходом; и вторая – у которых летальный исход не наступил (эти пациенты называются цензурированными) и либо пациенты продолжали лечение на момент окончания наблюдения, либо им была выполнена трансплантация почки, либо они выбыли из-под наблюдения.

Наиболее часто выживаемость оценивается по методу Каплана-Майера, графическое представление которого приведено на рис. 2. Количество больных на начало наблюдения принимается за 100%. Каждая «ступень» на кривой выживаемости отражает смерть пациента, и после каждой смерти процент выживших больных на графике уменьшается. Знаками «плюс» на рис. 2 отмечены цензурированные больные. Цензурированные больные несколько затрудняют восприятие кривых выживаемости, и поэтому обычно не отражаются на графиках. В данном отчете цензурированные больные на кривых Каплана-Майера также не отмечены. Выживаемость зависит как от количества умерших в данный момент больных, так и от общего количества пациентов, находящихся в данный момент времени под наблюдением. Поэтому выживаемость может быть рассчитана на любой момент времени. Так, однолетняя выживаемость больных на рис. 2 составила 91,0%, а двухлетняя – 87,8%.

Кривая выживаемости Каплана-Майера

Рис. 2. Кривая выживаемости Каплана-Майера (подробнее см. в тексте)

Следует сказать, что и летальность, и выживаемость являются вероятностными показателями. Т.е. приводимое для группы больных 19-44 лет значение однолетней выживаемости 87,0 является наиболее вероятным, тогда как истинное значение однолетней выживаемости с вероятностью 95% могло составить от 85,4 до 88,6%. Этот показатель назыавется 95% доверительным интервалом (95% ДИ), размах которого в значительной мере зависит от количества больных, включенных в анализ. Границы 95% ДИ позволяют судить о статистической значимости различий между отдельными группами больных. Так, если 95% ДИ для двух групп больных не пересекаются (например, 95% ДИ 85,2-88,4 для однолетней выживаемости больных с хроническим гломерулонефритом  и 89,3-94,7 – при поликистозе почек), то различия являются статистически значимыми при р<0,05.


* Приводится с изменениями, впервые опубликовано как приложение к отчету о состоянии ЗПТ (Бикбов Б.Т., Томилина Н.А. О состоянии заместительной терапии больных с хронической почечной недостаточностью в Российской Федерации в 1998-2003 г. Нефрология и диализ 2005; 7: 204-275)

Читать дальше »

В медицинской литературе широко используются понятия медиана и интерквартильный размах, а в представлении данных – ящичковые диаграммы. Ниже мы приводим разъяснения по этому поводу.

В медицинских публикациях при описании данных чаще всего можно встретить представление числовых значений (например, артериального давления, уровня гемоглобина, возраста и т.д.) в виде среднего и стандартного отклонения, что отражается как М±σ (например, 136±12). В такой записи «М» означает среднее, а σ – стандартное отклонение. Это описание данных возможно только для признаков, распределение которых носит нормальный характер (рис 1а) – чаще всего это касается роста, веса, возраста и проч.

Пример нормального распределения

Рис. 1а. Пример нормального распределения (среднее 95,0, стандартное отклонение 20,0 г/л). Серыми столбцами показано распределение уровня гемоглобина. Колоколообразная кривая над столбцами соответствует кривой нормального распределения.

При нормальном распределении все значения признака можно расположить в форме симметричной колоколообразной кривой (рис. 1а). При этом в пределах одного стандартного отклонения от среднего находится 68% всех значений признака (для примера на рисунке 1а в интервале 75-115 находится 68% всех значений), в пределах двух стандартных отклонений от среднего находится 95% всех значений признака (для примера на рисунке 1а это интервал 55-135 г/л), и в пределах трех стандартных отклонений находится 99,5% всех значений признака.

Однако в медицине встречаются и данные, распределение которых отлично от нормального. В качестве характерного примера можно привести длительность наблюдения пациентов. На начальных сроках наблюдения пациентов всегда больше, а затем их количество уменьшается вследствие потери из наблюдения, смерти, и других причин. Такое распределение показано на рис 2а. Можно видеть, что кривая нормального распределения абсолютно не соответствует реальной картине, отраженной серыми столбцами.

Пример распределения, отличного от нормального

Рис. 2а. Пример распределения, отличного от нормального: длительность наблюдения 4389 пациентов.

Для таких распределений понятия среднее и стандартное отклонение утрачивают смысл, поскольку они дают неправильное описание распредения переменной. Так, для примера на рисунке 2а среднее составляет 3,5 г., а стандартное отклонение 3,2 года. Получается, что 95% пациентов должны иметь срок наблюдения от «минус» 2,9 г. до 9,9 г. Вполне ясно, что отрицательных сроков наблюдения не бывает. Даже в интервал одного стандартного отклонения, в котором должно находится 68% всех значений, явно попадает около 80% всех наблюдений. Отличительной чертой распределения, отличного от нормального, является несимметричное по отношению к среднему значению распределение признака («скошенность») либо наличие явно выбивающихся из общей картины значений.

Распределения, отличные от нормального, принято описывать при помощи медианы и интерквартильного размаха. Медиана – это значение признака, которое делит весь ряд значений пополам, то есть половина значений признака меньше медианы, и половина  – больше ее. Интерквартильный размах – это интервал между 25 и 75 процентилями, то есть четверть всех значений признака будут меньше 25 процентили, а четверть – больше 75 процентили. Таким образом, интерквартильный размах содержит «центральные» 50% значений признака.

Для длительности наблюдения, показанного на рисунке 2а, медиана составляет 2,5 года и интерквартильный размах 1,0 – 5,1 лет. Это означает, что половина всех больных находилась на лечении гемодиализом 2,5 года. Четверть всех больных – менее одного года, и четверть всех больных – более 5,1 года. Это описание правильно характеризует реальное распределение признака.

В принципе, понятие медианы и интерквартильного размаха вполне применимо и к нормальному распределению. В этом случае медиана будет равна среднему, а в пределах интерквартильного размаха будет находиться чуть меньше значений (50% всех значений), чем в пределах одного стандартного отклонения (68% всех значений).

Для распределений, отличных от нормального, не подходит и графическое отображение данных, принятое для нормального распределения. Среди нескольких вариантов, подходящих для визуального представления данных любого распределения, на наш взгляд, наиболее удобны ящичковые диаграммы.

На рисунке 3а показана ящичковая диаграмма. Ящичек закрашен серым цветом. Его нижняя граница является 25 процентилью, верхняя – 75 процентилью. Горизонтальная черная черта, пересекающая ящичек – это медиана. Как видим, медиана делит ящичек на две неравные части – значит в распределение, отображенное на рисунке 3а, носит неправильный характер. От ящичка отходят «усы». В примере на рисунке 3а нижний «ус» отражает интервал, в котором находятся 25% самых низких значений – от 9 до 17. Следует обратить внимание, что над верхним «усом» имеются две точки – выбросы (так обозначаются значения признака, сильно выделяющиеся из его общей совокупности). Поэтому верхний «ус» отражает интервал, в котором находятся 22,2% (25% минус два значения, которые составляют 2,8%). Таким образом, если выбросов нет, то «ус» отражает интервал, в котором находятся 25% всех наблюдений. Если же выбросы имеются, то «ус» отражает интервал, в котором находятся значения от квартили до величины, которая меньше, чем полторы длины ящичка (в примере на рис. 3а это интервал 27-42 года). На рисунке 3а также видно, что «усы» имеют разную длину. Это также говорит о том, что распределение возраста к началу гемодиализа для данной патологии носит ненормальный характер.

Следует отметить, что значения среднего и стандандартного отклонения чувствительны к выбросам, и могут значительно меняться при наличии экстремальных значений в ряду данных. Описание данных при помощи медианы и интерквартильного размаха позволяет избежать влияния выбросов.

Распределение возраста больных с врожденной и наследственной патологией почек, впервые начавших лечение гемодиализом

Рис. 3а. Распределение возраста больных с врожденной и наследственной патологией почек, впервые начавших лечение гемодиализом в 2001 г.

В качестве еще одной демонстрации преимущества ящичковой диаграммы, медианы и интерквартильного размаха при представлении данных рассмотрим распределение диастолического артериального давления у больных, находившихся на гемодиализе к декабрю 2001 года (рисунок 4а).

Распределение значений диастолического артериального давления у больных на гемодиализе

Рис. 4а. Распределение значений диастолического артериального давления у больных на гемодиализе к декабрю 2001 года (1274 наблюдения). Цифры под рисунком обозначают: 1 – ящичковая диаграмма, 2 – среднее±стандартное отклонение, 3 – среднее ± два стандартных отклонения.

Ящичковая диаграмма на рисунке 4а имеет одинаковые «усы», однако медиана совпадает с 25-й процентилью, и в области как минимальных, так и максимальных значений имеются выбросы. Это говорит о том, что распределение носит ненормальный характер. Факт совпадения медианы и 25-й процентили объясняется довольно просто. Диастолическое давление ниже 75 мм. рт. ст. имеют 19,1% пациентов, а давление 80 мм.рт.ст. – 35,2% больных. Таким образом, и медиана и 25-ая процентриль равны 80 мм.рт.ст.

На рисунке 4а показаны также графики, используемые для представления данных нормального распределения. Один из них демонстрирует среднее значение АД для той же группы больных и стандартное отклонение от среднего (обозначено цифрой 2), а другой – среднее и два стандартных отклонения (под цифрой 3). Среднее составляет 84 мм. рт. ст, стандартное отклонение – 12 мм.рт.ст. Хотя среднее отличается от медианы всего на 4 мм.рт.ст., для популяционных исследований это является весьма существенной разницей, которая может приводить к неправильной интерпретации результатов. Кроме того, хотя границы стандартных отклонений и близки к реально имеющимся данным, они никак не отражают имеющуюся неоднородность распределения значений артериального давления.

Учитывая, что ящичковые диаграммы хорошо отражают как нормальное, так и ненормальное распределения, выявляют крайние значения признака и более информативны в представлении частоты встречаемости отдельных значений, они широко используются при отображении числовых признаков.


* Приводится с изменениями, впервые опубликовано как приложение к отчету о состоянии ЗПТ (Бикбов Б.Т., Томилина Н.А. О состоянии заместительной терапии больных с хронической почечной недостаточностью в Российской Федерации в 2001 г. Нефрология и диализ 2004; 6: 4-42)

Читать дальше »