Автор работы: Пользователь скрыл имя, 16 Февраля 2012 в 18:23, реферат
Термин «доказательная медицина» (ДМ) был предложен учёными университета Мак-Мастера г. Торонто (Канада) в 1990 г . ДМ – это технология сбора, обобщения и анализа медицинской информации, которая позволяет формулировать научно обоснованные решения в медицине. Т.е. ДМ – эпо последовательное и сознательное применение в ведении конкретных пациентов только тех вмешательств, эффективностьк которых доказана в доброкачественных исследованиях.
Полнейшая аналогия наблюдается и при проверке гипотез о равенстве средних количественных признаков более чем 2 групп. Например, сравниваются средние значения 4-х групп: 1 – здоровые (контроль), 2 – начальная стадия заболевания, 3 – средняя тяжесть заболевания, 4 – очень тяжёлая стадия заболевания. Проверка корректности использования классического однофакторного дисперсионного анализа (ANOVA) показала отсутствие нормальности в некоторых группах, а также обнаружила неравенство дисперсий в этих группах. В силу этого для сравнения групп был использован непараметрический дисперсионный анализ Краскела-Валлиса и медианный критерий. Результат сравнения привёл к отклонению нулевой гипотезы. Однако вполне возможно, что имеется равенство для соседних групп. Например, равенство между группами здоровые и начальная стадия заболевания, а также между группой средней тяжести и группой очень тяжёлой стадии. Такую гипотезу можно записать в следующем виде: H0: μ1= μ2≠ μ3= μ4. Поскольку мы имеем 4 группы, то число парных сравнений будет равно 4*(4-1)/2=6. Это будут пары 1-2; 1-3; 1-4; 2-3; 2-4 и 3-4. Попарные сравнения могут показать равенство для пар 1-2 и 3-4, и неравенство для всех остальных пар. В этом случае мы наблюдаем качественное изменение при переходе от группы начальной стадии заболевания к группе средней тяжести заболевания. В таком случае вполне возможно объединение групп 1 и 2, а также групп 3 и 4. Таким образом, мы опять видим, что взаимосвязь между анализируемым признаком, и группирующим признаком, не «размазана» равномерно по всем 4 группам, а сконцентрирована на переходе между двумя соседними группами. Такую детализацию, препарирование обнаруженных взаимосвязей можно провести практически во всех многомерных методах.
Специфика многомерных методов статистики заключается также и в том, что эти методы позволяют перейти от описания парных связей, к оценке интенсивности множественных связей. Например, при исследовании объектов описываемых только количественными признаками, это может быть множественная регрессия. В этом методе устанавливается форма связи между одной результирующей, зависимой переменной, например, систолическим артериальным давлением (САД), и набором, так называемых, независимых переменных, предикторов. Например, вес, рост, индекс Кетле, концентрация липидов и т.д. Для такого уравнения связи возможно проранжировать предикторы по силе их влияния на зависимую переменную САД. Можно также оценить силу множественной связи зависимой переменной и набором предикторов, которая изменяется в интервале от 0 до 1. При этом возможно также выявить аномальные наблюдения, значительно искажающие уравнение связи, и т.д. Все это в итоге приводит к повышению точности уравнения связи и концентрации извлекаемой информации. Однако для реализации этих возможностей, и повышения качества и надёжности получаемой информации, опять же требуются знания профессионального биостатистика.
Не
менее интересна в этом случае
и задача конструирования новых,
более информативных
Другая
не менее важная и интересная задача,
также имеющая большую
Нередко исследователю приходится анализировать объекты, для описания которых используются только качественные признаки. Например, пол, семейное положение, образование, заболевание, национальность и т.п. Каждый из таких признаков может иметь от 2 до 5-7 градаций, уровней. И в этом случае несомненный интерес представляет задача выделения однородных групп пациентов. Возможно также и решение задачи регрессии, когда зависимым признаком выступает, например, состояние здоровья, с уровнями 1 – здоров, 2 – болен. В этом случае возможно использование не только 2 уровней, но большего их количества, 3, 4 и т.д. С помощью логистической регрессии можно оценить такую множественную связь, причём в качестве независимых предикторов могут использовать как качественные, так и количественные признаки.
Реализация многомерных методов в силу их специфики обычно поливариантна. Т.е. не имеется одно единственное, уникальное решение искомой задачи. Поэтому для их использования требуется участия в этой работе профессионального биостатистика, поскольку необходимы основательные знания, как в области теории данного метода, так и в области его программной реализации. Например, автор этих строк за последние 10 лет произвёл оценку нескольких тысяч уравнений логистической регрессии. Из которых заказчиками были отобраны как оптимальные и объективно интерпретируемые порядка 200 уравнений.
При
использовании логистической регрессии
также возможно оценить силу такой множественной
связи, так называемый коэффициент конкордации,
который изменяется от 0 (нет связи), до
значений вблизи 1 (очень сильная связь).
Большое значение этот метод имеет для
прогноза исходов лечения, сравнения генетических
профилей здоровых и больных, групп различных
национальностей и т.д. И здесь также имеются
возможности концентрирования полезной
информации. В частности, оценки уравнения
логистической регрессии содержат так
называемые безразмерные коэффициенты
регрессии. Сравнивая по модулю такие
коэффициенты для разных предикторов,
вошедших в уравнение, можно проранжировать
эти признаки, по силе из взаимосвязи с
зависимой качественной переменной. Проиллюстрируем
возможности использования логистической
регрессии реальным примером. Задача заключалась
в сравнении генетических профилей жителей
двух национальностей, проживающих в одном
из регионов России. Зависимым признаком
являлась национальность, которая имела
два значения. Вот как выглядит результат
оценки уравнения логистической регрессии
по одной из реальных задач.
Standard Wald Standardized
Parameter DF Estimate Error Chi-Square Pr > ChiSq Estimate
Intercept 1 -11.9631 6.2186 3.7008 0.0544
VAR2A 1 4.4695 1.8339 5.9397 0.0148 1.1930
VAR7A 1 -1.2625 0.8213 2.3628 0.1243 -0.3847
VAR15A 1 -3.0246 1.5380 3.8676 0.0492 -0.9217
VAR25A 1 3.5180 1.5728 5.0034 0.0253 1.2648
VAR27A 1 -5.6306 2.8238 3.9761 0.0461 -0.9930
VAR30A 1 -6.7985 2.5963 6.8566 0.0088 -1.8755
VAR31A 1 2.3949 1.1484 4.3491 0.0370 1.5963
Percent Concordant= 91.2.
В первом
столбце представленной выше таблицы
приведены краткие (условные) названия
признаков, отобранных алгоритмом в уравнение.
В 3-м столбце этой таблицы приводятся
сами коэффициенты уравнения, а в последнем
столбце таблицы – безразмерные коэффициенты.
Если сравнить модули безразмерных коэффициентов,
то видно, что из 7 предикторов наибольшую
связь с национальностью имеют признаки
VAR30A и
VAR31A, а затем признаки VAR25A и VAR2A. При
этом процент согласия (Percent Concordant) между
фактической национальностью жителя и
предсказанной по уравнению логистической
регрессии составлял 91,2%.
Рассмотрим другой реальный пример использования метода логистической регрессии. В этом исследовании ставилась задача оценить факторы риска, приводящие к летальному исходу при одном конкретном заболевании. Массив данных содержал 45 признаков, из которых 24 признака были качественными, и 21 признак – количественный. Ниже приведены три варианта оценки уравнения логит-регрессии, содержащие отличающиеся наборы предикторов, но достаточно близкие значения процента конкордации.
Вариант 1:
Standard Wald Standardized
Parameter DF Estimate
Error Chi-Square Pr > ChiSq Estimate
Intercept 1 -24.5096 10.5551 5.3919 0.0202
VAR4A 1 3.4090 1.7662 3.7253 0.0536 0.7273
VAR38A 1 -3.9923 1.4302 7.7916 0.0052 -0.8104
VAR2 1 0.1813 0.0829 4.7775 0.0288 1.1151
VAR44 1 0.5960 0.2157
7.6322 0.0057 2.4228
Parameter Label
Intercept Intercept: VAR45A=1
VAR4A перенесенное ОНМК
VAR38A острая окклюз.гидроцефалия
VAR2 возраст
VAR44 балл шкалы NIH1
Percent Concordant
98.5
Вариант 2:
Standard Wald Standardized
Parameter DF Estimate
Error Chi-Square Pr > ChiSq Estimate
VAR22A 1 4.3523 2.1676 4.0317 0.0447 1.0519
VAR38A 1 -8.5259 3.2460 6.8990 0.0086 -1.7306
VAR2 1 0.1580 0.0757 4.3570 0.0369 0.9717
VAR6 1 -0.0830 0.0336 6.0902 0.0136 -1.6037
VAR44 1 0.5222 0.1941
7.2406 0.0071 2.1226
Parameter Label
VAR22A курение
VAR38A острая окклюз.гидроцефалия
VAR2 возраст
VAR6 АДсист заболевания
VAR44 балл шкалы NIH1
Percent Concordant
98.8
Вариант 3:
Standard Wald Standardized
Parameter DF Estimate
Error Chi-Square Pr > ChiSq Estimate
Intercept 1 27.8039 8.4266 10.8870 0.0010
VAR25A 1 3.7028 1.5635 5.6087 0.0179 0.8853
VAR28A 1 -2.8490 1.3891 4.2066 0.0403 -0.3599
VAR34A 1 -4.2357 2.1491 3.8843 0.0487 -1.1246
VAR38A 1 -4.9980 1.5306 10.6625 0.0011 -1.1111
VAR30 1 -1.8060 0.5592
10.4313 0.0012 -2.2639