Автор работы: Пользователь скрыл имя, 09 Апреля 2012 в 00:18, реферат
Систематической ошибкой (СО, смещением, bias, англ.) называют смещение среднего результата измерения по отношению к истинной величине . Например, из-за особенностей применяемых реагентов разные способы измерения концентрации отдельных веществ в крови (например, тропонина или глюкозы) дают несколько различные результаты.
1. Введение
2. Разновидности систематических ошибок
3. Случайные и систематические ошибки
4. Ошибок теория
5. Вмешивающиеся факторы
6. Методы контроля над систематическими ошибками
7. Заключение
8. Литература
Случайные ошибки вызываются большим числом отдельных причин, действующих в каждом отдельном измерении различными способами. В примере со взвешиванием это могут быть незаметные глазу колебания чаши весов, потоки воздуха, толчки фундамента здания, в котором стоят весы. Эти ошибки полностью исключить невозможно.
Полная ошибка измерения принимается равной сумме случайной и систематической ошибок: Δ = Δсл + Δсист.
Пример 1
Определите, какие ошибки из перечисленных являются случайными:
1) ошибка при однократном измерении сопротивления проводника;
2) отклонение значения сопротивления проводника от измеренного более точным прибором в процессе измерения сопротивления одного и того же проводника 100 раз в одну и ту же сторону;
3) однократное измерение диаметра сосуда;
4) отклонение значения внутреннего диаметра одного и того же сосуда при измерении 30 раз в разные стороны.
Показать решение
Случайная ошибка, возникающая при измерении некоторой величины, может теоретически принимать любые значения. Она является непрерывной случайной величиной, подчинённой определённому закону распределения вероятности.
Наиболее часто встречающиеся на практике ошибки распределены по нормальному закону:
При этом, как уже было вычислено,
С какой вероятностью измеренная величина будет отклоняться от своего точного значения не больше, чем на σ? Очевидно с той же самой, с которой ошибка измерения будет находиться в промежутке [–σ; σ]. Если случайная ошибка распределена по нормальному закону, то для ответа на этот вопрос необходимо вычислить интеграл
Расчёты показывают, что в 68,27 % отклонения случайной величины, распределённой по нормальному закону, не превышают σ, в 95,45 % – 2σ. Наконец, вероятность того, что случайная величина, распределённая нормально, отклоняется от математического ожидания больше, чем на 3σ, пренебрежимо мала и составляет 0,27 % – правило трёх сигм.
Теория ошибок
Ошибок теория, раздел математической статистики, посвященный построению уточнённых выводов о численных значениях приближённо измеренных величин, а также об ошибках (погрешностях) измерений. Повторные измерения одной и той же постоянной величины дают, как правило, различные результаты, так как каждое измерение содержит некоторую ошибку. Различают 3 основных вида ошибок: систематические, грубые и случайные. Систематические ошибки всё время либо преувеличивают, либо преуменьшают результаты измерений и происходят от определённых причин (неправильной установки измерительных приборов, влияния окружающей среды и т. д.), систематически влияющих на измерения и изменяющих их в одном направлении. Оценка систематических ошибок производится с помощью методов, выходящих за пределы математической статистики (см. Наблюдений обработка). Грубые ошибки возникают в результате просчёта, неправильного чтения показаний измерительного прибора и т. п. Результаты измерений, содержащие грубые ошибки, сильно отличаются от других результатов измерений и поэтому часто бывают хорошо заметны. Случайные ошибки происходят от различных случайных причин, действующих при каждом из отдельных измерений непредвиденным образом то в сторону уменьшения, то в сторону увеличения результатов.
О. т. занимается изучением лишь грубых и случайных ошибок. Основные задачи О. т.: разыскание законов распределения случайных ошибок, разыскание оценок (см. Статистические оценки) неизвестных измеряемых величин по результатам измерений, установление погрешностей таких оценок и устранение грубых ошибок.
Пусть в результате n независимых равноточных измерений некоторой неизвестной величины а получены значения x1, x2,..., xn. Разности
d1 = x1 — a,…, dn = xn — a
называются истинными ошибками. В терминах вероятностной О. т. все di трактуются как случайные величины; независимость измерений понимается как взаимная независимость случайных величин d1,..., dn. Равноточность измерений в широком смысле истолковывается как одинаковая распределённость: истинные ошибки равноточных измерений суть одинаково распределённые случайные величины. При этом математическое ожидание случайных ошибок b = Ed1 =...= Еdn называется систематической ошибкой, а разности d1 — b,..., dn — b — случайными ошибками. Таким образом, отсутствие систематической ошибки означает, что b = 0, и в этой ситуации d1,..., dn суть случайные ошибки. Величину где а — квадратичное отклонение, называют мерой точности (при наличии систематической ошибки мера точности выражается отношением Равноточность измерений в узком смысле понимается как одинаковость меры точности всех результатов измерений. Наличие грубых ошибок означает нарушение равноточности (как в широком, так и в узком смысле) для некоторых отдельных измерений. В качестве оценки неизвестной величины а обычно берут арифметическое среднее из результатов измерений
а разности D1 = x1 — ,..., Dn = xn — называются кажущимися ошибками. Выбор в качестве оценки для а основан на том, что при достаточно большом числе n равноточных измерений, лишённых систематической ошибки, оценка с вероятностью, сколь угодно близкой к единице, сколь угодно мало отличается от неизвестной величины а (см. Больших чисел закон); оценка лишена систематической ошибки (оценки с таким свойством называются несмещенными); дисперсия оценки есть
D = E ( — а)2 = s2/n.
Опыт показывает, что практически очень часто случайные ошибки di подчиняются распределениям, близким к нормальному (причины этого вскрыты так называемыми предельными теоремами теории вероятностей). В этом случае величина имеет мало отличающееся от нормального распределение, с математическим ожиданием а и дисперсией s2/n. Если распределения di в точности нормальны, то дисперсия всякой другой несмещенной оценки для а, например медианы, не меньше D. Если же распределение di отлично от нормального, то последнее свойство может не иметь места.
Если дисперсия s2 отдельных измерений заранее известна, то для её оценки пользуются величиной
(Es2 = s2, т. е. s2 — несмещенная оценка для s2), если случайные ошибки di имеют нормальное распределение, то отношение
подчиняется Стьюдента распределению с n — 1 степенями свободы. Этим можно воспользоваться для оценки погрешности приближённого равенства а » (см. Наименьших квадратов метод).
Величина (n — 1) s2/s2 при тех же предположениях имеет распределение c2 (см. «Хи-квадрат» распределение) с n — 1 степенями свободы. Это позволяет оценить погрешность приближённого равенства s » s. Можно показать, что относительная погрешность |s — s|Is не будет превышать числа q с вероятностью
w = F (z2, n — 1) — F (z1, n — 1),
где F (z, n — 1) — функция распределения c2,
3. Вмешивающиеся факторы
Организация медицинского исследования трудна прежде всего потому, что изучаемый признак, например длительность ремиссии, зависит от множества факторов помимо того, который изучает исследователь. Некоторые из этих привходящих факторов (вмешивающихся, confounders, англ.от лат. confundere, смешивать) хорошо известны, и их легко учесть. Например, при сравнении смертности среди шахтеров и священников для проверки предположения, что тяжелый труд сопровождается высокой смертностью, обнаруживается, что смертность выше у священников. Причину легко понять — священники значительно старше шахтеров. Поскольку это понятно, исследователь может сравнить смертность у шахтеров и священников равного возраста или сделать поправку на возраст (стандартизацию по возрасту). В результате выясняется, что, конечно же, смертность выше среди шахтеров; вмешивающийся фактор (ВФ) — возраст.
В других случаях ситуация оказывается сложнее. Например, у рабочих химических производств, связанных с экспозицией опасным веществам, можно ожидать повышенной по сравнению с популяцией смертности. Однако при попытке исследовать общую смертность в таких профессиональных группах обычно обнаруживается, что смертность в них ниже, чем в популяции. Оказывается, что, поскольку работники, в особенности работники вредных производств, отличаются лучшим здоровьем, чем в среднем в популяции, смертность среди них ниже (эффект здорового работника). Можно лишь предполагать, что их условия труда вредны и приводят к повышению смертности, но это повышение смертности не превышает имеющейся разницы с популяцией. Не существует способа проверить, повышается ли смертность и насколько . Из этого примера понятно, почему ВФ называют еще модификаторами эффекта (effect modifiers).
В общих чертах влиянием вмешивающихся факторов (ВВФ) называют любую ситуацию, в которой помимо изучаемого фактора (экспозиции) на исход действует один или более других, и влияние этих факторов не разделяется . Основным механизмом возникновения ошибки в результате действия ВФ является его связь как с действующим фактором (экспозицией), так и с изучаемым исходом. В первом примере возраст различается в двух профессиональных группах и одновременно влияет на смертность. Во втором примере состояние здоровья влияет на включение людей в профессиональную группу и одновременно— на смертность. Вмешивающийся фактор должен обязательно быть связан как с экспозицией, так и с исходом.
Само искажение видимого эффекта экспозиции, вносимое ее связью с другими факторами, которые могут влиять на исход, также называют ВВФ (конфаундингом). Соотношение между влияниями двух и более причинных факторов, нередко наблюдаемое в наборе данных, в котором логически невозможно разделить вклады отдельных причинных факторов, также называют ВВФ. Внешний фактор — это не звено в цепи причинной связи экспозиции и исхода, а именно отдельно действующий фактор, связанный как с экспозицией, так и с исходом.
Никогда нельзя исключить присутствие ВФ и предположение, что обнаруженная зависимость или различие объясняются действием ВФ. При получении неожиданного результата первой попыткой его интерпретации должен быть поиск возможных ВФ. Обычно ВВФ имеет не очень большое влияние, т.е. не приводит к появлению зависимостей с отношением шансов (ОШ) выше 2, но нельзя только на этом основании утверждать, что связь, например употребления пива с димедролом и импотенции при ОШ 2,3 — причинная. Всякий анализ результатов исследования в отношении потенциального объяснения результатов ВВФ должен быть конкретным, т.е. указывать на потенциальный фактор (экспозицию, признак), способные объяснить обнаруженную связь. Если такая гипотеза выглядит правдоподобной, то далее исследователь может выполнить другое исследование, в котором влияние данного ВФ будет устранено. Влияние возраста в приведенном примере сравнения священников и шахтеров легко учесть, но внести поправку можно не всегда. В случае с работниками вредного производства размер ВВФ неясен, и неизвестно, как можно было бы скорректировать это влияние экспериментальным путем или внесением расчетных поправок. В целом внесение поправок (adjustment) не полностью или, наоборот, избыточно изменяет полученную связь. В некоторых случаях внесение поправок может приводить к возникновению новых ошибок (ложных связей) .
Правильно спланированное исследование позволяет устранить ВВФ или скорректировать его (как в примере с использованием поправки на возраст для оценки смертности). Для того чтобы это было возможно, исследователь должен хорошо знать объект исследования и постоянно ожидать возникновения ошибок. Не будет большим преувеличением сказать, что подготовка ученого, методологическая и в предметной области, состоит прежде всего в подготовке к выявлению ВВФ. Если ВВФ остается невыявленным, то результат исследования оказывается смещенным. Такая СО, вызванная присутствием ВФ, связанного, как с воздействием, так и с его исходом, называется ошибкой конфаундинга или ВВФ.
ВВФ называют негативным, если оно затеняет или ослабляет изучаемую закономерность. Так, негативным оказывается влияние отбора по состоянию здоровья на выявляемый вред здоровью от работы на вредном производстве. Позитивным называют ВВФ, усиливающее изучаемую зависимость или увеличивающее выявляемое различие. В медицинских исследованиях некоторые разновидности ВВФ привлекают особое внимание, поскольку способны привести к серьезным ошибкам в исследовании. Прежде всего это конфаундинг показания (confounding by indication, англ.) — искажение влияния лечения на исход болезни, вызванное наличием симптома, который может быть связан как с лечением, так и с исходом; либо искажение влияния лечения на исход болезни при наличии показания или противопоказания к данному лечению, которое также связано с исходом[26]. Такое искажение не может возникнуть в контролируемом испытании, оно возникает при анализе результатов лечения. Если некоторое лекарственное средство (ЛС) назначается чаще при наличии определенного симптома, то обнаруженная связь применения ЛС и исхода может быть не эффектом лечения (полезным или вредным), а особенностью исхода у больных при наличии этого симптома.
4. Методы контроля над систематическими ошибками
На этапе дизайна исследования
Выбор популяции исследования первый и важнейший этап создания исследования. Этот выбор определяет прежде всего то, насколько актуален будет его результат. Выбор неверной популяции, редкой, с особенными свойствами, может привести к тому, что результат даже правильный, будет никому не нужен (не обладать внешней валидностью). Выбор популяции, в которой заболевание встречается редко, может привести к тому, что исследование, направленное на выяснение вреда загрязнения питьевой воды, вреда этого не обнаружит – удвоение частоты от 2/100 000 до 4/100 000 окажется статистически незначимым. Выбор источников информации в значительной степени определяет, что удастся найти. Например, если государственная статистика не регистрирует внезапную смерть новорожденных, то нелепо ориентироваться на нее в изучении этой и подобных патологий. Если статистика смертности от рака не предусматривает возможности исправления причин смерти задним числом, по мере установления окончательной причины смерти, то использование такой государственной статистики дает лишь ориентировочные представления об онкологической заболеваемости и смертности. На этапе дизайна исследования, составления его протокола должны уточняться все детали выполнения работ на каждом из последующих этапов. Здесь лишь для удобства приемы повышения надежности исследования разнесены по этапам.
На этапе проведения исследования
Стандартизация методов сбора информации. Лишь на первый взгляд измерение выполняется просто. В действительности для получения не высококлассных, но даже обычных по точности и воспроизводимости результатов необходимо предпринимать значительные усилия для выработки правильного метода измерения и обеспечения правильного измерения всеми участниками исследования. Это относится не только к приборным измерениям, но и к измерениям, выполняемым с помощью опроса. Даже отлично разработанный и проверенный набор вопросов должен предъявляться опрашиваемым в стандартной обстановке, со стандартными вводными словами, поскольку отсутствие атмосферы приватности или выражение отношения к содержанию или форме вопросника способны изменить существенно отношение опрашиваемого к заданным вопросам. Невинная прибаутка, добавляемая интервьюером может улучшить отношение опрашиваемого к процессу, но радикально изменить его отношение ко всем или отдельным вопросам вопросника.
Поскольку обобщение результатов проведенных исследований (систематический обзор) представляет собою технологию дескриптивного исследования, в котором в качестве единиц анализа выступают не люди, а отдельные исследования, постольку систематический обзор весьма сильно подвержен всем смещениям, характерным для дескриптивных исследований. Основными приемами, которые позволяют минимизировать смещения в систематическом обзоре, являются получение максимально полного набора выполненных исследований. Поскольку никогда не известно, сколько исследований выполнено в действительности, единственное приемлемое решение – искать все исследования и получать данные из всех исследований. Как упоминалось выше, получить несмещенную выборку все равно невозможно, но минимизировать смещения – возможно.