Требования, предъявляемые к тестам

Для любых скрининговых тестов, будь то опрос, физикальное или лабораторное исследование, применимы следующие критерии оценки качества.

Чувствительность и специфичность

При выборе теста для поиска болезни среди лиц с отсутствием симптомов следует учитывать очень низкую распространенность заболевания даже среди групп высокого риска, отобранных по возрасту, полу и другим характеристикам. Следовательно, хороший скрининговый тест должен обладать высокой чувствительностью - чтобы не пропускать те немногие случаи болезни, которые присутствуют, а также иметь высокую специфичность - чтобы снизить число лиц с ложноположительными результатами.

Чувствительность и специфичность для скринингового теста устанавливаются так же, как и для диагностического, за исключением того, что "золотым стандартом” служит не другой тест, а результаты проспективного наблюдения. Например, чувствительность скринингового теста на скрытую кровь для выявления рака толстой кишки определяется отношением числа случаев рака толстой кишки, диагностируемых во время скрининга, к сумме этого числа и числа случаев рака, впоследствии обнаруженных в течение года среди лиц с отрицательными результатами теста (исходя из предположения, что эти случаи рака присутствовали во время скрининга, но были пропущены, т.е. результаты теста были ложноотрицательными) [5]. Подобный способ определения чувствительности и специфичности для скринингового теста иногда называют методом выявляемости (detection method).

Этот метод хорошо работает при определении чувствительности многих скрининговых тестов, но для оценки скрининга на некоторые виды новообразований его использование затруднено. Применение данного метода возможно при следующих условиях. Во-первых, необходимо, чтобы был известен период, в течение которого должно проводиться наблюдение. Как правило, этот период неизвестен и его продолжительность устанавливается наугад. Во-вторых, необходимо, чтобы у всех лиц с положительными результатами скринингового теста обязательно развилось бы заболевание, если они не будут лечиться. Этот второй аспект составляет проблему при скрининге на рак предстательной железы. Поскольку гистологически выявляемый рак предстательной железы очень распространен (у 25% мужчин в возрасте 50 лет и практически у всех мужчин в возрасте 90 лет), скрининговые тесты обнаружат этот вид рака у многих мужчин, но у большинства из них никогда не будет клинических проявлений злокачественного роста. Таким образом, если методом выявляемости оценить чувствительность такого теста, как определение простатспецифического антигена (ПСА), то тест выглядит весьма ценным, поскольку числитель содержит все обнаруженные случаи, а не только те, которые в последующем проявят тенденцию к злокачественному росту.

Справиться с этими проблемами позволяет метод заболеваемости (incedence method), с помощью которого рассчитывают чувствительность, используя величину заболеваемости среди не подвергавшихся скринингу, а также частоту возникновения рака за определенный период времени среди подвергавшихся скринингу. Такой подход основан на том, что чувствительность теста должна влиять на частоту выявления заболевания за определенный отрезок времени, а не на заболеваемость. Для рака предстательной железы метод заболеваемости определяет чувствительность теста как единица минус отношение частоты выявления рака предстательной железы за определенный период времени в группе мужчин, периодически подвергающихся скринингу, к заболеваемости раком этой же локализации в группе лиц, не подвергающихся скринингу (контрольная группа). Метод заболеваемости при вычислении чувствительности диагностического теста обходит проблему учета "доброкачественного” рака предстательной железы, но может занизить чувствительность, поскольку исключает случаи рака с длительным периодом развития. Следовательно, истинная чувствительность теста скорее всего находится между оценками, полученными методами выявляемости и заболеваемости.

Из-за низкой распространенности большинства заболеваний прогностическая ценность положительного результата для основной массы скрининговых тестов (даже для тестов с высокой специфичностью) низка. Врачи, осуществляющие профилактические мероприятия с помощью скрининговых тестов, должны смириться с тем, что им приходится затрачивать массу усилий впустую, проводя исследования у лиц, которые никогда не заболеют. Однако ошибку можно минимизировать, если применять скрининг только среди лиц с более высокой вероятностью заболевания.

Пример. Заболеваемость раком молочной железы увеличивается с возрастом: от 1 на 100 000/год в возрасте 20 лет до 1 на 200/год для лиц старше 70 лет. Следовательно, уплотнение в молочной железе, обнаруженное во время скрининга у молодой женщины, будет доброкачественным с большей вероятностью, чем у пожилой. В большом исследовании по скринингу на рак молочной железы [6] результаты биопсии объемного образования молочной железы заметно варьировали в разных возрастных группах: отношение числа случаев доброкачественных опухолей к числу злокачественных составило более чем 16 к 1 у женщин в возрасте до 40 лет, но было менее чем 3 к 1 у женщин старше 70 лет (рис. 8.2). Показатели чувствительности и специфичности для клинического обследования молочной железы и для маммографии тоже оказались выше в группе старшего возраста.

Выявляемость заболеваний при скрининге снижается, если он применяется повторно (рис. 8.3). В самом деле, при первом скрининге (скрининг распространенности, prevalence screen) выявляются случаи заболевания, длительность которого у разных больных различна. При повторном скрининге большинство вновь выявленных случаев будут составлять заболевания, начавшиеся между первым и вторым скринингами и лишь небольшое число случаев составят те, что были пропущены во время первого скрининга. Следовательно, второй и последующие скрининги - это скрининги заболеваемости (incidence screen). На рис. 8.3 видно, как уменьшается число случаев заболевания в группе при повторных обследованиях после скрининга распространенности. Это означает, что предсказательная ценность положительного результата теста будет убывать при последующих обследованиях.

Эффективность скрининга в зависимости от возраста пациентов Отношение числа доброкачественных опухолей к числу злокачественных по результатам биопсии при скрининге женщин на рак молочной железы [Baker L Н СА 1982,32 195- 231]

Рис. 8.2. Эффективность скрининга в зависимости от возраста пациентов Отношение числа доброкачественных опухолей к числу злокачественных по результатам биопсии при скрининге женщин на рак молочной железы [Baker L Н СА 1982,32 195- 231]

Снижение эффективности повторных обследований Первое обследование (скрининг распространенности) выявляет уже присутствовавшие случаи, второе и третье (скрининги заболеваемости) выявляют вновь возникшие случаи При этом исходят из предположения, что тест обнаруживает все случаи заболевания, и что обследуется вся популяция Иначе, случаи заболевания, не обнаруженные при первом обследовании, могут быть выявлены при последующих, тогда эффективность последующих обследований может оказаться выше Д - момент установления диагноза

Рис. 8.3. Снижение эффективности повторных обследований Первое обследование (скрининг распространенности) выявляет уже присутствовавшие случаи, второе и третье (скрининги заболеваемости) выявляют вновь возникшие случаи При этом исходят из предположения, что тест обнаруживает все случаи заболевания, и что обследуется вся популяция Иначе, случаи заболевания, не обнаруженные при первом обследовании, могут быть выявлены при последующих, тогда эффективность последующих обследований может оказаться выше Д - момент установления диагноза

Простота и дешевизна

Идеальный скрининговый тест должен проводиться буквально в течение нескольких минут, не требовать особой подготовки пациента или дополнительного визита к врачу и быть недорогим.

Примером идеального скринингового теста может служить простое и быстрое обследование - измерение артериального давления. Сложные диагностические тесты, такие как колоноскопия, которая дорого стоит, требует специального визита к врачу и подготовки кишечника, показаны для обследования пациентов с симптомами и клиническими признаками, но не для скрининга. Другие тесты, такие как проверка полей зрения для выявления глаукомы или аудиограмма для обнаружения снижения слуха, находятся между двумя этими крайностями. Эти тесты, хотя и не вызывают таких затруднений как колоноскопия, вероятно, слишком сложны для использования в качестве скрининговых.

Стоимость скрининга в денежном выражении зависит от стоимости не только самой процедуры, но и дальнейших обследований, потребующихся для пациентов с положительным результато-м теста. Таким образом, на стоимость теста влияют чувствительность, специфичность и предсказательная ценность положительного результата. Стоимость также зависит от того, требуется ли специальный визит к врачу. Скрининговые тесты, проводимые во время посещения пациентом врача по другим поводам (например, измерение артериального давления), значительно дешевле, чем тесты, требующие специальных визитов, освобождения от работы и дополнительных затрат на транспорт.

Безопасность

Для диагностических тестов, применяемых у больных с конкретными жалобами, некоторая степень риска разумна и этична. Если пациент обращается за помощью и симптомы неясны, врач не может медлить и делает все возможное для установления диагноза. Совсем другое дело, когда риску подвергают людей, считающих себя здоровыми. В таких случаях к безопасности процедуры предъявляются особые требования. Отчасти это обусловлено низкими шансами обнаружения заболевания у здоровых людей. Хотя колоноскопия не считается опасной процедурой при обследовании пациентов с патологией желудочно-кишечного тракта, она недостаточно безопасна в качестве метода скрининга, особенно с учетом потенциальной возможности прободения кишечника. Если частота прободения составляет 0,2% и колоноскопия используется для скрининга рака толстой кишки у женщин в возрасте 50-55 лет, то число случаев прободения составит около двух на каждый случай обнаружения рака; для женщин старше 70 лет отношение обратное, поскольку в этом возрасте колоректальный рак встречается гораздо чаще [7].

Приемлемость для больного и врача

Значение приемлемости теста иллюстрируется опытом обследований, направленных на выявление ранних форм рака шейки матки и толстой кишки. Женщины с наиболее высоким риском рака шейки матки реже всего проходят кольпоцитодиагностику по Папаниколау. Та же проблема характерна и для рака толстой кишки: жители Северной Америки, у которых отсутствуют симптомы заболевания, не желают периодически подвергаться обследованию, что, впрочем, вовсе неудивительно.

Из данных, приведенных в табл. 8.2, видна готовность разных групп людей к скринингу на рак толстой кишки. Лица, посещающие врача по собственной инициативе, проявляют высокую степень сотрудничества: они готовы собрать кал, сделать гваяковую пробу (мазок) и отослать материал своему врачу для клинического анализа. Пациенты, которые не обращаются сами к врачу, менее склонны к сотрудничеству. Наименьшая готовность к участию в скрининге отмечается у пожилых людей, при том что риск развития рака толстой кишки в этой возрастной группе самый высокий. За счет дополнительных усилий можно привлечь большее число людей, хотя вряд ли это позволит охватить и половину популяции.

Таблица 8.2

Готовность пациентов к участию в скрининге: частота участия пациентов в проведении гваяковой пробы в разных группах*

Группа

Число участников, приславших пробу,%

Программа скрининга на рак толстой кишки

85

Программа скрининга на рак молочной железы

70

Лица, находящиеся под наблюдением страховой медицинской организации в возрасте 50 - 74 лет

27

Лица, находящиеся под наблюдением страховой медицинской организации в возрасте 50 - 74 лет, получившие набор для гваяковой пробы, инструкции и напоминания по почте и по телефону

48

* [Myers RE et al Med Care 1991.29 1039 - 1050, Fletcher S W Dauphinee WD Clin Invest Med 1981 4 23 -31]

Приемлемость теста для врачей - критерий, на который, как правило, обращают внимание только те, кто осуществляет обследование. После одного большого и успешно проведенного исследования целесообразности скрининга врачи отказались от сигмо-скопии, поскольку гастроэнтерологи, проводившие процедуру, нашли, что она слишком сложна, занимает много времени и не оправдывает полученных результатов [8]. При этом только 38% пациентов откликнулись на предложение пройти тест.

Эффект ярлыка

Эффект ярлыка (labeling) - это психологическое воздействие результатов теста или диагноза на пациента. Исследования показывают, насколько важна иногда бывает при тестировании роль психологического фактора.

Эффект ярлыка может либо помочь, либо повредить пациенту. Если пациент узнает, что результаты теста у него нормальные, то эффект положительный. Большинству врачей приходилось слышать реакцию: "Отлично, значит, я смогу поработать еще год”. Получение ’’carte blanche” по поводу состояния здоровья способствует тому, что человек с охотой выполняет свои обычные обязанности.

С другой стороны, если человеку сказать, что результат теста сомнительный, это может оказать отрицательное психологическое воздействие. Исследование группы женщин с ложноположительными результатами маммографии (женщины с сомнительным результатом маммографии, у которых при последующем обследовании рак не был обнаружен) показало, что спустя несколько месяцев 47% пациенток испытывали тревогу в связи с результатами маммографии и 41% боялись заболеть раком молочной железы, причем 17% сообщили, что это состояние мешало им выполнять ежедневные обязанности [9].

Роль эффекта ярлыка вызывает особую озабоченность в связи с прогрессом в области генетического скрининга. Идентификация гена хореи Гентингтона позволяет родственникам больного пройти тестирование на носительство этого гена. Такой тест может помочь людям, которые хотели бы знать, могут ли они вступать в брак и иметь детей. Куда сложнее оказываются ситуации (более частые), когда наличие гена обусловливает риск, но не обязательно развитие заболевания. Например, известно несколько генов, связанных с развитием рака толстой кишки и молочной железы. Далеко не у всех носителей данных генов возникнет рак, а многие из тех, кто не имеет их, все-таки заболеют. Поскольку эти события ожидаются только в будущем, лицам, которые узнали о наличии у них одного из упомянутых генов, предстоит долго жить в ожидании страшной болезни.

Этический аспект эффекта ярлыка вызывает особую тревогу, когда это касается лиц с ложноположительными результатами тестов. В подобных ситуациях проведение скрининга может вызвать у пациента ощущение уязвимости, т.е. причинит больше вреда, чем пользы.

Риск ложноположительного результата

Предыдущие рассуждения относятся в отдельности к каждому тесту, который может выполнять врач при периодическом обследовании больных. Однако большинство врачей используют при этом не один и не два теста. Одно из исследований показало, что практикующие врачи были убеждены, что при периодическом обследовании следует применять 57 различных тестов [10]. Современные технологии и, вероятно, опасение судебного преследования побуждают врачей к тому, чтобы "учесть любые варианты". Автоматизированные системы анализа крови позволяют назначать до нескольких десятков легко выполнимых тестов.

Таблица 8.3

Соотношение между числом назначаемых тестов и долей здоровых людей хотя бы с одним выходящим за пределы нормы результатом теста*

Число тестов

Число лиц хотя бы с одним выходящим за пределы нормы результатом, %

1

5

5

23

20

64

100

99,4

* [Sackett D L Clin Invest Med 1978,1 37 - 43]

Если результат скринингового теста выражен количественно (а чаще всего это именно так) и если за нормальный результат принимаются все значения показателя, укладывающиеся в 95% доверительный интервал (как это и бывает обычно), то чем больше тестов назначит врач, тем выше риск ложноположительного результата. Как видно их данных табл. 8.3, при достаточно большом количестве тестов "отклонения от нормы” будут обнаружены практически у всех здоровых людей.

Рекомендуем к просомтру

www.kievoncology.com благодарны автору и издательству, которые способствует образованию медицинских работников. При нарушении авторских прав, сообщите нам и мы незамедлительно удалим материалы.