Предыстория
Испытания лекарств от ВИЧ часто включает в себя аналитическое прерывание лечения, когда пациенты с ВИЧ прекращают прием антиретровирусной терапии (АРТ), чтобы ученые могли понаблюдать, как неконтролируемый вирус реагирует на исследуемые препараты.
Участие в такого рода клинических испытаниях может вызвать страх у человека с ВИЧ, который привык поддерживать неопределяемую вирусную нагрузку. Кроме того, предыдущее исследование, проведенное доктором Лау, показало, что многие люди с ВИЧ не были уверены в том, как работают эти испытания, и многие из них не были готовы к длительным периодам определяемой вирусной нагрузки.
Ученые работают над различными стратегиями излечения ВИЧ-инфекции. Некоторые методы нацелены на сокращение латентных резервуаров ВИЧ — инфицированных иммунных клеток, которые не производят новые вирионы в течение многих месяцев или лет. Другие виды терапии пытаются повысить способность иммунной системы контролировать вирус.
Существуют два типа исследований, основанных на прерывании лечения, которые используются для оценки потенциальной терапии: изучение времени до восстановления вирусной активности (TVR) и изучение контрольных точек. В исследованиях TVR после того, как участники прекращают АРТ, ученые измеряют время, необходимое, чтобы вирусная нагрузка сначала достигла обнаруживаемого уровня (50 копий/мл), а затем время, необходимое для достижения более высокого порога (часто 10 000 копий/мл), после чего участники возобновляют прием АРТ. Если тем, кто получает лечение, требуется больше времени для достижения этих пороговых значений по сравнению с контрольной группой, это указывает на то, что терапия замедляет восстановление вирусной активности. Исследования TVR часто используются для оценки методов терапии, нацеленной на резервуары, обычно они длятся всего несколько недель.
Исследования контрольных точек демонстрируют, насколько эффективно иммунная система участников контролирует ВИЧ самостоятельно. В этих гораздо более длительных исследованиях (до нескольких месяцев) исследователи позволяют вирусным нагрузкам участников достигать высоких уровней, имитируя острую фазу ВИЧ, чтобы проследить, сможет ли их иммунная система в дальнейшем снизить эту нагрузку. Порог для возобновления АРТ обычно устанавливается на высоком уровне (часто 100 000 копий/мл). Когда участники, получающие лечение, способны контролировать ВИЧ при более низких уровнях вирусной нагрузки и в течение более длительного времени, чем участники контрольной группы, это говорит о том, что терапия повышает их иммунитет против вируса.
Несмотря на то, что нет конкретных рекомендаций, определяющих, как планировать исследования с прерыванием лечения, группа ученых, занимающихся исследованием ВИЧ, встретилась в 2018 году, чтобы обсудить этические стороны и выработать методы для снижения риска. Прекращение АРТ во время этих исследований не просто подвергает участников риску длительных периодов определяемой, а в некоторых случаях и высокой вирусной нагрузки. Более высокие вирусные нагрузки также могут подвергать опасности и ВИЧ-отрицательных половых партнеров участников.
До сих пор в большинстве исследований риск снижался за счет небольшого числа участников и отсутствия контрольной группы, которая вместо лечения принимала неактивное плацебо. Включение контрольной группы важно, потому что это позволяет ученым сравнивать тех, кто принимает лекарства, с теми, кто находится на плацебо. Тем не менее научное сообщество обсуждало этичность использования контрольных групп в подобных испытаниях лекарств, потому что они подвергаются длительным периодам повышенной вирусной нагрузки в отсутствие каких-либо препаратов, даже экспериментальных.
Исследование
Доктор Лау и ее коллеги использовали данные предыдущих клинических испытаний для создания математических моделей, позволяющих оценить, как различные их параметры влияют на статистическую мощность испытания.
Статистическая мощность аналогична чувствительности. Например, тест на ВИЧ с чувствительностью 80% успешно идентифицирует вирус у 80% людей, которые на самом деле ВИЧ-положительны, но не выявит у остальных 20% ВИЧ-положительных людей. Когда клиническое испытание, оценивающее лечебную терапию, должно достигнуть статистической мощности в 80% (при условии, что терапия имеет реальную пользу для тех, кто ее принимает), в испытании будет 80-процентная вероятность обнаружить пользу и 20-процентная вероятность ее упустить.
Проще говоря, чем больше данных задействовано в испытании, тем большей статистической мощностью оно будет обладать. Такие факторы, как количество участников, число контрольных параметров, продолжительность испытания и частота анализов крови, влияют на статистическую мощность испытания.
Результаты пробного моделирования TVR
Лау и ее коллеги смоделировали исследования TVR, предназначенные для достижения статистической мощности 80%, чтобы определить, как количество участников, контрольная группа, продолжительность и частота анализов крови влияют на способность обнаруживать снижение частоты реактивации латентных клеток в резервуарах ВИЧ. «Спящие» клетки в резервуаре периодически и (по мнению ученых) случайным образом реактивируются, производя новые копии ВИЧ. Однако при эффективной АРТ вирусная нагрузка у человека остается неопределяемой. В отсутствие АРТ — как в испытаниях с прерыванием лечения, когда латентные клетки реактивируются, — они производят достаточное количество вируса для его обнаружения. Когда исследователи оценивают способность терапии снижать частоту реактивации, они на практике определяют способность терапии замедлять восстановление вирусной нагрузки после ее прекращения.
В отношении недавнего исследования TVR с участием 13 человек такая модель показала, что при мощности 80% исследование выявило бы только лечение со значительным снижением реактивации (от 70 до 80%). Чтобы исследование TVR выявило снижение реактивации на 30%, потребуется уже по 120 участников в группе терапии и в контрольной группе. Поскольку в большинстве исследований TVR задействовано малое число участников, они, вероятно, не устанавливают умеренных результатов терапии.
Может показаться нелогичным планирование исследования для выявления меньшего эффекта от лечения, когда конечной целью является поиск максимальной пользы (т. е. терапия, приводящая к 100% снижению реактивации). Тем не менее на начальных этапах поиска лекарства необходимо фиксировать даже умеренные результаты, чтобы решить, требует ли этот метод дальнейшего изучения.
«Не упускаем ли мы что-то важное из-за того, что исследования не способны обнаружить небольшие различия, которые мы могли бы использовать и более пристально изучить? — говорит Кромер. — Как бы мы ни проводили эти исследования, мы что-то упускаем, потому что просто не охватываем достаточное количество людей».
Помимо рекомендации увеличить количество участников, команда предлагает использовать ретроспективные контрольные данные в дополнение к контрольным группам. Данные из предыдущих испытаний, в которых люди прерывали АРТ, могли бы повысить потенциал выявления умеренной пользы от лечения. Они смоделировали гипотетическое исследование TVR, в которое вошли 50 участников и 50 человек из контрольной группы. При мощности 80% эта конструкция может обнаруживать снижение реактивации до 43%. Добавление ретроспективных данных еще 150 участников позволило бы в том же испытании выявить снижение до 36%.
Это может быть незначительным улучшением, но использование ретроспективных данных позволит уменьшить размер контрольной группы. «Возможно, нам даже не обязательно понадобятся настоящие плацебо-контролируемые испытания в будущем, если мы сможем получить доступ к ретроспективным данным за 20 лет», — говорит доктор Лау. Если использование истории исследований может снизить вероятность того, что кто-то войдет в группу плацебо, например, с типичных 50% до 25%, то большее число людей могут захотеть участвовать в этих исследованиях, говорит доктор Лау.
Такое моделирование также не показало практически никакого улучшения способности обнаруживать снижение реактивации при увеличении продолжительности испытаний TVR свыше пяти недель. После этого срока модель предсказала улучшение обнаружения не более чем на 1%. Точно так же они не обнаружили практически никакой пользы от проведения лабораторного мониторинга чаще, чем раз в неделю. Наблюдение за людьми два раза в неделю почти не помогло обнаружить снижение реактивации.
Ученые провели отдельный анализ для оценки максимального риска передачи ВИЧ во время исследований TVR на основе предыдущих данных. Они оценили максимальный риск передачи, предполагая, что участники занимались незащищенным сексом и что доконтактная или другие методы профилактики не использовались. Кроме того, если во время еженедельного мониторинга не сообщать пациенту показатель вирусной нагрузки сразу же, то участник, которому необходимо возобновить АРТ (если его вирусная нагрузка превысила 1000), скорее всего, отложит это до следующего еженедельного визита.
Было подсчитано, что в этом случае во время пятинедельного исследования TVR с порогом вирусной нагрузки 1000 для повторного начала АРТ максимальный риск передачи ВИЧ составил 3,6 на 1000 участников, занимающихся вагинальным сексом. При анальном сексе для вводящих партнеров максимальный риск составлял около 7 на 1000, а для принимающих партнеров — около 70 из 1000. Изменение схемы исследования, включающее экспресс-тестирование на вирусную нагрузку и возобновление АРТ в тот же день, снижает предполагаемый максимальный риск до 0,9, 1,8 и 18 на 1000 соответственно.
Результаты моделирования исследования по контрольным величинам
Поскольку исследования контрольных точек обычно оценивают иммунный контроль над ВИЧ, одна из проблем заключается в том, что у некоторых людей, называемых «контроллерами после лечения», иммунная система сама хорошо контролирует ВИЧ после прекращения приема АРТ. Предыдущее исследование под названием CHAMP показало, что к ним относятся около 4% людей с ВИЧ. Оно также показало, что контроль после лечения встречался гораздо чаще — около 13% случаев — среди людей, которые начали лечение вскоре после инфицирования.
Исследования контрольных точек должны иметь достаточную статистическую мощность, чтобы отделять преимущества предлагаемой лечебной терапии от контроля после лечения. Используя результаты исследования CHAMP, ученые предположили, что исходный уровень контроллеров после лечения ниже 4%. Если целью исследования было определить увеличение количества контролеров до 20% (это означает, что терапия помогла людям, которые не являются естественными контроллерами, подавить вирус), их модель показала, что 24-недельное исследование со статистической мощностью 80% потребует участия 60 пациентов.
Из-за чрезвычайно высоких вирусных нагрузок в типичных исследованиях контрольных величин (до 100 000) авторы сравнили, как использование более консервативного порогового значения (1000) для возобновления АРТ повлияет на способность этих исследований обнаруживать увеличение числа контроллеров после лечения. CHAMP показало, что у 55% контроллеров после лечения первоначальные всплески вирусной нагрузки не превышали 1000 копий/мл, и в дальнейшем они сохраняли вирусную нагрузку ниже этого порога.
Используя эти данные, Лау и Кромер предположили, что использование порога в 1000 копий маскирует 45% естественных контроллеров после лечения, что может помешать обнаружить, когда терапия усиливает иммунный контроль участников над ВИЧ. Чтобы восстановить статистическую мощность, потребуется больше участников. Как и в приведенном выше примере, при мощности 80% и цели выявления 20-процентного повышение числа контроллеров после лечения свыше базового уровня 4%, более низкий порог вирусной нагрузки потребует увеличить количество участников с 60 до 120 как в лечебных, так и контрольных группах.
Как и в случае исследований TVR, ученые также оценили максимальный риск передачи ВИЧ во время определения контрольных величин, используя те же предположения, что и описанные выше (отсутствие стратегий профилактики и экспресс-тестирования на вирусную нагрузку, незащищенный секс, недельная задержка перед возобновлением АРТ). Из-за гораздо большей продолжительности испытаний и высоких пороговых значений вирусной нагрузки (для этого они сослались на исследование контрольных величин, в котором использовали данные 50 000 человек) они оценили максимальный риск передачи ВИЧ как 13 случаев на 1000 при вагинальных половых контактах, около 25 на 1000 — для вводящего партнера при анальном сексе, 214 на 1000 — крайне высокий — для принимающего партнера при анальном сексе.
Предлагаемая гибридная схема испытаний
Исследование контрольных величин, как правило, более надежно, потому что оно проводится дольше по времени и приносит больше данных, а это означает, что они чаще всего имеют более высокую статистическую мощность, чем короткие исследования TVR. «В этом документе говорится о том, что компромисс между мощностью, которую вы получаете, по нашему мнению, не всегда достаточен, чтобы оправдать повышенный риск, связанный с исследованием заданных значений», — сказала доктор Дебора Кромер.
Основываясь на собственном моделировании и оценках максимального риска передачи, ученые предлагают использовать гибридную модель для анализа прерывания лечения. В озвученной ими схеме прерывания будут начинаться с пятинедельного исследования TVR. Хотя оно, как правило, применяется, когда терапия нацелена на резервуары ВИЧ, у людей, отвечающих на терапию, направленную на усиление иммунитета, также будет наблюдаться более медленное восстановление вируса (если лечение было эффективным).
Начало испытания для оценки потенциального лечения с помощью исследования TVR подвергнет участников гораздо более коротким перерывам в лечении, что позволит исследователям определить, имела ли эта терапия достаточную эффективность, чтобы перейти к более длительному изучению заданных значений. Если медики согласятся с необходимостью дальнейшего исследования, а пациенты с вирусной нагрузкой ниже 1000 согласятся перейти к следующей фазе, они продолжат тщательное наблюдение в течение 24 недель или до тех пор, пока вирусная нагрузка участников не превысит 1000 копий/мл, после чего они возобновят АРТ.
Ученые рекомендуют провести экспресс-тестирование на вирусную нагрузку и возобновить АРТ в тот же день, чтобы свести к минимуму риск передачи инфекции. По их оценке, ограничение контрольной точки теми, кто уже демонстрирует контроль за вирусом, до вирусной нагрузки ниже 1000, снижение порога вирусной нагрузки для возобновления АРТ до 1000, ограничение продолжительности до 24 недель, а также включение тестирования по месту оказания медицинской помощи и возобновление АРТ в тот же день снижают максимальный риск передачи до 0,2 на 1000 при вагинальном сексе, до 0,35 на 1000 — для вводящего партнера при анальном сексе и до 3,1 на 1000 — для принимающего партнера при анальном сексе. И это значительное улучшение показателей по сравнению с оценкой, полученной в ходе традиционных исследований контрольных величин.
Если первоначальное исследование TVR показывает, что лечение не требует дальнейшего изучения (например, если не обнаружено позитивного эффекта), то ученые смогут избежать затрат на проведение длительного исследования контрольных величин.
Выводы
Ученые пришли к выводу, что в испытаниях лекарств недостаточно участников для обеспечения знаковой статистической мощности при умеренных результатах лечения. Поскольку чаще всего при испытаниях терапии также не используются контрольные группы, количественная оценка пользы лечения чрезвычайно сложна. Специалисты рекомендуют сотрудничать всем заинтересованным структурам для создания ретроспективной контрольной базы данных, которая позволила бы разработать схему испытаний, не полностью полагающуюся на контрольные группы плацебо. Тем не менее они отмечают, что задействование ретроспективных контрольных данных означает включение людей, которые с большей вероятностью начали АРТ во время хронической ВИЧ-инфекции, и тех, кто использует более старые схемы АРТ, которые могут действовать как искажающие факторы.
Тем не менее сокращение числа участников, получающих плацебо, снижение пороговых значений вирусной нагрузки, продолжительности испытаний и рисков передачи ВИЧ могут побудить большее число людей с ВИЧ участвовать в исследованиях с прерыванием лечения.
И хотя ученые рекомендовали гибридную схему испытаний, доктор Лау уверила, что они не намерены использовать этот подход в каждом из будущих исследований. Вместо этого они хотят, чтобы медики, занимающиеся ВИЧ, соотнесли преимущества изучения того, что способствует разработке лекарств, с рисками, с которыми сталкиваются участники (и их сексуальные партнеры). «Где найти этот баланс и может ли эта гибридная модель сместить его в сторону чего-то более безопасного, научно обоснованного, а также немного более приемлемого для участников испытаний?»