Лише одне з десяти лікувальних процедур підтверджується якісними доказами
Towfiqu соромний барбхуія / Shutterstock

Коли ви відвідуєте свого лікаря, ви можете припустити, що лікування, яке він призначає, має вагомі докази, що підтверджують це. Але ти помилишся. Лише кожне десяте лікування підтримується якісними доказами, показують наші останні дослідження.

Аналіз, опублікований у Journal of Clinical Epidemiology, включав 154 систематичні огляди Кокрана, опубліковані між 2015 і 2019 рр. Тільки 15 (9.9%) мали високоякісні докази відповідно до метод золотого стандарту для визначення того, надають вони високоякісні чи неякісні докази, які називаються ОЦІНКА (оцінка рекомендацій, оцінка, розробка та оцінка) Серед них лише два мали статистично значущі результати - це означає, що результати навряд чи виникли через випадкову помилку - і автори огляду вважали їх корисними в клінічній практиці. Використовуючи ту саму систему, 37% мали помірні, 31% мали низькі та 22% мали дуже низьку якість доказів.

Система GRADE розглядає такі речі, як ризик упередженості. Наприклад, дослідження, які «засліплені» - в яких пацієнти не знають, чи отримують вони фактичне лікування чи плацебо, пропонують більш якісні докази, ніж «незрячі» дослідження. Сліпота важлива, оскільки люди, які знають, яке лікування вони отримують, можуть зазнати більші ефекти плацебо ніж ті, хто не знає, яке лікування вони отримують.

Крім усього іншого, GRADE також розглядає, чи були дослідження неточними через різницю в способі лікування. В огляді 2016 року дослідники виявили, що 13.5% - приблизно кожен сьомий - повідомили, що лікування підтверджується якісними доказами. Відсутність якісних доказів, на думку GRADE, означає, що майбутні дослідження можуть скасувати результати.

154 дослідження були обрані, оскільки вони були оновленнями попереднього огляд 608 систематичних оглядів, проведений у 2016 р. Це дозволяє нам перевірити, чи огляди, які були оновлені новими доказами, мали якісніші докази. Вони цього не зробили. У дослідженні 2016 року 13.5% повідомили, що лікування підтримується високоякісними доказами, тому спостерігалася тенденція до зниження якості, оскільки було зібрано більше доказів.


Innersele підписатися графіка


Дослідження мало декілька обмежень. По-перше, обсяг вибірки у дослідженні, можливо, не був репрезентативним, і інші дослідження виявили це понад 40% лікувальних процедур, ймовірно, будуть ефективними. Крім того, вибірка в дослідженні була недостатньо великою, щоб перевірити, чи існували певні види медичних методів лікування (фармакологічні, хірургічні, психологічні), які були кращими за інші. Також можливо, що "золотий стандарт" для ранжування доказів (GRADE) є занадто суворим.

Забагато неякісних досліджень

Публікується багато неякісних випробувань, і наше дослідження просто відобразило це. Через тиск на “Опублікувати або загинути”, щоб вижити в наукових колах, проводиться все більше досліджень. Тільки в PubMed - базі даних опублікованих медичних робіт - щороку публікується понад 12,000 XNUMX нових клінічних випробувань. Ось Щодня публікується 30 випробувань. Систематичні огляди були розроблені для їх синтезу, але зараз їх теж занадто багато: закінчено 2,000 на рік опубліковано лише у PubMed.

Рух медицини, що базується на фактичних даних, б'є барабаном про необхідність поліпшення якості досліджень вже більше 30 років, але, як це не парадоксально, доказів того, що справи покращились незважаючи на a поширення настанов і керівництво.

У 1994 році Даг Альтман, професор статистики медицини в Оксфордському університеті, просив менше, але краще, дослідження. Це було б добре, але сталося навпаки. Неминуче цунамі випробувань, що публікуються щороку, в поєднанні з необхідністю публікації, щоб вижити в академічних колах, призвело до того, що було видано багато сміття, і це з часом не змінилося.

Неякісні докази серйозні: без вагомих доказів ми просто не можемо бути впевнені, що лікування, яке ми використовуємо, працює.

Лише одне з десяти лікувальних процедур підтверджується якісними доказамиЦе було призначено для жарту. Twitter

Система GRADE занадто сувора

Столяр повинен звинувачувати свої інструменти лише в крайньому випадку, тому виправдання того, що GRADE не працює, слід застосовувати лише обережно. І все ж це, мабуть, правда, що система GRADE занадто жорстка для деяких контекстів. Наприклад, майже неможливо, щоб будь-яке дослідження, що оцінює певний режим вправ, було якісним.

Випробування вправи не можна "засліплювати": кожен, хто робить вправу, буде знати, що він у групі вправ, тоді як ті, хто входить до контрольної групи, будуть знати, що вони не роблять вправ. Крім того, важко змусити великі групи людей робити абсолютно однакові вправи, тоді як легше змусити всіх приймати однакові таблетки. Ці властиві проблеми засуджують випробування фізичних вправ на низьку якість, незалежно від того, наскільки корисними є безпечні вправи.

Крім того, наш метод був суворим. Хоча систематичні огляди мали багато результатів (кожен з яких міг бути якісним), ми зосередились на основних результатах. Наприклад, основним результатом огляду знеболюючих препаратів було б зменшення болю. Тоді вони також можуть виміряти ряд вторинних результатів, починаючи від зниження тривожності і закінчуючи задоволенням пацієнта.

Зосередження на первинних результатах запобігає помилковим висновкам. Якщо ми розглянемо багато результатів, існує небезпека, що один із них буде якісним просто випадково. Щоб пом'якшити це, ми розглянули, чи є якийсь результат - навіть якщо це не був основний результат. Ми виявили, що кожне п’яте лікування мало якісні докази будь-якого результату.

У середньому більшість медичних процедур, ефективність яких перевірена систематичними оглядами, не підтверджуються високоякісними доказами. Нам потрібні менші, але кращі дослідження для усунення невизначеностей, щоб ми могли бути впевненішими в тому, що лікування, яке ми проводимо, працює.Бесіда

Про автора

Джеремі Хауік, директор Оксфордської програми співпереживання, Оксфордський університет

Ця стаття перевидана з Бесіда за ліцензією Creative Commons. Читати оригінал статті.

книги_науки