Chỉ 1 trong 10 phương pháp điều trị y tế là có chứng cứ mạnh
Khi áp lực từ việc ‘xuất bản hay bị loại bỏ’ tăng lên, chất lượng của nghiên cứu đã sụt giảm xuống, mặc dù số lượng có thể tăng vọt
Khi gặp bác sĩ để khám chữa bệnh, bạn có thể cho rằng phương pháp điều trị họ đưa ra có bằng chứng khoa học vững chắc. Nhưng bạn đã nhầm. Chỉ 1 trong 10 phương pháp điều trị y tế là có bằng chứng đủ mạnh, khảo sát mới nhất của chúng tôi đã ghi nhận điều đó.
Theo nghiên cứu phân tích được công bố trên Tạp chí Dịch tễ học Lâm sàng, bao gồm 154 tài liệu nghiên cứu tổng quan có hệ thống Cochrane được xuất bản từ năm 2015 đến năm 2019, chỉ 15 nghiên cứu (9,9%) có bằng chứng mạnh dựa trên phương pháp tiêu chuẩn vàng để xác định chất lượng nghiên cứu.
Công cụ đó được gọi là GRADE (phân loại các khuyến nghị, đánh giá và phát triển). Trong số 15 phương pháp điều trị này, chỉ có hai phương pháp có kết quả có ý nghĩa thống kê – nghĩa là các kết quả không do lỗi ngẫu nhiên – và được các tác giả tin rằng nó hữu ích trong thực hành lâm sàng. Sử dụng cùng một hệ thống, 37% phương pháp điều trị có chứng cứ trung bình, 31% có chứng cứ yếu và 22% có chứng cứ rất yếu.
Công cụ GRADE xem xét những thứ chẳng hạn như rủi ro sai số. Ví dụ: các nghiên cứu “mù” —trong đó bệnh nhân không biết họ đang điều trị thực sự hay dùng giả dược – đưa ra bằng chứng chất lượng cao hơn các nghiên cứu “không mù”. Nghiên cứu “mù” rất quan trọng vì những người biết họ đang điều trị bằng phương pháp nào có thể gặp tác dụng giả dược lớn hơn những người không biết họ đang điều trị gì.
Ngoài ra, GRADE cũng xem xét liệu các nghiên cứu có chính xác hay không do sự khác biệt trong cách điều trị. Trong đánh giá năm 2016, các nhà nghiên cứu nhận thấy rằng 13,5% các phương pháp điều trị – khoảng 1/7 – có chứng cứ mạnh. Theo GRADE, không có chứng cứ mạnh có nghĩa là các nghiên cứu trong tương lai có thể đưa kết quả trái lại.
Trong 608 nghiên cứu hệ thống, được thực hiện vào năm 2016, thì có 154 nghiên cứu được chọn vì chúng là bản cập nhật của nghiên cứu trước đó. Chúng tôi đã kiểm tra xem nghiên cứu được cập nhật đó có chứng cứ mạnh hay không. Ra là không. Trong nghiên cứu năm 2016, chỉ có 13,5% báo cáo phương pháp điều trị có chứng cứ đủ mạnh, do đó, xu hướng nghiên cứu chất lượng thấp sẽ càng nhiều khi có nhiều bằng chứng hơn.
Có một số hạn chế trong nghiên cứu. Đầu tiên, cỡ mẫu trong nghiên cứu có thể không mang tính đại diện, và vài nghiên cứu đã phát hiện ra rằng hơn 40% các phương pháp điều trị y tế có thể có hiệu quả. Ngoài ra, mẫu trong nghiên cứu không đủ lớn để kiểm tra xem có một số loại phương pháp điều trị y tế nhất định (dược lý, phẫu thuật, tâm lý) tốt hơn những loại khác hay không. Cũng có thể là “tiêu chuẩn vàng” để xếp hạng bằng chứng (GRADE) quá khắt khe.
Quá nhiều nghiên cứu chất lượng thấp
Nhiều nghiên cứu chất lượng kém đang được xuất bản và khảo sát của chúng tôi phản ánh điều này. Vì áp lực “xuất bản hoặc bị loại bỏ” để tồn tại trong giới khoa học, ngày càng có nhiều nghiên cứu được thực hiện. Chỉ riêng trong PubMed – một cơ sở dữ liệu về các bài báo y tế đã xuất bản – hơn 12.000 thử nghiệm lâm sàng mới được xuất bản hàng năm. Nghĩa là 30 thử nghiệm được xuất bản mỗi ngày. Những nghiên cứu được thiết kế để tổng hợp chúng, nhưng hiện nay cũng có quá nhiều bài như vậy: hơn 2.000 bài mỗi năm được xuất bản chỉ tính riêng trên PubMed.
Y học thực chứng đã bỏ qua sự cần thiết phải nâng cao chất lượng nghiên cứu trong hơn 30 năm nay, nhưng nghịch lý thay, không có bằng chứng nào cho thấy mọi thứ đã được cải thiện mặc dù có rất nhiều hướng dẫn và chỉ dẫn
Năm 1994, Doug Altman, giáo sư thống kê y khoa tại Đại học Oxford, đã đề nghị nghiên cứu ít hơn, nhưng chất lượng hơn. Điều này lẽ ra là tốt, nhưng điều ngược lại đã xảy ra. Số lượng thử nghiệm lớn như vũ bão được công bố hàng năm, kết hợp với nhu cầu xuất bản để tồn tại trong giới học thuật, đã dẫn đến rất nhiều nghiên cứu rác được xuất bản và điều này không thay đổi theo thời gian.
Chứng cứ yếu là rất nghiêm trọng: Nếu không có bằng chứng đủ mạnh, chúng tôi không thể chắc chắn rằng các phương pháp điều trị được sử dụng là có hiệu quả.
Công cụ GRADE quá khắc khe
Người nghiên cứu khoa học chỉ nên đổ lỗi cho công cụ nghiên cứu như là biện pháp cuối cùng, vì vậy chỉ nên cân nhắc khi cho rằng công cụ GRADE không chính xác. Tuy nhiên, có lẽ là công cụ GRADE quá khắt khe với một số trường hợp. Ví dụ, gần như không thể có thử nghiệm đánh giá chế độ tập luyện hiệu quả nào là có chứng cứ mạnh
Thử nghiệm tập thể dục thì không thể nghiên cứu “mù”: Bất kỳ ai tập thể dục sẽ biết họ đang ở trong nhóm nào, trong khi những người trong nhóm đối chứng sẽ biết họ không tập thể dục. Ngoài ra, thật khó để khiến nhiều nhóm người cùng thực hiện một bài tập giống nhau, trong khi khiến mọi người cùng uống một viên thuốc thì dễ dàng hơn. Những vấn đề cố hữu này khiến các thử nghiệm tập thể dục bị đánh giá là có chất lượng thấp hơn, cho dù tập thể dục an toàn hữu ích đến đâu.
Ngoài ra, phương pháp của chúng tôi rất khắt khe. Trong khi các nghiên cứu hệ thống có nhiều kết quả (mỗi kết quả có thể có chứng cứ mạnh), chúng tôi tập trung vào các kết quả chính. Ví dụ, kết quả chính trong việc xem xét thuốc giảm đau sẽ là giảm đau. Sau đó, họ cũng có thể đo lường một loạt các kết quả phụ, từ giảm lo lắng đến hài lòng của bệnh nhân
Tập trung vào các kết quả chính sẽ ít bị sai lệch. Nếu chúng ta xem xét nhiều kết quả, có nguy cơ một trong số chúng có chứng cứ mạnh là do ngẫu nhiên. Để giảm thiểu điều này, chúng tôi đã xem xét mọi kết quả — ngay cả khi đó không phải là kết quả chính. Chúng tôi nhận thấy rằng mỗi 1 trong 5 kết quả phương pháp điều trị là có chứng cứ mạnh.
Tính trung bình, hầu hết các phương pháp điều trị y tế được chứng minh có hiệu quả trong các nghiên cứu hệ thống đều không có chứng cứ mạnh. Chúng tôi cần nghiên cứu có số lượng ít hơn, nhưng chất lượng hơn, để chúng tôi có niềm tin hơn rằng các phương pháp điều trị chúng tôi thực hiện là có hiệu quả.