Calidad de la evidencia y grado de recomendación
Autores:
|
|
| Tabla de contenidos: |
| Puntos clave |
|
||||||||||||||||||||||||||
En el capítulo 5 se han descrito los pasos a seguir en el proceso de elaboración de una Guía de Práctica Clínica (GPC). Se señaló que para dar respuesta a las preguntas clínicas y asegurar que las recomendaciones están basadas en la mejor evidencia disponible, los diferentes estudios identificados a partir de la búsqueda de la literatura se deben evaluar con la finalidad de disponer de los datos y de la información más apropiados (Shekelle PG, 1999) (lectura crítica de la literatura). El objetivo de este capítulo es revisar de forma más específica los apartados de síntesis de la evidencia y formulación de las recomendaciones.
En el desarrollo de una GPC, los conceptos de calidad, nivel de evidencia y grado de recomendación forman el eje central de la definición de GPC basada en la evidencia, ya que son los instrumentos que intentan estandarizar y proporcionar a los clínicos reglas sólidas para valorar la investigación publicada, determinar su validez y resumir su utilidad en la práctica clínica (Upshur RE, 2003). Este proceso debería ser transparente y realizarse de forma sistemática (NICE, 2004).
La estrategia de separar los niveles de evidencia y los grados de recomendación tuvo su origen en la Canadian Task Force on Preventive Health Care (CTFPHC, 2005). La CTFPHC fue creada en el año 1976 a partir de una Conferencia de los Ministros de Sanidad de las diez provincias de Canadá. La CTFPHC , en el desarrollo de su metodología, contempló el peso de la evidencia científica para hacer recomendaciones ya fueran a favor o en contra de incluir intervenciones de prevención en las personas asintomáticas (CTFPHC, 2005). En esta metodología se introduce la noción de que la evidencia científica se presenta de manera jerárquica, y que algunos diseños de estudio están más sujetos a sesgos que otros y, por lo tanto, justifican en menor medida las decisiones clínicas (Upshur RE, 2003).
Posteriormente diferentes instituciones y sociedades científicas también han contemplado estas diferencias en la apreciación de la calidad de las evidencias y han ido desarrollando diversos sistemas de clasificación para evaluar y estructurar la evidencia y establecer los grados de recomendación. Actualmente existen más de 100 sistemas de clasificación para valorar la calidad de la evidencia (West S, 2002). En el anexo 1 se describen las clasificaciones más conocidas y utilizadas en nuestro medio:
- Canadian Task Force on Preventive Health Care (CTFPHC, 2003; CTFPHC, 2005; Harris RP, 2001).
- US Preventive Services Task Force (USPSTF). (actualmente integrada en la Agency for Healthcare Research and Quality-AHRQ) (Harris RP, 2001; USPSTF, 2003).
- US Agency for Health Care Policy and Research (actualmente denominada AHRQ) (AHRQ, 2005).
- Centro de Medicina Basado en la Evidencia de Oxford (OCEBM, 2005).
- Scottish Intercollegiate Guidelines Network (SIGN, 2008).
- National Institute for Clinical Excellence (NICE, 2008).
En la mayoría de las clasificaciones se opta por señalar unos niveles de evidencia y grado de recomendaciones que sólo tienen en cuenta los estudios sobre intervenciones terapéuticas. La clasificación del Centro de Medicina Basada en la Evidencia de Oxford, se justifica por la necesidad de evaluar no sólo las intervenciones terapéuticas y preventivas, sino también aquellas ligadas al diagnóstico, pronóstico, factores de riesgo y evaluación económica (OCEBM, 2005). La clasificación de NICE opta por adaptar la clasificación de SIGN para estudios de intervención y la clasificación de Oxford para estudios de pruebas diagnósticas (NICE, 2008).
La descripción de las clasificaciones disponibles, su calidad y limitaciones han sido evaluadas por diferentes autores. Para las personas interesadas en profundizar en el tema se puede ampliar información con los siguientes documentos de revisión: Una de estas revisiones es la realizada por la AHRQ, donde se evalúan 19 clasificaciones (West S, 2002) y la otra realizada por el grupo de trabajo de GRADE donde se evalúan 7 de estas clasificaciones (GRADE, 2004).
La proliferación de clasificaciones para evaluar y clasificar la evidencia y las diferentes interpretaciones de los grados de evidencia plantea potenciales problemas para los usuarios (Upshur RE, 2003; Atkins D, 2004). Por un lado, esta situación entra en contradicción con el propio concepto de Medicina Basada en la Evidencia (MBE), ya que la MBE es un instrumento que en parte ha sido creado para reducir las inconsistencias innecesarias y ayudar a estandarizar la práctica clínica. Y en consecuencia, los diferentes criterios de las clasificaciones disponibles y las inconsistencias en la nomenclatura, introducen una amplia gama de variabilidad en las prácticas basadas en la evidencia científica (Upshur RE, 2003).
En el año 2000 y con el objetivo de abordar las deficiencias de los actuales sistemas de clasificación, personas de las diferentes instituciones que han desarrollado estas clasificaciones y/o elaboran GPC crearon el grupo de trabajo "Grading of Recommendations Assessment, Development and Evaluation (GRADE) Working Group" (Atkins D, 2004; GRADE, 2005). Este grupo de trabajo ha desarrollado el sistema GRADE, el cual persigue hacer juicios más coherentes y que la comunicación de dichos juicios pueda respaldar opciones mejor fundamentadas en la atención sanitaria (Atkins D, 2004). El nuevo sistema para guiar los juicios complejos trata de equilibrar la necesidad de sencillez con la necesidad de considerar de forma global y transparente todos los aspectos importantes de la gradación de la evidencia. Los autores de GRADE han desarrollado ampliamente el instrumento para evaluar los estudios de intervención y actualmente se está avanzando en la validación de esta clasificación para los estudios de diagnóstico. El grupo GRADE publicó su primer artículo explicando en qué consiste esta clasificación en un BMJ del año 2004 (Atkins D, 2004), y la traducción de este artículo al castellano se puede encontrar en la web (http://www.gradeworkinggroup.org/).
En nuestro medio la elaboración de GPC basadas en la evidencia científica no es todavía muy abundante. Hace unos años ya constatamos que las instituciones que empezaron a elaborarlas con una metodología rigurosa se podían contar con los dedos de una mano (Marzo M, 2002). Actualmente, y según podemos identificar a través del portal GuíaSalud, las GPC que han cumplido los criterios de calidad y que están en este catálogo del Sistema Nacional de Salud, todavía son muy escasas (GuiaSalud, 2005).
En nuestro entorno, los diferentes grupos que están elaborarndo GPC, han buscando información en las mismas fuentes y han revisado los documentos y materiales de los grupos internacionales (SIGN, New Zealand, AHQR yNICE) que elaboran GPC. Sin embargo las diferentes instituciones elaboradoras de guías en nuestro medio, ha optado por una clasificación diferente. A modo de ejemplos las GPC de Osakidetza han utilizado la clasificación de SIGN, en el Institut Català de la Salut, la clasificación de la AHQR y en el proyecto de semFYC junto a las diversas sociedades científicas y el Centro Cohrane Iberoamericano, la clasificación de Oxford. Posiblemente esto haya generado un poco más de inconsistencia y confusión a los usuarios de nuestras GPC. No obstante, algunas de estas instituciones ya están debatiendo la pertinencia de utilizar el sistema de clasificación GRADE (NICE, 2008). En el anexo 2, transcribimos una nota metodológica sobre el sistema de clasificación GRADE elaborada para la revista de Atención primaria basada en la evidencia.
| Aspectos metodológicos en el proceso de la síntesis de la evidencia y grado de recomendación |
Independientemente de la clasificación escogida, en todo proceso de elaboración de una GPC se deben seguir una serie de pasos que a continuación vamos a describir.
Es un paso preparatorio al proceso de clasificar la calidad de la evidencia y graduar las recomendaciones y esencial para articular las respuestas a las preguntas clínicas. Es una tarea laboriosa, en la que se trata de encontrar la mejor evidencia a partir de una búsqueda de la bibliografía en las fuentes más relevantes, con rigor y con la mínima presencia de sesgos (NICE, 2008). En este punto el objetivo también es identificar aspectos en los que la falta de evidencias haga necesario articular métodos de consenso.
La búsqueda bibliográfica se debe realizar mediante una estrategia que ha de ser sensible (habilidad para encontrar información relevante) y específica (habilidad para excluir documentos irrelevantes), cualidades relacionadas con los descriptores utilizados y el período de tiempo establecido entre los límites. El grupo elaborador tras consultar a expertos en el tema objeto de la guía decide los límites que se establecen. Se intentará incluir los años en los que se hayan publicado más estudios y con resultados más relevantes. Si existe una revisión sistemática (RS), la búsqueda adicional se limitará a la actualización tras la publicación de la RS , en los casos en los que la RS úsqueda. En ocasiones es necesario contactar con los autores de los trabajos publicados o pendientes de publicación (NICE, 2008).
Todos los pasos mencionados deben ser repetibles y trasparentes, documentado la estrategia de búsqueda, y los criterios de inclusión y exclusión de los originales para identificar evidencias, así como los términos elegidos.
Al identificar la evidencia hay una serie de documentos que deberían ser excluidos (NICE, 2008).
- Estudios con diseños poco adecuados si hay documentos de mejor calidad.
- Material comercial.
- Folletos divulgativos.
- Artículos, comentarios y editoriales que interpretan los resultados de lo publicado.
- Experiencias individuales salvo que formen parte de un estudio bien diseñado.
Revisión y gradación de la evidencia
Los estudios encontrados tras la búsqueda se revisarán para elegir los que ofrecen datos más útiles para responder a las preguntas clínicas y asegurar que las recomendaciones están basadas en la mejor evidencia. Estos pasos, al igual que en apartado anterior, se deben realizar de manera explícita, reproducible y transparente (Gómez E, 1999). La revisión se llevará a cabo mediante un proceso de revisión sistemática que incluye lo siguiente (NICE, 2008):
Selección de estudios relevantes
Antes de disponer de los artículos completos se hace un proceso de criba que incluye varios pasos, en cada uno de ellos se elimina aquel material no relevante según los criterios predefinidos:
- Lectura de los títulos
- Lectura de los resúmenes
- Examen de los resúmenes en función de los objetivos de la guía
- Revisión de documento completo
Para evitar sesgos se recomienda que dos personas individualmente repitan el mismo proceso con una selección aleatoria de resúmenes (Gómez E, 1999).
Evaluación de la calidad de los estudios
Una vez que se han seleccionado los estudios, el siguiente paso es evaluar su calidad y validez. La evaluación se realiza cumplimentando una planilla de lectura crítica que consta de una serie de preguntas específicas acerca del diseño y resultados del estudio. Las planillas con los criterios de calidad son diferentes según el tipo de estudio (ensayo clínico, estudios de cohortes, estudios de pruebas diagnósticas) y para cada estudio la evaluación se realiza de acuerdo a los aspectos que se recogen en cada una de las planillas (INFAC, 2002).
En nuestro medio las planillas de lectura crítica más utilizadas por los elaboradores de GPC son las de SIGN, que podemos encontrar en su manual para elaboradores de GPC (SIGN, 2008), el cuál está traducido al español y también las planillas de CASPE, a las cuáles se puede acceder a través de Internet (CASPE, 2005).
La evaluación es un aspecto clave en la revisión y la deberían realizar al menos 2 revisores de forma independiente. Para la evaluación global de cada estudio muchos elaboradores de guías utilizan la escala “++”, “+” ó “-”, que refleja la posibilidad de ausencia de sesgos. El resultado de la evaluación definirá el nivel de evidencia del estudio y su consiguiente impacto en la clase de la recomendación.
Obtención de los datos y tablas de evidencia:
Los resultados de la evaluación se incluyen en una tabla de evidencia, estas tablas ayudan a identificar los parecidos y diferencias entre los estudios en sus aspectos clave: características de la población, intervenciones y medidas de resultado.
Las tablas de evidencia facilitan la comparación y ayudan a comprobar la posibilidad de calcular un estimador de efecto. La síntesis de la evidencia puede realizarse por métodos cualitativos y cuantitativos. Los métodos cualitativos consisten en resumir lo encontrado en los estudios individuales que reflejen con la mayor exactitud la relevancia de la evidencia encontrada. Los métodos cuantitativos se realizan cuando existen estudios con el mismo diseño y se dispone de los datos necesarios, se utiliza una técnica estadística que combina los resultados de diferentes estudios con el mismo diseño que es el metaanálisis. Mediante análisis de sensibilidad se puede conocer el impacto de los datos perdidos (NICE, 2008).
La evaluación conjunta de los distintos estudios se recoge en forma de una tabla de evidencia que resume la calidad global de la evidencia y el balance entre los beneficios y los riesgos. Al resumir la información hemos de tener en cuenta:
- El volumen de la evidencia: ¿De cuántos estudios disponemos? ¿De cuántos pacientes disponemos?
- La validez interna: ¿Qué calidad tienen los estudios? ¿Qué tipo de sesgos les afecta?
- La aplicabilidad: ¿Hasta qué punto se pueden aplicar estas intervenciones a nuestra población? ¿Estas intervenciones están disponibles en aquellos lugares donde se ha de implementar la GPC?
- Generalización /Validez externa: ¿Hasta que punto se pueden extrapolar los datos de otras poblaciones?: Riesgo basal, edad, etc. Personal capacitado, otros actores culturales.
- Consistencia: ¿Los resultados de los estudios son consistentes: en los diferentes diseños de estudios, entre diferentes poblaciones?
- Impacto clínico: Teniendo en cuenta el tamaño de la muestra, la magnitud del efecto, el beneficio relativo comparando con otras opciones, recursos implicados, los costes, el balance entre beneficios y riesgos.
Niveles de evidencia:
A los estudios de intervención que reúnen un mínimo de criterios de calidad se les asignan a un nivel de evidencia que será útil tanto para el grupo elaborador, como para que los usuarios de la guía conozcan el tipo de evidencia en el que se ha basado la recomendación.
En este punto y teniendo en cuenta la necesidad de escoger una clasificación, nos parece que hasta que la colaboración internacional no llegue a un acuerdo, la opción de NICE es muy acertada. Como hemos comentado en los apartados previos NICE ha optado por utilizar la clasificación de SIGN para los estudios de intervención y la clasificación de Oxford para los estudios de diagnósticos [Anexo 1: Descripción de las clasificaciones más conocidas y utilizadas en nuestro medio (al final del capítulo)]. No obstante, pensamos que en un futuro próximo GRADE será una realidad a nivel internacional. Y como hemos descrito en el anexo 2 la iniciativa GRADE en el apartado de calidad de la evidencia, propone juzgar la calidad de la evidencia en los diferentes estudios para cada una de las variables (resultados importantes), tener solo en cuenta las variables clave a la hora de tomar una decisión y describir la calidad global a partir de las variables clave.
Gradación de la evidencia
Al realizar la evaluación de la calidad, como hemos comentado, a los artículos se les asigna un código que se representa “++”, “+” ó “-”. Los estudios incluidos en el grupo “-”, en general, no se usan para sentar recomendacione (NICE, 2008), pero se consideran las siguientes posibilidades:
- Si hay estudios de buena calidad que ayuden a responder a las preguntas clínicas y sus resultados son consistentes, se rechazan los estudios del grupo “-”.
- Si las conclusiones de los estudios clasificados como “-” forman parte de un cuerpo de evidencia razonable que muestra las mismas conclusiones, aunque de manera débil, que otros estudios “-”, se pueden incluir en la tabla de evidencia para demostrar el alcance de la consistencia.
- Si los estudios “-” sugieren una diferencia en los resultados se deben dejar en la tabla de evidencia para ser discutido posteriormente en el grupo.
El grupo de elaboración de la guía además de identificar la información suministrada por la literatura científica necesita conocer el funcionamiento de los servicios sanitarios, el nivel de actividad y las variaciones locales que puedan ser significativas. Esta información ayuda a identificar las diferencias de la práctica clínica actual, la provisión de servicios y las experiencias de los pacientes, de tal manera que la orientación de las recomendaciones tenga el máximo impacto en los servicios y en los resultados (NICE, 2008).
Todo el material previo (búsqueda bibliográfica, planillas de lectura crítica, tabla de evidencia, etc.) nos sirve de base para elaborar las recomendaciones. Esta elaboración se produce a partir de la interpretación de las pruebas científicas disponibles y es derivada de un método de consenso que inevitablemente involucra valores de juicio por parte del grupo que elabora la GP. Este ícito, para que el juicio hecho a partir de las evidencias sea lo más claro posible (NICE, 2008)..
Diferentes factores contribuyen al proceso de elaboración de las recomendaciones:
- La naturaleza de la evidencia (susceptibilidad al sesgo)
- Aplicabilidad de la evidencia a la población de interés
- Costos
- Características del sistema de salud
- Creencias y valores de grupo que confecciona las recomendaciones.
Las recomendaciones de la guía generalmente se clasifican de acuerdo al peso de la evidencia sobre la que se apoyan. Es importante esto y que las recomendaciones estén formuladas de manera clara. Muchos usuarios de las guías se centran exclusivamente en la lectura de las recomendaciones sin examinar el documento completo de la guía, la clasificación del grado de recomendación supone una indicación de la confianza en que se producirán los resultados deseados.
Los pasos a seguir en el desarrollo de las recomendaciones son:
- Traducir la evidencia en recomendaciones
Una vez que se ha examinado la evidencia y se ha discutido su adecuación para responder a las preguntas clínicas es necesario transformarla en recomendación. Si el peso de la evidencia es muy fuerte (nivel 1 de evidencia), el proceso se puede realizar de manera sencilla. En muchos casos el peso de la evidencia no está tan claro. - Redactar las recomendaciones
Es un aspecto muy importante por el motivo ya comentado, puede ser la única referencia para un número importante de usuarios. El grupo de elaboración debe estar de acuerdo con el resultado final. Algunos aspectos a tener en cuenta a la hora de redactar las recomendaciones son (NICE, 2008):- Redactar de una en una
- Redacción no ambigua
- Estar orientadas a la acción
- Ordenadas por tema y siempre que sea posible asignada a una grupo determinado
- No utilizar nombres comerciales en el caso de fármacos o de técnicas comercializadas.
- No incluir dosis de fármacos
- Explicitar cuando la recomendación de un fármaco en la GPC es con una indicación no incluida en su ficha técnica
- Utilizar técnicas que mejoren la calidad de presentación de las recomendaciones.
- Resaltadas claramente respecto a los comentarios que se hagan.
- Las recomendaciones deben tener en consideración al paciente, intentarán evitar el uso de palabras tales como “sujeto” en lugar de “personas” o “pacientes”.
- Clasificando las recomendaciones
Enlazando con el apartado de niveles de evidencia y siguiendo la clasificación escogida (SIGN para estudios de intervención y Oxford para pruebas diagnósticas), las recomendaciones se han de clasificar de acuerdo al peso de la evidencia sobre la que se sustentan.
Actualmente, y como hemos comentado en la introducción, se cuestiona la utilidad de un sistema de clasificación basado solamente en el nivel de evidencia porque no tiene en cuenta la importancia de la actualización de las recomendaciones en la práctica y la mejora del cuidado del paciente. El desarrollo de la iniciativa GRADE persigue que en un futuro se puedan incluir estos aspectos a la hora de presentar las recomendaciones de las GPC. Tal como se ha descrito en el anexo 2 esta iniciativa en el apartado de fuerza de la recomendación tiene en cuenta las consideraciones acerca de: todas las variables de resultado claves, la calidad de la evidencia, el balance entre beneficios y riesgos, la contextualización de la evidencia a las circunstancias específicas (valores y preferencias), la incertidumbre sobre el riesgo basal, así como la consideración de los costes (utilización de recursos). Y a modo de ejmplo la categoría de recomendación sugerida por GRADE de Hazlo (‘’recomendamos’’ o ‘’deberíamos recomendar’’) es un recomendación fuerte a favor de, e indica que los beneficios claramente sobrepasan los riesgos y que la gran mayoría de personas bien informadas harían la misma elección (alta confianza, poca incertidumbre). - Priorización de las recomendaciones para la implementación
Muchas guías con frecuencia contienen un número considerable de recomendaciones producto de una importante cantidad de preguntas clínicas, la priorización de las recomendaciones se hace con el objetivo de ayudar a los usuarios de las guías, y resaltar criterios que puedan ser utilizados como indicadores de calidad asistencial. Es recomendable priorizar un número de recomendaciones que no sea superior a diez. Se pueden usar muchos criterios para realizar la selección, no existen normas escritas de cómo hacerlo pero es importante tener en cuenta (NICE, 2008):- El alto impacto clínico.
- Un alto impacto en la reducción de la variabilidad.
- Implica un uso más eficiente de los recursos.
| Decisiones de grupo y consenso |
La elaboración de una GPC en muchas ocasiones exige que los miembros del grupo tomen decisiones colectivas. Desde la realización de preguntas clínicas a la elaboración de recomendaciones. No hay normas en las que basarse para decidir cual es la manera más adecuada de hacerlo. De manera práctica se recurre a los métodos de consenso que se describen a continuación (NICE, 2008).
Grupos focales
Método útil para usar en temas en los que no se dispone de información suficiente para formular una recomendación, permite interpretar con mayor profundidad perspectivas especiales, como ocurre, por ejemplo, con grupo étnicos o inmigrantes.
Métodos formales de consenso
Ofrecen una alternativa explícita y transparente para el proceso de toma de decisiones. La elección de uno de estos métodos formales que seguidamente describimos, está en función de las ventajas e inconvenientes de la pregunta a responder, de las necesidades del grupo y de la disponibilidad de tiempo. En muchas ocasiones se usan fórmulas híbridas para hacerlas más operativas. Es importante describir el proceso usado y sus resultados. Los casos en los que el grupo no cumple las condiciones de un grupo de consenso han de quedar reflejados en el documento, detallando los aspectos en los que no ha habido convergencia. Hemos de señalar la importancia del papel del facilitador en la calidad del proceso para cada uno de los tres métodos que se describen (Fitch K, 2001).
Técnica de Delphi
Se realizan varios envíos por correo a los participantes, en el primero de ellos se pregunta sobre su opinión de un tema determinado. En envíos sucesivos los participantes reciben un resumen de los resultados de las rondas anteriores con la posibilidad de revisar sus opiniones. Los participantes no se relacionan entre sí. Las opiniones de los participantes se agregan mediante métodos estadísticos. Este método tiene la ventaja de que se realiza intercambio de información entre una cantidad importante de personas sin gran coste, tiene el inconveniente de que se pierden los aspectos positivos del debate del grupo.
Técnica de grupo nominal
Es una técnica de identificación y de priorización que permite obtener resultados de manera rápida aunque con menos consenso. Los participantes convocados por correo o de manera presencial elaboran un listado individualmente, la lista de ideas se devuelve a las personas cuando están reunidas para debatir sobre ellas, posteriormente se emite un voto en privado. Es muy importante el papel del facilitador, cada idea se discute por turno y se discuten todas las ideas.
Conferencia de consenso
Consiste en un grupo seleccionado de 10 personas que se reúnen para conseguir un consenso, el grupo se complementa con expertos que no toman parten de las decisiones del grupo. Tras escucharles se retiran y consideran las preguntas a la luz de la evidencia presentada e intentan alcanzar el consenso. Las partes abiertas y las privadas del proceso son compartidas.
Método Rand
Técnica de consenso que es una modificación del método de Delphi al que incorpora elementos de la técnica de grupo nominal. Se considera un método más explícito y reproductible. En nuestro medio se ha utilizado con éxito para la elaboración de guías con escasas evidencias de calidad (Alonso C, 2003).
| Anexo 1. Descripción de las clasificaciones más conocidas y utilizadas en nuestro medio. |
Canadian Task Force on Preventive Health Care (CTFPHC)
| Tabla 1. Grados de recomendación para las intervenciones específicas de prevención |
|
![]()
| Tabla 2. Niveles de evidencia - Graduación de los diseños de estudio |
|
![]()
| Tabla 3. Niveles de evidencia - Calidad de la graduación (validez interna) |
|
U.S. Preventive Services Task Force (USPSTF): The U.S. Preventive Services Task Force (USPSTF) gradúa sus recomendaciones según una de estas cinco clasificaciones (A, B, C, D, I) reflejando la fuerza de la recomendación y la magnitud del beneficio neto (beneficio menos riesgo).
| Tabla 1. Fuerza de las recomendaciones |
|
![]()
| Tabla 2. Niveles de evidencia - Calidad de la evidencia |
|
Agency for Healthcare Research and Quality (AHRQ):
| Tabla 1. Grados de recomendación |
|
![]()
| Tabla 2. Clasificación de las recomendaciones en función del nivel de evidencia disponible |
|
||||||||||||||||||||
Centre for Evidence-Based Medicine, Oxford (OCEBM):
| Estudios sobre tratamiento, prevención, etiología y complicaciones |
|
|||||||||||||||||||||||||||
![]()
| Estudios de historia natural y pronóstico |
|
|||||||||||||||||||||||
![]()
| Estudios de diagnóstico |
|
![]()
| Análisis económico y análisis de decisiones |
|
Scottish Intercollegiate Guidelines Network (SIGN):
| Tabla 1. Niveles de evidencia |
|
||||||||||||||||||
![]()
| Tabla 2. Grados de Recomendación |
|
NICE: Guideline Development Methods:
| Tabla 1. Niveles de evidencia para estudios de intervención |
|
||||||||||||||||||||
![]()
| Tabla 2. Clasificación de las recomendaciones para estudios de intervención |
|
![]()
| Tabla 3. Niveles de evidencia para estudios de diagnóstico |
|
||||||||||||||
![]()
| Tabla 4. Clasificación de las recomendaciones para los estudios diagnóstico |
|
||||||||||
| Anexo 2. La iniciativa GRADE: la calidad de la evidencia y la fuerza de las recomendaciones |
La calidad de la evidencia indica hasta qué punto podemos confiar en que el estimador del efecto es correcto y la fuerza de una recomendación significa hasta qué punto podemos confiar en que poner en práctica una recomendación conllevará más beneficios que riesgos. GRADE propone realizar juicios secuenciales acerca de: 1) La calidad de la evidencia en los diferentes estudios para cada uno de los resultados importantes; 2) Los resultados clave para una decisión; 3) La calidad global de la evidencia para estos resultados claves; 4) El balance entre beneficios y riesgos y, 5) La fuerza de las recomendaciones.
La calidad de la evidencia
El primer paso consiste en escoger las variables de resultado (ya sean de beneficios o de riesgos) y juzgar la calidad de la evidencia (validez) de los diferentes estudios de donde proceden las variables de resultado, considerando su diseño, la calidad metodológica, la consistencia y si la evidencia es directa o indirecta (directness).
- El diseño del estudio se refiere al tipo de estudio, que en términos generales se clasifica en Ensayo Clínico Aleatorizado (ECA) y estudio observacional. El punto de partida de la calidad de la evidencia es de alta para el ECA y de baja para los estudios observacionales (tabla 1).
- La calidad del estudio hace referencia a los métodos utilizados y a su realización. Cada tipo de estudio se define por unos criterios que se deben juzgar para cada resultado clave. La calidad de la evidencia puede bajar en (-1) (-2), en función de las limitaciones de los ECA y aumentar o disminuir en el caso de los estudios observacionales (tabla 1).
- La consistencia se refiere a la similitud en las estimaciones del efecto entre los estudios para las variables de resultado. Si hay inconsistencias importantes sin una causa que lo explique, la calidad puede igualmente disminuir (-1) (tabla 1).
- El tipo de evidencia directa o indirecta indica hasta qué punto los sujetos, las intervenciones, las comparaciones y los resultados de los estudios son similares a la pregunta de nuestro interés. En el caso de existir algún grado de incertidumbre acerca de si la evidencia es directa, se disminuye una o dos categorías. (tabla 1).
Otros aspectos que podrían disminuir la calidad de la evidencia son disponer de datos imprecisos y sospechar un sesgo de información (reporting bias) (tabla 1).
| Tabla 1. Criterios GRADE para valorar la calidad de la evidencia |
|
Todos estos componentes descritos nos clasifican la calidad de la evidencia para cada variable de resultado. Una calidad alta indica que es muy poco probable que nuevos estudios modifiquen nuestra confianza en el resultado estimado; una calidad moderada, que es probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; una calidad baja, que es muy probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; y una calidad muy baja que cualquier resultado estimado es incierto.
Los resultados clave para una decisión
En esta etapa se escogen aquellas variables de resultado que son claves para tomar una decisión. La puntuación de cada una de las variables de resultado va del 1 al 9: una puntuación entre 1 y 3, define a la variable como poco importante; de entre 4 y 6, como importante y de entre 7 y 9, como clave.
La calidad global de la evidencia
Se valora la calidad global de la evidencia considerándola según el nivel de calidad mas bajo conseguido por las variables de resultado claves. Si las variables claves incluyen riesgos o daños, éstas deberían tenerse en cuenta, aún incluso habiendo incertidumbre de si la evidencia es directa. Si la evidencia para todas las variables claves favorece a la misma alternativa y hay evidencia de alta calidad para algunas, aunque no para todas las variables, la calidad global se puede considerar alta. Evidencias débiles sobre riesgos y daños poco importantes no deberían disminuir el grado de evidencia global.
El balance entre beneficios y riesgos
Es aconsejable que los juicios sobre el balance entre beneficios y riesgos, se lleven a cabo antes de considerar los costes y teniendo en cuenta tanto las variables claves como las importantes. Las preguntas a responder son: ¿Cuál es la magnitud del beneficio y hasta qué punto los resultados son reproducibles y precisos?, ¿Cuál es la magnitud del riesgo, daño y la carga que representan y hasta qué punto los resultados son reproducibles y precisos? ¿Hasta qué punto los beneficios superan a los riesgos, daños y la carga que representan?. ¿Los beneficios compensan a los riesgos, daños y la carga que representan?. Este balance se clasifica en: beneficios netos, balance entre beneficios y riesgos, balance incierto, ausencia de beneficios netos y riesgos netos.
La fuerza de las recomendaciones
En una última etapa se juzga la fuerza de la recomendación y los juicios requieren consideraciones acerca de: todas las variables de resultado claves, la calidad de la evidencia, el balance entre beneficios y riesgos, la contextualización de la evidencia a las circunstancias específicas (valores y preferencias), la incertidumbre sobre el riesgo basal, así como la consideración de los costes (utilización de recursos). Las categorías de recomendaciones sugeridas por GRADE son: Hazlo (do it), probablemente hazlo (probably do it), no recomendación, probablemente no lo hagas (probably don’t do it), no lo hagas. (don’t do it).
Hazlo (‘’recomendamos’’ o ‘’deberíamos recomendar’’) es un recomendación fuerte a favor de e indica que los beneficios claramente sobrepasan los riesgos y que la gran mayoría de personas bien informadas harían la misma elección (alta confianza, poca incertidumbre). En este caso la mayoría de los pacientes recibirían la intervención sin necesidad de ayuda en la decisión y no se esperaría mucha variación en la práctica clínica. Probablemente hazlo (‘’sugerimos’’, ‘’podríamos’’, ‘consideramos’’), es una recomendación débil a favor de, e indica que la mayoría de personas bien informadas harían la misma elección, pero un grupo sustancial no la llevaría a cabo (incertidumbre significativa) y que los beneficios y los riesgos están equilibrados o son inciertos. En este caso será útil la ayuda en la decisión y se espera mucha variación en la práctica clínica. En este caso la decisión se realizará teniendo en cuenta otros factores y se espera mucha variación en la práctica clínica. Este mismo razonamiento se aplicará a la recomendación de no hacer y probablemente no hacer.
La información sobre GRADE y sus publicaciones están disponibles en http://www.gradeworkinggroup.org/. La publicación del BMJ y otros materiales de trabajo se han traducido al castellano (Upshur RE, 2003) y están accesibles en la web de GRADE. GRADEpro es el software para elaborar las recomendaciones siguiendo la sistemática descrita previamente. El grupo de trabajo está avanzando en la mejora del propio sistema y en la aplicación del mismo a los estudios de diagnóstico y de coste-efectividad. Actualmente varias organizaciones están interesadas en GRADE: Cochrane, WHO, American College of Chest Physicians, UpToDate, etc. La sociedad española de medicina familiar y comunitaria (semFYC) está también considerando adoptar el sistema de clasificación de GRADE para la elaboración de sus recomendaciones (NICE, 2005)
- Alonso-Coello P, Zhou Q, Martinez MJ, Mills E, Heels-Ansdell D, Johanson JF, Guyatt G. Flavonoids for the treatment of hemorrhoids: a systematic review and metanalysis. Br J Surg 2006; 93: 909-920.
- Marzo M, Alonso-Coello P. La clasificación de la calidad de la evidencia y la fuerza de las recomendaciones GRADE Working Group. Aten Primaria. 2006;37(1):5-8
- Marzo M. Basora J, Rotaeche R, Mascort J. La trayectoria científica de semFYC. ¿Hacia dónde queremos avanzar? Aten Primaria 2005;35(9):447-8
| Bibliografía |
|
|||||
|


Autores: