|
|
|
|
|
| - - Calidad de la evidencia y grado de recomendación |
|
| Calidad de la evidencia y grado de recomendación |
Mapa Buscador Avanzado |
 |
|
|
 |
|
18/02/2009 - Guías Clínicas 2009;
9 Supl 1: 6
|
Autores:
|
 |
Mercè Marzo Castillejo |
Especialista en Medicina Familiar y Comunitaria y en
M. Preventiva y Salud Pública (1) |
|
 |
Cristina Viana Zulaica |
Especialista en M. Familiar y Comunitaria (2)
|
|
(1) Divisió d’Atención Primaria del Institut
Català de la Salut. Miembro del grupo de trabajo
GRADE. Coordinadora del Comité científico de
semFYC.
(2) Servicio de Atención Primaria de Elviña-
Mesoiro- SERGAS- A Coruña.
Miembros de grupos de la Red Temática de Investigación sobre Medicina Basada en la Evidencia (Expte FIS: G03/090).
|
|
| Información: |
Elaborada
por médicos con revisión posterior por colegas
Conflicto de intereses:
Ninguno declarado.
El material publicado en esta serie de artículos
forma parte de una actividad de formación continuada
desarrollada en colaboración con Red
MBE y
GuiaSalud
 |
Curso sobre Guías de Práctica
Clínica |
|
|
| Puntos
clave |
 |
 |
Los conceptos de
calidad, nivel de evidencia y grado de
recomendación forman el eje central de la
definición de GPC basada en la evidencia, ya
que son los instrumentos que proporcionan a
los clínicos reglas sólidas para valorar la
investigación publicada, determinar su
validez y su utilidad en la práctica clínica. |
 |
 |
La existencia de
diferentes clasificaciones para evaluar y
clasificar la evidencia y las diferentes
interpretaciones de los grados de evidencia
hace que en el año 2000 se cree el grupo de
trabajo GRADE. Este grupo que intenta
construir y validar una clasificación que
equilibre la sencillez con la necesidad de
integrar todos los aspectos importantes a la
hora de evaluar las evidencias y graduar las
recomendaciones. |
 |
 |
El grupo de elaboración
de la guía además de identificar la
información suministrada por la literatura
científica necesita conocer el
funcionamiento de los servicios sanitarios,
el nivel de actividad y las variaciones
locales que puedan ser significativas. Esta
información ayuda a identificar las
diferencias entre la práctica clínica actual
y la ideal y las experiencias de los
pacientes, de tal manera que las
recomendaciones tengan el máximo impacto.
>>> |
 |
 |
Para realizar la eliminación de los trabajos
no relevantes de la selección producto de la
búsqueda bibliográfica se realiza un proceso
de criba cuyos dos primeros pasos son la
lectura de los títulos y de los resúmenes de
los trabajos seleccionados.
>>> |
 |
 |
Las tablas de evidencia
facilitan la comparación y ayudan a
comprobar la posibilidad de calcular un
estimador de efecto, cuando se comparan
estudios cuantitativos con el mismo diseño y
se dispone de los datos necesarios se puede
realizar un metaanálisis.
>>> |
 |
 |
Todo el material producto de los diferentes pasos de la elaboración de la guía: búsqueda bibliográfica, planillas de lectura crítica, tabla de evidencia, etc., sirve de base al grupo de trabajo de la GPC para elaborar las recomendaciones, para ello realiza una interpretación de las pruebas científicas disponibles y mediante un método de consenso se alcanza un acuerdo sobre el contenido de las mismas. >>> |
 |
|
Arriba
|
|
 |
Introducción |
En el capítulo 5 se han descrito los pasos a seguir en el proceso de elaboración de una Guía de Práctica Clínica (GPC). Se señaló que para dar respuesta a las preguntas clínicas y asegurar que las recomendaciones están basadas en la mejor evidencia disponible, los diferentes estudios identificados a partir de la búsqueda de la literatura se deben evaluar con la finalidad de disponer de los datos y de la información más apropiados (Shekelle PG, 1999) (lectura crítica de la literatura). El objetivo de este capítulo es revisar de forma más específica los apartados de síntesis de la evidencia y formulación de las recomendaciones.
En el desarrollo de una GPC, los conceptos de calidad, nivel de evidencia y grado de recomendación forman el eje central de la definición de GPC basada en la evidencia, ya que son los instrumentos que intentan estandarizar y proporcionar a los clínicos reglas sólidas para valorar la investigación publicada, determinar su validez y resumir su utilidad en la práctica clínica (Upshur RE, 2003). Este proceso debería ser transparente y realizarse de forma sistemática (NICE, 2004).
La estrategia de separar los niveles de evidencia y los grados de recomendación tuvo su origen en la Canadian Task Force on Preventive Health Care (CTFPHC, 2005). La CTFPHC fue creada en el año 1976 a partir de una Conferencia de los Ministros de Sanidad de las diez provincias de Canadá. La CTFPHC , en el desarrollo de su metodología, contempló el peso de la evidencia científica para hacer recomendaciones ya fueran a favor o en contra de incluir intervenciones de prevención en las personas asintomáticas (CTFPHC, 2005). En esta metodología se introduce la noción de que la evidencia científica se presenta de manera jerárquica, y que algunos diseños de estudio están más sujetos a sesgos que otros y, por lo tanto, justifican en menor medida las decisiones clínicas (Upshur RE, 2003).
Posteriormente diferentes instituciones y sociedades científicas también han contemplado estas diferencias en la apreciación de la calidad de las evidencias y han ido desarrollando diversos sistemas de clasificación para evaluar y estructurar la evidencia y establecer los grados de recomendación. Actualmente existen más de 100 sistemas de clasificación para valorar la calidad de la evidencia (West S, 2002). En el anexo 1 se describen las clasificaciones más conocidas y utilizadas en nuestro medio:
- Canadian Task Force on Preventive Health Care (CTFPHC, 2003; CTFPHC, 2005; Harris RP, 2001).
- US Preventive Services Task Force (USPSTF). (actualmente integrada en la Agency for Healthcare Research and Quality-AHRQ) (Harris RP, 2001; USPSTF, 2003).
- US Agency for Health Care Policy and Research (actualmente denominada AHRQ) (AHRQ, 2005).
- Centro de Medicina Basado en la Evidencia de Oxford (OCEBM, 2005).
- Scottish Intercollegiate Guidelines Network (SIGN, 2008).
- National Institute for Clinical Excellence (NICE, 2008).
En la mayoría de las clasificaciones se opta por señalar unos niveles de evidencia y grado de recomendaciones que sólo tienen en cuenta los estudios sobre intervenciones terapéuticas. La clasificación del Centro de Medicina Basada en la Evidencia de Oxford, se justifica por la necesidad de evaluar no sólo las intervenciones terapéuticas y preventivas, sino también aquellas ligadas al diagnóstico, pronóstico, factores de riesgo y evaluación económica (OCEBM, 2005). La clasificación de NICE opta por adaptar la clasificación de SIGN para estudios de intervención y la clasificación de Oxford para estudios de pruebas diagnósticas (NICE, 2008).
La descripción de las clasificaciones disponibles, su calidad y limitaciones han sido evaluadas por diferentes autores. Para las personas interesadas en profundizar en el tema se puede ampliar información con los siguientes documentos de revisión: Una de estas revisiones es la realizada por la AHRQ, donde se evalúan 19 clasificaciones (West S, 2002) y la otra realizada por el grupo de trabajo de GRADE donde se evalúan 7 de estas clasificaciones (GRADE, 2004).
La proliferación de clasificaciones para evaluar y clasificar la evidencia y las diferentes interpretaciones de los grados de evidencia plantea potenciales problemas para los usuarios (Upshur RE, 2003; Atkins D, 2004). Por un lado, esta situación entra en contradicción con el propio concepto de Medicina Basada en la Evidencia (MBE), ya que la MBE es un instrumento que en parte ha sido creado para reducir las inconsistencias innecesarias y ayudar a estandarizar la práctica clínica. Y en consecuencia, los diferentes criterios de las clasificaciones disponibles y las inconsistencias en la nomenclatura, introducen una amplia gama de variabilidad en las prácticas basadas en la evidencia científica (Upshur RE, 2003).
En el año 2000 y con el objetivo de abordar las deficiencias de los actuales sistemas de clasificación, personas de las diferentes instituciones que han desarrollado estas clasificaciones y/o elaboran GPC crearon el grupo de trabajo "Grading of Recommendations Assessment, Development and Evaluation (GRADE) Working Group" (Atkins D, 2004; GRADE, 2005). Este grupo de trabajo ha desarrollado el sistema GRADE, el cual persigue hacer juicios más coherentes y que la comunicación de dichos juicios pueda respaldar opciones mejor fundamentadas en la atención sanitaria (Atkins D, 2004). El nuevo sistema para guiar los juicios complejos trata de equilibrar la necesidad de sencillez con la necesidad de considerar de forma global y transparente todos los aspectos importantes de la gradación de la evidencia. Los autores de GRADE han desarrollado ampliamente el instrumento para evaluar los estudios de intervención y actualmente se está avanzando en la validación de esta clasificación para los estudios de diagnóstico. El grupo GRADE publicó su primer artículo explicando en qué consiste esta clasificación en un BMJ del año 2004 (Atkins D, 2004), y la traducción de este artículo al castellano se puede encontrar en la web (http://www.gradeworkinggroup.org/).
 |
Experiencia sobre la síntesis de evidencias en nuestro medio |
En nuestro medio la elaboración de GPC basadas en la evidencia científica no es todavía muy abundante. Hace unos años ya constatamos que las instituciones que empezaron a elaborarlas con una metodología rigurosa se podían contar con los dedos de una mano (Marzo M, 2002). Actualmente, y según podemos identificar a través del portal GuíaSalud, las GPC que han cumplido los criterios de calidad y que están en este catálogo del Sistema Nacional de Salud, todavía son muy escasas (GuiaSalud, 2005).
En nuestro entorno, los diferentes grupos que están elaborarndo GPC, han buscando información en las mismas fuentes y han revisado los documentos y materiales de los grupos internacionales (SIGN, New Zealand, AHQR yNICE) que elaboran GPC. Sin embargo las diferentes instituciones elaboradoras de guías en nuestro medio, ha optado por una clasificación diferente. A modo de ejemplos las GPC de Osakidetza han utilizado la clasificación de SIGN, en el Institut Català de la Salut, la clasificación de la AHQR y en el proyecto de semFYC junto a las diversas sociedades científicas y el Centro Cohrane Iberoamericano, la clasificación de Oxford. Posiblemente esto haya generado un poco más de inconsistencia y confusión a los usuarios de nuestras GPC. No obstante, algunas de estas instituciones ya están debatiendo la pertinencia de utilizar el sistema de clasificación GRADE (NICE, 2008). En el anexo 2, transcribimos una nota metodológica sobre el sistema de clasificación GRADE elaborada para la revista de Atención primaria basada en la evidencia.
 |
Aspectos metodológicos en el proceso de la síntesis de la evidencia y grado de recomendación |
Independientemente de la clasificación escogida, en todo proceso de elaboración de una GPC se deben seguir una serie de pasos que a continuación vamos a describir.
Identificar la evidencia
Es un paso preparatorio al proceso de clasificar la calidad de la evidencia y graduar las recomendaciones y esencial para articular las respuestas a las preguntas clínicas. Es una tarea laboriosa, en la que se trata de encontrar la mejor evidencia a partir de una búsqueda de la bibliografía en las fuentes más relevantes, con rigor y con la mínima presencia de sesgos (NICE, 2008). En este punto el objetivo también es identificar aspectos en los que la falta de evidencias haga necesario articular métodos de consenso.
La búsqueda bibliográfica se debe realizar mediante una estrategia que ha de ser sensible (habilidad para encontrar información relevante) y específica (habilidad para excluir documentos irrelevantes), cualidades relacionadas con los descriptores utilizados y el período de tiempo establecido entre los límites. El grupo elaborador tras consultar a expertos en el tema objeto de la guía decide los límites que se establecen. Se intentará incluir los años en los que se hayan publicado más estudios y con resultados más relevantes. Si existe una revisión sistemática (RS), la búsqueda adicional se limitará a la actualización tras la publicación de
la RS
, en los casos en los que
la RS
úsqueda. En ocasiones es necesario contactar con los autores de los trabajos publicados o pendientes de publicación (NICE, 2008).
Todos los pasos mencionados deben ser repetibles y trasparentes, documentado la estrategia de búsqueda, y los criterios de inclusión y exclusión de los originales para identificar evidencias, así como los términos elegidos.
Al identificar la evidencia hay una serie de documentos que deberían ser excluidos (NICE, 2008).
- Estudios con diseños poco adecuados si hay documentos de mejor calidad.
- Material comercial.
- Folletos divulgativos.
- Artículos, comentarios y editoriales que interpretan los resultados de lo publicado.
- Experiencias individuales salvo que formen parte de un estudio bien diseñado.
Revisión y gradación de la evidencia
Los estudios encontrados tras la búsqueda se revisarán para elegir los que ofrecen datos más útiles para responder a las preguntas clínicas y asegurar que las recomendaciones están basadas en la mejor evidencia. Estos pasos, al igual que en apartado anterior, se deben realizar de manera explícita, reproducible y transparente (Gómez E, 1999). La revisión se llevará a cabo mediante un proceso de revisión sistemática que incluye lo siguiente (NICE, 2008):
Selección de estudios relevantes
Antes de disponer de los artículos completos se hace un proceso de criba que incluye varios pasos, en cada uno de ellos se elimina aquel material no relevante según los criterios predefinidos:
- Lectura de los títulos
- Lectura de los resúmenes
- Examen de los resúmenes en función de los objetivos de la guía
- Revisión de documento completo
Para evitar sesgos se recomienda que dos personas individualmente repitan el mismo proceso con una selección aleatoria de resúmenes (Gómez E, 1999).
Evaluación de la calidad de los estudios
Una vez que se han seleccionado los estudios, el siguiente paso es evaluar su calidad y validez. La evaluación se realiza cumplimentando una planilla de lectura crítica que consta de una serie de preguntas específicas acerca del diseño y resultados del estudio. Las planillas con los criterios de calidad son diferentes según el tipo de estudio (ensayo clínico, estudios de cohortes, estudios de pruebas diagnósticas) y para cada estudio la evaluación se realiza de acuerdo a los aspectos que se recogen en cada una de las planillas (INFAC, 2002).
En nuestro medio las planillas de lectura crítica más utilizadas por los elaboradores de GPC son las de SIGN, que podemos encontrar en su manual para elaboradores de GPC (SIGN, 2008), el cuál está traducido al español y también las planillas de CASPE, a las cuáles se puede acceder a través de Internet (CASPE, 2005).
La evaluación es un aspecto clave en la revisión y la deberían realizar al menos 2 revisores de forma independiente. Para la evaluación global de cada estudio muchos elaboradores de guías utilizan la escala “++”, “+” ó “-”, que refleja la posibilidad de ausencia de sesgos. El resultado de la evaluación definirá el nivel de evidencia del estudio y su consiguiente impacto en la clase de la recomendación.
Síntesis de los resultados
Obtención de los datos y tablas de evidencia:
Los resultados de la evaluación se incluyen en una tabla de evidencia, estas tablas ayudan a identificar los parecidos y diferencias entre los estudios en sus aspectos clave: características de la población, intervenciones y medidas de resultado.
Las tablas de evidencia facilitan la comparación y ayudan a comprobar la posibilidad de calcular un estimador de efecto. La síntesis de la evidencia puede realizarse por métodos cualitativos y cuantitativos. Los métodos cualitativos consisten en resumir lo encontrado en los estudios individuales que reflejen con la mayor exactitud la relevancia de la evidencia encontrada. Los métodos cuantitativos se realizan cuando existen estudios con el mismo diseño y se dispone de los datos necesarios, se utiliza una técnica estadística que combina los resultados de diferentes estudios con el mismo diseño que es el metaanálisis. Mediante análisis de sensibilidad se puede conocer el impacto de los datos perdidos (NICE, 2008).
La evaluación conjunta de los distintos estudios se recoge en forma de una tabla de evidencia que resume la calidad global de la evidencia y el balance entre los beneficios y los riesgos. Al resumir la información hemos de tener en cuenta:
- El volumen de la evidencia: ¿De cuántos estudios disponemos? ¿De cuántos pacientes disponemos?
- La validez interna: ¿Qué calidad tienen los estudios? ¿Qué tipo de sesgos les afecta?
- La aplicabilidad: ¿Hasta qué punto se pueden aplicar estas intervenciones a nuestra población? ¿Estas intervenciones están disponibles en aquellos lugares donde se ha de implementar
la GPC?
- Generalización /Validez externa: ¿Hasta que punto se pueden extrapolar los datos de otras poblaciones?: Riesgo basal, edad, etc. Personal capacitado, otros actores culturales.
- Consistencia: ¿Los resultados de los estudios son consistentes: en los diferentes diseños de estudios, entre diferentes poblaciones?
- Impacto clínico: Teniendo en cuenta el tamaño de la muestra, la magnitud del efecto, el beneficio relativo comparando con otras opciones, recursos implicados, los costes, el balance entre beneficios y riesgos.
Niveles de evidencia:
A los estudios de intervención que reúnen un mínimo de criterios de calidad se les asignan a un nivel de evidencia que será útil tanto para el grupo elaborador, como para que los usuarios de la guía conozcan el tipo de evidencia en el que se ha basado la recomendación.
En este punto y teniendo en cuenta la necesidad de escoger una
clasificación, nos parece que hasta que la colaboración internacional no
llegue a un acuerdo, la opción de NICE es muy acertada. Como hemos
comentado en los apartados previos NICE ha optado por utilizar la
clasificación de SIGN para los estudios de intervención y la
clasificación de Oxford para los estudios de diagnósticos [Anexo 1:
Descripción de las clasificaciones más conocidas y utilizadas en nuestro
medio (al final del capítulo)]. No obstante, pensamos que en un futuro próximo GRADE será una realidad a nivel internacional. Y como hemos descrito en el anexo 2 la iniciativa GRADE en el apartado de calidad de la evidencia, propone juzgar la calidad de la evidencia en los diferentes estudios para cada una de las variables (resultados importantes), tener solo en cuenta las variables clave a la hora de tomar una decisión y describir la calidad global a partir de las variables clave.
Gradación de la evidencia
Al realizar la evaluación de la calidad, como hemos comentado, a los artículos se les asigna un código que se representa “++”, “+” ó “-”. Los estudios incluidos en el grupo “-”, en general, no se usan para sentar recomendacione (NICE, 2008), pero se consideran las siguientes posibilidades:
- Si hay estudios de buena calidad que ayuden a responder a las preguntas clínicas y sus resultados son consistentes, se rechazan los estudios del grupo “-”.
- Si las conclusiones de los estudios clasificados como “-” forman parte de un cuerpo de evidencia razonable que muestra las mismas conclusiones, aunque de manera débil, que otros estudios “-”, se pueden incluir en la tabla de evidencia para demostrar el alcance de la consistencia.
- Si los estudios “-” sugieren una diferencia en los resultados se deben dejar en la tabla de evidencia para ser discutido posteriormente en el grupo.
Elaboración de recomendaciones El grupo de elaboración de la guía además de identificar la información suministrada por la literatura científica necesita conocer el funcionamiento de los servicios sanitarios, el nivel de actividad y las variaciones locales que puedan ser significativas. Esta información ayuda a identificar las diferencias de la práctica clínica actual, la provisión de servicios y las experiencias de los pacientes, de tal manera que la orientación de las recomendaciones tenga el máximo impacto en los servicios y en los resultados (NICE, 2008).
Todo el material previo (búsqueda bibliográfica, planillas de lectura crítica, tabla de evidencia, etc.) nos sirve de base para elaborar las recomendaciones.
Esta elaboración se produce a partir de la interpretación de las pruebas científicas disponibles y
es derivada de un método de consenso que inevitablemente involucra valores de juicio por parte del grupo que elabora
la GP. Este
ícito, para que el juicio hecho a partir de las evidencias sea lo más claro posible (NICE, 2008)..
Diferentes factores contribuyen al proceso de elaboración de las recomendaciones:
- La naturaleza de la evidencia (susceptibilidad al sesgo)
- Aplicabilidad de la evidencia a la población de interés
- Costos
- Características del sistema de salud
- Creencias y valores de grupo que confecciona las recomendaciones.
Las recomendaciones de la guía generalmente se clasifican de acuerdo
al peso de la evidencia sobre la que se apoyan. Es importante esto y que las recomendaciones estén formuladas de manera clara. Muchos usuarios de las guías se centran exclusivamente en la lectura de las recomendaciones sin examinar el documento completo de la guía, la clasificación del grado de recomendación supone una indicación de la confianza en que se producirán los resultados deseados.
Los pasos a seguir en el desarrollo de las recomendaciones son:
- Traducir la evidencia en recomendaciones
Una vez que se ha examinado la evidencia y se ha discutido su adecuación para responder a las preguntas clínicas es necesario transformarla en recomendación. Si el peso de la evidencia es muy fuerte (nivel 1 de evidencia), el proceso se puede realizar de manera sencilla. En muchos casos el peso de la evidencia no está tan claro.
- Redactar las recomendaciones
Es un aspecto muy importante por el motivo ya comentado, puede ser la única referencia para un número importante de usuarios. El grupo de elaboración debe estar de acuerdo con el resultado final. Algunos aspectos a tener en cuenta a la hora de redactar las recomendaciones son (NICE, 2008):
- Redactar de una en una
- Redacción no ambigua
- Estar orientadas a la acción
- Ordenadas por tema y siempre que sea posible asignada a una grupo determinado
- No utilizar nombres comerciales en el caso de fármacos o de técnicas comercializadas.
- No incluir dosis de fármacos
- Explicitar cuando la recomendación de un fármaco en
la GPC
es con una indicación no incluida en su ficha técnica
- Utilizar técnicas que mejoren la calidad de presentación de las recomendaciones.
-
Resaltadas claramente respecto a los comentarios que se
hagan.
- Las recomendaciones deben tener en consideración al paciente, intentarán evitar el uso de palabras tales como “sujeto” en lugar de “personas” o “pacientes”.
- Clasificando las recomendaciones
Enlazando con el apartado de niveles de evidencia y siguiendo la clasificación escogida (SIGN para estudios de intervención y Oxford para pruebas diagnósticas), las recomendaciones se han de clasificar de acuerdo al peso de la evidencia sobre la que se sustentan.
Actualmente, y como hemos comentado en la introducción, se cuestiona la utilidad de un sistema de clasificación basado solamente en el nivel de evidencia porque no tiene en cuenta la importancia de la actualización de las recomendaciones en la práctica y la mejora del cuidado del paciente. El desarrollo de la iniciativa GRADE persigue que en un futuro se puedan incluir estos aspectos a la hora de presentar las recomendaciones de las GPC. Tal como se ha descrito en el anexo 2 esta iniciativa en el apartado de fuerza de la recomendación tiene en cuenta las consideraciones acerca de: todas las variables de resultado claves, la calidad de la evidencia, el balance entre beneficios y riesgos, la contextualización de la evidencia a las circunstancias específicas (valores y preferencias), la incertidumbre sobre el riesgo basal, así como la consideración de los costes (utilización de recursos). Y a modo de ejmplo la categoría de recomendación sugerida por GRADE de Hazlo (‘’recomendamos’’ o ‘’deberíamos recomendar’’) es un recomendación fuerte a favor de, e indica que los beneficios claramente sobrepasan los riesgos y que la gran mayoría de personas bien informadas harían la misma elección (alta confianza, poca incertidumbre). - Priorización de las recomendaciones para la implementación
Muchas guías con frecuencia contienen un número considerable de recomendaciones producto de una importante cantidad de preguntas clínicas, la priorización de las recomendaciones se hace con el objetivo de ayudar a los usuarios de las guías, y resaltar criterios que puedan ser utilizados como indicadores de calidad asistencial. Es recomendable priorizar un número de recomendaciones que no sea superior a diez. Se pueden usar muchos criterios para realizar la selección, no existen normas escritas de cómo hacerlo pero es importante tener en cuenta (NICE, 2008):
- El alto impacto clínico.
- Un alto impacto en la reducción de la variabilidad.
- Implica un uso más eficiente de los recursos.
 |
Decisiones de grupo y consenso |
La elaboración de una GPC en muchas ocasiones exige que los miembros del grupo tomen decisiones colectivas. Desde la realización de preguntas clínicas a la elaboración de recomendaciones. No hay normas en las que basarse para decidir cual es la manera más adecuada de hacerlo. De manera práctica se recurre a los métodos de consenso que se describen a continuación (NICE, 2008).
Grupos focales
Método útil para usar en temas en los que no se dispone de información suficiente para formular una recomendación, permite interpretar con mayor profundidad perspectivas especiales, como ocurre, por ejemplo, con grupo étnicos o inmigrantes.
Métodos formales de consenso
Ofrecen una alternativa explícita y transparente para el proceso de toma de decisiones. La elección de uno de estos métodos formales que seguidamente describimos, está en función de las ventajas e inconvenientes de la pregunta a responder, de las necesidades del grupo y de la disponibilidad de tiempo. En muchas ocasiones se usan fórmulas híbridas para hacerlas más operativas. Es importante describir el proceso usado y sus resultados. Los casos en los que el grupo no cumple las condiciones de un grupo de consenso han de quedar reflejados en el documento, detallando los aspectos en los que no ha habido convergencia. Hemos de señalar la importancia del papel del facilitador en la calidad del proceso para cada uno de los tres métodos que se describen (Fitch K, 2001).
Técnica de Delphi
Se realizan varios envíos por correo a los participantes, en el primero de ellos se pregunta sobre su opinión de un tema determinado. En envíos sucesivos los participantes reciben un resumen de los resultados de las rondas anteriores con la posibilidad de revisar sus opiniones. Los participantes no se relacionan entre sí. Las opiniones de los participantes se agregan mediante métodos estadísticos. Este método tiene la ventaja de que se realiza intercambio de información entre una cantidad importante de personas sin gran coste, tiene el inconveniente de que se pierden los aspectos positivos del debate del grupo.
Técnica de grupo nominal
Es una técnica de identificación y de priorización que permite obtener resultados de manera rápida aunque con menos consenso. Los participantes convocados por correo o de manera presencial elaboran un listado individualmente, la lista de ideas se devuelve a las personas cuando están reunidas para debatir sobre ellas, posteriormente se emite un voto en privado. Es muy importante el papel del facilitador, cada idea se discute por turno y se discuten todas las ideas.
Conferencia de consenso
Consiste en un grupo seleccionado de 10 personas que se reúnen para conseguir un consenso, el grupo se complementa con expertos que no toman parten de las decisiones del grupo. Tras escucharles se retiran y consideran las preguntas a la luz de la evidencia presentada e intentan alcanzar el consenso. Las partes abiertas y las privadas del proceso son compartidas.
Método Rand
Técnica de consenso que es una modificación del método de Delphi al que incorpora elementos de la técnica de grupo nominal. Se considera un método más explícito y reproductible. En nuestro medio se ha utilizado con éxito para la elaboración de guías con escasas evidencias de calidad (Alonso C, 2003).
 |
Anexo 1. Descripción de las clasificaciones más conocidas y utilizadas en nuestro medio.
|
Canadian Task Force on Preventive Health Care (CTFPHC)
| Tabla 1. Grados de recomendación para las intervenciones específicas de prevención |
| A |
Existe buena evidencia para recomendar la intervención clínica de prevención |
| B |
Existe moderada evidencia para recomendar la intervención clínica de prevención |
| C |
La evidencia disponible es conflictiva y no permite hacer recomendaciones a favor o en contra de la intervención clínica preventiva; sin embargo, otros factores podrían influenciar en la decisión. |
| D |
Existe moderada evidencia para recomendar en contra de la intervención clínica de prevención |
| E |
Existe buena evidencia para recomendar en contra la intervención clínica de prevención |
| I |
Existe evidencia insuficiente (en cantidad y en cualidad) para hacer una recomendación; sin embargo, otros factores podrían influenciar en la decisión. |
|

| Tabla 2. Niveles de evidencia - Graduación de los diseños de estudio |
| I |
Evidencia a partir de ensayos clínicos aleatorizados |
| II-1 |
Evidencia a partir de ensayos clínicos sin aleatorización |
| II-2 |
Evidencia a partir de estudios de cohortes y casos y controles, preferiblemente realizados por más de un centro o grupo de investigación. |
| II-3 |
Evidencia a partir de comparaciones en el tiempo o entre sitios, con o sin la intervención; podrían incluirse resultados espectaculares provenientes de estudios no aleatorizados |
| III |
Opinión de expertos, basados en la experiencia clínica; estudios descriptivos o informes de comités de expertos |
|

| Tabla 3. Niveles de evidencia - Calidad de la graduación (validez interna) |
| Buena |
Un estudio (incluyendo el meta-análisis y la revisión sistemática) que cumple los criterios específicos de estudio bien diseñado* |
| Moderada |
Un estudio (incluyendo el meta-análisis y la revisión sistemática) que no cumple (o no está claro que cumpla) al menos uno de los criterios específicos de estudio bien diseñado*, aunque no tiene ’’defectos fatales’’. |
| Insuficiente |
Un estudio (incluyendo el meta-análisis y la revisión sistemática) que tiene en su diseño al menos un ’’defecto fatal’’ o no cumple (o no está claro que cumpla) al menos uno de los criterios específicos de estudio bien diseñado*, aunque no presenta’’errores fatales’’ o una acumulación de defectos menores que hagan que los resultados del estudio no permitan elaborar las recomendaciones. |
|
U.S. Preventive Services Task Force (USPSTF): The U.S. Preventive Services Task Force (USPSTF) gradúa sus recomendaciones según una de estas cinco clasificaciones (A, B, C, D, I) reflejando la fuerza de la recomendación y la magnitud del beneficio neto (beneficio menos riesgo).
| Tabla 1. Fuerza de las recomendaciones |
| A |
La USPSTF
recomienda claramente que los clínicos proporcionen la intervención a los pacientes que cumplan los criterios.
La USPSTF
ha encontrado buena evidencia de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan ampliamente a los riesgos). |
| B |
La USPSTF
recomienda que los clínicos proporcionen la intervención a los pacientes.
La USPSTF
ha encontrado evidencia moderada de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan a los riesgos. |
| C |
La USPSTF
no recomienda a favor o en contra de la intervención.
La USPSTF
ha encontrado al menos evidencia moderada de que la medida puede mejorar los resultados en salud, pero los beneficios son muy similares a los riesgos y no puede justificarse una recomendación general. |
| D |
La USPSTF
recomienda en contra que los clínicos proporcionen la intervención a los pacientes asintómaticos.
La USPSTF
ha encontrado al menos evidencia moderada de que la medida es ineficaz o que los riesgos superan a los beneficios. |
| I |
La USPSTF
concluye que la evidencia es insuficiente para recomendar a favor o en contra de la intervención. No existe evidencia de que la intervención es ineficaz, o de calidad insuficiente, o conflictiva y que el balance entre los riesgos y los beneficios no se puede determinar. |
|

| Tabla 2. Niveles de evidencia - Calidad de la evidencia |
| Buena |
La evidencia incluye resultados consistentes a partir de estudios bien diseñados y realizados en poblaciones representativas que directamente evalúan efectos sobre resultados de salud |
| Moderada |
La evidencia es suficiente para determinar efectos sobre resultados de salud, pero la fuerza de la evidencia es limitada por el número, la calidad, o la consistencia de los estudios individuales, la generalización a la práctica rutinaria, o la naturaleza indirecta de la evidencia sobre los resultados de salud. |
| Insuficiente |
La evidencia es insuficiente para evaluar los efectos sobre los resultados de salud debido al número limitado o al poder de estudios, defectos importantes en su diseño o realización, inconsistencias en la secuencia de la evidencia, o falta de información sobre resultados de salud importantes. |
|
Agency for Healthcare Research and Quality (AHRQ):
| Tabla 1. Grados de recomendación |
| A |
Existe buena evidencia en base a la investigación para apoyar la recomendación |
| B |
Existe moderada evidencia en base a la investigación para apoyar la recomendación |
| C |
La recomendación se basa en la opinión de expertos o en un panel de consenso |
| X |
Existe evidencia de riesgo para esta intervención |
|

| Tabla 2. Clasificación de las recomendaciones en función del nivel de evidencia disponible |
| Ia |
La evidencia científica procede a partir de meta-análisis de ensayos clínicos controlados y aleatorizados |
| Ib |
La evidencia científica procede de al menos un ensayo clínico controlado y aleatorizado |
| IIa |
La evidencia científica procede de al menos un estudio prospectivo
controlado, bien diseñado y sin aleatorizar |
| IIb |
La evidencia científica procede de al menos un estudio casi experimental, bien diseñado. |
| III |
La evidencia científica procede de estudios descriptivos no experimentales, bien diseñados como estudios comparativos, de correlación o de casos y controles |
| IV |
La evidencia científica procede de documentos u opiniones de expertos y/o
experiencias clínicas de autoridades de prestigio |
|
| A |
Recoge los niveles de evidencia científica Ia y Ib |
| B |
Recoge los niveles de evidencia científica IIa, IIb y IIII |
| A |
Recoge el nivel de evidencia IV |
|
Centre for Evidence-Based Medicine, Oxford (OCEBM):
| Estudios sobre tratamiento, prevención, etiología y complicaciones |
| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a
|
Revisión sistemática de ECA, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 1 b |
ECA individual (con intervalos de confianza estrechos) |
| 1 c |
Eficacia demostrada por la práctica clínica y no por la experimentación |
|
B
|
2 a
|
Revisión sistemática de estudios de cohortes, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 2 b |
Estudio de cohortes individual y ensayos clínicos aleatorios de baja calidad (< 80% de seguimiento) |
| 2 c |
Investigación de resultados en salud |
|
3 a
|
Revisión sistemática de estudios de casos y controles, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 3 b |
Estudios de casos y controles individuales |
| C |
4 |
Serie de casos y estudios de cohortes y casos y controles de baja calidad. |
|
*Si tenemos un único estudio con IC amplios o una revisión sistemática con heterogeneidad estadísticamente significativa, se indica añadiendo el signo (-) al nivel de evidencia que corresponda y la recomendación que se deriva es una D
|
|

| Estudios de historia natural y pronóstico |
| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a
|
Revisión sistemática de estudios de cohortes, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección y GPC validadas. |
| 1 b |
Estudios de cohortes individuales con > 80% de seguimiento |
| 1 c |
Resultados a partir de la efectividad y no de su eficacia demostrada a través de un estudio de cohortes |
| B |
2 a
|
Revisión sistemática de estudios de cohorte retrospectiva o de grupos controles no tratados en un ECA, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 2 b |
Estudio de cohorte retrospectiva o seguimiento de controles no tratados en un ECA, o GPC no validadas. |
| 2 c |
Investigación de resultados en salud |
| C |
4 |
Serie de casos y estudios de cohortes de pronóstico de poca calidad |
|
*Si tenemos un único estudio con IC amplios o una revisión sistemática con heterogeneidad estadísticamente significativa, se indica añadiendo el signo (-) al nivel de evidencia que corresponda y la recomendación que se deriva es una D
|
|

| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a
|
Revisión sistemática de estudios diagnósticos de nivel 1 (alta calidad), con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección y GPC validadas |
| 1 b |
Estudios de cohortes que validen la calidad de una prueba específica, con unos buenos estándares de referencia (independientes de la prueba) o a partir de algoritmos de estimación del pronóstico o de categorización del diagnóstico |
| 1 c |
Pruebas diagnósticas con especificidad tan alta que un resultado positivo confirma el diagnóstico y con sensibilidad tan alta que un resultado negativo descarta el diagnóstico. |
| B |
2 a
|
Revisión sistemática de estudios diagnósticos de nivel 2 (mediana calidad) con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección |
| 2 b |
Estudios exploratorios que, a través de p. e. una regresión logística, determinan qué factores son significativos , y que sean validados con unos buenos estándares de referencia (independientes de la prueba), o a partir de algoritmos de estimación del pronóstico o de categorización del diagnóstico, o de validación de muestras separadas |
| 3 b |
Comparación cegada u objetiva de un espectro una cohorte de pacientes que podría normalmente ser examinado para un determinado trastorno, pero el estándar de referencia no se aplica a todos los pacientes del estudio |
| C |
4 |
- Los estándares de referencia no son objetivables, cegados o independientes.
- Las pruebas positivas y negativas son verificadas usando estándares de referencia diferentes
- El estudio compara pacientes con un trastorno determinado conocido con pacientes diagnosticados de otra condición. |
| D |
5 |
Opinión de expertos sin valoración crítica explícita, ni basada en fisiología, ni en investigación juiciosa ni en los principios fundamentales |
|

| Análisis económico y análisis de decisiones |
| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a
|
Revisión sistemática de estudios económicos de nivel 1 (alta calidad), con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección |
| 1 b |
Análisis basados en los costes clínicos o en sus alternativas; revisiones sistemáticas de la evidencia; e inclusión de análisis de análisis de sensibilidad |
| 1 c |
Análisis en términos absolutos de riesgos y beneficios clínicos: claramente tan buenas o mejores, pero más baratas, claramente tan malas o peores pero más caras |
| B |
2 a
|
Revisión sistemática de estudios económicos de nivel 2 (mediana calidad) con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 2 b |
Análisis basados en los costes clínicos o en sus alternativas; revisiones sistemáticas con evidencia limitada; estudios individuales; e inclusión de análisis de análisis de sensibilidad |
| 2 c |
Investigación de resultados en salud |
| 3 b |
Análisis sin medidas de coste precisas pero incluyendo un análisis de sensibilidad que incorpora variaciones clínicamente sensibles en las variables importantes |
| C |
4 |
Análisis que no incluye análisis de la sensibilidad |
| D |
5 |
Opinión de expertos sin valoración crítica explícita, ni basada en teorías económicas |
|
Scottish Intercollegiate Guidelines Network (SIGN):
| Tabla 1. Niveles de evidencia |
| 1++ |
Metaanálisis de alta calidad, revisiones sistemáticas de ensayos clínicos o ensayos clínicos de alta calidad con muy poco riesgo de sesgo. |
| 1+ |
Metaanálisis bien realizados, revisiones sistemáticas de ensayos clínicos o ensayos clínicos bien realizados con poco riesgo de sesgos. |
| 1- |
Metaanálisis, revisiones sistemáticas de ensayos clínicos o ensayos clínicos con alto riesgo de sesgos. |
| 2++ |
Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos y controles. Estudios de cohortes o de casos y controles con riesgo muy bajo de sesgo y con alta probabilidad de establecer una relación causal. |
| 2+ |
Estudios de cohortes o de casos y controles bien realizados con bajo riesgo de sesgo y con una moderada probabilidad de establecer una relación causal. |
| 2- |
Estudios de cohortes o de casos y controles con alto riesgo de sesgo y riesgo significativo de que la relación no sea causal. |
| 3 |
Estudios no analíticos, como informes de casos y series de casos. |
| 4 |
Opinión de expertos. |
| Los estudios clasificados como 1- y 2- no deben usarse en el proceso de elaboración de recomendaciones por su alto potencial de
sesgo. |
|

| Tabla 2. Grados de Recomendación |
| A |
Al menos un metaanálisis, revisión sistemática o ensayo clínico clasificado como 1++ y directamente aplicable a la población diana de la guía; o un volumen de evidencia científica compuesto por estudios clasificados como 1+ y con gran consistencia entre ellos. |
| B |
Un volumen de evidencia científica compuesta por estudios clasificados como 2 ++, directamente aplicable a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica extrapolada desde estudios clasificados como 1 ++ ó 1+ |
| C |
Un volumen de evidencia científica compuesta por estudios clasificados como 2 + directamente aplicables a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica extrapolada desde estudios clasificados como 2 ++ |
| D |
Evidencia científica de nivel 3 ó 4; o evidencia científica extrapolada desde estudios clasificados como 2+ |
|
NICE: Guideline Development Methods:
| Tabla 1. Niveles de evidencia para estudios de intervención |
| 1++ |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con muy bajo riesgo de sesgos. |
| 1+ |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con bajo riesgo de sesgos. |
| 1- |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con alto riesgo de sesgos*. |
| 2++ |
Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de casos-controles de alta calidad, con muy bajo riesgo de confusión, sesgos o azar y una alta probabilidad de que la relación sea causal. |
| 2+ |
Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusión, sesgos o azar y una moderada probabilidad de que la relación sea causal. |
| 2- |
Estudios de cohortes o de casos y controles con alto riesgo de sesgo* |
| 3 |
Estudios no analíticos, como informe de casos y series de casos |
| 4 |
Opinión de expertos |
| * Los estudios con un nivel de evidencia ‘‘ no deberían utilizarse como base para elaborar una recomendación |
|
Adaptado de Scottish Intercollegiate Guidelines Network
|
|

| Tabla 2. Clasificación de las recomendaciones para estudios de intervención |
| A |
- Al menos un meta-análisis, o un ensayo clínico aleatorio categorizados como 1++, que sea directamente aplicable a la población diana, o
- Una revisión sistemática o un ensayo clínico aleatorio o un volumen de evidencia con estudios categorizados como 1+, que sea directamente aplicable a la población diana y demuestre consistencia de los resultados
- Evidencia a partir de la apreciación de NICE
|
| B |
- Un volumen de evidencia que incluya estudios calificados de 2++, que sean directamente aplicables a la población objeto y que demuestren globalmente consistencia de los resultados, o
- Extrapolación de estudios calificados como 1++ o 1+.
|
| C |
- Un volumen de evidencia que incluya estudios calificados de 2+, que sean directamente aplicables a la población objeto y que demuestren globalmente consistencia de los resultados, o
- Extrapolación de estudios calificados como 2++.
|
| D |
- Evidencia nivel 3 o 4, o
- Extrapolación de estudios calificados como 2+ o
- Consenso formal
|
| D (BPP) |
Un buen punto de práctica (BPP) es una recomendación para la mejor práctica basado en la experiencia del grupo que elabora la guía |
| IP |
Recomendación a partir del manual para
procedimientos de intervención de NICE |
|

| Tabla 3. Niveles de evidencia para estudios de diagnóstico |
| Ia |
Revisión sistemática (con homogenidad)* de estudios de nivel 1† |
| Ib |
Estudios de nivel 1† |
| II |
Estudios de nivel 2 ‡ Revisiones sistemáticas de estudios de nivel 2 |
| III |
Estudios de nivel 3 § Revisiones sistemáticas de estudios de nivel 3 |
| IV |
Consenso, informes de comités de expertos o opiniones y /o experiencia clínica sin valoración crítica explícita; o en base a la psicología, difusión de la investigación o ‘principios básicos’ |
|
* Homogeneidad significa que no hay variaciones o estas son pequeñas en la dirección y grado de los resultados entre los estudios individuales que incluye la revisión sistemática.
† Estudios de nivel 1:
- aquellos que utilizan una comparación ciega de la prueba con un estándar de referencia validado (gold standard)
- en una muestra de pacientes que refleja a la población a quien se aplicaría la prueba.
‡ Estudios nivel 2 son aquellos que presentan una sola de esta características:
- población reducida (la muestra no refleja las características de la población a la que se le va a aplicar la prueba)
- utilizan un estándar de referencia pobre (definido como aquel donde la ‘prueba’ es incluida en la ‘referencia’, o aquel en que las ‘pruebas’ afectan a la ‘referencia’)
- la comparación entre la prueba y la referencia no está cegada
- Estudios de casos y controles.
§ Estudios de nivel 3 son aquellos que presentan al menos dos o tres de las características señaladas anteriormente.
|
|
Adaptado de The Oxford Centre for Evidence-based Medicine Levels of Evidence (2001) and the Centre for Reviews and Dissemination Report Number 4 (2001).
|
|

| Tabla 4. Clasificación de las recomendaciones para los estudios diagnóstico |
| A (ED) |
Estudios con un nivel de evidencia Ia o Ib |
| B (ED) |
Estudios con un nivel de evidencia II |
| C (ED) |
Estudios con un nivel de evidencia III |
| D (ED) |
Estudios con un nivel de evidencia IV |
|
ED = Estudios diagnósticos
|
|
 |
Anexo 2. La iniciativa GRADE: la calidad de la evidencia y la fuerza de las recomendaciones |
La calidad de la evidencia indica hasta qué punto podemos confiar en que el estimador del efecto es correcto y la fuerza de una recomendación significa hasta qué punto podemos confiar en que poner en práctica una recomendación conllevará más beneficios que riesgos. GRADE propone realizar juicios secuenciales acerca de: 1) La calidad de la evidencia en los diferentes estudios para cada uno de los resultados importantes; 2) Los resultados clave para una decisión; 3) La calidad global de la evidencia para estos resultados claves; 4) El balance entre beneficios y riesgos y, 5) La fuerza de las recomendaciones.
La calidad de la evidencia
El primer paso consiste en escoger las variables de resultado (ya sean de beneficios o de riesgos) y juzgar la calidad de la evidencia (validez) de los diferentes estudios de donde proceden las variables de resultado, considerando su diseño, la calidad metodológica, la consistencia y si la evidencia es directa o indirecta (directness).
- El diseño del estudio se refiere al tipo de estudio, que en términos generales se clasifica en Ensayo Clínico Aleatorizado (ECA) y estudio observacional. El punto de partida de la calidad de la evidencia es de alta para el ECA y de baja para los estudios observacionales (tabla 1).
- La calidad del estudio hace referencia a los métodos utilizados y a su realización. Cada tipo de estudio se define por unos criterios que se deben juzgar para cada resultado clave. La calidad de la evidencia puede bajar en (-1) (-2), en función de las limitaciones de los ECA y aumentar o disminuir en el caso de los estudios observacionales (tabla 1).
- La consistencia se refiere a la similitud en las estimaciones del efecto entre los estudios para las variables de resultado. Si hay inconsistencias importantes sin una causa que lo explique, la calidad puede igualmente disminuir (-1) (tabla 1).
- El tipo de evidencia directa o indirecta indica hasta qué punto los sujetos, las intervenciones, las comparaciones y los resultados de los estudios son similares a la pregunta de nuestro interés. En el caso de existir algún grado de incertidumbre acerca de si la evidencia es directa, se disminuye una o dos categorías. (tabla 1).
Otros aspectos que podrían disminuir la calidad de la evidencia son disponer de datos imprecisos y sospechar un sesgo de información (reporting bias) (tabla 1).
| Tabla 1. Criterios GRADE para valorar la calidad de la evidencia |
| Calidad de la evidencia |
Diseño de estudio |
Disminuir si* |
Aumentar si* |
| Alta |
ECA |
Importante (-1) o muy importante (-2) limitación de la calidad del estudio
Inconsistencia importante (-1)
Alguna (-1) o gran (-2) incertidumbre acerca de la que evidencia sea directa
Datos escasos o imprecisos (-1)
Alta probabilidad de sesgo de notificación (-1)
|
Asociación: evidencia de una fuerte asociación: RR > 2 ó < 0,5 basado en estudios observacionales sin factores de confusión (+1). Evidencia de una muy fuerte asociación RR > 5 ó < 0,2 basada en evidencia sin posibilidad de sesgos (+2)
Gradiente dosis respuesta (+1)
Todos los posibles factores confusores podrían haber reducido el efecto observado (+1) |
| Moderada |
|
| Baja |
Estudio observacional |
| Muy baja |
Cualquier otra evidencia |
|
Todos estos componentes descritos nos clasifican la calidad de la evidencia para cada variable de resultado. Una calidad alta indica que es muy poco probable que nuevos estudios modifiquen nuestra confianza en el resultado estimado; una calidad moderada, que es probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; una calidad baja, que es muy probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; y una calidad muy baja que cualquier resultado estimado es incierto.
Los resultados clave para una decisión
En esta etapa se escogen aquellas variables de resultado que son claves para tomar una decisión. La puntuación de cada una de las variables de resultado va del 1 al 9: una puntuación entre 1 y 3, define a la variable como poco importante; de entre 4 y 6, como importante y de entre 7 y 9, como clave.
La calidad global de la evidencia
Se valora la calidad global de la evidencia considerándola según el nivel de calidad mas bajo conseguido por las variables de resultado claves. Si las variables claves incluyen riesgos o daños, éstas deberían tenerse en cuenta, aún incluso habiendo incertidumbre de si la evidencia es directa. Si la evidencia para todas las variables claves favorece a la misma alternativa y hay evidencia de alta calidad para algunas, aunque no para todas las variables, la calidad global se puede considerar alta. Evidencias débiles sobre riesgos y daños poco importantes no deberían disminuir el grado de evidencia global.
El balance entre beneficios y riesgos
Es aconsejable que los juicios sobre el balance entre beneficios y riesgos, se lleven a cabo antes de considerar los costes y teniendo en cuenta tanto las variables claves como las importantes. Las preguntas a responder son: ¿Cuál es la magnitud del beneficio y hasta qué punto los resultados son reproducibles y precisos?, ¿Cuál es la magnitud del riesgo, daño y la carga que representan y hasta qué punto los resultados son reproducibles y precisos? ¿Hasta qué punto los beneficios superan a los riesgos, daños y la carga que representan?. ¿Los beneficios compensan a los riesgos, daños y la carga que representan?. Este balance se clasifica en: beneficios netos, balance entre beneficios y riesgos, balance incierto, ausencia de beneficios netos y riesgos netos.
La fuerza de las recomendaciones
En una última etapa se juzga la fuerza de la recomendación y los juicios requieren consideraciones acerca de: todas las variables de resultado claves, la calidad de la evidencia, el balance entre beneficios y riesgos, la contextualización de la evidencia a las circunstancias específicas (valores y preferencias), la incertidumbre sobre el riesgo basal, así como la consideración de los costes (utilización de recursos). Las categorías de recomendaciones sugeridas por GRADE son: Hazlo (do it), probablemente hazlo (probably do it), no recomendación, probablemente no lo hagas (probably don’t do it), no lo hagas. (don’t do it).
Hazlo (‘’recomendamos’’ o ‘’deberíamos recomendar’’) es un recomendación fuerte a favor de e indica que los beneficios claramente sobrepasan los riesgos y que la gran mayoría de personas bien informadas harían la misma elección (alta confianza, poca incertidumbre). En este caso la mayoría de los pacientes recibirían la intervención sin necesidad de ayuda en la decisión y no se esperaría mucha variación en la práctica clínica. Probablemente hazlo (‘’sugerimos’’, ‘’podríamos’’, ‘consideramos’’), es una recomendación débil a favor de, e indica que la mayoría de personas bien informadas harían la misma elección, pero un grupo sustancial no la llevaría a cabo (incertidumbre significativa) y que los beneficios y los riesgos están equilibrados o son inciertos. En este caso será útil la ayuda en la decisión y se espera mucha variación en la práctica clínica. En este caso la decisión se realizará teniendo en cuenta otros factores y se espera mucha variación en la práctica clínica. Este mismo razonamiento se aplicará a la recomendación de no hacer y probablemente no hacer.
La información sobre GRADE y sus publicaciones están disponibles en http://www.gradeworkinggroup.org/. La publicación del BMJ y otros materiales de trabajo se han traducido al castellano (Upshur RE, 2003) y están accesibles en la web de GRADE. GRADEpro es el software para elaborar las recomendaciones siguiendo la sistemática descrita previamente. El grupo de trabajo está avanzando en la mejora del propio sistema y en la aplicación del mismo a los estudios de diagnóstico y de coste-efectividad. Actualmente varias organizaciones están interesadas en GRADE: Cochrane, WHO, American College of Chest Physicians, UpToDate, etc. La sociedad española de medicina familiar y comunitaria (semFYC) está también considerando adoptar el sistema de clasificación de GRADE para la elaboración de sus recomendaciones (NICE, 2005)
- Alonso-Coello P, Zhou Q, Martinez MJ, Mills E, Heels-Ansdell D, Johanson JF, Guyatt G. Flavonoids for the treatment of hemorrhoids: a systematic review and metanalysis. Br J Surg 2006; 93: 909-920.
- Marzo M, Alonso-Coello P. La clasificación de la calidad de la evidencia y la fuerza de las recomendaciones GRADE Working Group. Aten Primaria. 2006;37(1):5-8
- Marzo M. Basora J, Rotaeche R, Mascort J. La trayectoria científica de semFYC. ¿Hacia dónde queremos avanzar? Aten Primaria 2005;35(9):447-8
 |
Bibliografía
|
- Agency for Healthcare Research and Quality (AHRQ). EPC Evidence Reports [Internet]. Rockville: AHRQ. [acceso 12/2/2009]Disponible en http://www.ahrq.gov/clinic/epcindex.htm#methodology
- Alonso Ortiz del Río C, Medrano Ortega FJ, Romero Alonso A, Villar Conde E, Calderón Sandubete E, Marín León I et al. Guía PRETEMED 2003. Guía de profilaxis de enfermedad tromboembólica en patología médica [Internet]. Córdoba: SADEMI; 2003 [acceso 12/2/2009]. Disponible en: http://ics.aragon.es/awgc/contenido.detalle.do?idContenido=231&vienede=busqueda33
- Atkins D, Best D, Briss PA, Eccles M, Falck-Ytter Y, Flottorp S, et al; GRADE Working Group. Grading quality of evidence and strength of recommendations. BMJ 2004 ;328:1490. [PubMed] [Texto completo]
- Briones Pérez de la Blanca E , Marín León I, Alvarez Gil R, Reyes Domínguez A. Fundamentos de consenso en el ámbito de las ciencias de la salud. En : Metodología de expertos. Consenso en Medicina. Berra de Unamuno A, Marín León I, Alvarez Gil R. (Eds). Granada: Escuela Andaluza de Salud Pública; 1996.p. 13.
- Canadian Task Force on Preventive Health Care. History and methods. [Internet]. 2005 [ acceso 12/2/2009]. Disponible en: http://www.ctfphc.org
- Canadian Task Force on Preventive Health Care. New grades for recommendations from the Canadian Task Force on Preventive Health Care. CMAJ 2003;169:207-8 [PubMed] [Texto completo]
- Centre for Evidence-Based Medicine de Oxford . Levels of Evidence and Grades of Recommendation [Internet]. Oxford : Centre for Evidence-Based Medicine de Oxford [acceso 12/2/2009]. Disponible en http://www.cebm.net/levels_of_evidence.asp
- Fitch K, Bernstein SJ, Aguilar MS, Burnand B, La Calle JR , Lázaro P, van het Loo M, McDonnell J, Vader JP, Kahan JP. The RAND/UCLA appropriateness method user´s manual [Internet]. RAND Health Santa Mónica; 2001 [acceso 12/2/2009]. Disponible en: http://www.rand.org/pubs/monograph_reports/MR1269/
- Grading of Recommendations of Assessment Development and Evaluations. GRADE working group. [Internet]. GRADE [acceso 12/2/2009]. Disponible en: http://www.gradeworkinggroup.org/
- Guia Salud. Catálogo de Guías de Práctica Clínica en el Sistema Nacional de Salud. [Internet]. Ministerio de Sanidad y Consumo, Gobierno de Aragón [acceso 12/2/2009]
Disponible en: http://www.guiasalud.es/
- Gómez E, De Villar de E, Lacalle JR, Briones E, Reyes A, Alvarez R et al. Estudio de la reproductibilidad y validez de una revisión sistemática de la bibliografía médica. Med. Clin. (Barc) 1999; 112 (Supl 1): 74-78.
- Harris RP, Helfand M, Woolf SH, Lohr KN, Mulrow CD, Teutsch SM for the Methods Word Group, third U.S. et al. Preventive Services Task Force. Current methods of the U.S. Preventive Services Task Force: a review of the process. Am J Prev Med 2001;20(3S):21-35 [PubMed]
- Información farmacoterapéutica de la comarca (INFAC). Metodología de la elaboración de una recomendación en la guía de práctica clínica de la hipertensión arterial (HTA): Eficacia de la dieta hiposódica [Internet]. INFAC; mayo 2002; Volumen 10- nº5. [acceso 12/2/2009]. Disponible en: http://www.euskadi.net/sanidad
- Marzo M, Alonso Coello P, Bonfill X. Las guías de práctica clínica en España. Med Clin (Barc) 2002; 118 (Supl 3):30-5
- National Institute for Clinical Excelence (NICE): Guideline Development Methods. Chapter 6: Identifying the evidence. Information for National Collaborating Centers and Guideline Developers [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
- National Institute for Clinical Excelence (NICE): Guideline Development Methods. Chapter 9: Making group decisions and reaching consensus. Information for National Collaborating Centers and Guideline Developers. [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
- National Institute for Clinical Excelence. The guidelines manual 2007 [Internet]. London: NICE; 2009.[ acceso 12/2/2009]. Disponible en: [Entrar]
- National Institute for Clinical Excellence (NICE). Guidelines Development methods. Guideline Development Methods- Chapter 7: Reviewing and grading the evidence [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
- National Institute for Clinical Excellence (NICE). Guidelines Development methods. Guideline Development Methods - Chapter 11 Creating guideline recommendations [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
- Programa en habilidades de lectura crítica. España [Internet]. CASPE [acceso 12/2/2009]. Diponible en http://www.redcaspe.org/homecasp.asp
- Scotish Intercollegiate Guidelines Network. A guideline developer´s handbook [monografía en Internet]. Edinburgh : Scottish Intercollegiate Guidelines NetworK; 2008 [acceso 12/2/2009] Disponible en: http://www.sign.ac.uk/guidelines/fulltext/50/index.html
- Shekelle PG, Woolf SH, Eccles M, Grimsahw J. Developing guidelines. BMJ 1999; 318:593-596 [PubMed] [Texto completo]
- The GRADE Working Group. Systems for grading the quality of evidence and the strength of recommendations I: Critical appraisal of existing approaches. BMC Health Serv Res 2004;4:38.[Texto completo]
- U.S. Preventive Services Task Force Ratings: Strength of Recommendations and Quality of Evidence. Guide to Clinical Preventive Services. [Internet] Third Edition: Periodic Updates, 2000-2003. Rockville : Agency for Healthcare Research and Quality. [acceso 24 de marzo de 2005]. Disponible en: http://www.ahrq.gov/clinic/3rduspstf/ratings.htm
- Upshur RE. Are all evidence-based practices alike? Problems in the ranking of evidence. CMAJ 2003;169:672-3. [PubMed] [Texto completo]
- West S, King V, Carey TS, et al. Systems to Rate the Strength of Scientific Evidence. Evidence Report/Technology Assessment No. 47 (Prepared by the Research Triangle Institute-University of North Carolina Evidence-based Practice Center under Contract No. 290-97-0011). AHRQ Publication No. 02-E016. Rockville , MD : Agency for Healthcare Research and Quality. April 2002. [ acceso 12/2/2009]. Disponible en: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=hstat1.chapter.70996
|
|
 |
Bibliografía
comentada |
- National Institute for Clinical Excellence (Update 2008) Guideline Development Methods: Information for National Collaborating Centres and Guideline Developers. London: National Institute for Clinical Excellence. Disponible en: http://www.nice.org.uk/guidelinesmanual
|
Documento elaborado por el Instituto
Nacional de Excelencia Clínica (NICE)
británico, integrado en el NHS, con el
objetivo de proporcionar apoyo a las
personas y a las organizaciones que trabajan
en la producción de guías del propio
Instituto.
El documento recoge de manera sistematizada
la experiencia de personas que han
participado en el desarrollo de guías. Se
complementa con otro documento más general,
destinado a servir de ayuda a los revisores
externos.
Está integrado por 15 capítulos que abordan
todos los aspectos a tener en cuenta cuando
se decide elaborar una GPC. Como son:
definición del alcance de la guía,
elaboración del plan de trabajo,
constitución del grupo elaborador,
desarrollo de preguntas clínicas,
identificación de la evidencia, revisión y
gradación de la evidencia, incorporación de
criterios económicos y de impacto en los
recursos, toma de decisiones, elaboración de
recomendaciones, desarrollo de criterios de
evaluación, redacción, método de consulta
con evaluadores externos y actualización y
corrección de errores.
A lo largo de los capítulos se describe
de manera muy clara lo que hay que hacer en
cada una de las etapas de producción de una
guía y para ello se acompaña de la
utilización de ejemplos y de un apéndice en
el que se incluyen, entre otras cosas,
modelos de planillas de evaluación crítica
y tablas de evidencia. Su presentación
sigue el esquema de las GPC en su
estructura, en la transparencia de su
desarrollo y en su vocación de ser útil.
Constituye una referencia obligada en temas
de metodología de elaboración de guías,
respondiendo de manera muy adecuada a la
denominación: Guía de Guías. |
- Atkins D, Best D, Briss PA, Eccles M,
Falck-Ytter Y, Flottorp S, et al; GRADE Working Group.
Grading quality of evidence and strength of recommendations.
BMJ 2004 ;328:1490. [Medline]
|
En este artículo se presenta un resumen del sistema de clasificación de los niveles de evidencia y fuerza de las recomendaciones GRADE (http://www.gradeworkinggroup.org/_ES/index.htm) ed. español. El grupo GRADE Working Group comenzó en el año 2000 como una colaboración informal de profesionales interesados en abordar las deficiencias de los actuales sistemas de clasificación de las recomendaciones. El objetivo de GRADE es desarrollar un enfoque sistemático y explícito para hacer juicios sobre la calidad de la evidencia y la fuerza de las recomendaciones que ayude a prevenir errores, facilite la valoración crítica de estos juicios y su comunicación. Los juicios sobre la fuerza de una recomendación deben tener en cuenta el balance entre beneficios y riesgos, la calidad de la evidencia, la aplicación de esta evidencia en circunstancias específicas y la situación de riesgo basal. Antes de elaborar una recomendación también es importante considerar los costes. El sistema GRADE persigue equilibrar la sencillez con la valoración global y transparente de todos los aspectos importantes que se han de tener en cuenta a la hora de llevar a cabo los juicios. Esta clasificación se ha desarrollado para que pueda aplicarse a una amplia gama de intervenciones y contextos. El artículo original se ha traducido con autorización del grupo editor del BMJ y fue publicado en: Traducción GRADE-BMJ
http://www.gradeworkinggroup.org/_ES/publications/Traduccion_GRADE-BMJ-Atencion_Primaria.pdf
Marzo Castillejo M, Montaño Barrientos A.
El sistema GRADE para la toma de decisiones clínicas y la elaboración de recomendaciones y guías de practica clínica. Aten Primaria. 2007 Sep;39(9):457-60. http://www.doyma.es/cgi-bin/wdbcgi.exe/doyma/mrevista.fulltext?pident=13109491
|
|
|
|
|
 |
 |
| © 2009 fisterra.com |
|
|
|