Guías Clínicas      Ayuda en consulta      Medicamentos      Formación      Biblioteca virtual      Fisterrae       Tienda 
 Formación - MBE - Calidad de la evidencia y grado de recomendación
 Calidad de la evidencia y grado de recomendación  Mapa    Buscador Avanzado
18/02/2009 - Guías Clínicas 2009; 9 Supl 1: 6

Autores:
Mercè Marzo Castillejo Especialista en Medicina Familiar y Comunitaria y en M. Preventiva y Salud Pública (1)
Cristina Viana Zulaica

Especialista en M. Familiar y Comunitaria (2)


(1) Divisió d’Atención Primaria del Institut Català de la Salut. Miembro del grupo de trabajo GRADE. Coordinadora del Comité científico de semFYC.
(2) Servicio de Atención Primaria de Elviña- Mesoiro- SERGAS- A Coruña.

Miembros de grupos de la Red Temática de Investigación sobre Medicina Basada en la Evidencia (Expte FIS: G03/090).


Información:
Elaborada por médicos con revisión posterior por colegas
El material publicado en esta serie de artículos forma parte de una actividad de formación continuada desarrollada en colaboración con Redeguías y GuiaSalud

Curso sobre Guías de Práctica Clínica


  Tabla de contenidos: 
Índice
Introducción
Experiencia sobre la síntesis de evidencias en nuestro medio
Aspectos metodológicos en el proceso de la síntesis de la evidencia y grado de recomendación
Decisiones de grupo y consenso
Bibliografía
Bibliografía comentada
Documentos
Cuestionario de autoevaluación
GPC tema 6. Ejercicio práctico


 Puntos clave
Los conceptos de calidad, nivel de evidencia y grado de recomendación forman el eje central de la definición de GPC basada en la evidencia, ya que son los instrumentos que proporcionan a los clínicos reglas sólidas para valorar la investigación publicada, determinar su validez y su utilidad en la práctica clínica.
La existencia de diferentes clasificaciones para evaluar y clasificar la evidencia y las diferentes interpretaciones de los grados de evidencia hace que en el año 2000 se cree el grupo de trabajo GRADE. Este grupo que intenta construir y validar una clasificación que equilibre la sencillez con la necesidad de integrar todos los aspectos importantes a la hora de evaluar las evidencias y graduar las recomendaciones.
El grupo de elaboración de la guía además de identificar la información suministrada por la literatura científica necesita conocer el funcionamiento de los servicios sanitarios, el nivel de actividad y las variaciones locales que puedan ser significativas. Esta información ayuda a identificar las diferencias entre la práctica clínica actual y la ideal y las experiencias de los pacientes, de tal manera que las recomendaciones tengan el máximo impacto. >>>
Para realizar la eliminación de los trabajos no relevantes de la selección producto de la búsqueda bibliográfica se realiza un proceso de criba cuyos dos primeros pasos son la lectura de los títulos y de los resúmenes de los trabajos seleccionados. >>>
Las tablas de evidencia facilitan la comparación y ayudan a comprobar la posibilidad de calcular un estimador de efecto, cuando se comparan estudios cuantitativos con el mismo diseño y se dispone de los datos necesarios se puede realizar un metaanálisis. >>>
Todo el material producto de los diferentes pasos de la elaboración de la guía: búsqueda bibliográfica, planillas de lectura crítica, tabla de evidencia, etc., sirve de base al grupo de trabajo de la GPC para elaborar las recomendaciones, para ello realiza una interpretación de las pruebas científicas disponibles y mediante un método de consenso se alcanza un acuerdo sobre el contenido de las mismas. >>>
Arriba
 Introducción

En el capítulo 5 se han descrito los pasos a seguir en el proceso de elaboración de una Guía de Práctica Clínica (GPC). Se señaló que para dar respuesta a las preguntas clínicas y asegurar que las recomendaciones están basadas en la mejor evidencia disponible, los diferentes estudios identificados a partir de la búsqueda de la literatura se deben evaluar con la finalidad de disponer de los datos y de la información más apropiados (Shekelle PG, 1999) (lectura crítica de la literatura). El objetivo de este capítulo es revisar de forma más específica los apartados de síntesis de la evidencia y formulación de las recomendaciones.

En el desarrollo de una GPC, los conceptos de calidad, nivel de evidencia y grado de recomendación forman el eje central de la definición de GPC basada en la evidencia, ya que son los instrumentos que intentan estandarizar y proporcionar a los clínicos reglas sólidas para valorar la investigación publicada, determinar su validez y resumir su utilidad en la práctica clínica (Upshur RE, 2003). Este proceso debería ser transparente y realizarse de forma sistemática (NICE, 2004).

La estrategia de separar los niveles de evidencia y los grados de recomendación tuvo su origen en la Canadian Task Force on Preventive Health Care (CTFPHC, 2005). La CTFPHC fue creada en el año 1976 a partir de una Conferencia de los Ministros de Sanidad de las diez provincias de Canadá. La CTFPHC , en el desarrollo de su metodología, contempló el peso de la evidencia científica para hacer recomendaciones ya fueran a favor o en contra de incluir intervenciones de prevención en las personas asintomáticas (CTFPHC, 2005). En esta metodología se introduce la noción de que la evidencia científica se presenta de manera jerárquica, y que algunos diseños de estudio están más sujetos a sesgos que otros y, por lo tanto, justifican en menor medida las decisiones clínicas (Upshur RE, 2003).  

Posteriormente diferentes instituciones y sociedades científicas también han contemplado estas diferencias en la apreciación de la calidad de las evidencias y han ido desarrollando diversos sistemas de clasificación para evaluar y estructurar la evidencia y establecer los grados de recomendación. Actualmente existen más de 100 sistemas de clasificación para valorar la calidad de la evidencia (West S, 2002). En el anexo 1 se describen las clasificaciones más conocidas y utilizadas en nuestro medio:

En la mayoría de las clasificaciones se opta por señalar unos niveles de evidencia y grado de recomendaciones que sólo tienen en cuenta los estudios sobre intervenciones terapéuticas. La clasificación del Centro de Medicina Basada en la Evidencia de Oxford, se justifica por la necesidad de evaluar no sólo las intervenciones terapéuticas y preventivas, sino también aquellas ligadas al diagnóstico, pronóstico, factores de riesgo y evaluación económica (OCEBM, 2005). La clasificación de NICE opta por adaptar la clasificación de SIGN para estudios de intervención y la clasificación de Oxford para estudios de pruebas diagnósticas (NICE, 2008).

La descripción de las clasificaciones disponibles, su calidad y limitaciones han sido evaluadas por diferentes autores. Para las personas interesadas en profundizar en el tema se puede ampliar información con los siguientes documentos de revisión: Una de estas revisiones es la realizada por la AHRQ, donde se evalúan 19 clasificaciones (West S, 2002) y la otra realizada por el grupo de trabajo de GRADE donde se evalúan 7 de estas clasificaciones (GRADE, 2004).

La proliferación de clasificaciones para evaluar y clasificar la evidencia y las diferentes interpretaciones de los grados de evidencia plantea potenciales problemas para los usuarios (Upshur RE, 2003; Atkins D, 2004). Por un lado, esta situación entra en contradicción con el propio concepto de Medicina Basada en la Evidencia (MBE), ya que la MBE es un instrumento que en parte ha sido creado para reducir las inconsistencias innecesarias y ayudar a estandarizar la práctica clínica. Y en consecuencia, los diferentes criterios de las clasificaciones disponibles y las inconsistencias en la nomenclatura, introducen una amplia gama de variabilidad en las prácticas basadas en la evidencia científica (Upshur RE, 2003).

En el año 2000 y con el objetivo de abordar las deficiencias de los actuales sistemas de clasificación, personas de las diferentes instituciones que han desarrollado estas clasificaciones y/o elaboran GPC crearon el grupo de trabajo "Grading of Recommendations Assessment, Development and Evaluation (GRADE) Working Group" (Atkins D, 2004; GRADE, 2005). Este grupo de trabajo ha desarrollado el sistema GRADE, el cual persigue hacer juicios más coherentes y que la comunicación de dichos juicios pueda respaldar opciones mejor fundamentadas en la atención sanitaria (Atkins D, 2004). El nuevo sistema para guiar los juicios complejos trata de equilibrar la necesidad de sencillez con la necesidad de considerar de forma global y transparente todos los aspectos importantes de la gradación de la evidencia. Los autores de GRADE han desarrollado ampliamente el instrumento para evaluar los estudios de intervención y actualmente se está avanzando en la validación de esta clasificación para los estudios de diagnóstico. El grupo GRADE publicó su primer artículo explicando en qué consiste esta clasificación en un BMJ del año 2004 (Atkins D, 2004), y la traducción de este artículo al castellano se puede encontrar en la web (http://www.gradeworkinggroup.org/).

 Experiencia sobre la síntesis de evidencias en nuestro medio

En nuestro medio la elaboración de GPC basadas en la evidencia científica no es todavía muy abundante. Hace unos años ya constatamos que las instituciones que empezaron a elaborarlas con una metodología rigurosa se podían contar con los dedos de una mano (Marzo M, 2002). Actualmente, y según podemos identificar a través del portal GuíaSalud, las GPC que han cumplido los criterios de calidad y que están en este catálogo del Sistema Nacional de Salud, todavía son muy escasas (GuiaSalud, 2005).

En nuestro entorno, los diferentes grupos que están elaborarndo  GPC, han buscando información en las mismas fuentes y han revisado los documentos y materiales de los grupos internacionales (SIGN, New Zealand, AHQR yNICE) que elaboran GPC.  Sin embargo las diferentes instituciones elaboradoras de  guías en nuestro medio, ha optado por una clasificación diferente. A modo de ejemplos las GPC de Osakidetza han utilizado la clasificación de SIGN, en el Institut Català de la Salut, la clasificación de la AHQR y en el proyecto de semFYC junto a las diversas sociedades científicas y el Centro Cohrane Iberoamericano, la clasificación de Oxford. Posiblemente esto haya generado un poco más de inconsistencia y confusión a los usuarios de nuestras GPC. No obstante, algunas de estas instituciones ya están debatiendo la pertinencia de utilizar el sistema de clasificación GRADE (NICE, 2008). En el anexo 2, transcribimos una nota metodológica sobre el sistema de clasificación GRADE elaborada para la revista de Atención primaria basada en la evidencia.

 Aspectos metodológicos en el proceso de la síntesis de la evidencia y grado de recomendación

Independientemente de la clasificación escogida, en todo proceso de elaboración de una GPC se deben seguir una serie de pasos que a continuación vamos a describir.

Identificar la evidencia

Es un paso preparatorio al proceso de clasificar la calidad de la evidencia y graduar las recomendaciones y esencial para articular las respuestas a las preguntas clínicas. Es una tarea laboriosa, en la que se trata de encontrar la mejor evidencia a partir de una búsqueda de la bibliografía en las fuentes más relevantes, con rigor y con la mínima presencia de sesgos (NICE, 2008). En este punto el objetivo también es identificar aspectos en los que la falta de evidencias haga necesario articular métodos de consenso.

La búsqueda bibliográfica se debe realizar mediante una estrategia que ha de ser sensible (habilidad para encontrar información relevante) y específica (habilidad para excluir documentos irrelevantes), cualidades relacionadas con los descriptores utilizados y el período de tiempo establecido entre los límites. El grupo elaborador tras consultar a expertos en el tema objeto de la guía decide los límites que se establecen. Se intentará incluir los años en los que se hayan publicado más estudios y con resultados más relevantes. Si existe una revisión sistemática (RS), la búsqueda adicional se limitará a la actualización tras la publicación de la RS , en los casos en los que la RS úsqueda. En ocasiones es necesario contactar con los autores de los trabajos publicados o pendientes de publicación (NICE, 2008).

Todos los pasos mencionados deben ser repetibles y trasparentes, documentado la estrategia de búsqueda, y los criterios de inclusión y exclusión de los originales para identificar evidencias, así como los términos elegidos.

Al identificar la evidencia hay una serie de documentos que deberían ser excluidos (NICE, 2008).

Revisión y gradación de la evidencia

Los estudios encontrados tras la búsqueda se revisarán para elegir los que ofrecen datos más útiles para responder a las preguntas clínicas y asegurar que las recomendaciones están basadas en la mejor evidencia. Estos pasos, al igual que en apartado anterior, se deben realizar de manera explícita, reproducible y transparente (Gómez E, 1999). La revisión se llevará a cabo mediante un proceso de revisión sistemática que incluye lo siguiente (NICE, 2008):

Selección de estudios relevantes

Antes de disponer de los artículos completos se hace un proceso de criba que incluye varios pasos, en cada uno de ellos se elimina aquel material no relevante según los criterios predefinidos:

Para evitar sesgos se recomienda que dos personas individualmente repitan el mismo proceso con una selección aleatoria de resúmenes (Gómez E, 1999). 

Evaluación de la calidad de los estudios

Una vez que se han seleccionado los estudios, el siguiente paso es evaluar su calidad y validez. La evaluación se realiza cumplimentando una planilla de lectura crítica  que consta de una serie de preguntas específicas acerca del diseño y resultados del estudio. Las planillas con los criterios de calidad son diferentes según el tipo de estudio (ensayo clínico, estudios de cohortes, estudios de pruebas diagnósticas) y para cada estudio la evaluación se realiza de acuerdo a los aspectos que se recogen en cada una de las planillas (INFAC, 2002).

En nuestro medio las planillas de lectura crítica más utilizadas por los elaboradores de GPC son las de SIGN, que podemos encontrar en su manual para elaboradores de GPC (SIGN, 2008), el cuál está traducido al español y también las planillas de CASPE, a las cuáles se puede acceder a través de Internet (CASPE, 2005). 

La evaluación es un aspecto clave en la revisión y la deberían realizar al menos 2 revisores de forma independiente. Para la evaluación global de cada estudio muchos elaboradores de guías utilizan la escala “++”, “+” ó “-”, que refleja la posibilidad de ausencia de sesgos. El resultado de la evaluación definirá el nivel de evidencia del estudio y su consiguiente impacto en la clase de la recomendación.

Síntesis de los resultados

Obtención de los datos y tablas de evidencia:

Los resultados de la evaluación se incluyen en una tabla de evidencia, estas tablas ayudan a identificar los parecidos y diferencias entre los estudios en sus aspectos clave: características de la población, intervenciones y medidas de resultado.

Las tablas de evidencia facilitan la comparación y ayudan a comprobar la posibilidad de calcular un estimador de efecto. La síntesis de la evidencia puede realizarse por métodos cualitativos y cuantitativos. Los métodos cualitativos consisten en resumir lo encontrado en los estudios individuales que reflejen con la mayor exactitud la relevancia de la evidencia encontrada. Los métodos cuantitativos se realizan cuando existen estudios con el mismo diseño y se dispone de los datos necesarios, se utiliza una técnica estadística que combina los resultados de diferentes estudios con el mismo diseño que es el metaanálisis. Mediante análisis de sensibilidad se puede conocer el impacto de los datos perdidos (NICE, 2008).

La evaluación conjunta de los distintos estudios se recoge en forma de una tabla de evidencia que resume la calidad global de la evidencia y el balance entre los beneficios y los riesgos. Al resumir la información hemos de tener en cuenta:

Niveles de evidencia:

A los estudios de intervención que reúnen un mínimo de criterios de calidad se les asignan a un nivel de evidencia que será útil tanto para el grupo elaborador, como para que los usuarios de la guía conozcan el tipo de evidencia en el que se ha basado la recomendación.

En este punto y teniendo en cuenta la necesidad de escoger una clasificación, nos parece que hasta que la colaboración internacional no  llegue a un acuerdo, la opción de NICE es muy acertada. Como hemos comentado en los apartados previos NICE ha optado por utilizar la clasificación de SIGN para los estudios de intervención y la clasificación de Oxford para los estudios de diagnósticos [Anexo 1: Descripción de las clasificaciones más conocidas y utilizadas en nuestro medio (al final del capítulo)]. No obstante, pensamos que en un futuro próximo GRADE será una realidad a nivel internacional. Y como hemos descrito en el anexo 2 la iniciativa GRADE en el apartado de calidad de la evidencia, propone juzgar la calidad de la evidencia en los diferentes estudios para cada una de las variables (resultados importantes), tener solo en cuenta las variables clave a la hora de tomar una decisión y describir la calidad global a partir de las variables clave.

Gradación de la evidencia

Al realizar la evaluación de la calidad, como hemos comentado, a los artículos se les asigna un código que se representa “++”, “+” ó “-”. Los estudios incluidos en el grupo “-”, en general,  no se usan para sentar recomendacione (NICE, 2008), pero se consideran las siguientes posibilidades:

Elaboración de recomendaciones

El grupo de elaboración de la guía además de identificar la información suministrada por la literatura científica necesita conocer el funcionamiento de los servicios sanitarios, el nivel de actividad y las variaciones locales que puedan ser significativas. Esta información ayuda a identificar las diferencias de la práctica clínica actual, la provisión de servicios y las experiencias de los pacientes, de tal manera que la orientación de las recomendaciones tenga el máximo impacto en los servicios y en los resultados (NICE, 2008).

Todo el material previo (búsqueda bibliográfica, planillas de lectura crítica, tabla de evidencia, etc.) nos sirve de base para elaborar las recomendaciones. Esta elaboración se produce a partir de la interpretación de las pruebas científicas disponibles y es derivada de un método de consenso que inevitablemente involucra valores de juicio por parte del grupo que elabora la GP. Este ícito, para que el juicio hecho a partir de las evidencias sea lo más claro posible (NICE, 2008)..

Diferentes factores contribuyen al proceso de elaboración de las recomendaciones:

Las recomendaciones de la guía generalmente se clasifican de acuerdo al peso de la evidencia sobre la que se apoyan. Es importante esto y que las recomendaciones estén formuladas de manera clara. Muchos usuarios de las guías se centran exclusivamente en la lectura de las recomendaciones sin examinar el documento completo de la guía, la clasificación del grado de recomendación supone una indicación de la confianza en que se producirán los resultados deseados.

Los pasos a seguir en el desarrollo de las recomendaciones son:

 Decisiones de grupo y consenso

La elaboración de una GPC en muchas ocasiones exige que los miembros del grupo tomen decisiones colectivas. Desde la realización de preguntas clínicas a la elaboración de recomendaciones. No hay normas en las que basarse para decidir cual es la manera más adecuada de hacerlo. De manera práctica se recurre a los métodos de consenso que se describen a continuación (NICE, 2008).

Grupos focales

Método útil para usar en temas en los que no se dispone de información suficiente para formular una recomendación, permite interpretar con mayor profundidad perspectivas especiales, como ocurre, por ejemplo, con grupo étnicos o inmigrantes.

Métodos formales de consenso

Ofrecen una alternativa explícita y transparente para el proceso de toma de decisiones. La elección de uno de estos métodos formales que seguidamente describimos, está en función de las ventajas e inconvenientes de la pregunta a responder, de las necesidades del grupo y de la disponibilidad de tiempo. En muchas ocasiones se usan fórmulas híbridas para hacerlas más operativas. Es importante describir el proceso usado y sus resultados. Los casos en los que el grupo no cumple las condiciones de un grupo de consenso han de quedar reflejados en el documento, detallando los aspectos en los que no ha habido convergencia. Hemos de señalar la importancia del papel del facilitador en la calidad del proceso para cada uno de los tres métodos que se describen (Fitch K, 2001).

Técnica de Delphi

Se realizan varios envíos por correo a los participantes, en el primero de ellos se pregunta sobre su opinión de un tema determinado. En envíos sucesivos los participantes reciben un resumen de los resultados de las rondas anteriores con la posibilidad de revisar sus opiniones. Los participantes no se relacionan entre sí. Las opiniones de los participantes se agregan mediante métodos estadísticos. Este método tiene la ventaja de que se realiza intercambio de información entre una cantidad importante de personas sin gran coste, tiene el inconveniente de que se pierden los aspectos positivos del debate del grupo.

Técnica de grupo nominal

Es una técnica de identificación y de priorización que permite obtener resultados de manera rápida aunque con menos consenso. Los participantes convocados por correo o de manera presencial elaboran un listado individualmente, la lista de ideas se devuelve a las personas cuando están reunidas para debatir sobre ellas, posteriormente se emite un voto en privado. Es muy importante el papel del facilitador, cada idea se discute por turno y se discuten todas las ideas.

Conferencia de consenso

Consiste en un grupo seleccionado de 10 personas que se reúnen para conseguir un consenso, el grupo se complementa con expertos que no toman parten de las decisiones del grupo. Tras escucharles se retiran y consideran las preguntas a la luz de la evidencia presentada e intentan alcanzar el consenso. Las partes abiertas y las privadas del proceso son compartidas.

Método Rand

Técnica de consenso que es una modificación del método de Delphi al que incorpora elementos de la técnica de grupo nominal. Se considera un método más explícito y reproductible. En nuestro medio se ha utilizado con éxito para la elaboración de guías con escasas evidencias de calidad (Alonso C, 2003).

 Anexo 1. Descripción de las clasificaciones más conocidas y utilizadas en nuestro medio.

Canadian Task Force on Preventive Health Care (CTFPHC)

   Tabla 1. Grados de recomendación para las intervenciones específicas de prevención
A Existe buena evidencia para recomendar la intervención clínica de prevención
B Existe moderada evidencia para recomendar la intervención clínica de prevención
C La evidencia disponible es conflictiva y no permite hacer recomendaciones a favor o en contra de la intervención clínica preventiva; sin embargo, otros factores podrían influenciar en la decisión.
D Existe moderada evidencia para recomendar en contra de la intervención clínica de prevención
E Existe buena evidencia para recomendar en contra la intervención clínica de prevención
I Existe evidencia insuficiente (en cantidad y en cualidad) para hacer una recomendación; sin embargo, otros factores podrían influenciar en la decisión.

   Tabla 2. Niveles de evidencia - Graduación de los diseños de estudio
I Evidencia a partir de ensayos clínicos aleatorizados
II-1 Evidencia a partir de ensayos clínicos sin aleatorización
II-2 Evidencia a partir de estudios de cohortes y casos y controles, preferiblemente realizados por más de un centro o grupo de investigación.
II-3 Evidencia a partir de comparaciones en el tiempo o entre sitios, con o sin la intervención; podrían incluirse resultados espectaculares provenientes de estudios no aleatorizados
III Opinión de expertos, basados en la experiencia clínica; estudios descriptivos o informes de comités de expertos  

   Tabla 3. Niveles de evidencia - Calidad de la graduación (validez interna)
Buena Un estudio (incluyendo el meta-análisis y la revisión sistemática) que cumple los criterios específicos de estudio bien diseñado*
Moderada Un estudio (incluyendo el meta-análisis y la revisión sistemática) que no cumple (o no está claro que cumpla) al menos uno de los criterios específicos de estudio bien diseñado*, aunque no tiene ’’defectos fatales’’.
Insuficiente Un estudio (incluyendo el meta-análisis y la revisión sistemática) que tiene en su diseño al menos un ’’defecto fatal’’ o no cumple (o no está claro que cumpla) al menos uno de los criterios específicos de estudio bien diseñado*, aunque no presenta’’errores fatales’’ o una acumulación de defectos menores que hagan que los resultados del estudio no permitan elaborar las recomendaciones.

U.S. Preventive Services Task Force (USPSTF): The U.S. Preventive Services Task Force (USPSTF) gradúa sus recomendaciones según una de estas cinco clasificaciones (A, B, C, D, I) reflejando la fuerza de la recomendación y la magnitud del beneficio neto (beneficio menos riesgo).

   Tabla 1. Fuerza de las recomendaciones
A La USPSTF recomienda claramente que los clínicos proporcionen la intervención a los pacientes que cumplan los criterios. La USPSTF ha encontrado buena evidencia de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan ampliamente a los riesgos).
B La USPSTF recomienda que los clínicos proporcionen la intervención a los pacientes. La USPSTF ha encontrado evidencia moderada de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan a los riesgos.
C La USPSTF no recomienda a favor o en contra de la intervención. La USPSTF ha encontrado al menos evidencia moderada de que la medida puede mejorar los resultados en salud, pero los beneficios son muy similares a los riesgos y no puede justificarse una recomendación general.
D La USPSTF recomienda en contra que los clínicos proporcionen la intervención a los pacientes asintómaticos. La USPSTF ha encontrado al menos evidencia moderada de que la medida es ineficaz o que los riesgos superan a los beneficios.
I La USPSTF concluye que la evidencia es insuficiente para recomendar a favor o en contra de la intervención. No existe evidencia de que la intervención es ineficaz, o de calidad insuficiente, o conflictiva y que el balance entre los riesgos y los beneficios no se puede determinar.  

   Tabla 2. Niveles de evidencia - Calidad de la evidencia
Buena La evidencia incluye resultados consistentes a partir de estudios bien diseñados y realizados en poblaciones representativas que directamente evalúan efectos sobre resultados de salud
Moderada La evidencia es suficiente para determinar efectos sobre resultados de salud, pero la fuerza de la evidencia es limitada por el número, la calidad, o la consistencia de los estudios individuales, la generalización a la práctica rutinaria, o la naturaleza indirecta de la evidencia sobre los resultados de salud.
Insuficiente La evidencia es insuficiente para evaluar los efectos sobre los resultados de salud debido al número limitado o al poder de estudios, defectos importantes en su diseño o realización, inconsistencias en la secuencia de la evidencia, o falta de información sobre resultados de salud importantes.

Agency for Healthcare Research and Quality (AHRQ):

   Tabla 1. Grados de recomendación
A Existe buena evidencia en base a la investigación para apoyar la recomendación
B Existe moderada evidencia en base a la investigación para apoyar la recomendación
C La recomendación se basa en la opinión de expertos o en un panel de consenso
X Existe evidencia de riesgo para esta intervención

   Tabla 2. Clasificación de las recomendaciones en función del nivel de evidencia disponible
Ia La evidencia científica procede a partir de meta-análisis de ensayos clínicos controlados y aleatorizados
Ib La evidencia científica procede de al menos un ensayo clínico controlado y aleatorizado
IIa La evidencia científica procede de al menos un estudio prospectivo controlado, bien diseñado y sin aleatorizar
IIb La evidencia científica procede de al menos un estudio casi experimental, bien diseñado.
III La evidencia científica procede de estudios descriptivos no experimentales, bien diseñados como estudios comparativos, de correlación o de casos y controles
IV La evidencia científica procede de documentos u opiniones de expertos y/o experiencias clínicas de autoridades de prestigio
A Recoge los niveles de evidencia científica Ia y Ib
B Recoge los niveles de evidencia científica IIa, IIb y IIII
A Recoge el nivel de evidencia IV

Centre for Evidence-Based Medicine, Oxford (OCEBM):

   Estudios sobre tratamiento, prevención, etiología y complicaciones
Grado de recomendación Nivel de
evidencia
Fuente
A 1 a Revisión sistemática de ECA, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección.
1 b ECA individual (con intervalos de confianza estrechos)
1 c Eficacia demostrada por la práctica clínica y no por la experimentación

B

2 a Revisión sistemática de estudios de cohortes, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección.
2 b Estudio de cohortes individual y ensayos clínicos aleatorios de baja calidad (< 80% de seguimiento)
2 c Investigación de resultados en salud
3 a Revisión sistemática de estudios de casos y controles, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección.
3 b Estudios de casos y controles individuales
C 4 Serie de casos y estudios de cohortes y casos y controles de baja calidad.

*Si tenemos un único estudio con IC amplios o una revisión sistemática con heterogeneidad estadísticamente significativa, se indica añadiendo el signo (-) al nivel de evidencia que corresponda y la recomendación que se deriva es una D

   Estudios de historia natural y pronóstico
Grado de recomendación Nivel de evidencia Fuente
A 1 a Revisión sistemática de estudios de cohortes, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección y GPC validadas.
1 b Estudios de cohortes individuales con > 80% de seguimiento
1 c Resultados a partir de la efectividad y no de su eficacia demostrada a través de un estudio de cohortes
B 2 a Revisión sistemática de estudios de cohorte retrospectiva o de grupos controles no tratados en un ECA, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección.
2 b Estudio de cohorte retrospectiva o seguimiento de controles no tratados en un ECA, o GPC no validadas.
2 c Investigación de resultados en salud
C 4 Serie de casos y estudios de cohortes de pronóstico de poca calidad

*Si tenemos un único estudio con IC amplios o una revisión sistemática con heterogeneidad estadísticamente significativa, se indica añadiendo el signo (-) al nivel de evidencia que corresponda y la recomendación que se deriva es una D

  Estudios de diagnóstico
Grado de recomendación Nivel de evidencia Fuente
A 1 a Revisión sistemática de estudios diagnósticos de nivel 1 (alta calidad), con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección y GPC validadas   
1 b Estudios de cohortes que validen la calidad de una prueba específica, con unos buenos estándares de referencia (independientes de la prueba) o a partir de algoritmos de estimación del pronóstico o de categorización del diagnóstico
1 c Pruebas diagnósticas con especificidad tan alta que un resultado positivo confirma el diagnóstico y con sensibilidad tan alta que un resultado negativo descarta el diagnóstico.
B 2 a Revisión sistemática de estudios diagnósticos de nivel 2 (mediana calidad) con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección 
2 b Estudios exploratorios que, a través de p. e. una regresión logística,  determinan qué factores son significativos , y que sean validados con unos buenos estándares de referencia (independientes de la prueba), o a partir de algoritmos de estimación del pronóstico o de categorización del diagnóstico, o de validación de muestras separadas
3 b Comparación cegada u objetiva de un espectro una cohorte de pacientes que podría normalmente ser examinado para un determinado trastorno, pero el estándar de referencia no se aplica a todos los pacientes del estudio
C 4 - Los estándares de referencia no son objetivables, cegados o independientes.
- Las pruebas positivas y negativas son verificadas usando estándares de referencia diferentes
- El estudio compara pacientes con un trastorno determinado conocido con pacientes diagnosticados de otra condición.
D 5 Opinión de expertos sin valoración crítica explícita, ni basada en fisiología, ni en investigación juiciosa ni en los principios fundamentales

   Análisis económico y análisis de decisiones
Grado de recomendación Nivel de evidencia Fuente
A 1 a Revisión sistemática de estudios económicos de nivel 1 (alta calidad), con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección
1 b Análisis basados en los costes clínicos o en sus alternativas; revisiones sistemáticas de la evidencia; e inclusión de análisis de análisis de sensibilidad
1 c Análisis en términos absolutos de riesgos y beneficios clínicos: claramente tan buenas o mejores, pero más baratas, claramente tan malas o peores pero más caras
B 2 a Revisión sistemática de estudios económicos de nivel 2 (mediana calidad) con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección.
2 b Análisis basados en los costes clínicos o en sus alternativas; revisiones sistemáticas con evidencia limitada; estudios individuales; e inclusión de análisis de análisis de sensibilidad
2 c Investigación de resultados en salud
3 b Análisis sin medidas de coste precisas pero incluyendo un análisis de sensibilidad que incorpora variaciones clínicamente sensibles en las variables importantes
C 4 Análisis que no incluye análisis de la sensibilidad
D 5 Opinión de expertos sin valoración crítica explícita, ni basada en teorías económicas 


Scottish Intercollegiate Guidelines Network (SIGN):

   Tabla 1. Niveles de evidencia
1++ Metaanálisis de alta calidad, revisiones sistemáticas de ensayos clínicos o ensayos clínicos de alta calidad con muy poco riesgo de sesgo.
1+ Metaanálisis bien realizados, revisiones sistemáticas de ensayos clínicos o ensayos clínicos bien realizados con poco riesgo de sesgos.
1- Metaanálisis, revisiones sistemáticas de ensayos clínicos o ensayos clínicos con alto riesgo de sesgos.
2++ Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos y controles. Estudios de cohortes o de casos y controles con riesgo muy bajo de sesgo y con alta probabilidad de establecer una relación causal.
2+ Estudios de cohortes o de casos y controles bien realizados con bajo riesgo de sesgo y con una moderada probabilidad de establecer una relación causal.
2- Estudios de cohortes o de casos y controles con alto riesgo de sesgo y riesgo significativo de que la relación no sea causal.
3 Estudios no analíticos, como informes de casos y series de casos.
4 Opinión de expertos.
Los estudios clasificados como 1- y 2- no deben usarse en el proceso de elaboración de recomendaciones por su alto potencial de sesgo.

   Tabla 2. Grados de Recomendación
A Al menos un metaanálisis, revisión sistemática o ensayo clínico clasificado como 1++ y directamente aplicable a la población diana de la guía; o un volumen de evidencia científica compuesto por estudios clasificados como 1+ y con gran consistencia entre ellos.
B Un volumen de evidencia científica compuesta por estudios clasificados como 2 ++, directamente aplicable a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica extrapolada desde estudios clasificados como 1 ++ ó 1+
C Un volumen de evidencia científica compuesta por estudios clasificados como 2 + directamente aplicables a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica extrapolada desde estudios clasificados como 2 ++
D Evidencia científica de nivel 3 ó 4; o evidencia científica extrapolada desde estudios clasificados como 2+

NICE: Guideline Development Methods:

   Tabla 1. Niveles de evidencia para estudios de intervención
1++ Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con muy bajo riesgo de sesgos.
1+ Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con bajo riesgo de sesgos.
1- Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con alto riesgo de sesgos*.
2++ Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de casos-controles de alta calidad, con muy bajo riesgo de confusión, sesgos o azar y una alta probabilidad de que la relación sea causal.
2+ Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusión, sesgos o azar y una moderada probabilidad de que la relación sea  causal.
2- Estudios de cohortes o de casos y controles con alto riesgo de sesgo*
3 Estudios no analíticos, como informe de casos y series de casos
4 Opinión de expertos
* Los estudios con un nivel de evidencia ‘–‘ no deberían utilizarse como base para elaborar una recomendación

Adaptado de Scottish Intercollegiate Guidelines Network

   Tabla 2. Clasificación de las recomendaciones para estudios de intervención
A

- Al menos un meta-análisis, o un ensayo clínico aleatorio categorizados como 1++, que sea directamente aplicable a la población diana, o 
- Una revisión sistemática o un ensayo clínico aleatorio o un volumen de evidencia con estudios categorizados como 1+, que sea directamente aplicable a la población diana y demuestre consistencia de los resultados
- Evidencia a partir de la apreciación de NICE 

B

- Un volumen de evidencia que incluya estudios calificados de 2++, que sean directamente aplicables a la población objeto y que demuestren  globalmente consistencia de los resultados, o
- Extrapolación de estudios calificados como 1++ o 1+.

C

- Un volumen de evidencia que incluya estudios calificados de 2+, que sean directamente aplicables a la población objeto y que demuestren  globalmente consistencia de los resultados, o
- Extrapolación de estudios calificados como 2++.

D

- Evidencia nivel 3 o 4, o
- Extrapolación de estudios calificados como 2+ o
- Consenso formal

D (BPP) Un buen punto de práctica (BPP) es una recomendación para la mejor práctica basado en la experiencia del grupo que elabora la guía
IP Recomendación a partir del manual para procedimientos de intervención de NICE  

   Tabla 3. Niveles de evidencia para estudios de diagnóstico
Ia Revisión sistemática (con homogenidad)*  de estudios de nivel 1†
Ib Estudios de nivel 1†
II Estudios de nivel 2 ‡  Revisiones sistemáticas de estudios de nivel 2
III Estudios de nivel 3 §  Revisiones sistemáticas de estudios de nivel 3
IV Consenso, informes de comités de expertos o opiniones y /o experiencia clínica sin valoración crítica explícita; o en base a la psicología, difusión de la investigación o ‘principios básicos’

* Homogeneidad significa que no hay variaciones o estas son pequeñas en la dirección y grado de los resultados entre los estudios individuales que incluye la revisión sistemática.
† Estudios de nivel 1:
-   aquellos que utilizan una comparación ciega de la prueba con un estándar de referencia validado (gold standard)
-   en una muestra de pacientes que refleja a la población a quien se aplicaría la prueba.
‡ Estudios nivel 2 son aquellos que presentan una sola de esta características:
-   población reducida (la muestra no refleja las características de la población a la que se le va a aplicar la prueba)
-   utilizan un estándar de referencia pobre (definido como aquel donde la ‘prueba’ es incluida en la ‘referencia’, o aquel en que las ‘pruebas’ afectan a la ‘referencia’)
-   la comparación entre la prueba y la referencia no está cegada 
-   Estudios de casos y controles.
§ Estudios de nivel 3 son aquellos que presentan al menos dos o tres de las características señaladas anteriormente.

Adaptado de The Oxford Centre for Evidence-based Medicine Levels of Evidence (2001) and the Centre for Reviews and Dissemination Report Number 4 (2001).

   Tabla 4. Clasificación de las recomendaciones para los estudios diagnóstico
A (ED)   Estudios con un nivel de evidencia Ia o Ib
B (ED)  Estudios con un nivel de evidencia II
C (ED) Estudios con un nivel de evidencia III
D (ED) Estudios con un nivel de evidencia IV

ED = Estudios diagnósticos

 Anexo 2. La iniciativa GRADE: la calidad de la evidencia y la fuerza de las recomendaciones

La calidad de la evidencia indica hasta qué punto podemos confiar en que el estimador del efecto es correcto y la fuerza de una recomendación significa hasta qué punto podemos confiar en que poner en práctica una recomendación conllevará más beneficios que riesgos. GRADE propone realizar juicios secuenciales acerca de: 1) La calidad de la evidencia en los diferentes estudios para cada uno de los resultados importantes; 2) Los resultados clave para una decisión; 3) La calidad global de la evidencia para estos resultados claves; 4) El balance entre beneficios y riesgos y, 5) La fuerza de las recomendaciones.

La calidad de la evidencia

El primer paso consiste en escoger las variables de resultado (ya sean de beneficios o de riesgos) y juzgar la calidad de la evidencia (validez) de los diferentes estudios de donde proceden las variables de resultado, considerando su diseño, la calidad metodológica, la consistencia y si la evidencia es directa o indirecta (directness).

Otros aspectos que podrían disminuir la calidad de la evidencia son disponer de datos imprecisos y sospechar un sesgo de información (reporting bias)  (tabla 1).

   Tabla 1. Criterios GRADE para valorar la calidad de la evidencia
Calidad de la evidencia Diseño de estudio Disminuir si* Aumentar si*
Alta  ECA

Importante (-1) o muy importante (-2) limitación de la calidad del estudio

Inconsistencia importante (-1)

Alguna (-1) o gran (-2) incertidumbre acerca de la que evidencia sea directa

Datos escasos o imprecisos (-1)

Alta probabilidad de sesgo de notificación (-1)

Asociación: evidencia de  una fuerte asociación: RR > 2 ó < 0,5 basado en estudios observacionales sin factores de confusión (+1). Evidencia de una muy fuerte asociación RR > 5 ó < 0,2 basada en evidencia sin posibilidad de sesgos (+2)

Gradiente dosis respuesta (+1)

Todos los posibles factores confusores podrían haber reducido  el efecto observado (+1)
Moderada
Baja Estudio observacional
Muy baja Cualquier otra evidencia

Todos estos componentes descritos nos clasifican la calidad de la evidencia para cada variable de resultado. Una calidad alta indica que es muy poco probable que nuevos estudios modifiquen nuestra confianza en el resultado estimado; una calidad moderada, que es probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; una calidad baja, que es muy probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; y una calidad muy baja que cualquier resultado estimado es incierto.

Los resultados clave para una decisión

En esta etapa se escogen aquellas variables de resultado que son claves para tomar una decisión. La puntuación de cada una de las variables de resultado va del 1 al 9: una puntuación entre 1 y 3, define a la variable como poco importante; de entre 4 y 6, como importante y de entre 7 y 9, como clave.

La calidad global de la evidencia

Se valora la calidad global de la evidencia considerándola según el nivel de calidad mas bajo conseguido por las variables de resultado claves. Si las variables claves incluyen riesgos o daños, éstas deberían tenerse en cuenta, aún incluso habiendo incertidumbre de si la evidencia es directa. Si la evidencia para todas las variables claves favorece a la misma alternativa y hay evidencia de alta calidad para algunas, aunque no para todas las variables, la calidad global se puede considerar alta. Evidencias débiles sobre riesgos y daños poco importantes no deberían disminuir el grado de evidencia global.

El balance entre beneficios y riesgos

Es aconsejable que los juicios sobre el balance entre beneficios y riesgos, se lleven a cabo antes de considerar los costes y teniendo en cuenta tanto las variables claves como las importantes. Las preguntas a responder son: ¿Cuál es la magnitud del beneficio y hasta qué punto los resultados son reproducibles y precisos?, ¿Cuál es la magnitud del riesgo, daño y la carga que representan y hasta qué punto los resultados son reproducibles y precisos? ¿Hasta qué punto los beneficios superan a los riesgos, daños y la carga que representan?. ¿Los beneficios compensan a los riesgos, daños y la carga que representan?. Este balance se clasifica en: beneficios netos, balance entre beneficios y riesgos, balance incierto, ausencia de beneficios netos y riesgos netos.

La fuerza de las recomendaciones

En una última etapa se juzga la fuerza de la recomendación y los juicios requieren consideraciones acerca de: todas las variables de resultado claves, la calidad de la evidencia, el balance entre beneficios y riesgos, la contextualización de la evidencia a las circunstancias específicas (valores y preferencias), la incertidumbre sobre el riesgo basal, así como la consideración de los costes (utilización de recursos). Las categorías de recomendaciones sugeridas por GRADE son: Hazlo (do it), probablemente hazlo (probably do it), no recomendación, probablemente no lo hagas (probably don’t do it), no lo hagas. (don’t do it).

Hazlo (‘’recomendamos’’ o ‘’deberíamos recomendar’’) es un recomendación fuerte a favor de e indica que los beneficios claramente sobrepasan los riesgos y que la gran mayoría de personas bien informadas harían la misma elección (alta confianza, poca incertidumbre). En este caso la mayoría de los pacientes recibirían la intervención sin necesidad de ayuda en la decisión y no se esperaría mucha variación en la práctica clínica. Probablemente hazlo (‘’sugerimos’’, ‘’podríamos’’, ‘consideramos’’), es una recomendación débil a favor de, e  indica que la mayoría de personas bien informadas harían la misma elección, pero un grupo sustancial no la llevaría a cabo (incertidumbre significativa) y que los beneficios y los riesgos están equilibrados o son inciertos. En este caso será útil la ayuda en la decisión y se espera mucha variación en la práctica clínica. En este caso la decisión se realizará teniendo en cuenta otros factores  y se espera mucha variación en la práctica clínica. Este mismo razonamiento se aplicará a la recomendación de no hacer y probablemente no hacer.

La información sobre GRADE y sus publicaciones están disponibles en http://www.gradeworkinggroup.org/. La publicación del BMJ y otros materiales de trabajo se han traducido al castellano (Upshur RE, 2003) y están accesibles en la web de GRADE. GRADEpro es el software para elaborar las recomendaciones siguiendo la sistemática descrita previamente. El grupo de trabajo está avanzando en la mejora del propio sistema y en la aplicación del mismo a los estudios de diagnóstico y de coste-efectividad. Actualmente varias organizaciones están interesadas en GRADE: Cochrane, WHO, American College of Chest Physicians, UpToDate, etc. La sociedad española de medicina familiar y comunitaria (semFYC) está también considerando adoptar el sistema de clasificación de GRADE para la elaboración de sus recomendaciones (NICE, 2005)

  1. Alonso-Coello P,  Zhou Q, Martinez MJ, Mills E, Heels-Ansdell D, Johanson JF, Guyatt G. Flavonoids for the treatment of hemorrhoids: a systematic review and metanalysis. Br J Surg 2006; 93: 909-920.
  2. Marzo M, Alonso-Coello P. La clasificación de la calidad de la evidencia y la fuerza de las recomendaciones GRADE Working Group. Aten Primaria. 2006;37(1):5-8
  3. Marzo M. Basora J, Rotaeche R, Mascort J. La trayectoria científica de semFYC. ¿Hacia dónde queremos avanzar?  Aten Primaria 2005;35(9):447-8

  Bibliografía
  • Agency for Healthcare Research and Quality (AHRQ). EPC Evidence Reports [Internet]. Rockville: AHRQ. [acceso 12/2/2009]Disponible en http://www.ahrq.gov/clinic/epcindex.htm#methodology
  • Alonso Ortiz del Río C, Medrano Ortega FJ, Romero Alonso A, Villar Conde E, Calderón Sandubete E, Marín León I et al. Guía PRETEMED 2003. Guía de profilaxis de enfermedad tromboembólica en patología médica [Internet]. Córdoba: SADEMI; 2003 [acceso 12/2/2009]. Disponible en: http://ics.aragon.es/awgc/contenido.detalle.do?idContenido=231&vienede=busqueda33
  • Atkins D, Best D, Briss PA, Eccles M, Falck-Ytter Y, Flottorp S, et al; GRADE Working Group. Grading qua­lity of evidence and strength of recommendations. BMJ 2004 ;328:1490. [PubMed] [Texto completo]
  • Briones Pérez de la Blanca E , Marín León I, Alvarez Gil R, Reyes Domínguez A. Fundamentos de consenso en el ámbito de las ciencias de la salud. En : Metodología de expertos. Consenso en Medicina. Berra de Unamuno A, Marín León I, Alvarez Gil R. (Eds). Granada: Escuela Andaluza de Salud Pública; 1996.p. 13.
  • Canadian Task Force on Preventive Health Care. History and methods. [Internet]. 2005 [ acceso 12/2/2009]. Disponible en: http://www.ctfphc.org
  • Canadian Task Force on Preventive Health Care. New grades for recommendations from the Canadian Task Force on Preventive Health Care. CMAJ 2003;169:207-8 [PubMed] [Texto completo]
  • Centre for Evidence-Based Medicine de Oxford . Levels of Evidence and Grades of Recommendation [Internet]. Oxford : Centre for Evidence-Based Medicine de Oxford [acceso 12/2/2009]. Dis­ponible en http://www.cebm.net/levels_of_evidence.asp
  • Fitch K, Bernstein SJ, Aguilar MS, Burnand B, La Calle JR , Lázaro P, van het Loo M, McDonnell J, Vader JP, Kahan JP. The RAND/UCLA appropriateness method user´s ma­nual [Internet]. RAND Health Santa Mónica; 2001 [acceso 12/2/2009]. Disponible en: http://www.rand.org/pubs/monograph_reports/MR1269/
  • Grading of Recommendations of Assessment Development and Evaluations. GRADE working group. [Internet]. GRADE [acceso 12/2/2009]. Disponible en: http://www.gradeworkinggroup.org/
  • Guia Salud. Catálogo de Guías de Práctica Clínica en el Sistema Nacional de Salud. [Internet]. Ministerio de Sanidad y Consumo, Gobierno de Aragón [acceso 12/2/2009]
    Disponible en: http://www.guiasalud.es/
  • Gómez E, De Villar de E, Lacalle JR, Briones E, Reyes A, Alvarez R et al. Estudio de la reproductibilidad y validez de una revisión sistemática de la bibliografía médica. Med. Clin. (Barc) 1999; 112 (Supl 1): 74-78.
  • Harris RP, Helfand M, Woolf SH, Lohr KN, Mulrow CD, Teutsch SM for the Methods Word Group, third U.S. et al. Preventive Services Task Force. Current methods of the U.S. Preventive Services Task Force: a review of the process. Am J Prev Med 2001;20(3S):21-35 [PubMed]
  • Información farmacoterapéutica de la comarca (INFAC). Metodología de la elaboración de una recomen­dación en la guía de práctica clínica de la hipertensión arterial (HTA): Eficacia de la dieta hiposódica [Internet]. INFAC; mayo 2002; Volumen 10- nº5. [acceso 12/2/2009]. Disponible en: http://www.euskadi.net/sanidad
  • Marzo M, Alonso Coello P, Bonfill X. Las guías de práctica clínica en España. Med Clin (Barc) 2002; 118 (Supl 3):30-5
  • National Institute for Clinical Excelence (NICE): Guideline Development Methods. Chapter 6: Identifying the evidence. Information for National Collaborating Centers and Guideline Developers [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
  • National Institute for Clinical Excelence (NICE): Guideline Development Methods. Chapter 9: Making group decisions and reaching consensus. Information for National Collaborating Centers and Guideline Developers. [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
  • National Institute for Clinical Excelence. The guidelines manual 2007 [Internet]. London: NICE; 2009.[ acceso 12/2/2009]. Disponible en: [Entrar]
  • National Institute for Clinical Excellence (NICE). Guidelines Development methods. Guideline Development Methods- Chapter 7: Reviewing and grading the evidence [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
  • National Institute for Clinical Excellence (NICE). Guidelines Development methods. Guideline Development Methods - Chapter 11 Creating guideline recommendations [Internet]. London: NICE; 2008 [acceso 12/2/2009] Disponible en: http://www.nice.org.uk/guidelinesmanual
  • Programa en habilidades de lectura crítica. España [Internet]. CASPE [acceso 12/2/2009]. Diponible en http://www.redcaspe.org/homecasp.asp
  • Scotish Intercollegiate Guidelines Network. A guideline developer´s handbook [monografía en Internet]. Edinburgh : Scottish Intercollegiate Guidelines NetworK; 2008 [acceso 12/2/2009] Disponible en: http://www.sign.ac.uk/guidelines/fulltext/50/index.html
  • Shekelle PG, Woolf SH, Eccles M, Grimsahw J. Developing guidelines. BMJ 1999; 318:593-596 [PubMed] [Texto completo]
  • The GRADE Working Group. Systems for grading the quality of evidence and the strength of recommendations I: Critical appraisal of existing approaches. BMC Health Serv Res 2004;4:38.[Texto completo]
  • U.S. Preventive Services Task Force Ratings: Strength of Recommendations and Quality of Evidence. Guide to Clinical Preventive Services. [Internet] Third Edition: Periodic Updates, 2000-2003. Rockville : Agency for Healthcare Research and Quality. [acceso 24 de marzo de 2005]. Disponible en: http://www.ahrq.gov/clinic/3rduspstf/ratings.htm
  • Upshur RE. Are all evidence-based practices alike? Problems in the ranking of evidence. CMAJ 2003;169:672-3. [PubMed] [Texto completo]
  • West S, King V, Carey TS, et al. Systems to Rate the Strength of Scientific Evidence. Evidence Report/Te­chnology Assessment No. 47 (Prepared by the Research Triangle Institute-University of North Carolina Evidence-based Practice Center under Contract No. 290-97-0011). AHRQ Publication No. 02-E016. Roc­kville , MD : Agency for Healthcare Research and Quality. April 2002. [ acceso 12/2/2009]. Disponible en: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=hstat1.chapter.70996
 
 Bibliografía comentada
  • National Institute for Clinical Excellence (Update 2008) Guideline Development Methods: Information for National Collaborating Centres and Guideline Developers. London: National Institute for Clinical Excellence. Disponible en: http://www.nice.org.uk/guidelinesmanual

    Documento elaborado por el Instituto Nacional de Excelencia Clínica (NICE) británico, integrado en el NHS, con el objetivo de proporcionar apoyo a las personas y a las organizaciones que trabajan en la producción de guías del propio Instituto.

    El documento recoge de manera sistematizada la experiencia de personas que han participado en el desarrollo de guías.  Se complementa con otro documento más general, destinado a servir de ayuda a los revisores externos.

    Está integrado por 15 capítulos que abordan todos los aspectos a tener en cuenta cuando se decide elaborar una GPC. Como son: definición del alcance de la guía, elaboración del plan de trabajo, constitución del grupo elaborador, desarrollo de preguntas clínicas, identificación de la evidencia, revisión y gradación de la evidencia, incorporación de criterios económicos y de impacto en los recursos, toma de decisiones, elaboración de recomendaciones, desarrollo de criterios de evaluación, redacción, método de consulta con evaluadores externos y actualización y corrección de errores.

    A lo largo de los capítulos se describe de manera muy clara lo que hay que hacer en cada una de las etapas de producción de una guía y para ello se acompaña de la utilización de ejemplos y de un apéndice en el que se incluyen, entre otras cosas, modelos de planillas de evaluación crítica y  tablas de evidencia.  Su presentación sigue el esquema de las GPC en su estructura, en la transparencia de su desarrollo y en su vocación de ser útil. Constituye una referencia obligada en temas de metodología de elaboración de guías, respondiendo de manera muy adecuada a la denominación: Guía de Guías.


  • Atkins D, Best D, Briss PA, Eccles M, Falck-Ytter Y, Flottorp S, et al; GRADE Working Group. Grading quality of evidence and strength of recommendations. BMJ 2004 ;328:1490. [Medline]

    En este artículo se presenta un resumen del sistema de clasificación de los niveles de evidencia y fuerza de las recomendaciones GRADE (http://www.gradeworkinggroup.org/_ES/index.htm) ed. español. El grupo GRADE Working Group comenzó en el año 2000 como una colaboración informal de profesionales interesados en abordar las deficiencias de los actuales sistemas de clasificación de las recomendaciones. El objetivo de GRADE es desarrollar un enfoque sistemático y explícito para hacer juicios sobre la calidad de la evidencia y la fuerza de las recomendaciones que ayude a prevenir errores, facilite la valoración crítica de estos juicios y su comunicación. Los juicios sobre la fuerza de una recomendación deben tener en cuenta el balance entre beneficios y riesgos, la calidad de la evidencia, la aplicación de esta evidencia en circunstancias específicas y la situación de riesgo basal. Antes de elaborar una recomendación también es importante considerar los costes. El sistema GRADE persigue equilibrar la sencillez con la valoración global y transparente de todos los aspectos importantes que se han de tener en cuenta a la hora de llevar a cabo los juicios. Esta clasificación se ha desarrollado para que pueda aplicarse a una amplia gama de intervenciones y contextos. El artículo original se ha traducido con autorización del grupo editor del BMJ y fue publicado en: Traducción GRADE-BMJ http://www.gradeworkinggroup.org/_ES/publications/Traduccion_GRADE-BMJ-Atencion_Primaria.pdf Marzo Castillejo M, Montaño Barrientos A. El sistema GRADE para la toma de decisiones clínicas y la elaboración de recomendaciones y guías de practica clínica. Aten Primaria. 2007 Sep;39(9):457-60. http://www.doyma.es/cgi-bin/wdbcgi.exe/doyma/mrevista.fulltext?pident=13109491

 
Arriba  
© 2010 fisterra.com Imprimir Página Tamaño de letra pequeño Tamaño de letra normal Tamaño de letra grande | Mis Datos | Contacto-Sugerencias | FAQ's | Condiciones de uso | Política de privacidad | Aviso legal