Fisterra

    Cálculo del tamaño muestral para la determinación de factores pronósticos

    Cálculos online

    Introducción

    La identificación de factores capaces de influir en el pronóstico de una enfermedad es de suma importancia para la actividad clínica diaria. Por un lado, porque facilita la toma de decisiones en cuanto a procedimientos diagnósticos o tratamientos y, por otro, porque el conocer la posible evolución de un paciente concreto permitirá informarlo sobre el curso clínico de su enfermedad.

    La realización de estudios clínico-epidemiológicos es una de las principales vías de las que se dispone para conocer el pronóstico de una patología determinada. Aunque pueden utilizarse diferentes diseños de investigación, los estudios de seguimiento, ya sean prospectivos o retrospectivos, son los más adecuados para tratar de determinar factores pronóstico. En este tipo de trabajos, una vez identificada una cohorte de pacientes con una patología determinada, se realiza un seguimiento y se calcula el riesgo relativo asociado a un determinado factor. En múltiples ocasiones, además, los datos proporcionados por los estudios clínicos suelen venir expresados en términos de tiempo de supervivencia. Una de las características esenciales de los estudios de seguimiento donde se pretende objetivar la presencia de un evento es la posible presencia de datos censurados. El paciente censurado es el que durante este seguimiento no ha presentado el evento de interés. Esto puede suceder bien porque haya abandonado el estudio antes de fallecer, o bien porque éste termine sin que se haya producido la muerte o el evento estudiado. Esta circunstancia obliga a utilizar métodos estadísticos específicos que permitan manejar este tipo de observaciones. La regresión de Cox es el método apropiado para realizar el análisis cuando existen datos censurados permitiendo, a partir de los coeficientes estimados, calcular el riesgo relativo asociado a cada uno de los factores incluidos en el modelo.

    Todo estudio epidemiológico lleva implícita en la fase de diseño la determinación del tamaño muestral necesario para su ejecución. Existen fórmulas sencillas que permiten calcular el tamaño muestral necesario para la estimación de un RR cuando no se dispone del tiempo de seguimiento. Sin embargo, en estudios de supervivencia, las fórmulas para el cálculo del tamaño muestral suelen ser más complicadas y se utilizan con menor frecuencia. El presente trabajo tiene por objetivo describir algunas de las fórmulas existentes para calcular el tamaño de la muestra a estudiar cuando se quiere investigar la importancia de un nuevo factor sobre el pronóstico de una enfermedad. En primer lugar, se describe cómo calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo cuando se dispone de información acerca del estatus final del paciente pero no de su tiempo de seguimiento. A continuación, se presentan dos formas sencillas de calcular el tamaño muestral en estudios de supervivencia cuando la importancia pronóstica del factor a estudio se investiga por medio de un modelo de regresión de Cox. Se distingue el caso en el que se hace un análisis univariante de aquel en el que en el que el efecto del nuevo factor se estudia controlando por otras covariables.

    Cálculo del tamaño de la muestra para la estimación de un riesgo relativo

    El riesgo relativo mide la fuerza de la asociación entre la exposición a un factor y la presencia del evento estudiado (muerte, complicaciones, recidiva, etc.). Se calcula dividiendo la probabilidad de presentar dicho evento entre los expuestos (por ejemplo, la probabilidad de muerte entre esos pacientes) y esa misma probabilidad entre los no expuestos. Si deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer:

    1. Dos de los siguientes tres parámetros:
      • Una idea del valor aproximado del riesgo relativo que se desea estimar (RR).
      • La proporción de expuestos al factor de estudio que presentaron el evento de interés (P1).
      • La proporción de no expuestos que presentaron ese mismo evento (P2).
    2. El nivel de confianza o seguridad . Generalmente se trabajará con una seguridad del 95%.
    3. La precisión relativa que se quiere para el estudio . Dicha precisión es la oscilación mínima con la que se quiere estimar el RR correspondiente, expresada como porcentaje del valor real esperado para ese riesgo.

    Con estos datos, el cálculo del tamaño muestral se puede realizar mediante la fórmula:

    Donde el valor se obtiene de la distribución normal estándar en función de la seguridad (1-?) elegida para el estudio6. En particular, para una seguridad de un 95%, se tiene que .

    Ilustraremos con un ejemplo el uso de la fórmula anterior: supongamos que deseamos saber si existen diferencias entre dos terapias diferentes A y B utilizadas habitualmente para tratar un determinado tipo de cáncer. Para ello se planea realizar un estudio prospectivo en el que se recogerá el estatus de los pacientes (vivos/muertos) al cabo de un año de ser tratados ¿Cuántos pacientes deberán estudiarse con cada tratamiento si se desea calcular el riesgo relativo con una precisión del 50% de su valor real y una seguridad del 95%? De experiencias previas, se estima que el valor real del riesgo relativo es aproximadamente igual a 3 y la probabilidad de fallecer entre los pacientes tratados con el tratamiento A de un 20%.

    En este caso se tiene que:

    Aplicando la Ecuación 1:

    Es decir, se necesitaría en cada grupo una muestra de 38 pacientes.

    Si el tamaño del efecto a detectar fuese menor, el tamaño muestral necesario para llevar a cabo el estudio aumentará. Por ejemplo, si estimamos que el RR correspondiente al nuevo tratamiento es aproximadamente igual a 2 (P1=0.4) el tamaño necesario sería:

    Es decir, un total de 44 pacientes tratados con cada una de las dos terapias.

    Cálculo del tamaño de la muestra en estudios de supervivencia

    Supongamos ahora que, en el ejemplo anterior, se dispone de información no sólo acerca del estatus final de los pacientes en cada uno de los dos grupos, sino que además estamos en condiciones de conocer el tiempo de supervivencia de cada uno de ellos. En este caso, para conocer si el tratamiento A tiene un efecto beneficioso sobre la evolución de los enfermos, podremos utilizar un modelo de regresión de Cox en el que se ajuste por la variable tratamiento, y a partir de cuyos coeficientes podremos estimar el RR asociado a la terapia recibida.
    Si, con este procedimiento, deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer:
    a) Una idea del valor aproximado del riesgo relativo que se desea detectar (RR).
    b) La proporción de expuestos al factor de estudio (p), es decir, en nuestro caso, la proporción de enfermos habitualmente tratados con la terapia A.
    c) El porcentaje de observaciones censuradas que se espera en el total de la muestra.
    d) El nivel de confianza o seguridad con el que se desea trabajar.
    e) El poder que se quiere para el estudio. Con estos datos, el cálculo del tamaño muestral puede abordarse mediante la fórmula:
    Ecuación 2
    donde, de nuevo denota el -cuantil de la distribución normal estándar.Siguiendo con el ejemplo anterior, supongamos que el primer tratamiento (A) suele aplicarse a un 70% de los pacientes que padecen ese tipo de cáncer, mientras que la otra terapia (B) es recibida sólo por un 30% de los enfermos. Si el efecto pronóstico del tratamiento recibido va a analizarse de modo univariado, la Ecuación 2 puede aplicarse para calcular el número necesario de pacientes a estudiar. Así, para detectar un riesgo relativo de 3, y trabajando con una seguridad del 95% y un poder del 80% se tendría:
    Esto es, se necesitaría recoger información de 31 pacientes en total para detectar un efecto de RR=3. Si el efecto fuese menor (RR=2), se necesitarían un total de 78 pacientes y si este riesgo incluso descendiese a RR=1.5, el tamaño aumentaría hasta 228 enfermos. Todo ello si se asume que no existirá censura. Si, por el contrario, se prevé que un 20% de los datos corresponderán a observaciones censuradas, el tamaño muestral obtenido deberá multiplicarse por , resultando en un total de 47 pacientes para detectar un RR=3, 117 para detectar un RR=2 ó 342 para un RR=1.5.
    La fórmula anterior por tanto nos permite calcular el n para detectar un efecto ante la presencia de una característica o exposición determinada. Si, como sucede habitualmente, deseamos controlar o tener en cuenta más variables, el tamaño de la muestra se debe modificar teniendo en cuenta esas posibles variables.
    En una situación como la del ejemplo anterior, el conocimiento apropiado del efecto pronóstico del tratamiento recibido casi siempre exige ajustar por diferentes covariables en un modelo de regresión de Cox. Intuitivamente, el tratar de ajustar un modelo más complejo (ie, con un mayor número de variables) con el mismo número de pacientes llevará consigo una pérdida de precisión en la estimación de los coeficientes y, con ello, del RR asociado a cada una de las variables incluidas en el modelo multivariante. En esta situación, es obvio, que se necesita realizar alguna corrección en la Ecuación 2 que permita adaptar el tamaño muestral calculado a las variables que se incluirán a posteriori en el modelo.
    En este supuesto, la fórmula para el cálculo del tamaño muestral vendrá dada por:
    Ecuación 3
    La Ecuación 3 es así idéntica a la Ecuación 2, salvo en el factor , normalmente llamado “factor de inflación de la varianza”, donde denota al coeficiente de correlación de Pearson entre el factor a estudio y aquella otra variable que incluiremos en el modelo. En el caso en el que se ajuste por más de otro factor en el modelo, lo más sencillo es considerar como el mayor coeficiente de correlación entre el factor a estudio y todas las variables incluidas. Este coeficiente de correlación, cuanto mayor sea, más incrementará el valor del factor de inflacción de la varianza y, por tanto, se incrementará el tamaño de la muestra a estudiar.
    Siguiendo con el ejemplo anterior, posiblemente el tratamiento aplicado a cada enfermo dependerá, como ya se apuntó, de las características clínicas particulares del mismo, y recibirá una u otra terapia en función, por ejemplo, del estadiaje del tumor. En términos estadísticos, podrá entonces decirse que el factor tratamiento se encuentra “correlacionado” con esta característica. Supongamos, por ejemplo, que la correlación existente entre el nuevo tratamiento y el estadiaje del tumor es de 0.25. Este dato lo podremos obtener a partir de un estudio piloto o de otros trabajos sobre el tema. En caso de desconocerse, deberemos asumir una correlación suficientemente alta para así asegurar un poder suficiente. Una correlación de 0.25 implica un factor de inflación de la varianza de Aplicando la Ecuación 3, se obtendría un tamaño muestral mínimo necesario de pacientes para detectar un efecto de RR=3, de si se quiere detectar un efecto de RR=2 y para detectar un RR=1.5. De nuevo, deberemos ajustar el tamaño muestral a posibles pérdidas. Si se prevé, como antes, un 20% de censuras, el tamaño muestral será de 43 pacientes para detectar un RR=3, de 105 para detectar un RR=2 y de 305 enfermos para detectar un RR=1.5.
    El cálculo del tamaño muestral, por tanto, permite al investigador precisar el número de pacientes a estudiar para detectar como significativos efectos de una magnitud determinada. El no hacerlo, o el no conocer cuantos pacientes necesitamos para detectar un efecto como significativo podría llevarnos a cometer un error de tipo II, es decir, no encontrar diferencias cuando sí las hay. Es por ello recomendable, por tanto, no sólo tener una idea aproximada del número de pacientes sino además estimar los riesgos con su 95% intervalo de confianza para conocer la precisión y la dirección del efecto investigado.

    Bibliografía

    • Pita Fernández S, Valdés Cañedo FA. Determinación de factores pronósticos. Cad Aten Primaria 1997; 4: 26-29. [Texto completo]
    • Pita Fernández S, Vila Alonso MT, Carpente Montero J. Determinación de factores de riesgo. Cad Aten Primaria 1997; 4: 75-78. [Texto completo]
    • Lee ET. Statistical Methods for Survival Data Analysis. Belmont, California: Lifetime Learning Publications; 1980.
    • Pita Fernández S. Determinación del tamaño muestral. Cad Aten Primaria 1996; 3: 138-141. [Texto completo]
    • Lwanga SK, Lemeshow S. Determinación del tamaño muestral en los estudios sanitarios. Manual Práctico. Ginebra: O.M.S.; 1991.
    • Pértega Díaz S, Pita Fernández S. La distribución normal. Cad Aten Primaria 2001; 8: 268-274. [Texto completo]
    • Schoenfeld DA. Sample-size formula for the proportional-hazard regression model. Biometrics 1983; 39: 499-503. [Medline]
    • Schmoor C, Sauerbrei W, Schumacher M. Sample size considerations for the evaluation of prognostic factors in survival analysis. Statistic Med 2000; 19: 441-452. [Medline]

    Autores

    Pértegas Díaz, S., Pita Fernández, S.
    Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Universitario de A Coruña (España)
    CAD ATEN PRIMARIA 2002; 9: 30-33.

    Cálculo del tamaño muestral para la determinación de factores pronósticos

    Fecha de revisión: 06/06/2001
    • Documento
    Índice de contenidos

    Cálculos online

    Introducción

    La identificación de factores capaces de influir en el pronóstico de una enfermedad es de suma importancia para la actividad clínica diaria. Por un lado, porque facilita la toma de decisiones en cuanto a procedimientos diagnósticos o tratamientos y, por otro, porque el conocer la posible evolución de un paciente concreto permitirá informarlo sobre el curso clínico de su enfermedad.

    La realización de estudios clínico-epidemiológicos es una de las principales vías de las que se dispone para conocer el pronóstico de una patología determinada. Aunque pueden utilizarse diferentes diseños de investigación, los estudios de seguimiento, ya sean prospectivos o retrospectivos, son los más adecuados para tratar de determinar factores pronóstico. En este tipo de trabajos, una vez identificada una cohorte de pacientes con una patología determinada, se realiza un seguimiento y se calcula el riesgo relativo asociado a un determinado factor. En múltiples ocasiones, además, los datos proporcionados por los estudios clínicos suelen venir expresados en términos de tiempo de supervivencia. Una de las características esenciales de los estudios de seguimiento donde se pretende objetivar la presencia de un evento es la posible presencia de datos censurados. El paciente censurado es el que durante este seguimiento no ha presentado el evento de interés. Esto puede suceder bien porque haya abandonado el estudio antes de fallecer, o bien porque éste termine sin que se haya producido la muerte o el evento estudiado. Esta circunstancia obliga a utilizar métodos estadísticos específicos que permitan manejar este tipo de observaciones. La regresión de Cox es el método apropiado para realizar el análisis cuando existen datos censurados permitiendo, a partir de los coeficientes estimados, calcular el riesgo relativo asociado a cada uno de los factores incluidos en el modelo.

    Todo estudio epidemiológico lleva implícita en la fase de diseño la determinación del tamaño muestral necesario para su ejecución. Existen fórmulas sencillas que permiten calcular el tamaño muestral necesario para la estimación de un RR cuando no se dispone del tiempo de seguimiento. Sin embargo, en estudios de supervivencia, las fórmulas para el cálculo del tamaño muestral suelen ser más complicadas y se utilizan con menor frecuencia. El presente trabajo tiene por objetivo describir algunas de las fórmulas existentes para calcular el tamaño de la muestra a estudiar cuando se quiere investigar la importancia de un nuevo factor sobre el pronóstico de una enfermedad. En primer lugar, se describe cómo calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo cuando se dispone de información acerca del estatus final del paciente pero no de su tiempo de seguimiento. A continuación, se presentan dos formas sencillas de calcular el tamaño muestral en estudios de supervivencia cuando la importancia pronóstica del factor a estudio se investiga por medio de un modelo de regresión de Cox. Se distingue el caso en el que se hace un análisis univariante de aquel en el que en el que el efecto del nuevo factor se estudia controlando por otras covariables.

    Cálculo del tamaño de la muestra para la estimación de un riesgo relativo

    El riesgo relativo mide la fuerza de la asociación entre la exposición a un factor y la presencia del evento estudiado (muerte, complicaciones, recidiva, etc.). Se calcula dividiendo la probabilidad de presentar dicho evento entre los expuestos (por ejemplo, la probabilidad de muerte entre esos pacientes) y esa misma probabilidad entre los no expuestos. Si deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer:

    1. Dos de los siguientes tres parámetros:
      • Una idea del valor aproximado del riesgo relativo que se desea estimar (RR).
      • La proporción de expuestos al factor de estudio que presentaron el evento de interés (P1).
      • La proporción de no expuestos que presentaron ese mismo evento (P2).
    2. El nivel de confianza o seguridad . Generalmente se trabajará con una seguridad del 95%.
    3. La precisión relativa que se quiere para el estudio . Dicha precisión es la oscilación mínima con la que se quiere estimar el RR correspondiente, expresada como porcentaje del valor real esperado para ese riesgo.

    Con estos datos, el cálculo del tamaño muestral se puede realizar mediante la fórmula:

    Donde el valor se obtiene de la distribución normal estándar en función de la seguridad (1-?) elegida para el estudio6. En particular, para una seguridad de un 95%, se tiene que .

    Ilustraremos con un ejemplo el uso de la fórmula anterior: supongamos que deseamos saber si existen diferencias entre dos terapias diferentes A y B utilizadas habitualmente para tratar un determinado tipo de cáncer. Para ello se planea realizar un estudio prospectivo en el que se recogerá el estatus de los pacientes (vivos/muertos) al cabo de un año de ser tratados ¿Cuántos pacientes deberán estudiarse con cada tratamiento si se desea calcular el riesgo relativo con una precisión del 50% de su valor real y una seguridad del 95%? De experiencias previas, se estima que el valor real del riesgo relativo es aproximadamente igual a 3 y la probabilidad de fallecer entre los pacientes tratados con el tratamiento A de un 20%.

    En este caso se tiene que:

    Aplicando la Ecuación 1:

    Es decir, se necesitaría en cada grupo una muestra de 38 pacientes.

    Si el tamaño del efecto a detectar fuese menor, el tamaño muestral necesario para llevar a cabo el estudio aumentará. Por ejemplo, si estimamos que el RR correspondiente al nuevo tratamiento es aproximadamente igual a 2 (P1=0.4) el tamaño necesario sería:

    Es decir, un total de 44 pacientes tratados con cada una de las dos terapias.

    Cálculo del tamaño de la muestra en estudios de supervivencia

    Supongamos ahora que, en el ejemplo anterior, se dispone de información no sólo acerca del estatus final de los pacientes en cada uno de los dos grupos, sino que además estamos en condiciones de conocer el tiempo de supervivencia de cada uno de ellos. En este caso, para conocer si el tratamiento A tiene un efecto beneficioso sobre la evolución de los enfermos, podremos utilizar un modelo de regresión de Cox en el que se ajuste por la variable tratamiento, y a partir de cuyos coeficientes podremos estimar el RR asociado a la terapia recibida.
    Si, con este procedimiento, deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer:
    a) Una idea del valor aproximado del riesgo relativo que se desea detectar (RR).
    b) La proporción de expuestos al factor de estudio (p), es decir, en nuestro caso, la proporción de enfermos habitualmente tratados con la terapia A.
    c) El porcentaje de observaciones censuradas que se espera en el total de la muestra.
    d) El nivel de confianza o seguridad con el que se desea trabajar.
    e) El poder que se quiere para el estudio. Con estos datos, el cálculo del tamaño muestral puede abordarse mediante la fórmula:
    Ecuación 2
    donde, de nuevo denota el -cuantil de la distribución normal estándar.Siguiendo con el ejemplo anterior, supongamos que el primer tratamiento (A) suele aplicarse a un 70% de los pacientes que padecen ese tipo de cáncer, mientras que la otra terapia (B) es recibida sólo por un 30% de los enfermos. Si el efecto pronóstico del tratamiento recibido va a analizarse de modo univariado, la Ecuación 2 puede aplicarse para calcular el número necesario de pacientes a estudiar. Así, para detectar un riesgo relativo de 3, y trabajando con una seguridad del 95% y un poder del 80% se tendría:
    Esto es, se necesitaría recoger información de 31 pacientes en total para detectar un efecto de RR=3. Si el efecto fuese menor (RR=2), se necesitarían un total de 78 pacientes y si este riesgo incluso descendiese a RR=1.5, el tamaño aumentaría hasta 228 enfermos. Todo ello si se asume que no existirá censura. Si, por el contrario, se prevé que un 20% de los datos corresponderán a observaciones censuradas, el tamaño muestral obtenido deberá multiplicarse por , resultando en un total de 47 pacientes para detectar un RR=3, 117 para detectar un RR=2 ó 342 para un RR=1.5.
    La fórmula anterior por tanto nos permite calcular el n para detectar un efecto ante la presencia de una característica o exposición determinada. Si, como sucede habitualmente, deseamos controlar o tener en cuenta más variables, el tamaño de la muestra se debe modificar teniendo en cuenta esas posibles variables.
    En una situación como la del ejemplo anterior, el conocimiento apropiado del efecto pronóstico del tratamiento recibido casi siempre exige ajustar por diferentes covariables en un modelo de regresión de Cox. Intuitivamente, el tratar de ajustar un modelo más complejo (ie, con un mayor número de variables) con el mismo número de pacientes llevará consigo una pérdida de precisión en la estimación de los coeficientes y, con ello, del RR asociado a cada una de las variables incluidas en el modelo multivariante. En esta situación, es obvio, que se necesita realizar alguna corrección en la Ecuación 2 que permita adaptar el tamaño muestral calculado a las variables que se incluirán a posteriori en el modelo.
    En este supuesto, la fórmula para el cálculo del tamaño muestral vendrá dada por:
    Ecuación 3
    La Ecuación 3 es así idéntica a la Ecuación 2, salvo en el factor , normalmente llamado “factor de inflación de la varianza”, donde denota al coeficiente de correlación de Pearson entre el factor a estudio y aquella otra variable que incluiremos en el modelo. En el caso en el que se ajuste por más de otro factor en el modelo, lo más sencillo es considerar como el mayor coeficiente de correlación entre el factor a estudio y todas las variables incluidas. Este coeficiente de correlación, cuanto mayor sea, más incrementará el valor del factor de inflacción de la varianza y, por tanto, se incrementará el tamaño de la muestra a estudiar.
    Siguiendo con el ejemplo anterior, posiblemente el tratamiento aplicado a cada enfermo dependerá, como ya se apuntó, de las características clínicas particulares del mismo, y recibirá una u otra terapia en función, por ejemplo, del estadiaje del tumor. En términos estadísticos, podrá entonces decirse que el factor tratamiento se encuentra “correlacionado” con esta característica. Supongamos, por ejemplo, que la correlación existente entre el nuevo tratamiento y el estadiaje del tumor es de 0.25. Este dato lo podremos obtener a partir de un estudio piloto o de otros trabajos sobre el tema. En caso de desconocerse, deberemos asumir una correlación suficientemente alta para así asegurar un poder suficiente. Una correlación de 0.25 implica un factor de inflación de la varianza de Aplicando la Ecuación 3, se obtendría un tamaño muestral mínimo necesario de pacientes para detectar un efecto de RR=3, de si se quiere detectar un efecto de RR=2 y para detectar un RR=1.5. De nuevo, deberemos ajustar el tamaño muestral a posibles pérdidas. Si se prevé, como antes, un 20% de censuras, el tamaño muestral será de 43 pacientes para detectar un RR=3, de 105 para detectar un RR=2 y de 305 enfermos para detectar un RR=1.5.
    El cálculo del tamaño muestral, por tanto, permite al investigador precisar el número de pacientes a estudiar para detectar como significativos efectos de una magnitud determinada. El no hacerlo, o el no conocer cuantos pacientes necesitamos para detectar un efecto como significativo podría llevarnos a cometer un error de tipo II, es decir, no encontrar diferencias cuando sí las hay. Es por ello recomendable, por tanto, no sólo tener una idea aproximada del número de pacientes sino además estimar los riesgos con su 95% intervalo de confianza para conocer la precisión y la dirección del efecto investigado.

    Bibliografía

    • Pita Fernández S, Valdés Cañedo FA. Determinación de factores pronósticos. Cad Aten Primaria 1997; 4: 26-29. [Texto completo]
    • Pita Fernández S, Vila Alonso MT, Carpente Montero J. Determinación de factores de riesgo. Cad Aten Primaria 1997; 4: 75-78. [Texto completo]
    • Lee ET. Statistical Methods for Survival Data Analysis. Belmont, California: Lifetime Learning Publications; 1980.
    • Pita Fernández S. Determinación del tamaño muestral. Cad Aten Primaria 1996; 3: 138-141. [Texto completo]
    • Lwanga SK, Lemeshow S. Determinación del tamaño muestral en los estudios sanitarios. Manual Práctico. Ginebra: O.M.S.; 1991.
    • Pértega Díaz S, Pita Fernández S. La distribución normal. Cad Aten Primaria 2001; 8: 268-274. [Texto completo]
    • Schoenfeld DA. Sample-size formula for the proportional-hazard regression model. Biometrics 1983; 39: 499-503. [Medline]
    • Schmoor C, Sauerbrei W, Schumacher M. Sample size considerations for the evaluation of prognostic factors in survival analysis. Statistic Med 2000; 19: 441-452. [Medline]

    Autores

    Pértegas Díaz, S., Pita Fernández, S.
    Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Universitario de A Coruña (España)
    CAD ATEN PRIMARIA 2002; 9: 30-33.

    Cálculo del tamaño muestral para la determinación de factores pronósticos

    Fecha de revisión: 06/06/2001

    Cálculos online

    Introducción

    La identificación de factores capaces de influir en el pronóstico de una enfermedad es de suma importancia para la actividad clínica diaria. Por un lado, porque facilita la toma de decisiones en cuanto a procedimientos diagnósticos o tratamientos y, por otro, porque el conocer la posible evolución de un paciente concreto permitirá informarlo sobre el curso clínico de su enfermedad.

    La realización de estudios clínico-epidemiológicos es una de las principales vías de las que se dispone para conocer el pronóstico de una patología determinada. Aunque pueden utilizarse diferentes diseños de investigación, los estudios de seguimiento, ya sean prospectivos o retrospectivos, son los más adecuados para tratar de determinar factores pronóstico. En este tipo de trabajos, una vez identificada una cohorte de pacientes con una patología determinada, se realiza un seguimiento y se calcula el riesgo relativo asociado a un determinado factor. En múltiples ocasiones, además, los datos proporcionados por los estudios clínicos suelen venir expresados en términos de tiempo de supervivencia. Una de las características esenciales de los estudios de seguimiento donde se pretende objetivar la presencia de un evento es la posible presencia de datos censurados. El paciente censurado es el que durante este seguimiento no ha presentado el evento de interés. Esto puede suceder bien porque haya abandonado el estudio antes de fallecer, o bien porque éste termine sin que se haya producido la muerte o el evento estudiado. Esta circunstancia obliga a utilizar métodos estadísticos específicos que permitan manejar este tipo de observaciones. La regresión de Cox es el método apropiado para realizar el análisis cuando existen datos censurados permitiendo, a partir de los coeficientes estimados, calcular el riesgo relativo asociado a cada uno de los factores incluidos en el modelo.

    Todo estudio epidemiológico lleva implícita en la fase de diseño la determinación del tamaño muestral necesario para su ejecución. Existen fórmulas sencillas que permiten calcular el tamaño muestral necesario para la estimación de un RR cuando no se dispone del tiempo de seguimiento. Sin embargo, en estudios de supervivencia, las fórmulas para el cálculo del tamaño muestral suelen ser más complicadas y se utilizan con menor frecuencia. El presente trabajo tiene por objetivo describir algunas de las fórmulas existentes para calcular el tamaño de la muestra a estudiar cuando se quiere investigar la importancia de un nuevo factor sobre el pronóstico de una enfermedad. En primer lugar, se describe cómo calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo cuando se dispone de información acerca del estatus final del paciente pero no de su tiempo de seguimiento. A continuación, se presentan dos formas sencillas de calcular el tamaño muestral en estudios de supervivencia cuando la importancia pronóstica del factor a estudio se investiga por medio de un modelo de regresión de Cox. Se distingue el caso en el que se hace un análisis univariante de aquel en el que en el que el efecto del nuevo factor se estudia controlando por otras covariables.

    Cálculo del tamaño de la muestra para la estimación de un riesgo relativo

    El riesgo relativo mide la fuerza de la asociación entre la exposición a un factor y la presencia del evento estudiado (muerte, complicaciones, recidiva, etc.). Se calcula dividiendo la probabilidad de presentar dicho evento entre los expuestos (por ejemplo, la probabilidad de muerte entre esos pacientes) y esa misma probabilidad entre los no expuestos. Si deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer:

    1. Dos de los siguientes tres parámetros:
      • Una idea del valor aproximado del riesgo relativo que se desea estimar (RR).
      • La proporción de expuestos al factor de estudio que presentaron el evento de interés (P1).
      • La proporción de no expuestos que presentaron ese mismo evento (P2).
    2. El nivel de confianza o seguridad . Generalmente se trabajará con una seguridad del 95%.
    3. La precisión relativa que se quiere para el estudio . Dicha precisión es la oscilación mínima con la que se quiere estimar el RR correspondiente, expresada como porcentaje del valor real esperado para ese riesgo.

    Con estos datos, el cálculo del tamaño muestral se puede realizar mediante la fórmula:

    Donde el valor se obtiene de la distribución normal estándar en función de la seguridad (1-?) elegida para el estudio6. En particular, para una seguridad de un 95%, se tiene que .

    Ilustraremos con un ejemplo el uso de la fórmula anterior: supongamos que deseamos saber si existen diferencias entre dos terapias diferentes A y B utilizadas habitualmente para tratar un determinado tipo de cáncer. Para ello se planea realizar un estudio prospectivo en el que se recogerá el estatus de los pacientes (vivos/muertos) al cabo de un año de ser tratados ¿Cuántos pacientes deberán estudiarse con cada tratamiento si se desea calcular el riesgo relativo con una precisión del 50% de su valor real y una seguridad del 95%? De experiencias previas, se estima que el valor real del riesgo relativo es aproximadamente igual a 3 y la probabilidad de fallecer entre los pacientes tratados con el tratamiento A de un 20%.

    En este caso se tiene que:

    Aplicando la Ecuación 1:

    Es decir, se necesitaría en cada grupo una muestra de 38 pacientes.

    Si el tamaño del efecto a detectar fuese menor, el tamaño muestral necesario para llevar a cabo el estudio aumentará. Por ejemplo, si estimamos que el RR correspondiente al nuevo tratamiento es aproximadamente igual a 2 (P1=0.4) el tamaño necesario sería:

    Es decir, un total de 44 pacientes tratados con cada una de las dos terapias.

    Cálculo del tamaño de la muestra en estudios de supervivencia

    Supongamos ahora que, en el ejemplo anterior, se dispone de información no sólo acerca del estatus final de los pacientes en cada uno de los dos grupos, sino que además estamos en condiciones de conocer el tiempo de supervivencia de cada uno de ellos. En este caso, para conocer si el tratamiento A tiene un efecto beneficioso sobre la evolución de los enfermos, podremos utilizar un modelo de regresión de Cox en el que se ajuste por la variable tratamiento, y a partir de cuyos coeficientes podremos estimar el RR asociado a la terapia recibida.
    Si, con este procedimiento, deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer:
    a) Una idea del valor aproximado del riesgo relativo que se desea detectar (RR).
    b) La proporción de expuestos al factor de estudio (p), es decir, en nuestro caso, la proporción de enfermos habitualmente tratados con la terapia A.
    c) El porcentaje de observaciones censuradas que se espera en el total de la muestra.
    d) El nivel de confianza o seguridad con el que se desea trabajar.
    e) El poder que se quiere para el estudio. Con estos datos, el cálculo del tamaño muestral puede abordarse mediante la fórmula:
    Ecuación 2
    donde, de nuevo denota el -cuantil de la distribución normal estándar.Siguiendo con el ejemplo anterior, supongamos que el primer tratamiento (A) suele aplicarse a un 70% de los pacientes que padecen ese tipo de cáncer, mientras que la otra terapia (B) es recibida sólo por un 30% de los enfermos. Si el efecto pronóstico del tratamiento recibido va a analizarse de modo univariado, la Ecuación 2 puede aplicarse para calcular el número necesario de pacientes a estudiar. Así, para detectar un riesgo relativo de 3, y trabajando con una seguridad del 95% y un poder del 80% se tendría:
    Esto es, se necesitaría recoger información de 31 pacientes en total para detectar un efecto de RR=3. Si el efecto fuese menor (RR=2), se necesitarían un total de 78 pacientes y si este riesgo incluso descendiese a RR=1.5, el tamaño aumentaría hasta 228 enfermos. Todo ello si se asume que no existirá censura. Si, por el contrario, se prevé que un 20% de los datos corresponderán a observaciones censuradas, el tamaño muestral obtenido deberá multiplicarse por , resultando en un total de 47 pacientes para detectar un RR=3, 117 para detectar un RR=2 ó 342 para un RR=1.5.
    La fórmula anterior por tanto nos permite calcular el n para detectar un efecto ante la presencia de una característica o exposición determinada. Si, como sucede habitualmente, deseamos controlar o tener en cuenta más variables, el tamaño de la muestra se debe modificar teniendo en cuenta esas posibles variables.
    En una situación como la del ejemplo anterior, el conocimiento apropiado del efecto pronóstico del tratamiento recibido casi siempre exige ajustar por diferentes covariables en un modelo de regresión de Cox. Intuitivamente, el tratar de ajustar un modelo más complejo (ie, con un mayor número de variables) con el mismo número de pacientes llevará consigo una pérdida de precisión en la estimación de los coeficientes y, con ello, del RR asociado a cada una de las variables incluidas en el modelo multivariante. En esta situación, es obvio, que se necesita realizar alguna corrección en la Ecuación 2 que permita adaptar el tamaño muestral calculado a las variables que se incluirán a posteriori en el modelo.
    En este supuesto, la fórmula para el cálculo del tamaño muestral vendrá dada por:
    Ecuación 3
    La Ecuación 3 es así idéntica a la Ecuación 2, salvo en el factor , normalmente llamado “factor de inflación de la varianza”, donde denota al coeficiente de correlación de Pearson entre el factor a estudio y aquella otra variable que incluiremos en el modelo. En el caso en el que se ajuste por más de otro factor en el modelo, lo más sencillo es considerar como el mayor coeficiente de correlación entre el factor a estudio y todas las variables incluidas. Este coeficiente de correlación, cuanto mayor sea, más incrementará el valor del factor de inflacción de la varianza y, por tanto, se incrementará el tamaño de la muestra a estudiar.
    Siguiendo con el ejemplo anterior, posiblemente el tratamiento aplicado a cada enfermo dependerá, como ya se apuntó, de las características clínicas particulares del mismo, y recibirá una u otra terapia en función, por ejemplo, del estadiaje del tumor. En términos estadísticos, podrá entonces decirse que el factor tratamiento se encuentra “correlacionado” con esta característica. Supongamos, por ejemplo, que la correlación existente entre el nuevo tratamiento y el estadiaje del tumor es de 0.25. Este dato lo podremos obtener a partir de un estudio piloto o de otros trabajos sobre el tema. En caso de desconocerse, deberemos asumir una correlación suficientemente alta para así asegurar un poder suficiente. Una correlación de 0.25 implica un factor de inflación de la varianza de Aplicando la Ecuación 3, se obtendría un tamaño muestral mínimo necesario de pacientes para detectar un efecto de RR=3, de si se quiere detectar un efecto de RR=2 y para detectar un RR=1.5. De nuevo, deberemos ajustar el tamaño muestral a posibles pérdidas. Si se prevé, como antes, un 20% de censuras, el tamaño muestral será de 43 pacientes para detectar un RR=3, de 105 para detectar un RR=2 y de 305 enfermos para detectar un RR=1.5.
    El cálculo del tamaño muestral, por tanto, permite al investigador precisar el número de pacientes a estudiar para detectar como significativos efectos de una magnitud determinada. El no hacerlo, o el no conocer cuantos pacientes necesitamos para detectar un efecto como significativo podría llevarnos a cometer un error de tipo II, es decir, no encontrar diferencias cuando sí las hay. Es por ello recomendable, por tanto, no sólo tener una idea aproximada del número de pacientes sino además estimar los riesgos con su 95% intervalo de confianza para conocer la precisión y la dirección del efecto investigado.

    Bibliografía

    • Pita Fernández S, Valdés Cañedo FA. Determinación de factores pronósticos. Cad Aten Primaria 1997; 4: 26-29. [Texto completo]
    • Pita Fernández S, Vila Alonso MT, Carpente Montero J. Determinación de factores de riesgo. Cad Aten Primaria 1997; 4: 75-78. [Texto completo]
    • Lee ET. Statistical Methods for Survival Data Analysis. Belmont, California: Lifetime Learning Publications; 1980.
    • Pita Fernández S. Determinación del tamaño muestral. Cad Aten Primaria 1996; 3: 138-141. [Texto completo]
    • Lwanga SK, Lemeshow S. Determinación del tamaño muestral en los estudios sanitarios. Manual Práctico. Ginebra: O.M.S.; 1991.
    • Pértega Díaz S, Pita Fernández S. La distribución normal. Cad Aten Primaria 2001; 8: 268-274. [Texto completo]
    • Schoenfeld DA. Sample-size formula for the proportional-hazard regression model. Biometrics 1983; 39: 499-503. [Medline]
    • Schmoor C, Sauerbrei W, Schumacher M. Sample size considerations for the evaluation of prognostic factors in survival analysis. Statistic Med 2000; 19: 441-452. [Medline]

    Autores

    Pértegas Díaz, S., Pita Fernández, S.
    Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Universitario de A Coruña (España)
    CAD ATEN PRIMARIA 2002; 9: 30-33.
    © Descargado el 07/10/2022 6:42:47 Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright © . Elsevier Inc. Todos los derechos reservados.