Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestral necesario para la ejecución del mismo (1-4). El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: primera que realicemos el estudio sin el número adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parámetros y además no encontraremos diferencias significativas cuando en la realidad sí existen. La segunda situación es que podríamos estudiar un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de tiempo e incremento de recursos innecesarios sino que además la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.
Para determinar el tamaño muestral de un estudio, debemos considerar diferentes situaciones (5-7):
A. Estudios para determinar parámetros. Es decir pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra (Tabla 1).
B. Estudios para contraste de hipótesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes.
Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra.
Si deseamos estimar una proporción, debemos saber:
Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral:
donde:
Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la respuesta seria:
donde:
¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.
Según diferentes seguridades el coeficiente de Za varía, así:
Si deseamos estimar una media: debemos saber:
Ejemplo: Si deseamos conocer la media de la glucemia basal de una población, con una seguridad del 95 % y una precisión de ± 3 mg/dl y tenemos información por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl
Si la población es finita, como previamente se señaló, es decir conocemos el total de la población y desearíamos saber cuantos del total tendríamos que estudiar, la respuesta sería:
Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes. Habitualmente el investigador pretende comparar dos tratamientos. Para el cálculo del tamaño muestral se precisa conocer:
La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera).
B1. Comparación de dos proporciones:
Donde:
Los valores Za según la seguridad y Zb según el poder se indican en la Tabla 2 (8).
B2. Comparación de dos medias:
Donde:
Los valores Za según la seguridad y Zb según el poder se indican en la Tabla 2 (8).
Ejemplo de comparación de dos medias:
Deseamos utilizar un nuevo fármaco antidiabético y consideramos que seria clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tto. Habitual con el antidiabético estándar. Por estudios previos sabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadístico de 90% para detectar diferencias si es que existen.
precisamos 20 pacientes en cada grupo.
Ejemplo de comparación de dos proporciones:
Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseñamos un ensayo clínico. Sabemos por datos previos que la eficacia del fármaco habitual está alrededor del 70% y consideramos clínicamente relevante si el nuevo fármaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadístico de un 80%.
n = 48 pacientes. En cada grupo precisamos 48 pacientes.
En todos los estudios es preciso estimar las posibles perdidas de pacientes por razones diversas (pérdida de información, abandono, no respuesta….) por lo que se debe incrementar el tamaño muestral respecto a dichas pérdidas.
El tamaño muestral ajustado a las pérdidas se puede calcular:
Muestra ajustada a las pérdidas = n (1 / 1–R)
Así por ejemplo si en el estudio anterior esperamos tener un 15% de pérdidas el tamaño muestral necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo.