Estimado José,
Muchas gracias por el tiempo que has dedicado a elaborar tu respuesta que me ha
sido de mucha utilidad. Se trata de una serie de individuos, que en cierto
periodo de tiempo pueden presentar una enfermedad o no. El que haya algunos que
tengan más de un evento es porque algunos (muy pocos) padecen la enfermedad y
transcurrido cierto tiempo la vuelven a sufrir.
Es decir, tengo pacientes de tres tipos:
Grupo A nº total de casos: 56 nº eventos (ocurrencias de la enfermedad en un
periodo de tiempo de 2 años): 14
Grupo B nº total de casos: 49 nº eventos (ocurrencias de la enfermedad en un
periodo de tiempo de 2 años):: 10
Grupo C nº total de casos: 51 nº eventos (ocurrencias de la enfermedad en un
periodo de tiempo de 2 años):: 17
Espero que con esto haya sido capaz de dejar más claro lo que ando buscando.
Saludos,
Fernando
----- Mensaje original -----
De: José Trujillo Carmona <trujillo en unex.es>
Para: Fernando Sanchez <fernandsanche en yahoo.es>
Enviado: Sábado 23 de enero de 2016 17:44
Asunto: Re: [R-es] test z de tres proporciones
El 23/01/16 a las 16:14, Fernando Sanchez escribió:> Hola a todos,
>
> Quería hacer un test z con tres proporciones. He buscado información acerca
de si es posible en R y no he encontrado nada al respecto.
>
> La información de la que dispongo es la siguiente:
>
> A nº total de casos: 56 nº eventos: 14
>
> B nº total de casos: 49 nº eventos: 10
>
> C nº total de casos: 51 nº ecentos: 17
>
> La cuestión es que un mismo individuo puede tener más de un evento y es por
eso que he pensado en el test z. Y no en un Ji-cuadrado. ¿Mi suposición es
correcta?
El test Z para proporciones convencional utiliza una de estas dos
distribuciones normales:
f ~ N(p0 , s) ---> z = (p-p0) / s Donde s = raiz( p0 (1-p0)/n)
f1 ~ N(p1, s1) y f2 ~ N(p2, s2) luego f1-f2 ~ N(p1 - p2, raiz(s1^2 +
s2^2)) ---> Si p1-p2=0 Entonce z= (f1 - f2)/raiz(s1^2 + s2^2)
No consigo imaginar como se puede construir un test Z con tres proporciones.
Sea el test Z o el test Ji-Cuadrado el test se construyen asumiendo que
dispones de N = n1+n2+...+nk eventos que bajo hipótesis nula son
resultados de experimentos binomiales. En cada muestra tienes N intentos
(individuos) de encontrar un determinado resultado (una respuesta
concreta, por ejemplo A) y se necesita que si es cierta la hipótesis
nula del test todos los individuos (intentos) tengan la misma
probabilidad de de contestar A y además la probabilidad de que cada
individuos conteste A no depende de las respuestas de los demás individuos.
Dices que el mismo individuo puede producir más de un evento la puedo
interpretar de dos formas.
1º Al mismo individuo se le pregunta dos veces: te has cargado todos los
tests que conozco. Las dos respuestas del mismo individuo no cumplirían
la condición de independencia de las sucesivas respuestas: pueden ser
más probablemente parecidas o distintas entre sí que entre dos individuos.
2º Estás planteando tres cuestionarios completamente distintos y algunos
individuos han contestado en más de un cuestionario. Bueno, si las
cuestiones no están relacionadas (cuestionarios independientes) y no se
cumple el punto anterior no veo el problema. Cada cuestionario seguiría
siendo un experimento binomial y para un total de tres cuestionarios en
los que quieres ver si la probabilidad de tres respuestas concretas es
la misma en los tres cuestionarios.
En la información que das no aclaras si se trata de tres cuestionarios
en los que en cada uno preguntas solo sobre si o no. Es decir en el
primero pueden contestar A o no A, en el segundo grupos de casos pueden
contestar B o no B, etc... Tendrías condiciones adecuadas para un test
Ji-Cuadrado aunque algunos individuos participaran de los tres
cuestionarios.
O por el contrario a n individuos se les ha permitido libremente que
contesten sobre A, B y C pero algunos han contestado más de una opción y
por eso el total de respuestas superaría a n. En este caso yo que no soy
expertos en datos categóricos no conozco el test adecuado que recoja la
falta de independencia en las respuestas. En todo caso la información
disponible es insuficiente porque el análisis va a exigir conocer el
grado de dependencia de las respuestas (saber cuántas veces aparecen
juntas A y B, A y C, etc...)
Saludos.
>
> saludos,
>
> Fernando
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es