Hola, Estoy analizando unos datos para una tesis doctoral. Durante la investigación se han recogido distintas variables clínicas de dos grupos (n=30 y n=40). Me encuentro que las comparaciones de medias se han realizado mediante t-tests sin preocuparse de estudiar la distribución de las variables. Al revisar si las variables se ajustan a la distribución normal, aunque los QQplots no tienen "mala pinta" las distribuciones de las variables se alejan de la normalidad (Shapiro-Wilks<0.01). Aunque se podrían utilizar otros métodos (no parametricos, permutaciones, etc) para realizar las comparaciones, el doctorando se empeña en utilizar las pruebas t (imagino que por no rehacer todos los resultados). Entiendo que el t-test es una prueba bastante robusta y puede tolerar desviaciones de la normalidad, también entiendo que el criterio para poder aplicar esta prueba es que la distribución de las medias (no de las variables) sea normal. Se me ha ocurrido que si remuestreo (siendo d la variable de estudio) for (n in 1:500){ i[n]=mean(sample(d,20))} y justifico que la distribución de las medias sigue una distribución normal shapiro.test(i) podría decir que las pruebas t (utilizando la correccion de Welch por si acaso) se hacen "con todas las de la ley". Me gustaria que los que sabeis de esto me dierais vuestra opinion con respecto a este apaño. Un saludo y muchas gracias Jose Miguel
Entiendo que quieres regularizar tus datos agregandolos. El test de Shapiro rechaza la normalidad de una uniforme> set.seed(1234) > d=runif(100, min = 2, max = 4) > shapiro.test(d)Shapiro-Wilk normality test data: d W = 0.94504, p-value = 0.0003966 Pero acepta la normalidad de medias de 5 uniformes:> i=replicate(100,mean(sample(d,5))) > shapiro.test(i)Shapiro-Wilk normality test data: i W = 0.98641, p-value = 0.3991 Ahora bien, en todo caso, deberias contrastar la normalidad de tus "medias" en el seno de cada grupo y actualizar los grados de libertad de tu t-test basado en medias de medias. Pero mi consejo es optar por una solución más ortodoxa, tipo trimm-mean o test no parametrico. Un saludo. Olivier ----- Mensaje original ----- De: "JM Arbones" <marbones en unizar.es> Para: r-help-es en r-project.org Enviados: Martes, 13 de Septiembre 2016 16:13:08 Asunto: [R-es] t-test y distribución de variables Hola, Estoy analizando unos datos para una tesis doctoral. Durante la investigación se han recogido distintas variables clínicas de dos grupos (n=30 y n=40). Me encuentro que las comparaciones de medias se han realizado mediante t-tests sin preocuparse de estudiar la distribución de las variables. Al revisar si las variables se ajustan a la distribución normal, aunque los QQplots no tienen "mala pinta" las distribuciones de las variables se alejan de la normalidad (Shapiro-Wilks<0.01). Aunque se podrían utilizar otros métodos (no parametricos, permutaciones, etc) para realizar las comparaciones, el doctorando se empeña en utilizar las pruebas t (imagino que por no rehacer todos los resultados). Entiendo que el t-test es una prueba bastante robusta y puede tolerar desviaciones de la normalidad, también entiendo que el criterio para poder aplicar esta prueba es que la distribución de las medias (no de las variables) sea normal. Se me ha ocurrido que si remuestreo (siendo d la variable de estudio) for (n in 1:500){ i[n]=mean(sample(d,20))} y justifico que la distribución de las medias sigue una distribución normal shapiro.test(i) podría decir que las pruebas t (utilizando la correccion de Welch por si acaso) se hacen "con todas las de la ley". Me gustaria que los que sabeis de esto me dierais vuestra opinion con respecto a este apaño. Un saludo y muchas gracias Jose Miguel _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Gracias Olivier por tu sugerencia JM On 09/14/2016 10:03 AM, Olivier Nuñez wrote:> Entiendo que quieres regularizar tus datos agregandolos. > El test de Shapiro rechaza la normalidad de una uniforme > >> set.seed(1234) >> d=runif(100, min = 2, max = 4) >> shapiro.test(d) > Shapiro-Wilk normality test > > data: d > W = 0.94504, p-value = 0.0003966 > > Pero acepta la normalidad de medias de 5 uniformes: >> i=replicate(100,mean(sample(d,5))) >> shapiro.test(i) > Shapiro-Wilk normality test > > data: i > W = 0.98641, p-value = 0.3991 > > Ahora bien, en todo caso, deberias contrastar la normalidad de tus "medias" en el seno de cada grupo y actualizar los grados de libertad de tu t-test basado en medias de medias. Pero mi consejo es optar por una solución más ortodoxa, tipo trimm-mean o test no parametrico. > Un saludo. Olivier > > > ----- Mensaje original ----- > De: "JM Arbones" <marbones en unizar.es> > Para: r-help-es en r-project.org > Enviados: Martes, 13 de Septiembre 2016 16:13:08 > Asunto: [R-es] t-test y distribución de variables > > Hola, > Estoy analizando unos datos para una tesis doctoral. > Durante la investigación se han recogido distintas variables clínicas de > dos grupos (n=30 y n=40). Me encuentro que las comparaciones de medias > se han realizado mediante t-tests sin preocuparse de estudiar la > distribución de las variables. Al revisar si las variables se ajustan a > la distribución normal, aunque los QQplots no tienen "mala pinta" las > distribuciones de las variables se alejan de la normalidad > (Shapiro-Wilks<0.01). > Aunque se podrían utilizar otros métodos (no parametricos, > permutaciones, etc) para realizar las comparaciones, el doctorando se > empeña en utilizar las pruebas t (imagino que por no rehacer todos los > resultados). > > > Entiendo que el t-test es una prueba bastante robusta y puede tolerar > desviaciones de la normalidad, también entiendo que el criterio para > poder aplicar esta prueba es que la distribución de las medias (no de > las variables) sea normal. Se me ha ocurrido que si remuestreo (siendo > d la variable de estudio) > > for (n in 1:500){ > i[n]=mean(sample(d,20))} > > y justifico que la distribución de las medias sigue una distribución normal > > shapiro.test(i) > > podría decir que las pruebas t (utilizando la correccion de Welch por si > acaso) se hacen "con todas las de la ley". > > Me gustaria que los que sabeis de esto me dierais vuestra opinion con > respecto a este apaño. > > Un saludo y muchas gracias > > Jose Miguel > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >