Hola a tod en s, estoy intentando averiguar el número de modas en una distribución. Para ello utilizo diptest. Mi duda es que no acabo de entender cuando la información suministrada por los test suponen la existencia o no de unimodalidad/multimodalidad. Una parte de la salidad de diptest es la que pego a continuación (el resto esta en el fichero adjunto con las distribuciones kernels y las soluciones gráficas). *Distribución #1(suponía que hay más de una moda)* Hartigans' dip test for unimodality data: Datos8$V2 D = 0.0432, p-value = 0.3501 alternative hypothesis: non-unimodal, i.e., at least bimodal *Distribución #2* dip.test(Datos9$V2) Hartigans' dip test for unimodality data: Datos9$V2 D = 0.0667, p-value = 1.535e-06 alternative hypothesis: non-unimodal, i.e., at least bimodal Podría alguien por favor darme alguna pista. Gracias Justo ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20121109/b1e31f72/attachment-0001.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: diptest.pdf Type: application/pdf Size: 29230 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20121109/b1e31f72/attachment-0001.pdf>
Francisco Mauro Gutiérrez
2012-Nov-11 20:39 UTC
[R-es] Duda sobre modas en un distribución
Hola Justo, Por el resultado que nos envías yo entiendo que la hipótesis nula del test (Aquello que se supone) es que los datos son unimodales, pues la hipótesis alternativa es que son NO son unimodales. Es decir, en un principio se supone que los datos vienen de una distribución unimodal. Así, el test proporciona la probabilidad (p-value) de haber obtenido una muestra como la de los datos sometidos al test, suponiendo que es cierto que los datos son unimodales (Hipótesis nula). Por otro lado, aunque no estoy familiarizado con el test que indicas te aconsejaría que buscases información sobre dicho test. Los test estadísticos pueden ser un poco "suyos" y hay que tener muy en cuenta cuáles son sus puntos de partida. Por otro lado, en el ejemplo que comentas, es cierto que la grafica del Kernel es bimodal, y sin embargo el resultado del test te dice que no lo sea, simplemente te dice que hay evidencias de que la distribución NO sea unimodal. Es decir el test te deja como al principio, no sabes ni una cosa ni la otra. En el segundo ejemplo la gráfica y el resultado del test coinciden con lo que esperaríamos todos. Mi explicación a esto es la siguiente: El número de observaciones en el ejemplo uno es 78 (aproximadamente 3 veces menor que el numero de datos del ejemplo 2). Tanto las funciones Kernel como los test estadísticos dependen del tamaño de tu muestra. En cuanto a las distribuciones Kernel, el resultado con muestras reducidas simplemente tiene una mayor varianza. Es decir que la función de densidad real subyacente a los datos podría puede diferir de la estimación kernel en una cantidad que será menor cuanto mayor sea el número de datos. Es decir que el pequeño bache que se observa en 1 podría ser un efecto aleatorio. Con el test pasa algo parecido. Cuanto, menor es el número de datos, menor es la potencia de un test. Esto es; la capacidad para rechazar la hipótesis nula cuando esta no se verifica, es menor cuantos menos datos tenemos. Con los datos que tienes el test te dice que no puedes descartar que 1 sea unimodal y esto podría deberse a dos cosas: una falta de potencia del test o simplemente a que la distribución de 1 es unimodal. Un saludo Paco Hola a tod en s, estoy intentando averiguar el número de modas en una distribución. Para ello utilizo diptest. Mi duda es que no acabo de entender cuando la información suministrada por los test suponen la existencia o no de unimodalidad/multimodalidad. Una parte de la salidad de diptest es la que pego a continuación (el resto esta en el fichero adjunto con las distribuciones kernels y las soluciones gráficas). *Distribución #1(suponía que hay más de una moda)* Hartigans' dip test for unimodality data: Datos8$V2 D = 0.0432, p-value = 0.3501 alternative hypothesis: non-unimodal, i.e., at least bimodal *Distribución #2* dip.test(Datos9$V2) Hartigans' dip test for unimodality data: Datos9$V2 D = 0.0667, p-value = 1.535e-06 alternative hypothesis: non-unimodal, i.e., at least bimodal Podría alguien por favor darme alguna pista. Gracias