Hola, puedes calcular las cuasivarianzas muestrales por columnas mediante tapply y luego compararlas. El cociente entre las dos varianzas sigue una distribución F de Snedecor con grados de libertad n1-1 y n2-2. Puedes calcular la probabilidad de aceptar H0 con la función pf. El 14/06/2016 12:00, r-help-es-request en r-project.org escribió:> Envíe los mensajes para la lista R-help-es a > r-help-es en r-project.org > > Para subscribirse o anular su subscripción a través de la WEB > https://stat.ethz.ch/mailman/listinfo/r-help-es > > O por correo electrónico, enviando un mensaje con el texto "help" en > el asunto (subject) o en el cuerpo a: > r-help-es-request en r-project.org > > Puede contactar con el responsable de la lista escribiendo a: > r-help-es-owner en r-project.org > > Si responde a algún contenido de este mensaje, por favor, edite la > linea del asunto (subject) para que el texto sea mas especifico que: > "Re: Contents of R-help-es digest...". Además, por favor, incluya en > la respuesta sólo aquellas partes del mensaje a las que está > respondiendo. > > Asuntos del día: > > 1. Ayuda con la homocedasticidad de Varianza > (Francisco Ruben Castaneda Rivero) > 2. Re: Ayuda con la homocedasticidad de Varianza > (José Trujillo Carmona) > > ---------------------------------------------------------------------- > > Message: 1 > Date: Mon, 13 Jun 2016 19:01:17 -0700 > From: Francisco Ruben Castaneda Rivero <fruben en cicese.edu.mx> > To: R-help-es en r-project.org > Subject: [R-es] Ayuda con la homocedasticidad de Varianza > Message-ID: > <CADdyTLsoO48zXPLrXR8LarWeO4pd9072Y_yRG0Xs4vyh5+0vtg en mail.gmail.com> > Content-Type: text/plain; charset="UTF-8" > > Buenas Tardes. He tenido problemas al obtener la Homogenidad de varianza de > una base de datos ya que tengo 5 Variables bioticas (Especies) y 4 > Abioticas. El ejemplo es la siguiente: > > Especie a Especie b Especie c Especie d Especie e Profun Conc Temp Sediment > 0 2 9 14 2 72 4.8 3.5 2 > 26 4 13 11 0 75 2.8 2.5 1 > 0 10 9 8 0 59 5.4 2.7 1 > 0 0 15 3 0 64 8.2 2.9 2 > 13 5 3 10 7 61 3.9 3.1 1 > 31 21 13 16 5 94 2.6 3.5 3 > 9 6 0 11 2 53 4.6 2.9 2 > 2 0 0 0 1 61 5.1 3.3 1 > 17 7 10 14 6 68 3.9 3.4 1 > 0 5 26 9 0 69 10 3 2 > 0 8 8 6 7 57 6.5 3.3 1 > 14 11 13 1 0 84 3.8 3.1 2 > 0 0 19 0 6 53 9.4 3 2 > 13 0 0 9 0 83 4.4 2.5 1 > 4 0 10 12 0 100 6.7 2.8 1 > 42 20 0 3 6 84 2.8 3 3 > 4 0 0 0 0 96 6.4 3.1 1 > 21 15 33 20 0 74 4.4 2.8 3 > 2 5 12 16 3 79 3.1 3.6 2 > 0 10 14 9 0 73 5.6 3 2 > 8 0 0 4 6 59 4.3 3.4 1 > 35 10 0 9 17 54 1.9 2.8 2 > 6 7 1 17 10 95 2.4 2.9 3 > 18 12 20 7 0 64 4.3 3 1 > 32 26 0 23 0 97 2 3 3 > 24 21 0 10 5 78 2.5 3.4 2 > 24 17 0 25 6 85 2.1 3 3 > 16 3 12 20 2 92 3.4 3.3 3 > 11 0 7 8 0 51 6 3 2 > 24 37 5 18 1 99 1.9 2.9 3 > Me gustaria obtener la homogeneidad de varianza por poder realizar un > Análisis de Correlacción Canónica. El problema es que al utilizar Barlet o > Levenne test no calcula los valores ya que se necesita una variable > dependiente y Factor, y al meterlo como especie a y factor abiotico no lo > calcula. En este caso yo solo quiero obtener la homogeneidad de varianza > por columna ( si se puede). > > Agradeceria su pronta respuesta y Muchisimas Gracias de antemano. > > [[alternative HTML version deleted]] > > ------------------------------ > > Message: 2 > Date: Tue, 14 Jun 2016 10:51:07 +0200 > From: José Trujillo Carmona <trujillo en unex.es> > To: r-help-es en r-project.org > Subject: Re: [R-es] Ayuda con la homocedasticidad de Varianza > Message-ID: <575FC57B.2080009 en unex.es> > Content-Type: text/plain; charset=windows-1252; format=flowed > > No entiendo el problema. > > ¿La cuestión es saber si las distintas variables tienen la misma varianza? > > No es razonables esperar que la Temperatura, la concentración o la > profundidad tengan la misma varianza. La varianza tienen unidades y la > varianza depende de la unidad de medida. Y no es posible expresar la > temperatura en metros de profundidad (ni tendría sentido). > > Por ejemplo la estatura, que en personas se puede distribuir entre 1.5 y > 2 metros podría estar en el orden de 0.005 m^2 a 0.007 m^2. Pero si > medimos en cm y la estatura está desde los 150 a 200 cm, la varianza > estaría entre 50 a 70 cm^2 (cuestión de multiplicar por 100^2) como se > estudia en las propiedades básicas de las varianzas. > > Respecto de las variables "Bioticas", supongo que son frecuencias. Pasa > lo mismo aunque menos evidente. Aunque las frecuencias tienen siempre > como unidad de medida los individuos (quince individuos, siete > individuos) su distribución seguirá una distribución de Poisson o algo > parecido; es decir que su varianza dependerá de su media; o dicho de > otro modo, de lo abundante que sea la especie. > > Si en una muestra esperamos del orden de 20 ejemplares, será fácil que > los valores reales observados estén entre 10 y 30; pero si esperamos > solo del orden de cinco valores la varianza no puede ser tan grande como > en el primer caso por razones obvias (no se puede esperar que el mínimo > esté a 10 unidades por debajo de la media, sería un número negativo de > observaciones). > > En fin. Si la pregunta es si las distintas variables tienen la misma > varianza, no necesitas test: No pueden tenerla por la naturaleza de las > variables. > > Si esa no es la pregunta es que no la he entendido. Lo siento. > > Saludos. > > El 14/06/16 a las 04:01, Francisco Ruben Castaneda Rivero escribió: > >> Buenas Tardes. He tenido problemas al obtener la Homogenidad de varianza de >> una base de datos ya que tengo 5 Variables bioticas (Especies) y 4 >> Abioticas. El ejemplo es la siguiente: >> >> Especie a Especie b Especie c Especie d Especie e Profun Conc Temp Sediment >> 0 2 9 14 2 72 4.8 3.5 2 >> 26 4 13 11 0 75 2.8 2.5 1 >> 0 10 9 8 0 59 5.4 2.7 1 >> 0 0 15 3 0 64 8.2 2.9 2 >> 13 5 3 10 7 61 3.9 3.1 1 >> 31 21 13 16 5 94 2.6 3.5 3 >> 9 6 0 11 2 53 4.6 2.9 2 >> 2 0 0 0 1 61 5.1 3.3 1 >> 17 7 10 14 6 68 3.9 3.4 1 >> 0 5 26 9 0 69 10 3 2 >> 0 8 8 6 7 57 6.5 3.3 1 >> 14 11 13 1 0 84 3.8 3.1 2 >> 0 0 19 0 6 53 9.4 3 2 >> 13 0 0 9 0 83 4.4 2.5 1 >> 4 0 10 12 0 100 6.7 2.8 1 >> 42 20 0 3 6 84 2.8 3 3 >> 4 0 0 0 0 96 6.4 3.1 1 >> 21 15 33 20 0 74 4.4 2.8 3 >> 2 5 12 16 3 79 3.1 3.6 2 >> 0 10 14 9 0 73 5.6 3 2 >> 8 0 0 4 6 59 4.3 3.4 1 >> 35 10 0 9 17 54 1.9 2.8 2 >> 6 7 1 17 10 95 2.4 2.9 3 >> 18 12 20 7 0 64 4.3 3 1 >> 32 26 0 23 0 97 2 3 3 >> 24 21 0 10 5 78 2.5 3.4 2 >> 24 17 0 25 6 85 2.1 3 3 >> 16 3 12 20 2 92 3.4 3.3 3 >> 11 0 7 8 0 51 6 3 2 >> 24 37 5 18 1 99 1.9 2.9 3 >> Me gustaria obtener la homogeneidad de varianza por poder realizar un >> Análisis de Correlacción Canónica. El problema es que al utilizar Barlet o >> Levenne test no calcula los valores ya que se necesita una variable >> dependiente y Factor, y al meterlo como especie a y factor abiotico no lo >> calcula. En este caso yo solo quiero obtener la homogeneidad de varianza >> por columna ( si se puede). >> >> Agradeceria su pronta respuesta y Muchisimas Gracias de antemano. >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es > > ------------------------------ > > Subject: Pié de página del digest > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > > ------------------------------ > > Fin de Resumen de R-help-es, Vol 88, Envío 15 > *********************************************[[alternative HTML version deleted]]
José Trujillo Carmona
2016-Jun-14 16:15 UTC
[R-es] Ayuda con la homocedasticidad de Varianza
El 14/06/16 a las 15:58, morales en us.es escribió:> Hola, puedes calcular las cuasivarianzas muestrales por columnas > mediante tapply y luego > compararlas. El cociente entre las dos varianzas sigue una distribución > F de Snedecor con grados de libertad n1-1 y n2-2. Puedes calcular la > probabilidad de aceptar H0 > con la función pf. >Eso solo es cierto si las variables constituyen muestras procedentes de variables aleatorias normales. El cociente de varianzas solo sigue una distribución F de Snedecor en el caso de variables normales. Incluso su comportamiento asintótico solo está indicado para muestras muy muy grandes. Para variables no normales dispones de contrastes como el de Ansari-Bradley (en R es la función ansari.test), o el test de Moses (que es el que usa SPSS y en R está también disponible en el paquete DescTools). En R hay disponibles otros como el de Mood o el de Siegel-Tukey, pero el primero de los señalados en el párrafo anterior tiene una gran potencia asintótica y el segundo es el más utilizado (por el efecto de penetración de mercado del SPSS). Pero insisto, para las variables del ejemplo, es obvio que no se necesita ningún test: No hay ninguna razón para pensar que estas variables puedan compartir varianza. Ni siquiera el principio de parsimonia puede ser invocado para variables con distintas unidades de medida y escala como tienen las variables mostradas. Saludos.