Hola chic en s, tengo una pregunta teórica. Tengo la evolución de una variable en función del tiempo. Hay 145 valores. Los primeros 1 son 0, y los demás son crecientes. Calculo la desviacion estandard con R, contemplando las 145 muestras (incluyendo los 0), y las 132 muestras (sin incluir los ceros). Me da que la desviación estandard sin contemplar los 0 es mayor. Como puede ser? no le veo el sentido. Adjunto cálculos en excel. En principio, si quito el mínimo de la serie, los datos tendrian que estar mas comprimidos no? -- *Albert Montolio Aguado* ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20151107/588c4c61/attachment.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: DatosP3.xlsx Type: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Size: 13012 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20151107/588c4c61/attachment.bin>
La desviación típica no depende de la escala. Si incluyes valores que se repiten o que tienen poca variabilidad sería de esperar que pase eso, aunque sea en uno de los extremos... Un saludo, Rubén. El 7/11/2015 9:43, "Albert Montolio" <albert.montolio en gmail.com> escribió:> Hola chic en s, > > tengo una pregunta teórica. Tengo la evolución de una variable en función > del tiempo. Hay 145 valores. Los primeros 1 son 0, y los demás son > crecientes. Calculo la desviacion estandard con R, contemplando las 145 > muestras (incluyendo los 0), y las 132 muestras (sin incluir los ceros). > > Me da que la desviación estandard sin contemplar los 0 es mayor. Como > puede ser? no le veo el sentido. > > Adjunto cálculos en excel. En principio, si quito el mínimo de la serie, > los datos tendrian que estar mas comprimidos no? > > -- > > > *Albert Montolio Aguado* > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Hola, ¿qué tal? Lo que te pasa no es tan raro: set.seed(1234) muestra <- abs(rnorm(100)) sd(muestra) #[1] 0.5811866 muestra.ceros <- c(muestra, rep(0, 100000)) sd(muestra.ceros) #[1] 0.03196273 En una muestra de números positivos, añadir un cero (sobre todo si está lejos de la media) sube la varianza. Si añado otro, posiblemente también. Pero cuando añado muchísimos ceros, la varianza tiende a cero. Si luego los quito, me quedo con la original: ¡la varianza crece a pesar de que la muestra está "más comprimida"! Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com P.D.: La desviación típica depende linealmente de la escala. El día 8 de noviembre de 2015, 12:16, Rubén Fernández-Casal <rubenfcasal en gmail.com> escribió:> La desviación típica no depende de la escala. Si incluyes valores que se > repiten o que tienen poca variabilidad sería de esperar que pase eso, > aunque sea en uno de los extremos... > > Un saludo, Rubén. > El 7/11/2015 9:43, "Albert Montolio" <albert.montolio en gmail.com> escribió: > >> Hola chic en s, >> >> tengo una pregunta teórica. Tengo la evolución de una variable en función >> del tiempo. Hay 145 valores. Los primeros 1 son 0, y los demás son >> crecientes. Calculo la desviacion estandard con R, contemplando las 145 >> muestras (incluyendo los 0), y las 132 muestras (sin incluir los ceros). >> >> Me da que la desviación estandard sin contemplar los 0 es mayor. Como >> puede ser? no le veo el sentido. >> >> Adjunto cálculos en excel. En principio, si quito el mínimo de la serie, >> los datos tendrian que estar mas comprimidos no? >> >> -- >> >> >> *Albert Montolio Aguado* >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es