thr3ads.net - R help es - [R-es] Bootstrap data frame (Jesús Para Fernández) [Jan 2016]

If this information is useful, please help other people find it:
Share via:

JORGE OCAÑA REBULL

2016-Jan-27 10:14 UTC

[R-es] Bootstrap data frame (Jesús Para Fernández)

Hola Jesús,
Si no entiendo mal lo que planteas, has observado unas frecuencias
N = c(12, 0, 8, 6, 4, 2)
de pedidos acaecidos en 1:6 días, en total
n = sum(N)
pedidos. Llamemos P = (p1, p2, ?, p6) a las probabilidades ?teóricas? de pedido
en cada día. En principio el vector N se puede considerar una realización de una
distribución multinomial M(n; p1, ?, p6).
P se puede estimar mediante las frecuencias relativas N / n, y una remuestra
bootstrap correspondería a una realización de una multinomial M(n; N/n), es
decir:
rmultinom(1, n, N/n)
o si deseas generar ?b? remuestras bootstrap:
rmultinom(b, n, N/n)

Fíjate que el proceso anterior es equivalente aunque más compacto y posiblemente
más rápido al típico proceso que se suele designar como ?bootstrap no
paramétrico?, generar muestras aleatorias y con reemplazamiento de la muestra
original. Las frecuencias anteriores serían asimilables a una gran muestra, un
vector de ?n? valores 1, 2, ?, 6, en la que hubiese 12 valores 1, ningún valor
2, 8 valores 3, etc. Tomando una muestra aleatoria (sample, etc.) de tamaño n
del vector anterior y luego calculando las frecuencias de 1, ?, 6 observadas en
ella se reproduciría el proceso basado en la multinomial.

Este enfoque tiene el inconveniente de que convierte lo improbable en imposible,
en ninguna remuestra bootstrap aparecerá el día 2. La solución consistiría en
asumir algún modelo para las probabilidades p1, ?, p6, de manera que se pudiesen
estimar a partir de la muestra, de una manera más ?refinada? que una simple
frecuencia relativa. En este caso la estimación de p2, aunque seguramente
pequeña, no sería 0. La idea de la multinomial seguiría siendo válida pero ahora
a partir de estas nuevas estimaciones de las probabilidades.

Saludos

Jordi Ocaña Rebull
Dep. d?Estadística
Universitat de Barcelona



Aquest correu electrònic i els annexos poden contenir informació confidencial o
protegida legalment i està adreçat exclusivament a la persona o entitat
destinatària. Si no sou el destinatari final o la persona encarregada de
rebre?l, no esteu autoritzat a llegir-lo, retenir-lo, modificar-lo,
distribuir-lo, copiar-lo ni a revelar-ne el contingut. Si heu rebut aquest
correu electrònic per error, us preguem que n?informeu al remitent i que
elimineu del sistema el missatge i el material annex que pugui contenir. Gràcies
per la vostra col·laboració.

Este correo electrónico y sus anexos pueden contener información confidencial o
legalmente protegida y está exclusivamente dirigido a la persona o entidad
destinataria. Si usted no es el destinatario final o la persona encargada de
recibirlo, no está autorizado a leerlo, retenerlo, modificarlo, distribuirlo,
copiarlo ni a revelar su contenido. Si ha recibido este mensaje electrónico por
error, le rogamos que informe al remitente y elimine del sistema el mensaje y el
material anexo que pueda contener. Gracias por su colaboración.

This email message and any documents attached to it may contain confidential or
legally protected material and are intended solely for the use of the individual
or organization to whom they are addressed. We remind you that if you are not
the intended recipient of this email message or the person responsible for
processing it, then you are not authorized to read, save, modify, send, copy or
disclose any of its contents. If you have received this email message by
mistake, we kindly ask you to inform the sender of this and to eliminate both
the message and any attachments it carries from your account. Thank you for your
collaboration.

	[[alternative HTML version deleted]]

Jesús Para Fernández

2016-Jan-27 11:40 UTC

head link

[R-es] Bootstrap data frame (Jesús Para Fernández)

Buenas Jorge, 

No sé si estamos hablando exactamente de lo mismo. Me explicaré mejor, ya que me
he dado cuenta que no lo he hecho bien.

Lo que quiero es buscar un óptimo para no quedarme nunca sin stock. Tengo un
listado de piezas pedidas durante un año, de la forma siguiente:
1 de enero    2 piezas pedidas
2 de enero    0
....
15 de diciembre 0 piezas pedidas

Se que el recambio me tarda en llegar 6 dias(por ejemplo), por lo que me
interesa tener la tienda con el stock optimo, es decir, aquel que me permite no
tener un exceso de stock pero que me garantice con un % de probabilidad que no
me voy a quedar sin stock.

Por ello, lo que hago son muestras bootstrap sobre la población, cogiendo 6 dias
al azar y viendo que he pedido en esos 6 dias. Con una tabla de frecuencias, veo
como se reparte esa frecuencia de pedidos y sobre eso y los porcentajes
acumulados, obtengo la probabilidad de veces que se da cada casuistica.

Como ejemplo, añado datos.txt, el cual contiene una tabla de cada dia y los
pedidos que se hacen cada uno de esos dias.

Si el pedido tarda en este caso en llegar 6 dias, entonces hago muestras
bootstrap y saco la tabla de frecuencias.

#codigo R
set.seed(121)
final<-0
nuevo<-0
for(i in 1:100000){
nuevo<-sample(datos$pedidos,replace=T)
final[i]<-sum(nuevo[1:6])
}


hist(final,col=8,breaks=50)
table(final)

Con esto puedo crear lo que aparece en stockmin donde me dice el porcentaje de
veces que me se piden las cantidades, por ejemplo, se que si pongo stock minimo
de 3, el 60% de las veces lo cumplo, pero el 40% me quedo sin stock. Para
garantizarme la viabilidad iria a un porcentaje del 99%, que es un stock de 50.

¿Como veis este metodo?

Gracias
Jesús


> From: jocana en ub.edu
> To: r-help-es en r-project.org
> Date: Wed, 27 Jan 2016 10:14:20 +0000
> Subject: [R-es] Bootstrap data frame (Jesús Para Fernández)
> 
> Hola Jesús,
> Si no entiendo mal lo que planteas, has observado unas frecuencias
> N = c(12, 0, 8, 6, 4, 2)
> de pedidos acaecidos en 1:6 días, en total
> n = sum(N)
> pedidos. Llamemos P = (p1, p2, ?, p6) a las probabilidades ?teóricas? de
pedido en cada día. En principio el vector N se puede considerar una realización
de una distribución multinomial M(n; p1, ?, p6).
> P se puede estimar mediante las frecuencias relativas N / n, y una
remuestra bootstrap correspondería a una realización de una multinomial M(n;
N/n), es decir:
> rmultinom(1, n, N/n)
> o si deseas generar ?b? remuestras bootstrap:
> rmultinom(b, n, N/n)
> 
> Fíjate que el proceso anterior es equivalente aunque más compacto y
posiblemente más rápido al típico proceso que se suele designar como ?bootstrap
no paramétrico?, generar muestras aleatorias y con reemplazamiento de la muestra
original. Las frecuencias anteriores serían asimilables a una gran muestra, un
vector de ?n? valores 1, 2, ?, 6, en la que hubiese 12 valores 1, ningún valor
2, 8 valores 3, etc. Tomando una muestra aleatoria (sample, etc.) de tamaño n
del vector anterior y luego calculando las frecuencias de 1, ?, 6 observadas en
ella se reproduciría el proceso basado en la multinomial.
> 
> Este enfoque tiene el inconveniente de que convierte lo improbable en
imposible, en ninguna remuestra bootstrap aparecerá el día 2. La solución
consistiría en asumir algún modelo para las probabilidades p1, ?, p6, de manera
que se pudiesen estimar a partir de la muestra, de una manera más ?refinada? que
una simple frecuencia relativa. En este caso la estimación de p2, aunque
seguramente pequeña, no sería 0. La idea de la multinomial seguiría siendo
válida pero ahora a partir de estas nuevas estimaciones de las probabilidades.
> 
> Saludos
> 
> Jordi Ocaña Rebull
> Dep. d?Estadística
> Universitat de Barcelona
> 
> 
> 
> Aquest correu electrònic i els annexos poden contenir informació
confidencial o protegida legalment i està adreçat exclusivament a la persona o
entitat destinatària. Si no sou el destinatari final o la persona encarregada de
rebre?l, no esteu autoritzat a llegir-lo, retenir-lo, modificar-lo,
distribuir-lo, copiar-lo ni a revelar-ne el contingut. Si heu rebut aquest
correu electrònic per error, us preguem que n?informeu al remitent i que
elimineu del sistema el missatge i el material annex que pugui contenir. Gràcies
per la vostra col·laboració.
> 
> Este correo electrónico y sus anexos pueden contener información
confidencial o legalmente protegida y está exclusivamente dirigido a la persona
o entidad destinataria. Si usted no es el destinatario final o la persona
encargada de recibirlo, no está autorizado a leerlo, retenerlo, modificarlo,
distribuirlo, copiarlo ni a revelar su contenido. Si ha recibido este mensaje
electrónico por error, le rogamos que informe al remitente y elimine del sistema
el mensaje y el material anexo que pueda contener. Gracias por su colaboración.
> 
> This email message and any documents attached to it may contain
confidential or legally protected material and are intended solely for the use
of the individual or organization to whom they are addressed. We remind you that
if you are not the intended recipient of this email message or the person
responsible for processing it, then you are not authorized to read, save,
modify, send, copy or disclose any of its contents. If you have received this
email message by mistake, we kindly ask you to inform the sender of this and to
eliminate both the message and any attachments it carries from your account.
Thank you for your collaboration.
> 
> 	[[alternative HTML version deleted]]
> 
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es 		 	   		  
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL:
<https://stat.ethz.ch/pipermail/r-help-es/attachments/20160127/e9cf2a6b/attachment-0001.html>
------------ próxima parte ------------
An embedded and charset-unspecified text was scrubbed...
Name: datos.txt
URL:
<https://stat.ethz.ch/pipermail/r-help-es/attachments/20160127/e9cf2a6b/attachment-0001.txt>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: stockmin.csv
Type: application/octet-stream
Size: 1683 bytes
Desc: no disponible
URL:
<https://stat.ethz.ch/pipermail/r-help-es/attachments/20160127/e9cf2a6b/attachment-0001.obj>

JORGE OCAÑA REBULL

2016-Jan-28 09:12 UTC

head link

[R-es] Bootstrap data frame (Jesús Para Fernández)

Hola Jesús,
Ciertamente no entendí la situación que planteabas. Si no sigo entendiéndolo
mal, en el fondo se trata de estudiar mediante bootstrap la distribución de la
suma de los pedidos en 6 días, que entiendo que presupones independientes entre
ellos (no hace falta por ejemplo que sean bloques de 6 días consecutivos). En
este caso creo que el enfoque y el código que propones ya es acertado.
Posiblemente se pueda optimizar algo substituyendo las líneas de tu código
nuevo<-sample(datos$pedidos,replace=T)
final[i]<-sum(nuevo[1:6])

por:
nuevo<-sample(datos$pedidos, size = 6, replace=T)
final[i]<-sum(nuevo)

para evitar cada vez extraer una remuestra enorme de la que sólo aprovechas los
6 primeros elementos. También alojaría ya de entrada espacio de memoria para
'final' para evitar problemas de gestión de memoria al tener que ir
ampliándolo:
final<-numeric(100000)
# nuevo<-0 (no hace falta)

Saludos,
Jordi
De: Jesús Para Fernández [mailto:j.para.fernandez en hotmail.com]
Enviado el: miércoles, 27 de enero de 2016 12:40
Para: JORGE OCAÑA REBULL <jocana en ub.edu>; r-help-es en r-project.org
Asunto: RE: [R-es] Bootstrap data frame (Jesús Para Fernández)

Buenas Jorge,

No sé si estamos hablando exactamente de lo mismo. Me explicaré mejor, ya que me
he dado cuenta que no lo he hecho bien.

Lo que quiero es buscar un óptimo para no quedarme nunca sin stock. Tengo un
listado de piezas pedidas durante un año, de la forma siguiente:
1 de enero    2 piezas pedidas
2 de enero    0
....
15 de diciembre 0 piezas pedidas

Se que el recambio me tarda en llegar 6 dias(por ejemplo), por lo que me
interesa tener la tienda con el stock optimo, es decir, aquel que me permite no
tener un exceso de stock pero que me garantice con un % de probabilidad que no
me voy a quedar sin stock.

Por ello, lo que hago son muestras bootstrap sobre la población, cogiendo 6 dias
al azar y viendo que he pedido en esos 6 dias. Con una tabla de frecuencias, veo
como se reparte esa frecuencia de pedidos y sobre eso y los porcentajes
acumulados, obtengo la probabilidad de veces que se da cada casuistica.

Como ejemplo, añado datos.txt, el cual contiene una tabla de cada dia y los
pedidos que se hacen cada uno de esos dias.

Si el pedido tarda en este caso en llegar 6 dias, entonces hago muestras
bootstrap y saco la tabla de frecuencias.

#codigo R
set.seed(121)
final<-0
nuevo<-0
for(i in 1:100000){
nuevo<-sample(datos$pedidos,replace=T)
final[i]<-sum(nuevo[1:6])
}


hist(final,col=8,breaks=50)
table(final)

Con esto puedo crear lo que aparece en stockmin donde me dice el porcentaje de
veces que me se piden las cantidades, por ejemplo, se que si pongo stock minimo
de 3, el 60% de las veces lo cumplo, pero el 40% me quedo sin stock. Para
garantizarme la viabilidad iria a un porcentaje del 99%, que es un stock de 50.

¿Como veis este metodo?

Gracias
Jesús

> From: jocana en ub.edu<mailto:jocana en ub.edu>
> To: r-help-es en r-project.org<mailto:r-help-es en r-project.org>
> Date: Wed, 27 Jan 2016 10:14:20 +0000
> Subject: [R-es] Bootstrap data frame (Jesús Para Fernández)
>
> Hola Jesús,
> Si no entiendo mal lo que planteas, has observado unas frecuencias
> N = c(12, 0, 8, 6, 4, 2)
> de pedidos acaecidos en 1:6 días, en total
> n = sum(N)
> pedidos. Llamemos P = (p1, p2, ..., p6) a las probabilidades
"teóricas" de pedido en cada día. En principio el vector N se puede
considerar una realización de una distribución multinomial M(n; p1, ..., p6).
> P se puede estimar mediante las frecuencias relativas N / n, y una
remuestra bootstrap correspondería a una realización de una multinomial M(n;
N/n), es decir:
> rmultinom(1, n, N/n)
> o si deseas generar 'b' remuestras bootstrap:
> rmultinom(b, n, N/n)
>
> Fíjate que el proceso anterior es equivalente aunque más compacto y
posiblemente más rápido al típico proceso que se suele designar como
"bootstrap no paramétrico", generar muestras aleatorias y con
reemplazamiento de la muestra original. Las frecuencias anteriores serían
asimilables a una gran muestra, un vector de 'n' valores 1, 2, ..., 6,
en la que hubiese 12 valores 1, ningún valor 2, 8 valores 3, etc. Tomando una
muestra aleatoria (sample, etc.) de tamaño n del vector anterior y luego
calculando las frecuencias de 1, ..., 6 observadas en ella se reproduciría el
proceso basado en la multinomial.
>
> Este enfoque tiene el inconveniente de que convierte lo improbable en
imposible, en ninguna remuestra bootstrap aparecerá el día 2. La solución
consistiría en asumir algún modelo para las probabilidades p1, ..., p6, de
manera que se pudiesen estimar a partir de la muestra, de una manera más
"refinada" que una simple frecuencia relativa. En este caso la
estimación de p2, aunque seguramente pequeña, no sería 0. La idea de la
multinomial seguiría siendo válida pero ahora a partir de estas nuevas
estimaciones de las probabilidades.
>
> Saludos
>
> Jordi Ocaña Rebull
> Dep. d'Estadística
> Universitat de Barcelona
>
>
>
> Aquest correu electrònic i els annexos poden contenir informació
confidencial o protegida legalment i està adreçat exclusivament a la persona o
entitat destinatària. Si no sou el destinatari final o la persona encarregada de
rebre'l, no esteu autoritzat a llegir-lo, retenir-lo, modificar-lo,
distribuir-lo, copiar-lo ni a revelar-ne el contingut. Si heu rebut aquest
correu electrònic per error, us preguem que n'informeu al remitent i que
elimineu del sistema el missatge i el material annex que pugui contenir. Gràcies
per la vostra col·laboració.
>
> Este correo electrónico y sus anexos pueden contener información
confidencial o legalmente protegida y está exclusivamente dirigido a la persona
o entidad destinataria. Si usted no es el destinatario final o la persona
encargada de recibirlo, no está autorizado a leerlo, retenerlo, modificarlo,
distribuirlo, copiarlo ni a revelar su contenido. Si ha recibido este mensaje
electrónico por error, le rogamos que informe al remitente y elimine del sistema
el mensaje y el material anexo que pueda contener. Gracias por su colaboración.
>
> This email message and any documents attached to it may contain
confidential or legally protected material and are intended solely for the use
of the individual or organization to whom they are addressed. We remind you that
if you are not the intended recipient of this email message or the person
responsible for processing it, then you are not authorized to read, save,
modify, send, copy or disclose any of its contents. If you have received this
email message by mistake, we kindly ask you to inform the sender of this and to
eliminate both the message and any attachments it carries from your account.
Thank you for your collaboration.
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org<mailto:R-help-es en r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
	[[alternative HTML version deleted]]

R help es - Jan 2016 - Bootstrap data frame (Jesús Para Fernández)

[R-es] Bootstrap data frame (Jesús Para Fernández)

[R-es] Bootstrap data frame (Jesús Para Fernández)

[R-es] Bootstrap data frame (Jesús Para Fernández)