UNIVERSIDAD CENTRAL DE VENEZUELA POSTGRADO EN ESTADISTICA facultad de agronomía
ESTADISTICA NO PARAMETRICA Estadísticos de Orden
Gabriel Álvarez
Maracay Febrero 2013
ESTADISTICOS DE ORDEN En Estadística, se suele considerar el estadístico de orden k de una muestra estadística como el késimo valor más pequeño. Por ejemplo, en una muestra de tamaño 25, el estadístico de orden k = 9, sería el noveno valor más pequeño de dicha muestra. Los estadísticos de orden tienen bastante importancia dentro de la Estadística no paramétrica y de la inferencia.
Así, si se tiene una muestra aleatoria simple de tamaño n, X1,X2,…,Xn, y x1,x2,…x3 es una realización de esa muestra, el mínimo es siempre el valor más pequeño de la muestra, esto es, x(1)= Min{x1,x2,…xn} ; mientras que el máximo es el valor más grande de la muestra. X(n)=Max{x1,x2,…xn} Ejemplo 1: Se tiene la muestra de tamaño 6 siguiente: 45, 23, 67, 33, 101, 122. Los valores de dicha muestra se escriben de la siguiente forma: x1=45, x2=23 x3=67, x4=33, x5=101 y x6=122. Los estadísticos de orden para esa muestra se escribirían de la siguiente forma: x(1)=23, x(2)=33 x(3)=45, x(4)=67, x(5)=101 y x(6)=122. Así, en esa muestra, el mínimo sería x(1), que vale 23 y el máximo x(6) igual a 122).
Ejemplo 2: X1
X2
X3
X4
X5
Muestra 1
10
6
11
3
25
Muestra 1
4
8
2
22
10
Muestra 2
30
8
15
11
9
Muestra 4
21
7
11
4
8
U(1)
U(2)
U(3)
U(4)
U(5)
Muestra 1
3
6
10
11
25
Muestra 2
2
4
8
10
22
Muestra 3
8
9
11
15
30
Muestra 4
4
7
8
44
21
Así en la Muestra 1 X1=10, X2=6, X3=11, X4=3, X5=25 Y sin embargo U(1)=3, U(2)=6, U(3)=10,U(4)=11, U(5)=25 , Min (1)= U(1)=3 y Max(1)= U(5)=25
Podemos concluir entonces que si se extrae una muestra aleatoria {X1, X2,…Xn} de cualquier población con funciones de distribución Fx(x) y densidad f(x) respectivamente y ordenamos en forma creciente quedando de la forma {U1, U2,…Un} con U(1)≤ U(2) ≤… U(r) ….≤ U(n) estas constituyen las estadísticas de orden de la muestra original, luego U(r), 1≤ r ≤ n toma el nombre de la résima estadística de orden En ocasiones no estamos interesados en estimar un parámetro de la población sino, por ejemplo, el valor máximo o mínimo que puede tomar. Así, podemos interesarnos por la temperatura máxima en vez de por la temperatura media. De esta forma surge el estadístico que estima el lugar que ocupa un elemento de la muestra, al ordenarla de forma creciente.
Aplicaciones de los Estadísticos de orden El máximo, X(n) interesante en inundaciones y otros fenómenos meteorológicos El Mínimo, X(1) interesante en problemas de ingeniería como sucesiones de dispositivos en serie . La mediana Muestral 𝑋 n es par
𝑋 𝑛 +𝑋 𝑛+1
𝑛+1 2
si n es impar y
2
2
2
si
El Rango X(n) – X(1) que es una medida de dispersión. Experimentos en ingeniería con n dispositivos, cuyos tiempos de vida se observan hasta que falla el r-ésimo dispositivo; así se tienen r tiempos de vida ordenados X(1)< X(2)<…< X(n)
Distribución del Máximo y el Mínimo 𝐹𝑥 1 𝑥 = 1 − 1 − 𝐹(𝑥) 𝑛 función de distribución del mínimo derivando obtenemos su densidad 𝑓𝑥 1 𝑥 = 𝑛𝑓 𝑥 1 − 𝐹 𝑥
𝑛−1
𝐹𝑥 𝑛 𝑥 = 𝐹(𝑥) 𝑛 función de distribución del máximo derivando obtenemos su densidad 𝑓𝑥 𝑛 𝑥 = 𝑛𝑓 𝑥 𝐹 𝑥 𝑛−1 Ejemplo 3: Se tiene una muestra aleatoria simple de tamaño 52 de una variable aleatoria con distribución exponencial de parámetro 𝜃 = 4 y se quiere calcular la función de densidad tanto del mínimo como del máximo. La función de densidad de una variable aleatoria con dicha 1 −𝑥/4 distribución viene dada por: 𝑓𝑥 𝑥 = 𝑒 , x ≥ 0 mientras que 4 la función de distribución es 𝐹𝑥 𝑥 = 1 − 𝑒 𝑥/4 , x ≥ 0
Para el máximo 𝐹𝑥
52
𝑥 = 𝐹(𝑥)
𝑓𝑥
52
=
13𝑒 −𝑥/4
52
= 1−𝑒
1− 1−1−𝑒 1
𝑥 =
=
51 −𝑥/4 −𝑒
Para el mínimo 𝐹𝑥 1 𝑥 = 1 − 1 − 𝐹(𝑥)
𝑓𝑥
52−1
𝑥 = 52𝑓 𝑥 𝐹 𝑥 1
−𝑥/4 52
𝑥
−4
52
1 −𝑥/4 52 𝑒 4
52 =1
− 1−𝐹 𝑥
= 1 − −𝑒 𝑒
−
𝑥 4
1 52 𝑒 −𝑥/4 4
52−1
𝑥
−4
52
1
52
− 𝑒 −𝑥/4
51
=
=
= 1 − 𝑒 −13𝑥
=13𝑒 −𝑥/4 𝑒
𝑥 4
−
51
=13𝑒 −13𝑥
Distribución de probabilidad del r-ésimo estadístico de orden 𝑛! 𝑓𝑟 (𝑥𝑟 ) = 𝐹(𝑥(𝑟) ) 𝑟−1 ! 𝑛−𝑟 !
𝑟−1
1 − (𝐹𝑥
𝑟
)
𝑛−1
𝑓(𝑥(𝑟) )
Ejemplo 4: Se tiene una población cuyos elementos están definidos por una variable aleatoria continua X con densidad de probabilidad 2𝑥 𝑠𝑖 0 < 𝑥 < 1 de esta población se extrae una 0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 m.a. de tamaño 5, encuentre los estadísticos de orden 1,2,3,4,5. 𝑓 𝑥 =
Solución: 𝑓 𝑥 = 2𝑥 , 𝐹 𝑥 = luego los estadísticos de orden 0
x(1)
x(2)
𝑥 2𝑥𝑑𝑥 0
x(3)
= 𝑥 2 𝑐𝑜𝑛 − ∞ < 𝑥 < ∞
x(4)
x(5)
1
𝑛! 𝑓𝑟 (𝑥𝑟 ) = 𝐹(𝑥(𝑟) ) 𝑟−1 ! 𝑛−𝑟 !
𝑟−1
1 − (𝐹𝑥
𝑟
)
𝑛−1
𝑓(𝑥(𝑟) )
Densidad del estadístico de orden 1 con r=1, n=5, 𝑓 𝑥 = 2𝑥 y F 𝑥 = 𝑥 2 5! 𝑓1 (𝑥) = 1−1 ! 5−1 ! 𝑥 2 ) 1−1 1 − (𝑥 2 ) 5−1 2𝑥 desarrollando y simplificando se obtiene 𝑓1 𝑥 = 10𝑥 1 − 𝑥 2 𝑓2 𝑓3 𝑓4 𝑓5
𝑥 𝑥 𝑥 𝑥
4
, 0 < x < 1 de la misma manera:
= 40𝑥 3 = 60𝑥 5 = 10𝑥 7 = 10𝑥 9
1 − 𝑥 2 3, 1 − 𝑥 2 2, 1 − 𝑥2 , ,
0<x<1 0<x<1 0<x<1 0<x<1
Distribución conjunta de los estadísticos de Orden
𝑓 𝑥1, 𝑥2,… 𝑥𝑛 = 𝑛!
𝑛 𝑖=1 𝑓
𝑥𝑖 , 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛
Distribución de los r primeros estadísticos de Orden 𝑓 𝑥1 , 𝑥2,…., 𝑥𝑛 = 𝑛!
𝑛−𝑟
1−𝐹(𝑥𝑟 ) 𝑛 𝑖=𝑛−𝑟 𝑛−𝑟 !
, 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛
Distribución de los r últimos estadísticos de Orden 𝑓 𝑥𝑛−𝑟+1, 𝑥𝑛−𝑟+2,… 𝑥𝑛 = 𝑛!
1−𝐹(𝑥𝑛−𝑟+1 ) 𝑛 𝑖=𝑛−𝑟 𝑛−𝑟 !
𝑛−𝑟
, 𝑥𝑛−𝑟+1 ≤ 𝑥𝑛−𝑟+2 ≤ … ≤ 𝑥𝑛
CONCLUSION Las estadísticas de orden, generalmente tratan con las propiedades de X(r) ó funciones de algún subconjunto de las n estadísticas de orden, son particularmente útiles en estadística no paramétrica debido a que la transformación Ur= Fx(Xr) da lugar a una variable aleatoria que es el r-ésimo estadístico de orden, utilizados para identificar modelos de probabilidades de observaciones ubicadas de las muestras en cualquier posición específica, una vez conocido el modelo de probabilidad de un estadístico de orden es posible hacer un análisis completo de dicho orden.