This document was ed by and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this report form. Report 3i3n4
7. Una compañía estadounidense paga a sus empleados un salario promedio de 9.25 dólares por hora, con una desviación estándar de 60 centavos de dólar. Si los salarios siguen una distribución aproximadamente normal, ¿qué porcentaje aproximado de trabajadores reciben un salario de entre $8.75 y $9.69 incluso, por hora?
8. Un conferencista cuenta un promedio de cuatro anécdotas en cada conferencia que imparte. Determine la probabilidad de que cuente menos de tres anécdotas por conferencia, durante tres de las siguientes siete conferencias que imparta.
276
Parte 111. Inferencia estadística
9. Calcule la probabilidad de que una persona que lanza al aire una moneda, logre obtener su cuarta águila en el séptimo lanzamiento.
10. Las hogazas de pan de centeno distribuidas a las tiendas por una panadería, tienen una longitud promedio de 30 cm y una desviación estándar de 2 cm. Suponiendo que las longitudes de estos panes se distribuyen normalmente, ¿qué porcentaje de las hogazas tiene una longitud entre 29.3 cm y 33.5 cm?
Test 7.2 En el siguiente cuadro, anote con lápiz suave sus respuestas. Los procedimientos debe realizarlos en hojas separadas, y no en el libro. (En el apéndice D se dan las respuestas correctas para que las coteje con las suyas.)
1
6.-
.
2
.
3.-
7
.
9
4.
-
.
5.
-
10.-
ii) iii) -
1. Un compositor de música para piano lanza un nuevo CD al mercado tan pronto como logra componer 14 melodías nuevas. El tiempo que tarda en componer una melodía 1 nueva (en años) sigue una distribución exponencial cuya varianza es -. Calcule la 36 probabilidad de que el tiempo entre dos CDs consecutivos que graba sea menor que dos años y seis meses.
2. En un establecimiento de lavado de automóviles, tienen una promoción que dice: "Conserve su comprobante; con cinco el siguiente lavado es gratis." Si un señor lleva su automóvil a lavar a ese sitio un promedio de 1.8 veces por semana, calcule la probabilidad de que el tiempo transcurrido entre dos lavados gratis que obtenga sea menor que cinco semanas. [Suponga que el número de veces que el señor lava su coche a la semana sigue una distribución de Poisson.]
3. Use la aproximación de la curva normal para resolver este problema. Un fabricante de calzado para niño sabe por experiencia que 4% de su producción es rechazada por
Cap. 7. Teorema Central del Límite y distribuciones muestrales
277
defectos de fabricación. Si un nuevo lote de 800 pares de zapatos se presenta a inspección, ¿qué tan probable es que se rechacen menos de 36 pares?
4. En una papelería se venden en promedio 3.5 diskettes sueltos por hora. Cada vez que se venden 10 unidades, la señorita encargada tiene que abrir una caja nueva. Si la encargada abrió una caja a las 10:OO a. m., determine la probabilidad aproximada de que abra la siguiente después del mediodía.
5. Una variable aleatoria discreta X sigue una distribución de Poisson, cuya media es p = 9. Calcule el valor de P ( k - 20 < X < p + 20).
6. Sea X una variable aleatoria discreta, con distribución de Poisson, en la que se sabe que P(X = 1) = P(X = 3). De acuerdo con esa información, se requiere determinar P(X = 5).
7. Los siguientes datos aparecieron en elJoumal of the American Statistical Associatiun, vol. 31, pp. 376-380. Durante un periodo de 96 años se registraron las vacantes para empleo en la Suprema Corte de Justicia de Estados Unidos, ya sea por muerte o renuncia de alguno de sus . El tamaño de muestra es n = 96.
k=nÚmo de vacantes
1
n, = número
durante el
de años con k
año
vacantes
O
59 27
1 2 3 más de 3
9
1 O
Para aproximar estos datos mediante un proceso de Poisson, el parámetro h se toma como la media aritmética ponderada de esta distribución empírica, esto es:
278
Parte 111. Inferencia estadística
Haga ahora un comparativo del modelo teórico (o esperado) 969 (k, 0.5), con respecto a los valores observados en la tabla señalada. a)
k=númm de vacantes durante el año O 1
m-, , , ,
k = número de vacantes durante el año O 1 2 3 más de 3
k = número de vacantes durante el
-año
-o -
%=núm de años con k vacantes (observado) 59 27 9 1 O
n =número años con k vacantes (esperado) 59.224 28.117
dek =número años con vacantes
n =número be años con k vacantes (esperado)
8.977 1.210 0.173
rdo)
58.227 29.113
-.
9 1 O
1 I
7.278 1.2 13 0.168
%=n ú m %;.=-me; ' años con k vacart-'-vacantes psperado) -
-
58.224
27
L 1
m á s de 3
h
O
1
1.210 0.163
'
d)
k =número de vacantes durante el
2 3 mas de 3
' nch añosncírnero 2 años número cm k vacantes k vacantes =
=
cm
--
I
1
(observado)
(esperado)
59
59.224 27.117 9.277 1.2 10 0.173
27 9 1 O
1
8. Cada sucursal del banco llamado Serfin en México cuenta con 15 cajas para atender al público, pero normalmente sólo unas pocas funcionan (a menudo sólo una o dos) y las demás tienen un letrero que dice "cerrada". Suponga que si X es el número de cajas que funcionan en dicho banco en un día cualquiera, la distibución de probabilidad de X está dada por la siguiente tabla:
i ) Encuentre la probabilidad de que 60% o más de las cajas funcionen en un día cualquiera.
ii) ¿Qué porcentaje de las cajas funcionan la mayoría de las veces?
iii) ¿Cuál es el número promedio de cajas que funcionan en un día cualquiera?
9. Si el conjunto de calificaciones de un examen de estadística tiene una distribución normal, con media de 74 y desviación estándar de 7.9, obtenga la calificación aprobatoria más baja, si a 10% de los exámenes con más bajas calificaciones se les pone NA (no acreditado).
10. El diámetro interior de un anillo para émbolo se distribuye normalmente, con una media de 10 cm y una desviación estándar de 0.03 cm. ¿Debajo de qué valor de diámetro interior caerá 15% de los anillos?
Para calcular un intervalo de confianza de 100(1 - a)% relativo a la media desconocida de una población, primero debemos preguntarnos si la muestra de la que disponemos es grande (n 1 30) y si conocemos o no el valor de la desviación estándar o de la población. De las respuestas de estas preguntas depende el procedimiento a seguir. A decir verdad, si no se conoce el valor de la media, es poco verosímil que podamos conocer el valor de la desviación estándar, pero a veces este último parámetro se conoce por la experiencia previa, o tal vez se tienen fuertes sospechas de su valor aproximado. Sin embargo, en la mayoría de los casos, cuando se desconoce la media p.,también se desconoce la desviación estándar o, por lo que debe utilizarse la desviación estándar muestra1s como sustituto de o. Para una muestra grande, o para una muestra pequeña en la que se conoce el valor de la desviación estándar poblacional, es necesario buscar en tablas de la normal estándar inversa (o en tablas de valores críticos de la distribución normal estándar) el percentil crítico para un intervalo de confianza de 100(1- a)%. Dicho percentil crítico se calcula de la siguiente manera:
(
:i
z crítico =z,,~ =a-'1 - -
En la figura 8.1 se localiza la ubicación de z, y de -2, tándar.
en la curva normal es-
Figura 8.1
En la práctica, los valores más usuales para el nivel de confianza son 95% y 99%. En el primer caso, el valor del percentil crítico es (P-'(0.975) = 1.95996 .1.96, mientras que en el segundo caso es @-'(0.995) = 2.57583 = 2.576. Incluso vale la pena aprenderse de memoria estos dos percentiles críticos, que son los más usuales. Si la muestra es pequeña, pero la población es aproximadamente normal y se desconoce el valor de o, entonces se usan percentiles críticos de la t de Student con n - 1grados de libertad. Recomendamos aprenderse de memoria el esquema que aparece en la figura 8.2. Si no se dispone de tablas de la normal estándar inversa, ni tampoco se conocen de memoria los valores críticos z,, se puede usar una tabla de percentiles de la distribución t de Student, de la cual la última fila (m grados de libertad) corresponde precisamente a los respectivos percentiles de la normal estándar. Si t, es el percentilp en una tabla de percentiles de la distribución t de Student, entonces el valor crítico t , se halla buscando el percentil del siguiente valor dep:
El Excel de Microsoft Office es un programa muy cómodo y tiene una utilería estadística que proporciona directamente el valor crítico t , para el nivel de confianza 100(1- a)%, pero eso lo veremos con más detalle en la sección 8.3, que tratará del caso de muestras pequeñas en las que se desconoce el valor de la desviación estándar poblacional. Ejemplo 8.1. Confeccionar con el Excel una pequeña tabla de valores críticos z, para intervalos de confianza relativos a la media p, con niveles de confianza desde 99 %
hasta 90%.
1
1
Aumentar el tamaño de la muestra o usar métodos de estadística no
Figura 8.2. Esquema para intervalos de confianza relativos a la media de una población. Solución: En una celdilla cualquiera de la hoja d e cálculo, por ejemplo, en la celdilla B2, anotamos 0.01, que es el valorde a,y como encabezado de esa columna escribimos Alfa en la celdilla B1. Luego escribimos 0.02 en la celdilla B3, seleccionamos ambas celdil l a ~(B1 y B2) y nos posicionamos con el cursor en la parte inferior derecha de la celdilla B2, para arrastrar hacia abajo, sin dejar de oprimir el botón izquierdo del ratón, hasta llegar al número 0.1. Enseguida nos posicionamos en la celdilla C2 y escribimos:
y damos enter. Por último, se da un clic en la celdilla B2 y ésta aparecerá rodeada por una línea gruesa con un pequeño punto en la parte inferior derecha, en el cual damos dos clics con el ratón (botón izquierdo) y aparecen los números buscados. Como encabezado de la segunda columna escribimos ya sea "zcrítico" o bien "z alfan":
Resulta muy fácil deducir la fórmula para el intervalo de confianza correspondiente a una media poblacional; cuando a uno se le olvida una fórmula, lo más fácil (y divertido) es volverla a deducir. Recuérdese que en el capítulo anterior vimos que la distribución muestral de medias para muestras de tamaño n (grandes o pequeñas) provenientes de una distribución normal, o bien para muestras grandes provenientes de una distribución que no es normal, tenderá en cualquier caso a la distribución normal estándar, con media
px= p. y desviación típica
0
=-
Jñ
. Luego, la variable:
tiene distribución normal estándar. Como hay una probabilidad 1- a de que una variable aleatoria con distribución normal estándar asuma un valor entre -2, y z,, se tendrá entonces:
Usando algo de álgebra elemental se despeja fácilmente p. de la desigualdad anterior, para obtener:
Ejemplo 8.2. Una muestra de 36 sábanas tamaño king size de cierta marca dio como resultado el siguiente promedio de longitudes: X =2.60 m, con desviación típica (muestral) S = 0.3 m. No se tiene idea de cuái pudiera ser la distribución de probabilidad deX= longitud de las sábanas de esa marca y tamaño. Construir un intervalo de confianza de:
con respecto a p., que es la media de X.
Cap. 8. Estimación de parámetros
285
Solución : a) El intervalo es 2.60 t(l.%)%,
es decir: 2.502 m < p < 2.698 m
J36 b) El intervalo es 2.602(2.576)- O" , esto es: 2.471 m c p < 2.729 m. J36
Obsérvese que a mayor nivel de confianza el intervalo se vuelve más amplio, mientras que a menor nivel de confianza será un intervalo más estrecho o preciso. Por ejemplo, si nos hubiésemos conformado con una confianza de 10% (esto es, a = 0.9), entonces el valor crítico sería W'(0.55) = 0.12566, y el intervalo de confianza sería 2.60 f 0.006 m. En el otro extremo de la escala, si hubiésemos exigido una confianza tan alta como 99.9999 % (o sea, a = 0.000001), tendríamos que usar el valor crítico siguiente:
lo cual de acuerdo con el Excel es 5.06639. (¡Qué rápido se acerca la campana normal al ejeX!) En tal caso, el intervalo de confianza sería tan vago como 2.60 f 0.25332, es decir, un margen de error de más de medio metro al estimar la longitud promedio de las sábanas. Ejemplo 8.3. Los biólogos saben que el contenido de vitaminas en las frutas siempre sigue una distribución normal (por razones que se explicaron en el capítulo anterior). Supbngase que se analizan las cantidades de vitamina C (en miligramos) en una muestra aleatoria de 10 naranjas de cierta variedad, con los siguientes resultados: 96.4,86.3,102.6, 99.0, 107.9,84.9, 92.5,97.2, 101.2, 105.0.Si se sabe que la desviación estándar del contenido de vitamina C en esa variedad de naranjas es de 7 mg, con s610 una calculadora y tablas estadísticas construir un intervalo de confianza de 95 % con respecto al contenido promedio de vitamina C en esa variedad de naranjas. Solución: Sólo hay que calcular el promedio de esos datos, el cual es jc =97.3 mg. Luego:
Así que hay una probabilidad de 0.95 d e que el verdadero valor de p (contenido medio de
vitamina C) esté comprendido en el intervalo 92.96 mg < p < 101.64 mg.
¿Por qué no convenía resolver este ejemplo con Excel? Por una razón muy sencilla: el Excel no puede saber lo que saben los biólogos (que el contenido de vitaminas en las frutas se distribuye de modo normal con desviación típica conocida). Por consiguiente, al resolver este ejemplo con Excel (usando el menú Hewamientas, Análisis de datos, Estadistica descriptiva), por default el Excel presupone que se desconoce la desviación típica poblacional de donde se extrajo la pequeña muestra, y por tanto, evalúa el intervalo usando valores críticos de la t de Student con nueve grados de,libertad, además de que emplea la desviación típica de la muestra, la cual es algo mayor de 7.575.
8.2. CULO DEL T&O
DE MUESTRA EN LA ESTIMACI~N
DE UNA MEDIA
En la fórmula para el intervalo de confianza relativo a la media:
hemos denotado con E al error en la medición del intervalo, es decir:
Es muy fácil despejar n de esta igualdad, con lo cual se obtiene la fórmula para el tamaño mínimo de muestra:
Con esto vemos que para averiguar el tamaño mínimo de muestra, en problemas donde se trata de estimar la media de la población, se necesita conocer la desviación estándar de la población. Cuando a usted le pregunten: "¿Cuál es el tamaño de muestra que debe tomarse al estimar la media de la población?', entonces puede responder en tono de broma: "Si la desviación estándar de la población es cero, entonces el tamaño de muestra es n = 1,es decir, isólo hay que tomar un dato!" En problemas prácticos es muy común que el valor de la última ecuación no resulte entero, en cuyo caso hay que sumar 1y tomar la parte entera, esto es:
donde el uso de corchetes significa la parte entera del número, o sea, el mayor entero que no excede a ese número. Ejemplo 8.4. Se desea hacer una estimación de la edad promedio (en días a partir de la fecha de nacimiento) en que le brotan los primeros dientes a un bebé ("dientes de leche"). Aunque se desconoce cuál sea la distribución de probabilidad de dicha variable, algunos estudios previos confirman que la desviación típica es aproximadamente o = 28 días. Se va a tomar una muestra aleatoria de n historiales de bebés de muchos pediatras, con objeto de estimar la media de esa variable. Si se desea que el error en dicha estimación sea de cuando mucho 12 días, con una confianza mínima de 95 %, ¿cuál debe ser el tamaño de la muestra? Solución:
Cap. 8. Estimación de parámetros
287
Luego, se requieren por lo menos 21 historiales pediátricos de bebés (es decir, n = 21), para cumplir con las especificaciones del problema. Lo anterior significa que si se toman 21 datos aleatorios de las edades en que brotaron los primeros dientes en los infantes, y se calcula el promedio aritmético de dichos datos, entonces el valor que se obtenga, más o menos 12 días, será el intervalo donde se encuentre el promedio real, con una probabilidad de 0.95. Ejemplo 8.5. Para una nueva marca de cigarrillos que salió al mercado, denotemos conXal contenido promedio de alquitrán (en miligramos) por cada cigarrillo. No se tiene idea de cuál pudiera ser la distribución de probabilidad de X, pero se estima que el valor de la desviación estándar es aproximadamente o = 0.3 mg. si X es la media del contenido de alquitrán de una muestra aleatofia de n cigarrillos de esa marca, se requiere calcular el tamaño de la muestra, para que X 0.10 sea un intervalo donde se encuentre el valor verdadero de p =E(&), con una confianza mínima de 99 %. Solución:
+
Por tanto, se requiere una muestra de n = 60 cigarrillos.
Si la muestra es pequeña, entonces se siguen las instrucciones del esquema d e la figura 8.2, pero es necesario que la población se distribuya d e manera normal o aproximadamente normal. Si se desconoce la desviación estándar d e la población, entonces se usan valores críticos de prueba d e la distribución t d e Student, con n - 1grados d e libertad. Si sólo se tiene a la mano tablas d e percentiles t, d e la distribución t d e Student, es fácil hallar el valor crítico t , si se recuerda la N
igualdad p = 1- 2, que equivale a la igualdad a = 2(1 - p ) . 2
La mayoría de los libros d e estadística traen tablas d e percentiles o d e valores críticos (o ambas tablas) para algunas opciones selectas. Tal vez las tablas estadísticas que vienen al final d e los libros (y que ocupan muchas páginas) desaparezcan poco a poco, gracias a la alta calidad d e las nuevas calculadoras científicas d e bolsillo y a la proliferación d e software estadístico barato y fácil d e usar. Seguramente, cuando sus hijos estudien estadística algún día, las tablas estadísticas serán tan obsoletas como lo es hoy, por ejemplo, la regla d e cálculo. Los s de algunos modelos de calculadoras científicas HP pueden hallar intervalos d e confianza de manera expedita y fácil, sin recurrir a tablas ni a Excel ni a nada d e eso, pero esas calculadoras todavía no son tan baratas como uno quisiera. Ejercicio 8.1. Con la utilería estadística del Excel, confeccione una pequeña tabla de valores críticos t, de la distribución t de Student con v grados de libertad, para valores de a (en orden descendente) desde 0.1 hasta 0.01 (columnas) y valores de v desde 1 hasta 30 (filas). Al final añada una fila correspondiente a grados de libertad, la cual le servirá
288
Parte 111. Inferencia estadística
como referencia para valores críticos de la distribución normal estándar. Recuerde que la sintaxis es la siguiente:
Cuando termine este ejercicio, compare con la tabla que hemos confeccionado (tabla 8.1). Si le toma menos de cinco minutos hacer esa tabla y concuerda con la que damos, su manejo del Excel es bueno. Tabla 8.1. Valores críticos t , para la distribución t de Student con v grados de libertad.
Cap. 8. Estimación de parámetros
289
Ejemplo 8.6. En el área de juegos infantiles de un restaurante, una señora maquilla las caras de los niños, pintándoles en forma artística figuras de gatos, tigres o payasos. La señora no cobra tarifa fija por su trabajo, pero los padres de las criaturas le pagan una contribución voluntaria. Si X es la cantidad que recibe por cada niño que pinta, se desconoce la media y la varianza de X, pero se puede presuponer que sigue una distribución más o menos normal. Las siguientes cantidades (en pesos) fueron dadas a la señora por los padres de nueve niños elegidos al azar: 12, 10,15, 20, 15, 18, 13, 15 y 10. Construir un intervalo de confianza de 90 % para la media de X. Solución:Con ayuda de una calculadora de bolsillo, hallamos que X = 14.22 y s = on-,= 3.383. El valor crítico t , lo buscamos en la misma tabla que acabamos de confeccionar: para a = 0.1,v = 8 grados de libertad, hallamos elvalor 1.85955.En consecuencia, el intervalo de confianza queda así:
es decir:
Esto significa que podemos tener una confianza de 90 % de que se dice la verdad al afirmar que la señora recibe en promedio alguna cantidad dentro de ese intervalo, como pago por sus servicios.
Con Excel se puede encontrar este intervalo rápidamente si se usa el menú Herramientas, Análisis d e datos, Estadistica descriptiva. Basta con anotar los nueve datos de la muestra en una columna, activar dicho menú y seleccionar la opción Nivel d e confianza: 90 %. En forma automática, aparece el número 2.0969, que es el margen d e error en la medición del intervalo con centro en 14.22. Este último dato también aparece en el resumen de estadística descriptiva del Excel.
8.4. INTERVALOS DE CONFIANZA PARA LA VARIANZA POBLACIONAL Y PARA LA DESMACI~N EST~DAR
Para el cálculo d e intervalos d e confianza relativos a la varianza (o a la desviación típica) d e una población, se requiere usar una tabla d e valores críticos X: d e la distribución con v = n - 1 grados d e libertad. En la figura 8.3 se ilustra Como se aprecia en la figura, el valor crítico es la posición del valor crítico precisamente el percentil 1- a, es decir, el punto sobre el eje X tal que a mano izquierda hay un área d e 1- a bajo la curva. Con Excel es fácil localizar los valores críticos usando la siguiente sintaxis:
x2
x:.
x:
=PRUEBA.CHI.INV(a,v) 2
Por ejemplo, para hallar el valor crítico X0.06 Con V = 8 grados de libertad, escribimos:
Figura 8.3. Distribución x2 con v grados de libertad. y se obtiene al instante 14.956, lo cual significa que en una curva que tenga distribución ji-cuadrada con 8 grados de libertad, a mano derecha de la abscisa x = 14.956y bajo la curva de densidad de probabilidad, habrá un área de 6 % del área total y, lógicamente, a mano izquierda habrá 94 % del área total. En forma alternativa, se puede hallar un valor crítico X: con el menú de funciones de Excel (fig. 8.4). Al picar aceptar, el es guiado paso a paso para introducir los valores necesarios. ¿Por qué el Excel escribe "chi" en vez de "ji"?Lo que sucede es que la letra j en alemán es cb, como en Bach, mientras que en inglés el sonido de laj es la combinación kb. Por ejemplo, el hmoso estadístico ruso Khinchin (o Khinchine) (1894-1959) se pronuncia "Jinchin", así como Alekhine (famoso ajedrecista de la primera mitad del siglo m) se pronuncia 'Niojin". El término ji-cuadrada (también Ilamadaji-cuadrado ojidos) fue inventado por el gran estadístico británico Karl Pearson (1857-1936). En cursos de estadística teórica (estadística matemática) se demuestra el siguiente teorema notable: Teorema. Si X,, X,, ... ,Xn es una muestra aleatoria de tamaño n tomada de una poblaciónx que se distribuye normalmente, con media p y varianza 02, entonces la variable aleatoria:
1 sigue una distribución ji-cuadrada con n grados d e libertad.
1
Figura 8.4
Por otra parte, recuérdese que la varianza muestral:
es un estimador insesgado d e la varianza poblacional 02. n-1 Si multiplicamos ambos d e la ecuación 2 por -, se obtiene: c2
Por último, obsérvese que los derechos de las ecuaciones 1 y 3 son casi idénticos, excepto porque aparece X en lugar de p. Esto nos hace sospechar que el lado izquierdo d e la ecuación 3 debe seguir una distribución ji-cuadrada, lo cual es verdad y puede probarse con todo rigor, pero ¿con cuántos grados d e libertad? Notamos que en la ecuación 1 no hay ningún parámetro desconocido, mientras que en la 3 hay un parámetro d e la población que se desconoce
292
Parte 111. Inferencia estadística
y que se desea estimar mediante la muestra de las X,, X2, ... ,Xn. Entonces, de acuerdo con la definición de grados de libertad, sospechamos que la variable aleatoria definida por la ecuación 3 debería seguir una distribución ji-cuadrada con n - 1grados de libertad. Efectivamente, así es y ello puede demostrarse con toda formalidad,aunque no lo haremos aquí. Sólo nos interesa enunciar y aplicar el hecho mismo: Teorema Si se extrae una muestra aleatoria de tamaño n de una población normal con varianza o', entonces el estadístico:
(n-1)s' o2
i41
tiene una distribución ji-cuadrada con n - 1grados de libertad. La primera consecuencia de este notable teorema es que nos permite idear un método para construir un intervalo de confianza de 100(1- a)% relativo a la varianza poblacional. 1 En efecto, sea O < a < -. Entonces 100(1- a)% de los valores de probabi2
lidad de la distribución ji-cuadrada con n - 1grados de libertad están comprenyxcln,esto es, hay una probabilidad de didos entre los valores críticos 1- a de obtener un valor de x2tal que:
&,
Con un poco de álgebra elemental se puede despejar 02enla desigualdad 5, de donde se deduce que hay una probabilidad de 1- a de que la varianza de la población se encuentre dentro del siguiente intervalo: Intervaio de confianza de lOO(1
- a)% para la varianza poblacionai
Para hallar un intervalo de confianza relativo a la desviación típica o de la población, basta con extraer raíz cuadrada positiva a los tres de la desigualdad 6, ya que se trata de cantidades positivas. En la figura 8.5 se muestran las posiciones de los valores críticos x:-(,, y ,para la distribución ji-cuadrada con n - 1 grados de libertad.
XL
Ejemplo 8.7. En una muestra de 58 focos (bombillas de luz) se halló que la desviación estándar muestra1 de su duración era de s = 98 horas. Si se supone que la duración
Figura 8.5 de esos focos sigue una distribución normal, encontrar un intervalo de 90% de confianza para la desviación estándar o de la duración de esos focos. Solución:Primeramente hay que calcular los valores críticos x:,, y ,ambos con 57 grados de libertad. Por tanto, usando el EXcel escribimos:
Así, se halla el intervalo siguiente:
Si se efectúan las operaciones indicadas y luego se extrae raíz cuadrada a todo, se obtiene: 85.08 horas I o I 116.05 horas Esto significa que hay una probabilidad de 0.9 de decir lo correcto, si se afirma que la desviación estándar de la duración de todos los focos de esa marca se encuentra dentro ese intervaio de valores. Ejercicio 8.2. Use Excel para diseñar una tabla de parejas de valores críticos XL y x : - para ~ ~ los intervalos de confianza relativos a una varianza poblacional, con niveles de confianza de 90 %, 95 %, 98 % y 99 %. Use grados de libertad desde 1hasta 30, y luego de 40,50 y 60. Calcule con una precisión de cuatro dígitos decimales. Cuando termine de elaborar su tabla, compare con la que damos enseguida. Si se tarda más de diez minutos, es que hay algo que no está haciendo correctamente.
1
90%de confianza
1
95%de canfianza
f
98%de confianza
1
99%dewnfianza
1
Cap. 8.Estimación de parárnetros
295
Ahora, con la proliferación de computadoras cualquiera puede hacer tablas de valores críticos de la distribución ji-cuadrada, así como de otros valores estadísticos, en sólo unos minutos. Hace varios años, todos los libros de estadística reproducían las tablas originales hechas por Karl Pearson en 1930 con papel y 1ápiz, las cuales fueron las primeras tablas en confeccionarse. Por supuesto, fue un gran mérito por parte del famoso estadístico británico.
8.5. INTERVALOS DE COIWMNZA PARA UNA PROPORCI~N POBLACIONAL
En el capítulo 7, vimos que el estimador j , que es la proporción muestral, es un estimador insesgado de la proporción poblacionalp. Vimos también que si n es grande, entonces la distribución de P tiende a la distribución normal estándar. En la figura 8.6 se aprecia dicha distribución y su desviación estándar ( S a . Hay una gran analogía entre los intervalos de confianza para la media poblacional y para una proporción poblacional (en el fondo se habla d e una misma cosa). En el caso de proporciones, la magnitud z,crí: es el margen de error en la estimación d e la proporción p. Al igual que en la estimación de la media poblacional, aquí usaremos también los valores críticos z, d e la distribución normal estándar. El intervalo de confianza de 100(1- a)%, para estimar una proporción poblacionalp, está dado por:
Figura 8.6. Distribución rnuestral de p.
296
Parte 111. Inferencia estadútica
Ejemplo 8.8. Se desea estimar qué porcentaje (proporción) de las familias del Distrito Federal tienen vivienda de su propiedad (no se consideran predios irregulares invadidos como vivienda propia). Se toma una muestra aleatoria de n = 120 familias de distintas partes del D. F. y se encuentra que 40 % de ellas tienen vivienda de su propiedad. Calcular un intervalo de confianza de 90 % para la proporción (porcentaje) real de familias del D. F. 'que tienen vivienda propia. Solución:El valor crítico z, para el intervalo de confianza de 90 % es:
Por tanto, el intervalo de confianza buscado es:
Esto es:
Ello significa que podemos afirmar que entre 32.6 % y 47.4 % de las familias del D. F. tienen vivienda propia, a sabiendas de que hay 90 % de confianza en que se está diciendo la verdad.
8.6. CALCULO DEL TMO DE MUESTRA EN LA ESTIMACI~N DE UNA PROPORCI~N
Antes de empezar este tema, lo invitamos a que elija mentalmente cualquier valor de probabilidadp que se le ocurra (O I p I1) y su correspondiente valor complementario q = 1-p. Multiplíquelos y le aseguramos que su respuesta será menor o igual que 0.25. ¿Lovio? No se trata d e magia ni nada por el estilo, sino de un problema elemental de máximos y mínimos que podría formularse así: Hallar dos números positivosx yy, tales que su suma sea 1y su producto sea el máximo posible. Esto equivale a calcular el valor máximo de la funciónf (x) = x ( l -x). Un estudiante de bachillerato o de los cursos remediales hallaría rápidamente la solución: x = l / ~ y, = '/2, y el valor máximo del producto es 1/4. De acuerdo con esto, ahora podemos comprobar con facilidad la siguiente desigualdad:
Si se retoma ahora la fórmula para el intervalo de confianza de 100(1- a)% de una proporción poblacional p , y se toma en cuenta la fórmula 7, se halla que el margen de error en la estimación es:
Dicho en otras palabras,
-es una cota superior del mayor error posi-
2Jn ble al estimar una proporción poblacional. Al despejar n se obtiene una cota superior para el tamaño de muestra:
La fórmula 8 nos proporciona una cota superior para el tamaño de muestra, pero bajo la hipótesis de que somos pesimistas y no sabemos nada acerca d e la proporción poblacionalp que deseamos estimar. En tal caso, lo peor que puede pasar es q u e p =q = 1/2, y cometeríamos el máximo error posible en la estimación. En la práctica, sin embargo, no hay razones para ser tan pesimistas, ya que se puede sospechar acerca de cuál es, más o menos, el valor d e p o bien se puede hacer una pequeña prueba piloto con una muestra pequeña, para hallar una estimación provisional dep. Si no se sabe nada acerca de ese parámetro, y la prueba piloto es inviable o muy costosa, entonces no hay más remedio que tomar el peor valor d e p,es decir, 1/2, y calcular el tamaño de muestra de acuerdo con la expresión 8. Por ejemplo, si se trata de tomar una muestra aleatoria de hombres adultos (sanos) para estimar qué porcentaje de la población de hombres adultos sanos son desempleados, podemos usar cifras d e años anteriores de la tasa de desempleo abierto, y si dichas cifras han oscilado alrededor de 15%, por ejemplo, no tenemos por qué suponer que de pronto se hubiese disparado esa cifra a 50%, así que podemos tomar, d e manera conservadora, una proporción de cuando muchop* = 0.2 para estimar el tamaño de muestra. Recuérdese que cuanto más cercano seap* a 112 tanto mayor será el tamaño de muestra requerido. Todo esto lo resumimos en la siguiente regla. Procedimiento para calcular el tamaiio de muestra a i estimar una proporción. Primero se debe establecer el margen máximo de error E que uno está dispuesto a tolerar. Si dicho margen de error está en porcentaje, debe expresarse en fracción de la unidad; por ejemplo, 9 % = 0.09. Después se tiene que convenir en un nivel de confianza en la estimación, lo cual no tiene nada que ver con el margen de error acordado. Por ejemplo, se puede elegir una confianza de 80%, 90% o 98%, por mencionar algunas posibilidades, aunque lo usual es tomar 95 % o 99 %. Sea 100(1 - a ) % el nivel que usted escogió. Enseguida, de acuerdo con el nivel de confianza elegido, se procede a hallar el valor crítico z, con tablas o con Excel. Si lo hace con Excel. la sintaxis es:
A continuación, y ya teniendo a la mano los datos numéricos de E (error) y 2% (valor
crítico), se da una estimación subjetiva (o sospecha) p * d e la proporcion que se desea estimar, ya sea por datos históricos de años anteriores o por
298
Parte 111. Inferencia estadística
medio de alguna prueba piloto que se haya hecho previamente con una muestra pequeña. Hay que tomar en cuenta que cuanto más cercano seap* a 0.5 tanto mayor será el tamaño de muestra que se va a requerir. Si no es viable hacer esa prueba piloto y no se tiene ni una idea remota, entonces tomep* = 0.5. Calcule por último q* = 1-p*. Entonces, ya se tienen a la mano todos los valores numéricos de los símbolos que intervienen en la siguiente fórmula: Fórmula para hallar el tamaíío de muestra a i estimar una proporción poblaciond:
Ejemplo 8.9. Una institución financiera otorga créditos o préstamos a sus clientes. Seap la proporción de préstamos que no fueron pagados por el deudor en la fecha acordada y que ocasionan un quebranto financiero a la institución. El nombre que se le da a p en la jerga económica es el de cartera vencida. Se desea tomar una muestra aleatoria de n clientes que recibieron algún préstamo, para hacer una estimación de la cartera vencida. Supóngase además que en años anteriores (o en instituciones similares) las cifras de cartera vencida estaban cerca de 8%. Calcular el tamaño de la muestra, si la estimación debe tener un margen de error de cuando mucho 2 % con una confianza de 90 %. Solución: Hacemos acopio de los datos: E = 0.02, a = 0.1, z, = 1.64485 (con tablas o con Excel). Además, se nos dice que en instituciones o bancos similares (o en años anteriores) la cifra de cartera vencida estaba cerca de 8 %. Así,p* = 0.08. Por consiguiente:
Debido a la incertidumbre, podemos tomar n = 500 casos de créditos otorgados a clientes. Es un tamaño de muestra adecuado para hallar qué porcentaje (o proporción) de esos créditos no fueron pagados a tiempo. La cifra resultante será un indicativo de la cartera vencida real, con un margen de error de 35.2 % y una confianza de 90 % de que se está diciendo la verdad. Ejemplo 8.10. Un agricultor desea saber qué porcentaje de semillas de cierta planta lograrán germinar. En una pequeña prueba piloto realizada en macetas se haiió que 80 % de las semillas lograron germinar. Sin embargo, él desea averiguar la proporción real p de semillas que germinan, mediante un muestre0 de n semillas que serán sembradas en el campo en condiciones naturales. El agricultor desea que el porcentaje de semillas que logren germinar sea un indicativo real del parámetro buscado con un error de 1 5% y una confianza de 93 %. ¿Cuál es el tamaño de la muestra de semillas que debe tomarse? , para un intervalo de Solución: En primer lugar, se debe calcular el valor crítico z confianza de 100(1- a ) % = 93 %. Con tablas (o con Excel) hallamos que z,,, = 1.81191. Se puede encontrar ese dato de varias formas; por ejemplo, en la tabla de valores críticos para la t de Student (ya la hicimos) se busca el valor correspondiente a a = 0.07 con m grados de libertad. O también, de manera directa se escribe en Excel:
Cap. 8. Estimación de parámetros
299
De acuerdo con la pequeña prueba en macetas (prueba piloto), podemos tomar
p*
= 0.80, q* = 0.20. En consecuencia, el tamaño de la muestra es de:
Ello significa que si el agricultor siembra 211 semillas de esa planta @ajo condiciones usuales de riego y todo), el porcentaje de las que logren germinar será un indicativo del porcentaje real de semillas que germinan, con un margen de error de f5% en la estimación y una confianza de 93 % de que se está diciendo la verdad.
Con esto terminamos este capítulo, uno d e los más importantes d e todos por su utilidad práctica, y procedemos a la autoevaluación, con algunos problemas sencillos a u e le darán al estudiante la ~osibilidad d e autocalifilarse y hacer un diagnóstici d e cómo va su aprovechamiento del material que ha estu-
Thomas Bayes ( 1 702- 176 1). Ministro presbiteriano inglts y aficionado a la estadística. De joven recibió clases particulares de Abraham de Moivre, de donde nació su afición por la estadística. El título de su trabajo revolucionario fue Essay towards solving a problem in the doctrine of chances.
Pafnuti Lvóvich Chebishev ( 1 82 I - 1894). Fue uno de los más distinguidos matemáticos y probabilistas rusos del siglo xix. ~nri~uecib la estadística teórica con una serie de desigualdades importantes que involucran la media y la desviación estándar de una variable aleatoria.
Es importante que cada capítulo finalice con un autodiagnóstico del estudiante, en el cual pueda comprobar si ha entendido y asimilado bien lo que ha estudiado. Hay dos recomendaciones al respecto que nos atreveríamos a sugerir. En primer término, conviene hacer del estudio un hábito. Algún filósofo definió al ser humano como un animal con hábitos, y tal vez hay algo de verdad en esa aseveración. Las personas que quieren hacer ejercicio se levantan a correr todas las mañanas una misma distancia y hacen d e ello un hábito, que al principio parece desagradable, pero que poco a poco se le va tomando gusto. Lo mismo pasa con el estudio. En segundo término, es importante estar solo, en una habitación bien iluminada y sin distracciones, sin música ni nada. Se recomienda hacer un hábito del estudio, aunque sea sólo una o dos horas diarias, pero de preferencia siempre en el mismo lugar, a la misma hora y bajo las mismas condiciones. Desconecte su celular y deje indicaciones de que si le hablan por teléfono no está para nadie. Con el tiempo se irá acostumbrando a esa rutina y le irá tomando gusto. Cada ejercicio vale un punto si está correctamente resuelto. Si acierta sólo a uno de dos incisos, se abona sólo medio punto, etc. Al final, multiplique el total d e puntos obtenidos por 5 y así obtendrá su calificación en escala del O al 100. Si obtiene menos de 70 de calificación, su aprovechamiento es deficiente; de 71 a 79 es regular, de 80 a 89 es bueno, de 90 a 95 es muy bueno y de 96 a 100 es excelente y amerita una felicitación calurosa por parte del autor. ¡Mucha suerte! 1. Se desconoce la distribución de probabilidad de cierta variable aleatoriax, y tampoco se tiene idea de cuál sea el valor de su media (p); no obstante, hay motivos para asegurar que la desviación típica deXes aproximadamente o = 3. iDe qué tamaño debe ser una muestra aleatoria de valores de X, para tener una confianza mínima de 95 %
de que la discrepancia entre la media muestral y la media verdadera de la población será menor que 0.3? 2. Suponga que acerca de una variable aleatoria X, sólo se sabe que la desviación típica es o, pero no se tiene idea de cuál sea la media ni de cuál sea su distribución de probabilidad. Con objeto d e poder tener una estimación razonable del valor de la media p.,se toma al azar una muestra de n observaciones de dicha variable. ¿Qué tan grande debe ser el valor de n, para tener una confianza mínima de:
de que la discrepancia entre la media muestral X y la media verdadera p será menor que cierto número k? 3. Un general desea estimar la aptitud física promedio (medida a través de cierta prueba) de miles de soldados que tiene a su cargo, con base en una muestra aleatoria de ellos. El general desea que tal estimación tenga un error de cuando mucho dos puntos de la prueba, con una confianza mínima d e 99 %. Si sabe por experiencia que el valor de la desviación estándar para esta prueba es de o = 15.0, icuál es el tamaño mínimo de la muestra de soldados a quienes debe aplicar la prueba? 4. Una nutrióloga estima, basada en análisis previos, que la desviación estándar del contenido d e proteínas por cada lata d e atún d e cierta marca es d e aproximadamente o = 3.2 g. ¿Qué tan grande debe ser el tamaño de la muestra de latas de atún que debe analizar, para que el error en la estimación del parámetro que desconoce (p) sea de cuando más 1.5 g, con una confianza mínima de:
Cap. 8. Estimación de parámetros
30 1
5. Las mediciones de la presión sanguínea de 25 mujeres de edad avanzada tienen una media de 2 = 140 mm de mercurio. Si estos datos se pueden considerar como una muestra tomada al azar de una población normal con o = 10 mm de mercurio, calcule un intervalo de confianza de 95 % de la media de la población p. 6. Durante varios años, se había aplicado una prueba de nivel de matemáticas a todos los alumnos de primer ingreso de cierta universidad. Si 64 estudiantes, seleccionados al azar en ese periodo, tardaron en promedio 28.5 minutos en resolver la prueba con una varianza de 9.3,construya un intervalo de confianza de 99 % del tiempo promedio verdadero que tarda un alumno de primer ingreso en resolver el examen. 7. Un experto en eficiencia desea determinar el tiempo promedio que tarda el personal de un foso de reparaciones en cambiar un conjunto de cuatro neumáticos a un auto de carreras. ~ e t e r m i n eel tamaño de la muestra requerido para poder afirmar, con 95 % de confianza, que la media de la muestra difiere de la media real en cuando mucho dos segundos. Por estudios realizados antes, se sabe que la desviación estándar de la población es 12 segundos. 8. La longitud de los cráneos de 10 esqueletos fósiles de una especie de ave extinta tiene una media de X = 5.68 cm y una desviación estándar d e s =o"-,= 0.29 cm. Suponiendo que estas mediciones están normalmente distribuidas, obtenga un intervalo de confianza de 95 % para la longitud media de los cráneos. 9. Un inspector d e alimentos, que examinó 12 frascos d e cierta marca de mantequilla de cacahuate (maní), obtuvo los siguientes porcentajes de impurezas: 2.3, 1.9,2.1, 2.8, 2.3, 3.6, 1.4, 1.8, 2.1, 3.2, 2.0 y 1.9. Suponiendo que estas mediciones están normalmente distribuidas, construya un intervalo de confianza de 99 % del porcentaje promedio de impurezas que hay en esta marca de mantequilla de cacahuate. 10. Repita el ejercicio 9, pero considerando que el valor de la desviación estándar poblacional es aproximadamente o = 0.5. 11. En un laboratorio se midió el contenido, en litros, de cada uno de nueve envases de un litro de leche de cierta marca, con los siguientes resultados: 1.02,0.96, 1.03,0.94, 1.00, 0.92, 1.01, 0.97, 1.02. Encuentre un intervalo de confianza de 98% para la desviación estándar poblacional o, de donde se extrajo la muestra. 12. La desviación típica de la duración de una muestra aleatoria de 10 focos (bombillos) de cierta marca resultó ser S = 120 horas. Halle los límites de confianza de:
para la desviación típica de la duración de todos los focos de esa marca. 13. Un especialista en genética está interesado en la proporción de hombres africanos
que presentan un desorden sanguíneo leve. En una muestra aleatoria de 100 de ellos, se encontró que 24 presentaban dicho desorden. Calcule un intervalo de confianza de 99 % para la proporción de hombres africanos con este desorden sanguíneo. 14. Un fabricante de baterías para automóvil asegura que sus baterías duran, en promedio, tres años con una varianza d e un año. Si seis de estas baterías tienen duraciones d e 1.9, 2.0,4.0,3.0,3.5y 4.2 años, determine un intervalo de confianza de 95 % para la varianza e indique si es válida la afirmación del fabricante de que la varianza es igual a 1. Suponga que la población de las duraciones de las baterías se distribuye aproximadamente en forma normal. 15. Un ingeniero civil está probando la resistencia compresiva de concreto. Realiza una prueba con 16 especímenes y obtiene los siguientes datos: 2216,2237, 2249,2204, 2225,2301,2281,2263,2318,2255,2275,2295,2250,2238,2300,2217.Construya un intervalo de confianza respecto a la resistencia media. Suponga que la distribución de la resistencia compresiva es aproximadamente normal.
302
Parte 111. Inferencia estadística
16. Cierto porcentaje de estudiantes de una universidad considera que hay que cambiar el diseño de las evaluaciones de profesores, porque el formato actual las ha convertido en concursos de popularidad y además se presta a venganzas recíprocas. Suponga que se lleva a cabo una pequeña encuesta piloto en la cafetería y se observa que 30 % de los encuestados manifestaron estar a favor de una modificación en el diseño de las evaluaciones a docentes. Determine el tamaño de la muesti-a de estudiantes que se deben encuestar, para tener una confianza de 95 % de que el estadístico j estima al parámetrop con un margen de error de cuando mucho 10%. 17. Suponga que en el ejercicio 16 no se realiza ninguna encuesta piloto, y que se desea calcular directamente el tamaño de la muestra, bajo las mismas condiciones. 18. Un grupo de cirujanos dentistas de la Asociación Dental Mexicana A. C. desea averiguar el porcentaje de adolescentes que requieren trabajos de ortodoncia. Calcule una cota superior para el tamaño de una muestra de adolescentes que deben examinarse, con objeto de que el porcentaje registrado en esa muestra sea representativo del porcentaje verdadero de toda la población de adolescentes, con un margen de error de r18 % y un nivel de confianza de 96 % en la estimación. 19. En un plebiscito realizado entre los habitantes del D. F., se realiza una encuesta cuyo objetivo es averiguar la proporción (o porcentaje) p de habitantes de esa ciudad que r segundo piso en el Viaducto y el Perifériestán a favor de que se mande c o n s t ~un co. ¿Qué tan grande debe ser la muestra de personas que respondan a esa encuesta, si se desea que el máximo error en la estimación d e p sea igual a: 0.03 con 95 % de confianza? 6) 0.02 con 95 % de confianza? c) 0.03.con 90% de confianza?
q)
20. En una sucursal bancaria se tomó un registro del tiempo que los clientes permane-
cían en la ventanilla, para una muestra aleatona de ocho clientes, con los siguientes resultados: 2 min 55 s 4 min 39 s 4 min 16 s
3 min 5 s 3 min 34 s 7min2s
2 min 38 s 1min 44 s
Se requiere calcular: a) la varianza muestra19 6) un intervalo de 95 % de confianza para la desviación típica de la población c) un intervalo de 95 % de confianza para la media de la población.
Suponga que la distribución del tiempo de permanencia de los clientes en la ventanilla es normal. RESPUESTASDE LOS EJERCICIOSD E AUTOEVALUACIÓN 8.1
1. Sea
Iamedia de una muestra de tamaño n. Se requiere resolver la desigualdad:
o 3 El error típico de la media es oi = -= -. Entonces, usamos la fórmula:
Jñ Jñ
Luego, n
= 385.
3. n 2 373 soldados. 4. a) n 2 13 latas de atún 5. 136.08 < p < 143.92. 6. 28.5 k2.57583 X
&-
b) n 2 31 latas de atún.
esto es: 27.52 < p < 29.48.
7. n = 139. 8. Para a = 0.05, buscamos t , con n - 1= 9 grados de libertad en la tabla de valores críticos de la distribución t de Student. Hallamos el valor 2.26216. Por tanto, el intervalo buscado es:
Se halla entonces que 5.47 cm < p < 5.89 cm, con 95% de confianza. 0.624985 7. 2.2833 I 3.10582 X ,esdecir, 1.723
<2.844.
Jiz 10. 2.2833 Ic 2.57583 X -, es decir, 1.91< p < 2.66. Jiz 0.5
11. Los valores críticos X; Y x:-(@) con 8 grados de libertad son, respectivamente 20.0902 y 1.6465 (véase la tabla). Además hallamos con la calculadora que s = 0.0394; o sea, la varianza muestra1 es s2= 0.001553. Entonces, el intervalo para la varianza es el siguiente:
(n - l)s2
X&
(n -l)s2 8 X 0.001553 8 X0.001553
Al extraer raíz cuadrada se determina, finalmente, que 0.025 litros 5 o 5 0.087 litros. b) 74.12 horas I o 5273.3 horas. 12. a)82.54 horas I o 1219.07 horas 13. 0.13 < p < 0.35, es decir, entre 13%y 35%. 14. 0.377 5 o2I 5.823. Sí es válida su afirmación, porque es un valor dentro del intervalo. 15. 2239.36 < p < 2276.14.
16. n 2 (STX
., .
0.30 X 0.70 = 8 O H
debe realizar la encuesta a 81 estudiantes al azar.
304
Parte 111. Inferencia estadística
( ~ 1 ( J
0.25 = 96.04. Se debe aplicar la encuesta a 97 estudiantes al azar.
17. n
l8
2'053748 0.08
C)
x 0.25 = 164.76. Se deben examinar las bocas de 165 adolescentes.
Intervalo para p: 3.7354 2 2.36462 X
TEST SOBREESTIMACI~NDE P-OS, DE CONFIANZA Y T u 0 DE MUESTRA
1.618726
;portanto:2min23s
<5min5s.
p,). Por último, la prueba bilateral (o d e dos colas) se basa en el esquema H,:{p = p,) contra la hipótesis alternativa Ha:-$ *P,). Como consecuencia del Teorema d e De Moivre-Laplace, se puede deducir que el error estándar en la estimación d e una proporciónp cuyo valor se supone igual a p , por hipótesis, está dado por:
6-
INTERVALOS
En el siguiente cuadro, anote con lápiz suave sus respuestas. Los procedimientos debe realizarlos en hojas separadas, y no en el libro. (En el apéndice D se dan las respuestas correctas para que las coteje con las suyas.)
1. Los contenidos de ácido sulfúrico de siete recipientes similares (en litros) son: 9.8, 10.2, 10.4,9.8, 10.0, 10.2 y 9.6 litros. Obtenga un intervalo de confianza de 95 % para la media de todos los recipientes, suponiendo una distribución aproximadamente normal.
2. A una muestra aleatoria de 16 señoritas egresadas de una escuela para secretarias se les practicó una prueba mecanográfica para tomar el tiempo empleado en escribir un dictado en la computadora, y en cada caso se registró el número de palabras escritas por minuto, con los siguientes resultados:
Suponiendo una distribución normal, obtenga un intervalo de confianza de 95 % para el número promedio de palabras escritas por minuto por todas las egresadas de la escuela.
Cap. 8. Estimación de parárnetros
305
3. Repita el ejercicio 2, pero además considere que la desviación estándar de la población de donde se sacaron los datos es de o = 4.5.
4. De una máquina automática expendedora de refresco gaseoso se tom6 una muestra aleatoria de 12 s e ~ c i oys se midió cuidadosamente el contenido neto servido en cada caso, con los siguientes resultados (en decilitros):
Obtenga un intervalo de confianza de 95 % para el contenido promedio real de la cantidad de refresco que contienen los vasos servidos por esa máquina (en decilitros), si se supone que la población de donde provienen esos datos se distribuye normalmente, con varianza de 0.01.
5. Repita el ejercicio 4, considerando que la varianza de la población es desconocida,
6. Se desconoce la distribución de probabilidad de cierta variable aleatoria X, y tampoco se tiene idea de cuál sea el valor de su media (p); no obstante, hay motivos para asegurar que la desviación típica de X es aproximadamente o = 3. ¿De qué tamaño debe ser una muestra aleatoria de valores de X, para tener una confianza mínima de 95 % de que la discrepancia entre la media muestra1 y la media verdadera de la población será menor que 0.3?
7. A una muestra aleatoria de 36 estudiantes de los últimos semestres de una universidad se les proporcionó una encuesta para que contestaran con franqueza cuántas horas en promedio dedicaban semanalmente al estudio de sus asignaturas, en casa o en la
306
Parte 111. Inferencia estadística
biblioteca. Al analizar los datos de la encuesta se halló que la media era de 2 horas 36 minutos, con una desviación típica de 18 minutos. Obtenga un intervalo de confianza de 99% para el tiempo promedio real que dedican al estudio los alumnos de últimos semestres de esa universidad.
8. En relación con el ejercicio 7, ia cuántos estudiantes de los últimos semestres se les debe aplicar la encuesta, si se desea tener una confianza de 95 % de que el error en la estimación de la media sea menor que 0.05?
9. La vida útil (duración) de los focos fabricados por una empresa sigue una distribución aproximadamente normal, con desviación estándar de 40 horas. Se tomó una muestra aleatoria de 30 focos y se halló que su vida promedio era de 780 horas. Construya un intervalo de confianza de 96% para la duración media (en horas) de todos los focos producidos por esa compañía.
10. Repita el ejercicio 9, pero tomando en cuenta que la muestra aleatoria es de 20 focos (en lugar de 30).
11. En relación con el ejercicio 9, ¿qué tan grande debe ser la muestra, si se desea tener una confianza de 96 % de que la media de la muestra está dentro de 10 horas de la media verdadera?
12. Una muestra aleatoria de ocho cigarrillos de determinada marca tiene un contenido promedio de nicotina de 2.6 mg por cigarrillo, con una desviación estándar de 0.9 mg. Obtenga un intervalo de confianza de 99% para el contenido medio verdadero de nicotina (en mg) por cigarrillo (de esa marca), suponiendo que el contenido de ese alcaloide se distribuye normalmente en los cigamllos.
9.1. HIP~TESIS ESTAD~STICAS,ERRORES Y GLOSARIO DE TÉRMINOS
La teoría de pruebas de hipótesis (también llamadas ensayos de hipótesis, contraste de hipótesis opruebas de signzj?cación) es una parte fundamental de la inferencia estadística, creada y desarrollada por Jerzy Neyman (1894-1981),un estadístico y matemático de origen polaco, naturalizado ciudadano estadounidense y considerado uno de los más grandes exponentes en estadística de todos los tiempos. Una prueba de hipótesis es un procedimiento estadístico simple cuya finalidad es corroborar o desmentir alguna afirmación que se hace en relación con un parámetro poblacional. Para hacer esto, se toma una muestra aleatoria de la población y se calcula el valor de un estadístico deprueba, el cual debe obedecer ciertas leyes estadísticas comprobadas. Según como resulte o se comporte el estadístico de prueba, se podrá aceptar o rechazar alguna hipótesis previamente establecida. Al emitir la decisión final de rechazar o aceptar la hipótesis original, uno corre el riesgo de equivocarse y darle un valor significativo erróneamente a algo que sólo ocurrió de manera fortuita. Esto es inevitable, porque el azar siempre está presente y es como un pequeño demonio que a veces nos trae buena suerte, pero otras veces nos juega tretas y nos conduce al error. Imagínese, por ejemplo, que de pronto nos visitaran unos seres extraterrestres y lo primero que viesen en nuestro planeta fuese a dos niños jugando a lanzar al aire una moneda y ver si cae águila o sol (juego de volados). Supongamos que esos seres están escondidos y toman nota de una serie de 10 volados, de los cuales siete cayeron con el lado de águila hacia arriba. Al regresar a su planeta,
308
Parte 111. Inferenciaestadística
podrían informar que los terrícolas tienen un pasatiempo curioso que consiste en lanzar al aire unos pequeños discos metálicos que 70 % de las veces caen con el lado del águila hacia arriba. Nosotros sabemos que esa conclusión es errónea, producto de la extrapolación d e un hecho fortuito, y que en general 50 % d e las veces las monedas tenderán a caer con el signo de águila hacia arriba, porque hay un principio estadístico @y de los Grandes Números) que lo respalda. No necesitamos ir tan lejos para comprobar extrapolaciones equivocadas de hechos casuales. A decir verdad, los humanos somos proclives a generalizar sin fundamento. Por ejemplo, algún día alguien vio un loco que salió cuando había luna llena y entonces concluyó que "cuando hay luna llena, salen los locos a la calle" y hasta les llamó lunáticos.Aunque parezca chiste, esto es cierto. Hace muchos años un regente (alcalde) del Distrito Federal que tenía pereza de hacer un censo estadístico de la población, tomó la primera muesu-a de personas que vio a su alrededor y la extrapoló, tras lo cual anunció con toda seriedad un dato estadístico que se hizo muy famoso en su tiempo y que todavía muchos creen: "En el Distrito Federal, por cada hombre hay siete mujeres, dos generales y un afeminado." Es auténtico. Al realizar una prueba de hipótesis, podemos cometer dos tipos de error, llamados universalmente error de tipo I y error de tipo II, los cuales definimos a continuación, junto con otros términos usuales.
Error de tipo 1. Consiste en rechazar una hipótesis que es cierta y debería haberse aceptado. Por ejemplo, cuando un instructor pone calificación reprobatona a un estudiante que entendió y asimiló todo el contenido del curso perfectamente, pero que por mala suerte falló en los exámenes, se comete un error d e tipo 1; o cuando se rechaza la alegada inocencia de un acusado, que en realidad es inocente pero que no pudo dar pruebas suficientes a su favor, también se comete un error de tipo 1. Error de tipo 11. Consiste en aceptar como válida una hipótesis que es falsa y debería haberse rechazado. Esta es, como se dice, "la otra cara de la moneda". Si un jurado acepta la supuesta inocencia de un acusado que en realidad es culpable, pero que por falta de pruebas en su contra se acepta la hipótesis de que es inocente, entonces se comete un error d e tipo 11. O también, cuando un instructor acepta la hipótesis de que un alumno entendió y asimiló el curso, pero que en realidad tuvo suerte o logró copiar a sus compañeros sin saber casi nada, entonces el instructor comete un error de tipo 11 al ponerle calificación aprobatoria. Hipótesis nula. Se llama así a una suposición inicial que sirve para echar a andar el procedimiento de una prueba o verificación de una hipótesis estadística relativa a algún parámetro de una población. Por lo general se usa el símbolo H, para denotar la hipótesis nula. Es importante señalar que una hipótesis nula siempre debe estar expresada mediante alguna igualdad (=: igual a) o cuando mucho un signo de I(menor o igual que) o de 2 (mayor o igual que). No se puede establecer una hipótesis nula que involucre'sólo un signo de desigualdad del tipo e (menor que) o bien > (mayor que). Además, la hipótesis nula debe ser en principio inocua o inofensiva. Por ejemplo, si se sospecha que el señor que vende quesos y fruta en la esquina ha alterado su balanza para dar en realidad menos de lo que la gente pide, al
Cap. 9. Pruebas de hipótesis paramétricas
309
elaborar una hipótesis nula, ésta no puede consistir en suponer que el señor nos engaña y nos ofrece menos de lo que supuestamente da. Tenemos que suponer que él es honesto y que nos entrega el peso exacto d e la mercancía que pedimos (o aun más). Ya será el procedimiento estadístico d e prueba el que se encargará de desmentir o rechazar esa suposición. Hipótesis aiternativa. Establece lo contrario de la hipótesis nula. Si ésta es rechazada, entonces será la hipótesis alternativa la que se tome tentativamente como válida, y viceversa. Y decimos "tentativamente" porque d e ninguna manera se acepta de manera tajante y concluyente, pues quizá alguna prueba futura, realizada con mayor precisión, podría ponerla en tela de juicio. Una hipótesis alternativa se denota por el símbolo Ha,o también por el símbolo H,. Por ejemplo, en nuestra sociedad se ha aceptado la hipótesis de que el humo del cigarro provoca cáncer, debido a que un gran número d e pruebas estadísticas realizadas con muestras de fumadores, y bajo la suposición d e que el humo del cigarro era inofensivo, fueron rechazadas. Pero ello no quiere decir que se esté 100% seguro de que el humo del cigarro ocasiona cáncer. Todos conocemos muchos casos de personas que fumaban constantemente y llegaron a vivir casi cien años sin haber padecido jamás ninguna forma d e cáncer; por otra parte, también conocemos innumerables casos d e personas que tuvieron cáncer y jamás en su vida fumaron ni un solo cigarrillo. Las pruebas estadísticas sólo han servido para concluir que "es probable que el cigarro provoque cáncer". ¿Qué tan probable? Quizá haya una probabilidad superior a 0.8 o aun mayor en la validez de esa afirmación, como muestran los ensayos estadísticos. Pero siempre hay una pequeña probabilidad de que tal vez esa afirmación sea falsa. Asimismo, podríamos argumentar que el estar tendido en una cama es sumamente peligroso, porque 80 % o más de las personas que han muerto lo hicieron estando tendidas en una cama. Nivel de significación de una prueba. Se llama así a la probabilidad máxima d e cometer un error de tipo 1, y dicha probabilidad se suele denotar universalmente por la letra griega a. Lo más usual es que al principio uno establezca cuál es el valor de a que desea aplicar en la prueba. Resulta común tomar los valores a = 0.05 o bien a = 0.01. A la probabilidad máxima de cometer un error de tipo 11 se le denota por la letra griega P. Y aunque p no tiene ningún nombre especial, el número 1- B se llama potencia de la prueba. Si la hipótesis alternativa es vaga, en el sentido que involucra un signo e o >, entonces no se puede cuantificar el valor de p. Para poder calcular un valor numérico d e flse necesita que la hipótesis alternativa sea específica, esto es, que involucre el signo =. Estadístico de prueba Es una magnitud calculada mediante una muestra aleatoria y que involucra algún estadístico o combinaciones de estadísticos, y cuyo valor se usará finalmente para contrastar con algún valor estadístico tabulado, y entonces decidir si procede o no el rechazo de la hipótesis nula. Por eso una prueba de hipótesis se llama también contraste de hipótesis, porque a fin de cuentas el momento de decidir si se rechaza o no la hipótesis nula, ocurre al contrastar el valor numérico de un estadístico de prueba con otro valor numérico, usualmente tabulado, que rige el comportamiento hipotético de la población de donde se extrajo la muestra, d e acuerdo con la distribución supuesta y con la Ley de los Grandes Números. Esta es una ley fundamental en
3 10
Parte 111. Inferencia estadktica
estadística que establece que si los supuestos de distribución son correctos, entonces los estadísticos observados en diferentes muestras tienden como limite a losparámetros teóricos correspondientescuando el tamaño de muestra tiende a injinito;enparticular lasfrecuencias relat?vasobservadas tienden a lasprobabilidades teóricas como límite. Regla de decisión. Es una especificación clara de cuánio se rechazará la hipótesis nula y cuándo no se rechazará. La regla de decisión siempre está relacionada con el nivel de significación a de la prueba, en el sentido de que si a se conoce de antemano, entonces la regla de decisión se deduce de manera única, y recíprocamente: si sólo se dispone de una regla de decisión al principio, entonces no se debe establecer ningún valor para a , ya que éste quedará determinado en forma automática, de acuerdo con la regla de decisión elegida. No se deben especificar ambas cosas de antemano, el valor de a y la regla de decisión, ya que podrían ser contradictorios. En la mayoría de los casos, se acostumbra especificar el valor de a al principio, y entonces la regla de decisión se deduce o se infiere, de acuerdo con el modelo. Pero no hay nada de malo en hacerlo al revés. Casi todo mundo lisa cotidianamente reglas de decisión en su vida. Por ejemplo, si usted va de compras y desea adquirir una calculadora científica o un libro que le interese, entonces pondría una regla de decisión más o menos así: "Si cuesta cuando mucho 200 pesos, entonces la compro, pero si cuesta más, no compraré nada." O bien, cuando se hace un examen de isión para ingresar a una escuela, los que lo elaboran ponen una regla de decisión: "Si un aspirante obtiene más de 65 puntos, entonces será aprobado, de lo contrario será reprobado."
9.2. EJEMPLOS DE PRUEBAS DE HIP~TESIS Y ERRORES DE TIPOS 1 Y 11 En esta sección se examinan algunos ejemplos ilustrativos simples. En el primer ejemplo, la regla de decisión está dada y sólo se debe hallar el valor de a. En el segundo se da de antemano el valor de a, y entonces hay que determinar cuál es la regla de decisión. Ejemplo 9.1. Una persona, llamémosla A, le entrega dos tarjetas a su amigo B, las cuales son de distintos colores, y afirma que es capaz de adivinar el color de una tarjeta escondida por lo menos 75 % de las veces. Entonces B propone la siguiente prueba para comprobar o desmentir la supuesta habilidad de A: Va a esconder una tarjeta al azar 12 veces, sin queA vea, y si éste logra adivinar el color correcto en por lo menos nueve de las 12 veces, entonces aceptará tentativamente que A tiene esa habilidad de la que presume, pero de lo contrario la rechazará. Se requiere calcular la probabilidad de que la afirmación sea rechazada cuando en realidad es cierta. Solución:Seap la probabilidad de que A acierte el color de una tarjeta. Si es verdad lo queA afirma (hipótesis nula), entoncesp = 0.75 (o bienp 2 0.75). La afirmación será rechazada si A acierta en menos de nueve de los 12 intentos (regla de decisión). La probabilidad de que ello ocurra es, por tanto:
Cap. 9.Pruebas de hipótesis paramétricas
311
Un valor tan grande para a como en este ejemplo no es conveniente. Ello se debe a que la regla de decisión establecida es demasiado estricta para un error de tipo 1, y para un tamaño de la muestra que no es suficientemente grande (sólo n = 12 intentos). El valor de a sólo puede reducirse si se aumenta el tamaño de muestra n o bien si se pone una regla de decisión adecuada a ese tamaño de muestra, o ambas cosas. El inconveniente de manipular la regla de decisión radica en que, si bien se logrará reducir la probabilidad del error de tipo 1 (a), el costo será un incremento en el error de tipo 11 (B). Comprobemos esto: la probabilidad de que la afirmación sea aceptada cuando en realidad es falsa (esto es, cuandop = 0.5, porque A sólo está adivinando) está dada por:
lo cual es un valor pequeño y aceptable. Si B decidiera hacer menos rigurosa su regla de decisión y dijera que la afirmación será aceptada si A logra atinar el color en por lo menos siete d e los 12 intentos, el valor de a (probabilidad de cometer error d e tipo 1) sería, entonces:
x-o
el cual es un valor bastante aceptable (casi 5 %). Sin embargo, ahora la magnitud de B (probabilidad de cometer error d e tipo 11) será:
Entonces nos damos cuenta de que no se puede ganar nada mientras no se aumente el valor de n. Al principio se tenía un valor aceptablemente pequeño para j3,pero un valor demasiado grande para a,y al manipular la regla d e decisión se logró disminuir mucho el valor de a, pero entonces aumentó el valor de P a un tamaño inadecuado. Supongamos que ahora la persona B aumenta el tamaño d e n y propone una regla de decisión razonable: Esconderá una tarjeta al azar n = 120 veces y decidirá que se acepta la afirmación de su amigo A, si éste acierta por lo menos 82 de los 120 intentos. Entonces, los valores d e a y B serán los siguientes:
Resulta claro, entonces, que la única forma de reducir simultáneamente las probabilidades de errores d e tipo 1 y d e tipo 11 consiste en aumentar el tamaño d e la muestra, lo cual es además una consecuencia d e la Ley d e los Grandes Números de Bernoulli. Ejemplo 9.2. Retomando el caso de los dos amigos A y B del ejemplo anterior, supóngase ahora que B desea diseñar una regla de decisión, con n = 120, de tal manera que a = 0.05, o en todo caso lo más cercano posible a 0.05. ¿Cuál debe ser entonces la regla de decisión? Solución:Usemos la aproximación normal para la binomial. El valor de Z que tiene 5 % de área bajo la curva a mano izquierda es:
Por otra parte, tenemos:
Por tanto, se tiene:
Esto significa que con 82 aciertos como tope para la regla de decisión nos acercamos lo más posible al valor especificado a = 5 %. Podemos comprobar esto fácilmente:
En tal caso, la regla de decisión es: SiA acierta en los colores de más de 82 de las 120 tarjetas, se acepta la afirmación; en caso contrario,se rechaza. El nivel de significaciónque provoca esta regla de decisión es de a = 0.05955 < 6%.
En los ejemplos d e la sección anterior, al individuo B no le preocupaba la posibilidad de que su amigo A tuviese un número inusualmente pobre d e aciertos. A decir verdad, era de esperarse que hasta un chimpancé con los ojos cerrados hubiese acertado más o menos a la mitad de los colores, así que siA acertaba, por ejemplo, sólo uno o ningún color d e los 12 intentos, no sólo sería obvio que carecía del poder del que s e ufanaba, sino que además evidenciaría su mala suerte. Este es un típico ejemplo de lo que s e llama ensayo unilateral o también en-
Cap. 9. Pruebas de hipótesis paramttricas
3 13
sayo de una sola cola. Los ensayos unilaterales (ya sea de coia izquierda o d e cola
derecha) son muy comunes. Si usted tiene mucha hambre, va a un restaurante d e comida rápida en el que se anuncia que la orden de papas fritas a la sa tiene 400 g de papas, y al pedir y pagar una orden le sirven algo así como 800 g, no tendría motivos para reclamar, porque le responderían que se comiera lo que gustara y dejara lo que ya no quisiera. Pero si le sirvieran sólo 300 g, quizá sí debería reclamar (a menos que no le gusten las papas a la sa). Una prueba d e hipótesis se llama bilateral cuando .la hipótesis alternativa involucra el signo + (diferente de) para el parámetro que se somete a prueba. Por ejemplo, si uno está ensayando la hipótesis de que aproximadamente 50% de la población son mujeres, la alternativa sería que ese porcentaje fuese diferente de 50% (mayor o menor). Por otra parte, una prueba se llama unilaterai (o d e una cola) cuando la hipótesis alternativa involucra el signo < (prueba unilateral izquierda) o bien el signo > (prueba unilateral derecha). Como podemos ver, es precisamente el signo que se usa en la hipótesis alternativa el que nos da la clave acerca de si la prueba es de cola izquierda, de cola derecha o de ambas colas.
9.4. h U M E N DEL PROCEDIMIENTO PARA UNA PRUEBA DE HIP~TESISEN GENERAL
Paso 1. Se emite una hipótesis nula (Hd relativa a algún parámetro de la población. La. hipótesis debe involucrar alguno de los signos =, 2 o S, pero no puede involucrar ninguno d e los signos <, > ni 2,los cuales se reservan para
la hipótesis alternativa. Al mismo tiempo, se especifica la hipótesis alternativa Ha, la cual establece lo contrario de la hipótesis nula. Paso 2. Se especifica un nivel d e significación a a usar. Lo convencional es emplear los niveles de 5 % (a = 0.05) o de 1% (a= 0.01), pero ello no es obligatorio. Paso 3. Se extrae de la población una muestra aleatoria de tamaño n, y se calcula el estadístico de prueba apropiado. Paso 4. Se compara el valor numérico obtenido para el estadístico de prueba con el valor numérico correspondiente del modelo teórico que se va a seguir, usualmente empleando las tablas de percentiles o de valores críticos de alguna distribución estadística teórica. Paso 5. De acuerdo con el contraste de valores numéricos del paso 4 se decide si se rechaza la hipótesis nula o no se rechaza, bajo el entendido de que si no se rechaza, entonces significa que se acepta sólo de manera tentativa o provisional, a reserva de efectuar pruebas ulteriores que corroboren o desmientan esa decisión.
9.5. ESQUEMA GU~APARA LA PRUEBA DE HIPOTESIS RELATIVA A UNA MEDIA
En el esquema de la figura 9.1, que recomendamos aprender de memoria, se especifican los estadísticos d e prueba que deben usarse en cada caso, al hacer
i 1
1
1 I
1
1i 1
ii i
1 i !
estadística no
i 1i
Figura 9.1
pruebas de hipótesis concernientes a la media de una población. Obsérvese que sólo cuando la muestra es pequeña y la población no es normal, no hay ninguna prueba de hipótesis paramétrica adecuada, aunque en tales casos hay varios métodos no paramétricos que se pueden emplear. Los valores críticos de la distribución t de Student con n - 1grados de libertad se emplean únicamente en el caso de que la muestra sea pequeña y la varianza de la población se desconozca, pero por lo menos se sabe que ésta se distribuye de manera normal o aproximadamente normal. El símbolo p, significa la media que se toma en la hipótesis nula H,, es decir, en todos estos casos la hipótesis nula es H , : { p = CL,). En las figuras 9.2,9.3 y 9.4, se ilustran las zonas de rechazo para los tres tipos de pruebas relativas a una media poblacional, donde a es el nivel de significación de la prueba. En la prueba de cola izquierda (fig. 9.2), la hipótesis nula H,:{y = CL,)puede escribirse también como H,:{y 2 y,), mientras que en la prueba de cola derecha (fig. 9.3), la hipótesis nula H,:{y = y,) se puede escribir como Ho:{yIyo).
Estadístico de prueba:
Figura 9.2. Prueba de cola izquierda.
Estadístico de prueba:
Figura 9.3. Prueba de cola derecha.
Estadístico de prueba:
Figura 9.4. Prueba de dos colas.
9.6. PRUEBAS
PARA LA MEDIA DE UNA POBLACI~N: CASO DE MUESTRA GRANDE
Ilustraremos el caso de una muestra grande con algunos ejemplos típicos. Ejemplo 9.3. Los paquetes de café Bemoka de Colombia de medio kilogramo dicen "contenido neto 500 g". Se eligieron al azar 50 paquetes y se pesaron con una balanza analítica, tras lo cual se registraron los siguientes datos muestrales: 3C= 492 g, S = 34.4 g. A primera vista, parece que el peso neto promedio de los paquetes fuese tal vez menor que el anunciado. Efectuar una prueba al nivel de a = 0.05, para ensayar la hipótesis: H , : { p = 500 g) (o bien p 2 500 g) contra la alternativa Ha:@ < 500 g)
Solución: El valor crítico de Z que servirá como Frontera entre la zona de rechazo y la zona de aceptación de la hipótesis, es:
Véase la figura 9.5.
5 % del área baio la curva
4
J'
\
Zona de rechazo -1.645 de la hipótesis H, d I
Figura 9.5 Ahora comparamos este valor con el estadístico de prueba:
Aunque es un número muy parecido al valor crítico, queda a la derecha de éste, es decir, queda en zona de aceptación. Por tanto, no es posible rechazar H,, y la prueba
Cap. 9. Pruebas de hipótesis paramttricas
3 17
muestra que no hay razones para suponer que el contenido neto medio de los paquetes es menor que el anunciado.
El vdor p (en inglés p-value), también llamado nivel de significación experimenta o descriptivo, en una prueba de hipótesis, es la probabilidad de observar un valor del estadístico d e prueba que sea por lo menos tan extremoso como el valor calculado con la muestra dada. Por supuesto, cuanto más pequeño sea el valorp d e una prueba tanto mayor evidencia habrá en contra de la hipótesis nula H . En el ejemplo anterior, el valorp de la prueba es el área bajo la curva normal a a! izquierda de -1.6444, es decir:
Ejemplo 9.4. El departamento de seguridad de una fábrica desea saber si el tiempo promedio red que requiere el velador para realizar su ronda nocturna es de 30 minutos. Se tomó una muestra al azar de 32 rondas y el velador promedió 30.8 minutos con una desviación estándar de 1.7minutos. a ) Realizar una prueba de hipótesis, con a = 0.01, que permita averiguar si hay evidencia suficiente para rechazar la hipótesis nula {p = 30 minutos) en favor de la hipótesis alternativa {p f 30 minutos). b) Calcular el valorp de la prueba.
a ) Se trata de un ensayo bilateral (de dos colas). Los valores de Z críticos son aquellos con áreas respectivas de 0.005 en sendas esquinas bajo la curva, es decir, f2.576. El estadístico de prueba es:
Este valor cae en zona de rechazo, porque es mayor que 2.576. Por consiguiente, se rechaza la hipótesis de que el tiempo promedio real que hace el velador en sus rondas es de 30 minutos, en favor de la alternativa, y concluimos que es muy probable que el velador baga un tiempo promedio diferente de 30 minutos. Esto se traduce a lo siguiente: "Hay una probabilidad de 0.99 de que las discrepancias que hay entre el promedio hipotético úL, = 30 minutos) y el promedio de los datos muestrales (?= 30.8) no puedan atribuirse a la casualidad." Desde luego, hay una pequeña probabilidad de 0.01 de que esa diferencia observada si sea obra del azar, y en esa misma proporción, sería injusto y erróneo llamarle la atención al pobre velador (error de tipo 0. b) El vaiorp de la prueba es el área bajo la curva normal a la derecha de 2.662 más el área que hay a la izquierda de -2.662, esto es:
3 18
Parte 111. inferencia estadística
Lo que nos dice este valorp de la prueba es que cualquier prueba de hipótesis que hubiésemos hecho en este ejemplo con a > 2 x 0.00388 hubiera conducido a rechazar la hipótesis nula, mientras que si a hubiese sido menor que 2 x 0.00388, entonces no podría haberse rechazado H,. Por ejemplo, si a = 0.004, entonces la localización de los valores de Z críticos hubiera estado en fW(0.998) = f 2.878, y en ese caso, el valor calculado del estadístico de prueba (2.662) no habría caído en zona de rechazo. Esto es, no podemos asegurar con probabilidad de 0.996 que las diferencias observadas sean significativas. (Se usa la palabra signz$cativo en estadística como sinónimo de algo que no puede ser obra de la casualidad.) Si el valor calculado del estadístico de prueba cae en zona de rechazo es porque hay evidencia significativa en contra de la hipótesis nula (con el nivel de significación elegido). Obsérvese que en el ejemplo del café, los datos muestrales mostraron también una discrepancia con el promedio supuesto, y sin embargo, la hipótesis no fue rechazada, ya que no se puede afirmar con probabilidad de 0.95 que las discrepancias observadas sean significativas.
9.7.hUEBAS PARA UNA MEDIA POBLACIONAL: CASO DE MUESTRA PEQUE~~A
Para muestras pequeñas con varianza poblacional desconocida y población supuestamente normal, se emplean las tablas de percentiles o de valores críticos de la distribución t de Student con n - 1grados de libertad. Veamos un ejemplo. Ejemplo 9.5. En una pizzería afirman que el tiempo promedio en la entrega de sus pizzas a domicilio (dentro de la zona en que ellos hacen entregas) es de cuando mucho 40 minutos desde el momento en que se ordenan las pizzas. Para una muestra aleatoria de 10 pedidos de piua a domicilio (domicilios aleatorios dentro de la zona) se registraron los siguientes tiempos d e entrega en minutos (redondeados al minuto más cercano): 38,48, 37,39,46,46,43,42,44y 40. Si se supone que la distribución de los tiempos de entrega es normal, realizar una prueba de hipótesis con nivel de significación a = 0.04, para ensayar la hipótesis nula H,:{p I40) contra la hipótesis alternativa Ha:{p> 40). Solución:Con una calculadora d e bolsillo, se halla queZ = 42.3 min, S = 3.743 min. El valor del estadístico de prueba es, en consecuencia:
Por otra parte, el valor crítico t,,, (es decir, percentil correspondiente a p = 0.96) en la distribución t de Student con v = 10 - 1 = 9 grados de libertad se halla en las tablas de percentiles de esa distribución. Como dicho valor es 1.9727> 1.943,no se puede rechazar la afirmación de la pizzería al nivel de a = 0.04. En este mismo ejemplo, el valorp de la prueba (o nivel de significación experimental) es el área a la derecha de 1.943 en una distribución t de Student con nueve grados d e libertad. Con Excel se calcula así:
Cap. 9. Pruebas de hipótesis paramétricas
3 19
El 1 que se escribe dentro del paréntesis indica una cola. EUo implica que en este ejemplo, sólo un nivel de significación mayor que 0.0419 permite rechazar H,,. Ejercicio 9.1. Con Ekcel, elabore una tabla de percentiles importantes de la distribución t de Student, en donde tc represente el punto sobre el eje X tal que, a mano izquierda de él y bajo la curva t de Student con v grados de libertad, se tenga un área exactamente igual a c. Considere grados de libertad del 1al 30 y añada una fila al final que corresponda a los percentiles correspondientes de la normal estándar (o t de Student con grados de libertad). Considere 13 columnas, correspondientes a t para c igual a 0.995,0.990,0.985,
0.980,0.975,0.970,0.965,0.960,0.955,0.950,0.94~,0.940 y 0.900, respectivamente. Tome precisión de sólo cuatro dígitos decimales después del punto. Esta tabla que hará es de enorme utilidad en estadística práctica. Le recomendamos imprimirla y enmicarla. Recuerde que para calcular con Ejrcel el percentil tc de la t de Student con v grados de libertad, se emplea la sintaxis:
Cuando termine su trabajo, compárelo con la tabla siguiente (tabla 9.1).
9.8. DETERMINACI~N DEL TUO DE MUFSTRA
EN UNA PRUEBA DE HIP~TESISRELATWA A UNA MEDIA POBLACIONAL
Ya vimos cómo calcular el tamaño óptimo d e muestra en la estimación de un intervalo de confianza relativo a una media o a una proporción. También hay una fórmula útil para determinar el tamaño de muestra recomendable en una prueba de hipótesis relativa a una media, pero esta fórmula requiere d e la especificación d e una máxima probabilidad tolerable para el error de tipo 11 en un valor particular p = de la hipótesis alternativa. Consideremos la figura 9.6 (pág. 322). En ambas curvas se representa una posible distribución muestra1 d e medias para muestras de tamaño n, pero en la de arriba la media es p.? =p., , mientras que en la de abajo es y? =p., . En la curva de abajo, j3 representa la máxima probabilidad tolerable para un error de tipo 11 en caso que la media fuese y,. En la curva de arriba, a es el nivel de significación de la prueba. Para esta figura particular se ha tomado Ho:{y2 ko)y Ha:{p< h). Si la prueba fuese de cola derecha, las curvas estarían más o menos intercambiadas, pero el razonamiento y la fórmula final serían iguales. Pero si la prueba fuese de dos colas, lo único que cambiaría, tanto en el razonamiento como en la fórmula final, sería que en lugar de a se tomaría En la figura de arriba, c es el valor crítico tal que Z e c determina la región de rechazo de la prueba. Abajo tenemos dónde se vería ubicado el mismo punto c con respecto a la distribución con media y = p.a. Resulta claro que en la distribución de arriba, el punto c se localizaría como sigue:
m.
(En caso de ser prueba de cola derecha, sólo se cambiaría el signo menos por un signo +.)
Tabla 9.1. Percentiles importantes de la distribuuón t de Student con v grados de libertad. El último renglón (m grados de libertad) corresponde a la distribución normal estándar. Para percentiles simétricos a la izquierda del origen se usan los mismos valores pero con signo negativo; por ejemplo: t,,,, = -to
.,.
,
,--
C
v
0.995
163.656
0.990 31.821
0.985 21.205
0.980 15.895
0.975 12.706
0.970 10.579
ir-pG-
0.965
0.960
0.955
0.950
O.!
9.0579
7.9158
7.0264
6.3137
5.72Y7
5.2422
3.0777 -
2
9.9250
6.9645
5.6428
4.8487
4.3027
3.8964
3,5782:
3.3198
3.1040
2.9200
2.7604
2.6202
1.8856
3
5.8408
4.5407
3,8961
3.4819
13.1824
2.9505
2.7626
2.6054
2.4708
2.3534
2.2494
2.1562
1.6377
4
4.6041
3.7469
3.2976
2.9985
2.7765
2.6008
2.4559
2.3329
2.2261
2.1318
2.0475
1.9712
1.5332 -
2.1910
2.0978
2.0150
1.9405
1.8727
1.4759
2.1043
2.0192
1.9432
1.874
1.8117
1.4398
2.0460
1.9662
1.8946
1.8297
1.7702
1.4149
5
4.0321
3.3649
3.0029
2.7565
2.5706
2.4216
2.2974'
61
3.7074
3.1427
2.8289
2.6122
-.-
2.4469
2.3133
2.2011
7
3.4995
2.9979
2.7146
2.5168
2.3646
2.2409
2.1365
1
/
i. , '
b) Distribución muestra1de F cuando Ho es falsa YCLa
La desviación estándar de ambas distribuciones
Figura 9.6
En forma.análoga, en la segunda distribución se tendrá:
En estas dos ecuaciones, los símbolos zay zPdenotan, respectivamente, los valores críticos (percentiles) de la normal estándar, con d&zo positivo, que tienen áreas de a y B en las respectivas colas que determinan. Al restar miembro a miembro la expresión 1de la 2, elevar al cuadrado y despejar n se obtiene:
Esta fórmula permite calcular el tamaño recomendable d e muestra antes de realizar una prueba d e hipótesis para la media poblacional, bajo las condiciones que se expusieron al principio. Se puede demostrar que si la prueba fuese bilateral, sólo haría falta cambiar zapor z, en la fórmula 3. Ejemplo 9.6. Se desea ensayar la hipótesis nula (con a = 0.05) de que una oftalrnóloga demora, en promedio, por lo menos 30 minutos en cada consulta con el paciente en turno, contra la alternativa de que demora menos tiempo en promedio. Si la hipótesis inicial fuese falsa, se estaría dispuesto a tolerar una probabilidad máxima de $ = 0.08 para el error de tipo 11 cuando el tiempo promedio fuese de 26 minutos. Si se sabe que los
Cap. 9. Pruebas de hipdtesis paramttricas
323
tiempos de consulta siguen una distribución normal con o = 5 minutos, ¿cuál es el tamaño recomendado para la muestra de pacientes? Solución: Se sustituyen los valores correspondientes en la fórmula 3 y se obtiene:
lo cual implica que el tamaño de muestra recomendable es de n = 15 pacientes, a fin de que la prueba de hipótesis que se realice tenga las características deseadas. Ejemplo 9.7. Una nutrióloga quiere probar la hipótesis de que un litro de leche envasada de cierta marca contiene en promedio 48 g de carbohidratos, contra la alternativa de que es una cantidad diferente. Además, se tolerará una probabilidad de 0.12 de cometer un error de tipo 11 si el contenido promedio fuese de 50 g. Si la desviación estándar del contenido de carbohidratos por litro es de o = 2.8 g, calcular el tamaño de muestra adecuado para realizar la prueba, usando el nivel de significación de a = 0.04. Supóngase una distribución normal. Solución :
Por tanto:
Entonces, es suficiente analizar una muestra aleatoria de 21 litros de leche de esa marca.
9.9. CRITERIOS DEL VALORP
DE LA PRUEBA
PARA RECHAZAR H,
Como se mencionó antes, el nivel de significación experimental -o valorp de la prueba- es a menudo más útil para decidir si conviene rechazar la hipótesis nula que un nivel de significación prefijado de antemano. Ello se debe a que cuanto más pequeño sea el valorp de la prueba tanto más significativos serán los resultados de la misma en contra de la hipótesis nula. Los criterios convencionales son los siguientes: 1. Si el valorp es mayor que 0.10, entonces no se aconseja rechazar Ho.En tal caso se dice que los resultados de la prueba no son signzjicativos,y se recomienda volver a realizar la prueba, de preferencia con una muestra más grande. 2. Si el valorp es mayor que 0.05, pero no mayor que 0.10, se puede rechazar la hipótesis H,, pero los resultados de la prueba sólo se consideran, cuando mucho, ligeramente signzjicativos. 3. Si el valorp de la prueba es mayor que 0.01, pero no mayor que 0.05, se debe rechazar Ho y declarar que los resultados de la prueba son signzjicativos.
324
Parte 111. Inferenciaestadística
4. Si el valorp de la prueba es menor o igual a 0.01, se rechaza H, y se declara q u e los resultados de la prueba s o n altamente signzjicatiuos. Ejemplo 9.8. En cierto país se estableció que hace 20 años el promedio de vida de una persona era de 71.4 años. Recientemente, se tomó una muestra aleatoria d e 100 muertes, y se obtuvo que la media muestra1 fue d e F = 73.8 años, con una desviación estándar de S = 9.8 años. ¿Son significativos estos datos para argumentar que actualmente la gente vive, en promedio, más que hace 20 años? Solución:La hipótesis nula es Ho:(p = 71.4) y la hipótesis alternativa es Ha:{p > 71.4). El valor del estadístico de prueba es:
Entonces, el valorp d e la prueba es el área bajo la curva normal estándar, a mano derecha del punto 2.449. Hallamos con Excel que vale:
Por consiguiente, se rechaza HAy se concluye que los resultados d e la muestra ente"significativos argumentar que en la actualidad las personas viven, en promedio, más que hace 20 años. Alexander Lyapunov (1 857- 19 18). Creó las condiciones precisas para formular y demostrar en su forma más general el famoso Teorema Central del Límite. Con Lyapunov. Markov y Chebishev. inicia la época de máximo rigor matemático en el tratamiento de la estadística.
Andréi Kolmogórov (1 903- 1987). Publicó trabajos notables donde describió ciertas desigualdades en sumas parciales de variables aleatorias. Además propuso y demostró la llamada ley fuerte de los grandes números. Se considera el más eminente probabilista desde Laplace.
10.1.~ U E B A DE S HIPÓTESIS SOBRE UNA PROPORCI~N POBLACIONAL
No es ninguna exageración afirmar que el parámetro más socorrido y más popular, tanto en intervalos de confianza como en pruebas de hipótesis, es la proporción. Muy a menudo escuchamos afirmaciones que involucran una proporción poblacional, aunque casi siempre se expresa en forma de porcentaje. Por ejemplo, escuchamos que 80 % de las personas que sufren de depresión también padecen insomnio, que 90% de los conductores de microbuses urbanos en el Distrito Federal manejan con imprudencia y violan los reglamentos de tránsito vehicular, que 65 % de las hembras del insecto conocido como mantis religiosa se comen al macho después del apareamiento, que casi 30 % de los partidos de futbol terminan con resultado de 1-1,que 86% del presupuesto del gobierno de México se usa en sueldos de burócratas y, a su vez, que 70 % de esos burócratas son innecesarios, etc. Todas estas afirmaciones, y otras por el estilo, pueden ser válidas o no, pero en todo caso se requiere una prueba de hipótesis para confirmarlo o desmentirlo, no sin itir que semejante confirmación es sólo de carácter tentativo y está sujeta a errores que se conocen. Así como la metodología para la estimación de intervalos para la media poblacional es muy similar a la de la estimación d e un intervalo de confianza para una proporción, también las pruebas de hipótesis relativas a la media poblacional o a una proporción son muy similares. Y resulta lógico que así sea, porque, visto desde la óptica d e los ensayos de Bernoulli, el número promedio de éxitos de n eventos es np, y la desviación estándar es , dondep es precisamente la proporción teórica de éxitos en la población.
&
326
Parte 111. Inferencia estadística
Una prueba unilateral izquierda para una proporciónp se basa en la hipótesis nula H,:(p =p,) frente a la hipótesis alternativa Ha:@
Los valores críticos d e la distribución normal estándar se usan como se indica en la figura 10.1. Ejemplo 10.1. El subsecretario de educación superior de la SEP quiere demostrar que en México más de 15% de los estudiantes de las especialidades de ingeniería son mujeres. Al tomar una muestra aleatoria de 400 estudiantes de ingeniería (de varias universidades al azar) se halló que había 72 mujeres. Por supuesto, esto significa que hubo 18% de mujeres en la muestra, pero ello bien podía deberse a la casualidad. Además, hay en el país muchos miles (o decenas de miles) de estudiantes de ingeniería, por lo que podría ser aventurado extrapolar el resultado observado en una muestra a toda la gran población de estudiantes de ingeniería del país. Para confirmar sus sospechas, este señor plantea la hipótesis nula H,:{p I0.15) contra la alternativaHa:{p> 0.151, a un nivel de significación de a = 0.05. El valor puntual de la proporción observada en la muestra es j5 = 0.18,y el error estándar de la proporción está dado por:
El valor numérico del estadístico de prueba es, entonces:
El valorp de la prueba es, entonces:
O, de manera equivalente, 1.645 < 1.68. Por tanto, se concluye que los resultados de la muestra son significativos y debe rechazarse la hipótesis nula. Así que hay motivos para afirmar que más de 15%de los estudiantes de ingeniería del país son mujeres.
a) Prueba unilateral izquierda
Estadístico de prueba:
I
6)Prueba unilateral derecha
C)
Estadísuco de prueba:
Estadístico de prueba:
Prueba bilateral
Figura 10. I
328
Parte 111. Inferencia estadística
Ejemplo 10.2. En el pasado se había establecido que aproximadamente 20 % de los automóviles que circulaban en la capital tenían placas de provincia, pero se desea averiguar si esta proporción ha cambiado ahora. Se tomó una muestra aleatoria de 400 automóviles, y se obtuvo el resultado de que 70 de ellos tenían placas de provincia.
a) Usando nivel de significación de a = 0.05, ensayar la hipótesis nula H,:{p = 0.20) contra la alternativa Ha:@# 0.20). 6) Calcular el valorp de la prueba.
a) Se rechaza Ho si z < -1.96 o bien z > 1.96. En este caso, tenemos:
El estadístico de prueba es:
Como -1.96 < -1.25 < 1.96, no se rechaza H,. Así, los resultados del muestre0 no son significativos para argumentar que el porcentaje de automóviles con placas de provincia ha cambiado. 1 6) -(valorp)= @(-1.25) = 0.10565. Por tanto, el valorp de la prueba es 0.2113. 2 Este valorp es, obviamente, demasiado grande para servir como evidencia contra la hipótesis nula.
Para realizar una prueba de hipótesis relativa a la varianza (o la desviación estándar) de la población se usa el estadístico de prueba llamado ji-cuadrado muestrai, definido como sigue:
El símbolo 0; es la varianza supuesta en la hipótesis Ho. Para una prueba unilateral derecha (o de cola derecha), la hipótesis nula es H,: {dIo; ) o bien H,: {d= 0;),y la hipótesis alternativa es Ha:{d> o; ). Para un nivel de significación a,la región de rechazo se busca en la distribución ji-cuadrada con v = n -1 grados de libertad, como se muestra en la figura 10.2. Ejemplo 10.3. La compañía de cerillos marca ACME fabrica cajetillas de cerillos de 40 g. Cuando las máquinas estaban nuevas, la desviación estándar del peso neto por
'- -- Zona de rechazo Figura 10.2. Distribución
x2 con n - I grados de libertad.
cajetilla era de o = 0.25 g, pero después de un tiempo de uso continuo, al gerente del departamento de empaque le pareció que, aunque el peso promedio neto seguía siendo aparentemente el mismo, algunas cajetillas estaban saliendo más llenas que otras, y sugirió detener la producción un par de días para revisar las máquinas. Se tomó una muestra aleatoria de 20 cajetillas y se obtuvo una desviación típica muestra1 de S = 0.32 g. Se determinó entonces efectuar una prueba de hipótesis con nivel de significación de 5 % para decidir si procede o no una revisión de las máquinas. ¿Cuál es la conclusión? Solución:Sea Ha:{& = (0.25)2),H ~{ :d > (0.25)2). El valor crítico x:,, con 19 grados de libertad es:
La hipótesis Ha se rechazará sólo si el estadístico de prueba resulta mayor que este número. Veamos:
Se rechaza H,. La conclusión es, entonces, que probablemente sí debe detenerse la producción para revisar las máquinas y, en su caso, proceder a ajustarlas.
En el caso de una prueba unilateral izquierda (o de cola izquierda), se tiene H,:{c? 2 0;) O bien Ho:{02= 0;), y la hipótesis alternativa es Ha:{02c 0;). Para un nivel de significación a, la región d e rechazo se busca, igualmente, en la distribución ji-cuadrada con v = n - 1grados de libertad, como se ilustra en la tigura 10.3.
I
a
&a
Zonade rechazo*
~ = n - l
-: Figura 10.3. Distribución x2 con n - I grados de libertad.
Ejemplo 10.4. En una sucursal bancaria se había establecido que la desviación estándar del tiempo de atención a cada cliente en la ventanilla correspondiente era de 2.3 minutos. Para tratar d e disminuir el valor de este parámetro, las cajeras fueron obligadas a tomar un breve curso de capacitación. Después del curso, se tomó una muestra aleatoria de 10 clientes, con los siguientes tiempos de espera (en minutos) frente a la ventanilla correspondiente: 1.8, 5.2,4.3,6.6,2.5, 3.4,2.6, 5.6,4.7 y 4.0. Para averiguar si el curso de capacitación sirvió de algo, se realiza la prueba d e hipótesis siguiente: H,:{oZ 2 (2.3)9, Ha:{02c (2.3)2), con a = 0.05. ¿Cuál es su conclusión? Solución:Hallamos que s = 1.5166 minutos. A primera vista, podríamos sospechar que el curso sí sirvió, pero veamos. El valor crítico para la distribución ji-cuadrada con nueve grados de libertad es:
Luego:
No hay suficiente evidencia estadística en contra de la hipótesis H,, así que se concluye que probablemente el curso de capacitación no sirvió d e nada, a reserva d e tomar una nueva muestra (más grande) y realizar una nueva prueba de hipótesis.
Por último, para una prueba bilateral (o de dos colas) se tiene H,:{c? = o: 1, y la hipótesis alternativa es Ha:{d# o: ). Para un nivel de significación a la región de rechazo se busca, al igual que en los casos anteriores, en la distribución ji-cuadrada con v = n - 1grados de libertad, como se observa en la figura 10.4.
Figura 10.4. Distribución x2 con n - I grados de libertad. Ejemplo 10.5. Supóngase que las personas que elaboran el conocido examen de inglés TOEFL saben por experiencia que la desviación típica de los resultados ha sido aproximadamente de 26 puntos. Entonces, deciden elaborar un nuevo tipo de examen, con un formato distinto, pero quieren que la desviación estándar siga siendo más o menos la misma. Si se aplicó el nuevo examen a 30 aspirantes elegidos al azar, con el resultado de que la desviación estándar fue de 22.4 puntos, ¿se puede argumentar al nivel de significación de 5 % que el valor de este parámetro probablemente cambió con el nuevo examen? Solución: Planteamos una prueba de hipótesis: Ho:{02= 262),Ha:{a2# 26'1, con a = 0.05. Los valores críticos de la distribución ji-cuadrada con 29 grados de libertad son los siguientes:
Por tanto, se rechazará H,, si el valor calculado para el estadístico de prueba cae fuera del intervalo dado por [16.047,45.722].Veamos:
Está dentro del intervalo de no rechazo, así que no se rechaza H, y se concluye que el valor de la varianza ha sido probablemente preservado con el nuevo formato de examen.
_=
-_
Karl Pearson ( 1 857- 1936). Discípulo y amigo de Francis Galton. Realizó importantes contribuciones al desarrollo de la estadística; además es el inventor de muchos ttrminos usuales, como desviación estándar, ji-cuadrado, etc. En 19 19, fundó la famosa revista de estadística llamada Biometrika.
Charles Spearman ( 1 863- 1 945). Fue psicólogo de profesión, pero desarrolló notables aplicaciones de la estadística en el campo de la psicología. Creó la metodología de los llamados experimentos factoriales. Usó la estadística (experimentos de dos factores) para determinar y medir la inteligencia de las personas.
TEST GENERALACERCA DE LOS INTERVALOS DE CONPIANZA Y PRUEBAS DE HIP~TESIS
Anote sus respuestas en el siguiente cuadro. Escriba los procedimientos en hojas separadas.
1. En el Distrito Federal, se trató de averiguar el porcentaje de automovilistas que al estacionarse en la calle ponen bastón contra robo para inmovilizar el volante de su automóvil. En una muestra aleatoria de 800 automóviles estacionados en la calle se observó que 70% de ellos tenían el bastón contra robo. Determine un intervalo de confianza de 90% para el porcentaje de automovilistas del D. E que, al estacionar su automóvil en la calle, usarán el bastón contra robo.
Cap. 10. Pruebas de hipótesis
33 3
2. En una investigación se trata de averiguar el porcentaje de veces que hay diputados durmiendo dentro del recinto de la Cámara de Diputados en el curso de una sesión ordinaria de trabajo. ¿Cuántas visitas debe hacer un observador a la Cámara de Diputados para tener 95 % de confianza de que el margen de error en su estimación del porcentaje de veces que hay diputados dormidos sea de cuando mucho 10%?Suponga que carece de datos históricos para dar a pnmi un valor tentativo de dicho porcentaje.
3. Repita el ejercicio 2, pero con el cambio de que ahora sí se toman como tentativos algunos datos del pasado, en el sentido de que aproximadamente 80% de las veces se han visto diputados durmiendo durante una sesión de trabajo. ¿Cuántas visitas debe hacer en ese caso el observador?
4. Según la revista Tiempo (febrerode 2002), un conocido sociólogo mexicano afirma que una gran proporción de los discursos oficiales de los políticos mexicanos (incluso los informes presidenciales) son fundamentalmente discursos de aspiraciones futuristas que, en lugar de informar de algún logro concreto realizado, lamentan la situación presente, pero dan una especie de compromiso para que en el futuro las cosas cambien, aunque no especifican cuándo ni cómo. ¿De qué tamaño debe ser una muestra aleatoria de discursos de políticos mexicanos para tener una confianza de 90% de que el error en la estimación de dicha proporción es de cuando mucho 0.08, si se toma en cuenta una pequeña prueba piloto, según la cual s610 uno de 10 discursos aleatorios de políticos no fue futuristaen ese sentido?
5. Repita el ejercicio 4, pero con el cambio de que no se dispone de ninguna prueba piloto previa ni de ningún dato al respecto. ¿Cuál es el tamaño de muestra de discursos que se deben analizar?
6. A una muestra aleatoria de 369 personas adultas se les preguntó cuál era su principal fuente para enterarse de las noticias cotidianas, y 200 respondieron que era la televisión. Calcule un intervalo de confianza de 95 % para la proporción de personas que se enteran de las noticias por medio de la televisión.
7. En cierto país se desea probar la hipótesis nula de que la edad promedio a la que se casan los hombres es de 28 años, contra la hipótesis alterna de que dicha edad es distinta de 28 años. Si al realizar la prueba se acepta tolerar una probabilidad de 0.15 de cometer un error de tipo 11cuando la media real de la edad es de 29 años, ¿qué tamaño de muestra se recomienda usar si se supone además que a = 0.05 y o = 6?
3 34
Parte 111. Inferencia estadística
8. Repita el ejercicio 7, pero con el cambio de que ahora se supone que la desviación estándar de la edad a la que se casan los hombres en ese país es de o = 3.4 años.
9. Sea p el tiempo promedio (en minutos) que demora el de un banco mientras es atendido por la cajera en la ventanilla. Se desea probar la hipótesis nula Ho:{p 2 5) contra la hipótesis alternativa H,:{p < 51, con un nivel de significación de a = 0.05. El investigador que realiza la prueba acepta tolerar una probabilidad de 0.10 para el error de tipo 11 cuando el tiempo promedio real es de cuatro minutos. ¿Que tamaño de muestra se recomienda para efectuar la prueba? Suponga que la desviación estándar es de o = 1.3 minutos.
10. En una muestra aleatoria de 600 automóviles que dan vuelta a la derecha en cierto crucero, 157 se internaron al caml equivocado. Utilice el nivel de significación de a = 0.05 para ensayar la hipótesis nula de que la proporción de conductores que cometen este error (en el crucero dado) es 0.30, contra la alternativa de que esta cifra es incorrecta de una u otra forma.
a) Hose rechaza, porque 1.96 < 2.049 b) Hose acepta, porque 1.849 < 1.96 c) Hose acepta, porque -1.96 < -1.849 d) Hose rechaza, porque -2.049 < -1.96.
En el trabajo estadístico se hace a menudo una comparación entre parámetros correspondientes a dos poblaciones, tomando una muestra aleatoria de cada una de ellas. Supóngase queX, yX2son dos variables aieatorias con distribuciones normales independientes que representan el comportamiento de dos poblaciones tales que sus respectivas medias son pl y p,, y SUS respectivas varianzas son o: yo: . Si de dichas poblaciones se toman sendas muestras de tamaños n, y n,,respectivamente, se puede demostrar que la variable aieatoria Y = X,-X2 posee una distribución normal con media p, - CL, y con una desviación estándar expresada mediante la fórmula siguiente:
En caso d e que n, y n, sean mayores que 30 (incluso mayores que 25), puede prescindirse d e la hipótesis de normalidad para las variables Xl y,X2. En la sección 11.4, veremos cuáles serían las fórmulas y metodos si las dos muestras no fuesen independientes, sino apareadas (correlacionadas), pero en las dos secciones siguientes (11.2 y 11.3) supondremos que las muestras son independientes.
Para muestras q u e sean grandes e independientes, el intervalo d e confianza d e 100(1- a)% para una diferencia de medias p, - p, es análogo al caso de una sola media, y está dado por:
Si las muestras son suficientemente grandes (mayores q u e 30), entonces las varianzas poblacionales pueden sustituirse por las muestrales.
Ejemplo 11.1. Se desea comparar el tiempo promedio de viaje en autobús entre la Ciudad de México y la ciudad de Guadalajara (en un sentido) para dos compañías independientes de autobuses públicos. Para la compañía 1 se tomó una muestra aleatoria de 34 viajes y se obtuvo una media muestral de 6.1 horas de viaje con una desviación típica de 0.8 horas. Para la compañía 2 se tomó una muestra aleatoria d e 40 viajes, con un tiempo promedio (media muestral) de 6.4 horas y una desviación estándar de 0.5 horas. Si p, y & denotan, respectivamente, los tiempos promedio d e viaje entre dichas ciudades para cada una de las dos compañías de autobuses, obtener un intervalo de confianza de 90% para p, - p2 e interpretar el resultado. Solución: Se tiene F, - Z2= 6.1 - 6.4 = -0.3. Por otra parte, el valor crítico d e z para un intervalo de confianza de 90% es z,. - 1.645. Como ambas muestras son grandes, podemos usar las varianzas muestrales y Z e n e m o s el siguiente error típico para p, - K:
Por tanto, el intervalo de confianza buscado es -0.3 f (1.645 x 0.1583) = -0.3 0.2605, es decir:
+
Esto significa que hay una confianza de 90 % en que se dice la verdad, si se afirma que la compañía 1 de autobuses hace entre 0.0395 horas (es decir, 2 minutos con 22 segundos) y 0.5605 horas (es decir, 33 minutos con 38 segundos) menos tiempo que la compañía 2 en esos viajes, en promedio. Ejemplo 11.2. Dos grupos independientes de alumnos de diferentes escuelas, pero que cursan el mismo grado escolar (segundo año de bachillerato), se sometieron a un mismo examen de aritmética básica y áigebra elemental. De la escuela 1 tomaron parte 50 alumnos y (en la escala del O al 100) obtuvieron un promedio de 75 de calificación con desviación estándar de 7.6, mientras que de la escuela 2 tomaron parte 40 alumnos y se registró un promedio de 70.7 puntos con una desviación típica de 9.5. Si p, y p2denotan, respectivamente, las calificaciones promedio que habrían obtenido todos los estudiantes d e la escuela 1 y de la escuela 2, calcular un intervalo de confianza a 95 % para p., - p2 e interpretar el resultado. Solución: Se tiene X,- Z,= 75 - 70.7 = 4.3. En este caso, el valor crítico d e z para un intervalo de confianza d e 95% es z,,~, = 1.96. Obtenemos el siguiente error típico para P, - P2:
Así, el intervalo de confianza buscado es 4.3 f (1.96 x 1.847) = 4.3 f3.62. Esto e$:
Esto significa que, en promedio, los alumnos de la primera escuela obtendrían entre 0.68 y 7.92 puntos más (sobre 100 y en matemáticas básicas) en comparación con los de la segunda escuela, con un riesgo de 5 % de que tal afirmación sea falsa.
La técnica d e pruebas de hipótesis para una diferencia d e medias pl - p., es muy similar a la técnica correspondiente para una sola media. Si se quieren comparar las medias de dos poblaciones a fin d e averiguar si son iguales o diferentes, entonces se realiza.una prueba bilateral (o d e dos colas) con las siguientes hipótesis: Prueba bilateral: Hipótesis nula: Ho:{p, - p2 = 0); hipótesis alterna: Ha:{pl - CL, O). Prueba unilateral izquierda: - p., 2 O); Ha:{pl - p2< O}. Prueba unilateral derecha: Ho:{p, - p., 1 0); Ha:{p, - p, > 0).
*
p.,
En las pruebas unilaterales, los signos 2 o 1 pueden remplazarse por signos de igualdad. También es posible usar, en lugar de 0, algún valor constante prefijado Do. En todos estos casos, se toman dos muestras, una de cada población, n, 2 30 y n, 2 30, y se aplica el siguiente estadístico de prueba:
'Ejemplo 11.3. El dueño de una peluquería ha contratado a dos damas (Juanita y María) que cortan el cabello de los clientes (de sexo masculino). Desea averiguar si ellas tardan más o menos el mismo tiempo promedio en cada corte o si alguna es más lenta (o más rápida) que la otra. Se tomaron algunas muestras y se obtuvieron los siguientes datos: para Juanita, n, = 30, Z, = 11.4 minutos, S, = 2.2 minutos; para María, n, = 35,?, = 9.8 minutos, S, = 4.3 minutos. Se desea ensayar la hipótesis nula H,,:{p, - p, = O} contra la hipótesis alterna Ha:{p.,- p2# O}, en un nivel de significación de 5 %. Solución: El estadístico de prueba es:
338
Parte 111. Inferencia estadística
Como en una prueba bilateral a 95 % el intervalo de no rechazo se encuentra entre -1.96 y 1.96, se sigue que no hay razones para rechazar la hipótesis H,; así, las dos peluqueras hacen más o menos el mismo tiempo promedio y las discrepancias observadas pueden atribuirse a la casualidad.
11.4. MUESTRAS PEQUE~~AS TOMADAS DE POBLACIONES A P R O Y U M A D NORMALES ~
En esta sección, supondremos que uno o ambos tamaños de muestra son pequeños (menores que 30), pero las poblaciones de donde proceden son normales o casi normales y además las varianzas de ambas poblaciones se suponen iguales. Para ello se requiere un estimador combinado de o2(la varianza común d e las poblaciones), el cual es el siguiente: =
(n,- 1)s: + (n,- 1)s; n,+ n,- 2
El estadístico de prueba que se usa en este caso es:
Y; bajo la suposición de que las muestras extraídas son aleatorias e independientes, se contrasta el valor calculado de este estadístico con el valor crítico o percentil correspondiente de la distribución t de Student con n, + n, - 2 grados de libertad. Ejemplo 11.4. Se desea averiguar si el tiempo promedio de trasmisión de anuncios entre dos canales de televisión de empresas independientes es el mismo o difiere (se exceptúan los partidos de futbol). Se midieron varios intervalos exactos de una hora de trasmisión (al azar) en cada uno de los dos canales y se registró cuántos minutos en cada hora habían sido de anuncios, con los siguientes registros:
Cap. 1 1 . Inferencia estadística para dos poblaciones
339
Con un nivel de significación de a = 0.05, probar la hipótesis Ho:{p,- p2= O) contra , # O). Supóngase que la población se distribuye normalla hipótesis alterna ~ ~ : {-pCL, mente con una misma varianza. Soluci6n: Con ayuda de una calculadora se halla rápidamente que Z, = 32.54, S, = 3.0746; Z, = 29.7167, S, = 3.59022. Por otra parte, el estimador combinado de la varianza es: =
(n, - 1)s: + (n, - 1)s; - 4(3.074Q2+ 'j(3.5902)' n,+ n2-2 9
= 11.36226
El estadístico de prueba es:
El percentil to,, con nueve grados de libertad es 2.262, el cual se puede obtener de tablas, o también con Excel, usando la sintaxis siguiente:
La hipótesis nula se rechazaría s610 si el valor calculado del estadístico de prueba cayera fuera del intervalo [-2.262, 2.2621, el cual no es el caso para el número 1.38. Por consiguiente, no existen argumentos para rechazar Hoy se infiere que ambos canales pasan, en promedio, la misma cantidad de anuncios.
11.5. CASO DE MUESTRAS APAREADAS (O EMPAREJADAS)
Supóngase que usted quiere comparar dos tipos de exámenes de una misma asignatura para averiguar si alguno es más difícil d e resolver que el otro. Una manera de hacerlo sería aplicar un tipo de examen a un grupo específico de estudiantes y el otro examen a otro grupo, para luego comparar los resultados. Esto es exactamente lo que hicimos en las secciones anteriores. La desventaja de este método estriba en el ruido que introduce la posible variación entre los estudiantes como fuente d e error muestral. Tal desventaja podría evitarse si se aplican ambos exámenes a cada alumno de los grupos, aunque esto pudiera tomar algunos días más. En ese caso, se podrían comparar las calificaciones de cada uno d e los dos exámenes en cada alumno en particular. Esto se denomina muestras apareadas (o emparejadas). En general, se trata de dos columnas de datos con los encabezados antes y después (o mktodo 1 y método 2), pero aplicados a las mismas personas u organizaciones. En el caso de muestras apareadas se escribe una columna adicional con las respectivas diferencias (con todo y signo algebraico), y esas diferencias constituyen la base de la metodología. La notación que se emplea es: C L ~ ,que denota la media de las diferencias (por ejemplo, antes y después, o bien con dos métodos distintos de producción,
340
Parte 111. Inferencia estadística
etc.). Se usa el símbolo d, para denotar la i-ésima diferencia en la lista. Por ejemplo, para una prueba bilateral se tendría H,: {CL,= O}, Ha:{CL,# O}. La desviación típica de las diferencias es la desviación típica muestral común y corriente para datos aislados:
El estadístico de prueba que se emplea es:
y se contrastan los valores calculados con los valores críticos (o percentiles) de la distribución t de Student con n - 1grados de libertad @ara muestras pequeñas). En caso de muestras grandes se emplea, como de costumbre, la distribución normal estándar. Ejemplo 11.5. A seis empleadas de un restaurante se les mostraron dos métodos para preparar una taza de café capuchino y se registraron los tiempos (en minutos) empleados por ellas en cada uno de los dos métodos:
Con un nivel de significación de a = 0.05, ensayar la hipótesis de que las empleadas se tardan, en promedio, lo mismo con los dos métodos contra la alternativa de que algún método es más rápido que el otro. Soluci6n: Con ayuda de una calculadora,obtenemos ráp-amente la media y la desviación estándar (muestral) de los seis valores de diferencias: d = 0.30 y S, = 0.334664. El estadístico de prueba es el siguiente:
Por otra parte, el valor crítico de la distribución t de Student con a = 0.05 y n - 1 = 5 grados de libertad se puede obtener rápidamente con Excel usando la sintaxis:
Cap. 1 1 . inferencia estadística para dos poblaciones
34 1
O, en forma alternativa, se puede hallar en una tabla de percentiles de la distribución t de Student, buscando el percentil to,9,,con cinco grados de libertad. En cualquier caso, se obtiene 2.5706. La hipótesis nula sería rechazada si el valor calculado del estadístico de prueba cayera fuera del intervalo [-2.5706, 2.57061, lo cual no es el caso. Obsérvese la figura 11.1.En consecuencia,no existen motivos para rechazar la hipótesis nula y concluimos que ninguno de los dos métodos para preparar café capuchino es más rápido que el otro.
Figura I 1.1. Distribución t de Student con cinco grados de libertad. Ejemplo 11.6. A 15 vacas lecheras de una finca se les suministró cierto tipo de dieta durante cinco días, y se registró la cantidad total de litros de leche que cada una había producido en todo ese tiempo (redondeada al litro más cercano). Luego se les suministró otra dieta diferente y se realizó el mismo registro. Los datos que se obtuvieron se muestran a continuación:
342
Parte 111. Inferencia estadística a) Calcular un intervalo de confianza de 95 % para la diferencia promedio en leche pd producida en cinco días con los dos tipos de alimentación. 6 ) Ensayar la hipótesis nula H0:{& = O) contra la alternativa Ha:{pd # 0) con a = 0.05. Solución:
a) En principio:
Además, el valor crítico de la distribución t de Student con 14 grados de libertad es el percentil t,,,,, o con Excel:
Por consiguiente, el intervalo de confianza a 95 % para CL, = p, - p2 es:
Es decir, la diferencia promedio (en litros cada cinco días) está en el intervalo:
6 ) De acuerdo con el resultado del inciso a se podría sospechar que la primera dieta hace que las vacas produzcan más leche (más diferencias positivas que negativas). Sin embargo, el simple hecho de que el intervalo de confianza contenga al cero es señal de que las observaciones no son perceptibles (no son significativas) para concluir que alguna dieta las haga producir más leche que la otra. En efecto, el estadístico de prueba es:
En este caso, el valorp de la prueba es @ara prueba de dos colas) el siguiente:
Es un valor demasiado grande para servir como evidencia contra la hipótesis nula. En consecuencia, no existen motivos para rechazar Ho y podemos argumentar que no hay diferencia perceptible entre la cantidad de leche producida con uno u otro tipo de alimentación en las vacas.
11.6. ~JFJBENcIAs ACERCA DE LA DIFERENCIA ENTRE PROPORCIONES DE DOS POBLACIONES
Para el caso d e diferencias de dos proporciones poblacionales, el estimador puntual es 4, - j2. La distribución muestra1 d e este estimador tiene las siguientes características:
- Media o valor esperado:
- Desviación estándar:
-
En esta fórmula, q, = 1-p, y q, = 1-p,, mientras que n, y n, denotan los tamaños de muestra extraídos, respectivamente, de las poblaciones 1y 2. Si todos los productos n,p, y n,q, son mayores o iguales que 5, se supone una distribución normal.
Para elaborar pruebas d e hipótesis o para obtener intervalos de confianza relativos a una diferencia de proporciones se emplea un estadístico basado en proporciones observadas jlyp,. Dicho estadístico (que es el estimador puntual para la expresión 1) es:
Así, un intervalo de confianza a 100(1- a)% parap, -p, está dado por:
Para hacer pruebas d e hipótesis (ya sea d e una o d e dos colas), se emplea el siguiente estadístico de prueba:
En estos casos se emplea un estimador combinado que tome en cuenta la hipótesis nulap, =p,, en caso de que esa hipótesis fuese cierta. Ese estimador combinado (denotado por P ) es:
344
Parte IIL Inferencia estadística
De este modo, podemos corregir la ecuación 2, sustituyendo jJ y 1 tras lo cual la ecuación se escribe así:
fi por jJ,
Ejemplo 11.7. Supóngase que se trata de determinar si el porcentaje de policías mexicanos que son adictos a las sustancias psicotrópicas es mayor entre los de la Policía Judicial (PJ) o entre los de la Policía Federal Preventiva (PFP). A 250 policías judiciales se les practicó examen antidoping y 14 % dieron positivo. Por otra parte, a 300 elementos de la PFP se les aplicó examen antidoping y s610 9 % dieron positivo. Realizar una prueba de hipótesis al nivel de cx = 0.05 para determinar si el porcentaje de adictos a tales sustancias es menor entre los elementos de la PFP que entre los de la PJ. Solución: Seanp, yp, las proporciones de adictos a esas sustancias entre los de la PJ y de la PFP, respectivamente. Sea Ho:(Pl-p, = O}, Ha:@,-p, > O). Tenemos los siguientes datos: n, = 250, jl= 0.14, n, = 300, = 0.09. Aplicando las ecuaciones 3 y 4 se halla que j = 0.1127, sp,-p2= 0.027083. Por otra parte, el estadístico de prueba es:
&
Por último, el valor crítico para prueba de cola derecha es zo,, = 1.645.Como el estadístico de prueba es mayor que este número, entonces se rechaza la hipótesis nula y se concluye que los datos observados son significativos (perceptibles) para afirmar que en promedio hay más adictos a las sustancias psicotrópicas entre los de la PJ que en la PFi? Como comentario final sobre este ejemplo, nótese que si la hipótesis alterna hubiese sido (P, -p, f O), es decir, una prueba bilateral, entonces la zona de no rechazo habría quedado e n el intervalo comprendido entre -1.96 y 1.96, y e n tal caso la hipótesis H, no habría sido rechazada (con el mismo nivel de significación), esto es, n o habría muchos argumentos estadísticos a favor d e la suposición d e que e n generalp, zp,, mas sí los habría a favor d e la hipótesis más específica d e quep, >p,. Con un nivel d e significación prefijado, suele ser más difícil argumentar e n contra d e la hipótesis nula e n una prueba bilateral que e n una prueba dnilateral.
f
'
Sir Ronald Aylmer Fisher ( 1 890- 1962). Logró aplicar con éxito sus conocimientos de estadística en la genética y en la teoría de la evolución de los seres vivos, para lo cual inventó el análisis de uarianza y el diseño de experimentos. Aplicó sus conocimientos de estadística al estudio de muestras pequeñas.
William S. Gosset ( 1 876- 1937). Químico inglés radicado en Dublín, Irlanda. Usaba el seudónimo de Student (el estudiante) en sus trabajos y fue el creador de la famosa distribución t destudent.
THTGENERALACERCA DE PRUEBAS DE HIP~TESIS EN SUS D 1 m A . S MODALIDADES En el siguiente cuadro, anote el inciso que considere correcto. Las operacionespuede hacerlas en hojas separadas.
1. A la máxima probabilidad de rechazar una hipótesis que es verdadera y debió haberse aceptado, se le llama:
a) nivel de significación b) error de tipo 1 c) error de tipo 11
d) poder (o potencia) de la prueba. 2. En un juicio contra un posible inculpado de un crimen, se establece la hipótesis nula de que el acusado es inocente. Si en verdad el acusado cometió el crimen y al final el jurado decide liberarlo por falta de pruebas, entonces el jurado está cometiendo:
a) errores de tipo 1 y 11 b) ningún error c) error de tipo 1
d) error de tipo 11. 3. Varias amas de casa que suelen comprar en el mercado popular de La Merced en el Distrito Federal, queso, huevo, azúcar, frutas y otros productos que se pesan, sospechan que les entregan menos mercancia de la que les cobran. Para confirmar o desmentir
346
Parte 111. Inferencia estadística
esas sospechas, inspectores de la PROFECO (organismo protector de los consumidores) van a realizar una prueba de hipótesis, haciéndose pasar por clientes y adquiriendo varios productos al azar para pesarlos en básculas de precisión. ¿Qué tipo de prueba de hipótesis deben realizar? a) Prueba de cola derecha b) Prueba de cola izquierda o derecha C) Prueba de cola izquierda d) Prueba de ambas colas (prueba bilateral).
4. Con respecto al ejercicio 3, ¿qué parámetro deben someter a prueba los inspectores de la PROFECO! a) b) c) d)
La varianza La media La desviación estándar La moda.
5. Se desea probar la durabilidad de un nuevo tipo de pintura blanca para setializar el asfalto en los cruces peatonales de una ciudad. Mediante contadores electrónicos automáticos instalados en ocho zonas de cruce peatonal (donde previamente se habían pintado líneas blancas con esa pintura), se registró la cantidad de vehículos automotores que transitaron antes de que las líneas se empezaran a borrar. Los resultados fueron los siguientes: 149 400,162 000, 133 700,126 400,108 300,136 500,167 800 y 142 600. Si se supone una distribución normal, entonces un intervalo de confianza de 95 % para el número promedio de vehículos automotores que puede soportar la pintura antes de empezar a borrarse, es de:
6. Un psicólogo desea probar la hipótesis nula de que el tiempo promedio de reacción refleja de un adulto ante una señal repentina es de 0.56 segundos, contra la hipótesis alternativa de que dicho promedio es distinto de ese valor, usando un nivel de significación de a = 0.05. Estudios previos publicados en una revista especializada confirman que la desviación estándar para dicho tiempo de reacción refleja es de o = 0.09055 segundos. El psicólogo que realiza la prueba tomó una muestra aleatoria de 35 individuos y obtuvo el'valor muestra1 de Z = 0.59 segundos. ¿Cuálde los siguientes incisos indica la decisión correcta que hay que tomar? a) El estadístico de prueba es 1.96, y H, no se acepta ni se rechaza b) El estadístico de prueba es 1.96, y H, se rechaza C) El estadístico de prueba es 1.96, y H, se acepta d) El estadístico de prueba es menor que 1.96, y H, se acepta.
7. Según el informe nutrimental del envase de margarina Primavera ChantiUy, por cada 15 g de producto hay 1.9 g de grasas saturadas, lo que equivale a 12.67 % de grasas saturadas. Se supone que el porcentaje de grasas de todo tipo en la margarina sigue
Cap. 1 l . Inferencia estadística para dos poblaciones
347
una distribución normal. Un grupo de nutriólogas de una universidad examinó en el laboratorio una muestra de siete porciones de ese producto, escogidas aleatoriamente en sitios distintos y fechas distintas, y los porcentajes de grasas saturadas que se obtuvieron fueron los siguientes: 12.68 %, 12.69%, 12.66%, 12.65 %, 12.67 %, 12.68 % y 12.66%. Pruebe la hipótesis nula H,:(p I 12.67%) contra la hipótesis alternativa Ha:{p > 12.67%) con un nivel de significación de a = 0.05. ¿Cuál de los siguientes incisos muestra la decisión correcta?
a) Se rechaza H, porque Z - po= O b) No se rechaza H,porque X - CL, = O c) La prueba no funciona porque Z - p, = O d) Se rechaza H,porque la varianza muestra1 es muy pequeña. 8. Durante más de una década se practicó un mismo examen de ubicación de matemáticas básicas a estudiantes de nuevo ingreso de una universidad, y el promedio global de calificaciones (en escala del O al 100) fue de 70 puntos, con una desviación estándar de 13 puntos, pero hace más de 10 años que ese examen se dejó de aplicar. Un grupo de educadores afirma que actualmente el nivel promedio de preparación matemática de estudiantes universitarios de nuevo ingreso es igual que hace 10 años, pero un segundo grupo de educadores sostiene que es peor. Entonces se acuerda realizar una prueba de hipótesis y se aplica aquel viejo examen a una muestra aleatoria de 50 estudiantes de nuevo ingreso a la universidad. Acuerdan un nivel de significación de a = 0.05 y se dan como supuestos una distribución normal y el mismo valor viejo de la desviación estándar. Si el examen tuvo un promedio de calificaciones de 67, ¿cuál de los dos grupos de educadores tiene razón?
a) El segundo, porque 1.645 > 1.63 b) El segundo, porque -1.645 > -1.63 C) El primero, porque 1.645 > 1.63 d) El primero, porque -1.645 < -1.63. 9. Un individuo afirma que tiene algunos conocimientos de cerámica china antigua. Para comprobar o desmentir esa afirmación, un examinador le da un test de 50 preguntas básicas sobre el tema, todas del tipo verdadero o falso. El examinador realizará una prueba de hipótesis con un nivel de significación de a = 0.01. Al calificar el test, se comprobó que el individuo tuvo sólo 32 aciertos. ¿Qué conclusión debe sacar el examinador?
a) El resultado de la prueba no es significativo para afirmar que el individuo conoce algo sobre el tema, porque 1.838 < 2.326. b) Se puede afirmar que el individuo sí conoce algo sobre el tema, porque 1.838 < 2.326. C) El resultado de la prueba no es significativo para afirmar que el individuo conoce algo sobre el tema, porque 1.838 < 2.576. d) Se puede afirmar que el individuo sí conoce algo sobre el tema, porque 1.838 < 2.576. 10. En la compañia de cerillos La Central afirman que, en el pasado, la desviación estándar de los pesos de las cajetillas de cerillos de 40 g era de o = 0.25 g. Se sospecha que con el uso de las máquinas, el valor de la desviación estándar ha aumentado, lo que ocasiona más variabilidad en el contenido de las cajetillas y quizá amerite una revisión de las má-
348
Parte 111. Inferencia estadística
quinas, pero ello implicaría un costo al detener la producción durante algunos días. Se decide realizar una prueba de hipótesis, haciendo H,:{a = 0.25 g) contra Ha:{o > 0.25 g), con un nivel de significación de cx = 0.05. Para ello se tomó una muestra aleatona de 20 cajetillas y se obtuvo una desviación estándar muestra1 de s = 0.32 g. iAmeritará esa variabilidad aparente detener la producción para revisar las máquinas? a) Sí, porque 31.1296 > 30.1435 b) No, porque 31.1296 > 30.1435 c ) Sí, porque -3 1.1296 < -30.1435 d) No, porque -3 1.1296 < -30.1435.
350
Parte 111. inferencia estadística
Obsérvese que, no obstante su aspecto aparatoso, en general suele reducirse a una expresión sencilla para elecciones apropiadas de sus parámetros v, y v, (véase fig. 12.1). También es interesante señalar que, a diferencia de casi todas las distribuciones continuas importantes, aquí no aparece explícitamente el número e, base de los logaritmos naturales, aunque sí aparece en forma implícita en las funciones gama que forman parte de su expresión.
Figura 12.1. Gráficas típicas de la distribución F de Fisher.
En vista de su importancia, la distribución F se ha tabulado extensamente. La tabla contiene valores de los percentiles F,(v,, VJ para a = 0.05 y 0.01 y para diversas elecciones en cuanto al número de grados de libertad. En la figura 12.1 se han dibujado las gráficas de dos distribuciones F de Fisher. La más alta de ellas es F(12,4) y la más baja es F(4, 2). Resulta relativamente fácil comprobar que sus respectivas ecuaciones se simplifican de la manera siguiente: F(4 , 2) =
8x (1 2x1'
+
;
F(12, 4)=
30 618x5 con x > O en ambos casos (1 + 3 ~ ') ~
Si el estudiante tiene algún software de computadora para dibujar gráficas de curvas, se le recomienda que juegue un rato con distintas elecciones para los grados de libertad v, y v, de la distribución F de Fisher, con objeto de poder apreciar cómo cambia el aspecto de la curva y, si es posible, cómo se simplifica la expresión matemática de la función una vez que se sustituyen los valores específicos de V, y v,. Notará dos cosas: en primer lugar, que a medida que aumentan
Cap. 12. Comparación de las uarianzas de dos poblaciones
35 1
los valores de los parámetros v! y vs,,la curva tiende a desplazarse a la derecha (al igual que ocurre con la distribucion ji-cuadrado); y en segundo lugar, que la expresión matemática final se vuelve cada vez más aparatosa e incontrolable. Por ejemplo, F(8,2) se puede simplificar así: F(8 , 2) =
1024x3 conx 2 O (1 4 ~ ' ) ~
+
En cambio, F(50,20) adquiere una expresión aparatosa: F(50, 20) =
48 849 038 779 735 565 185 546 875 x2*
, conx 2 0
La figura 12.2 muestra la gráfica de esta espectacular expresión.
Figura 12.2. Gráfica de F(50,20).
Finalizamos esta sección con un resultado interesante: Si si y si son las varianzas de variables aleatorias independientes de tarnaños n,y n,, respectivamente, tomadas de poblaciones normales con varianzas respectivas o: y o:, entonces:
.:l.: 03:s: F=m -
0;s;
tiene una distribución F con n, - 1y n,
- 1grados de libertad.
12.2. ~ I E R v A L O SDE CONHANZA PARA RAZONES DE DOS VARMNZAS
Si si y $son las varianzas muestraies de muestras aieatorias independientes de tamano n, y n,, respectivamente, tomadas de poblaciones normales, entonces:
es una variable aleatoria que tiene una distribución F de Fisher con n, - 1 y n2- 1 grados de libertad. Al sustituir esta expresión de F en:
se llega al siguiente resultado para un intervalo de confianza relativo a P.o:
o;
1
'
Si S: y 4 son los valores de las varianzas de muestras aleatorias independientes de tamaño n, y n,, respectivamente, tomadas de dos poblaciones nor-
oz
males, un intervalo de confianza de (1- a)100% para 2: esta dado por:
o2
I
Se pueden obtener límites de confianza del (1 - a)100% correspondientes de ol/O, obteniendo las raíces cuadradas de los límites de confianza.
12.3. PRUEBADE HIP~TESIS PARA LA VARIANZA DE DOS POBLACIONES
Dadas muestras aleatorias independientes de tamaño n, y n, tomadas de dos poblaciones normales con las varianzas cf y a:, respectivamente, debemos obtener que las regiones críticas correspondientes de tamaño a , para probar la hipótesis nula = 4 contra las alternativas unilaterales cf < c$ o bien cf > o:, son respectivamente:
<
Cap. 12. Comparación de las uarianzas de dos poblaciones
353
son valores de la tabla F. La región crítica apropiadonde F,;, -,;,-, y Fa,. piada para demostrar la hipótesis nula contra la alternativa bilateral o: # o: es: -];,
Antes de proseguir, damos unas tablas de la distribución F de Fisher, que hemos generado con ayuda del Excel. Cabe señalar que esta distribución también se suele conocer con el nombre de distribución F de Snedecor-Fisher, o distribución F de Snedecor.
Las tablas 12.1 y 12.2 se elaboraron usando Excel. Son muy útiles para el trabajo estadístico relacionado con la comparación de las varianzas de dos poblaciones. Jerzy Neyman ( 1 894- 198 1). Matemático de origen polaco, luego se naturalizó ciudadano estadounidense. Desarrolló la teoría de la estimación y las pruebas de hipótesis. Publicó trabajos notables en estadística matemática teórica que dieron un impulso decisivo a esta ciencia.
Boris \/: Gnedenko ( 1 9 12- 1995). Fue uno de los más distinguidos probabilistas del siglo m.Escribió 2 13 trabajos y varios libros sobre teoría de probabilidades y estadística matemática. En particular, su monumental Curso de probabilidad alcanzó varias ediciones y fue traducido a más de I O idiomas: todavía es un clásico.
Tabla 12.1. Valores críticos de la distribución F de Fisher: F,,, ( x , v,, v,). I
1
1
w m
Tabla 12.1. Valores críticos de la distribuciónF de Fisher: F,,, ( x , v,, v,). (Continuación.)
1 2
.
-LA
89
VI
"2
12
243.90465 19.412482
,
15
20
24
245.94920
248.01557
249.05239
19.429081
<
19.445679 .
19.454092
30
40
60
1.20
999
m
250.09649
251.14423
252.19560
253.25426
254.18558
254.31655
19.470690
19.462504 A
19.479103
19.487288
--
19.494792
19.495928
w
Tabla 12.2. Valores críticos de la distribuciónF de Fisher: Foo, ( x , v,, v,). "2
--
1845
4999.33%
5624.2570
5403.5336
6
5 5763.9554
7
5858.9503
5928.3338
8
10
9 6022.3974
-
5980.9536
6055.9250
99.164026
99.251338
99.302270
99.331373
99.356839
93.375029
99.389581
99.396857
--3
34.116056
30.816409
-29.456714
28.710019
28.237082
27.910573
27.671376
27.489477
27.344868
27.228452
4
21.197593
17.999810
16.694230
15.977093
15.521891
15.206751
14.975740
14.798843
14.659236
14.546004
" 258127
13.274075
12.059900
11
.IA AL->, I I
10.672238
10.455551
'A30n2"
10.157692
10.051053
-
745193
9.7795692
9
-
246346 1 -
8.4512521
7
ln'OTL
-
i
7.9760412
7.8741778
8.4660314
8.2600309
1
7.1913746
6.9928774
3
6.7187784
6.6200982
8
11.258635
8.6490672
7.590:
.O060651
1
6.3706693
6.1776291
6.0288130
5,9105787
5.8142859
9
10.561507
8.0215159
6.991!
,4220558 ---
'
5.8017804
5.6128329
5.4670863
5.3511258
5.2565383
'"044232
7.5594926
6.552>=~7
,9943659
5.385"Ma
-
5.2001496
5.056676O
XnA24216
4,8491415
6.2167373
5.6683120
5.069
1.8860329
4.744492
15449
4.5392881
3302788
5.9525291
5.4119482
4.820
L.6395030
4.499384
75161
4.2%0551
E3
9.0738013
5.7393663
4.4410358
4.3020805
4.19
4.1002863
14
8.8616616
3.9394195
15
8.6831733
16
8.5309466
17
8.3997520
-
6461008
LZcQQAco
-
5.6363660
-
i
1
1
5.2053224
4.8615902
5.5638907
5.0354174
4.6949822
4.4558419
4.2778652
4.1399630
4.02'
5.4169504
4.8931952
4.5556021
4.3182808
4.1415547
4.0044483
3.8947974
5.2922360
4.7725734
;
4.2016381
4.0259351
8
3.78
3.6909285
3.68
3.5930725
'
4.6203468
/
3.8049279
5.1850293
4.6689479
4.1014800
3.9267434
4
'
4.0146233
3.8406256
3.7054235
3.5970515
3.5081484
!
3.9385668 1
3.7652512
3.6305323
3.5225014
3.4337972
3.871&7
3.6987444
3.5644234
3.4566767
3.3681999
-
2854967
6.0128968
5.0919198
4.5790216
-
1849976
5.9259264
5.0102926
4.5002366
20
8.0959808
5.8489604
4.9382152
4.4307171
.,
21
8.0166274
5.7804073
4.8740390
4.3688146
4.0421355
3.8117491
3.6395704
3.5056473
3.3981564
3.3098218
22
7.9453457
5.7190164
4.8166271
4.3134492
3.9879637
3.7583163
3.5866492
3.4530387
3.3457752
3.2576111
3.5390144
3,4056882
3,:6236
3.21:6
1 . .
4
3
99.000317
-'"
AA
2
1
Vi 00
"1
501914
-
2 -
,
P
2
,
,
,
J
1
/
,
3.7102268
,
Tabla 12.2. Valores críticos de la distribución F de Fisher: Fo,, ( x , v,, v,). (Continuación.)
En todas las estimaciones de intervalo y pruebas de hipótesis de los capítulos anteriores se partió de la suposición de que las poblaciones a estudiar seguían una distribución normal o, en el peor de los casos, aproximadamente normal; y cuando ello no se daba, entonces se suponía que las muestras tomadas eran lo bastante grandes para que el Teorema Central del Límite garantizara que las distribuciones muestrales o los estadísticos empleados tuvieran distribuciones aproximadamente normales. Ese tipo de pruebas (o métodos) se acostumbran llamar pruebas paramétricas (o métodos estadísticos paramétricos). En este capítulo, vamos a introducir el estadístico de enumeración xZ de Pearson, para el cual no se requiere la hipótesis de normalidad. Tales estadísticos se llaman estadísticos no paramktricos (o de distribución libre), y las pruebas de hipótesis que con ellos se realizan se llaman pruebas no paramdtricas. El estadístico x2 de Pearson se emplea en pruebas de hipótesis para lo que se llama bondad de ajuste y para independencia de datos, y se utiliza cuando los datos representan frecuencias tanto absolutas como relativas, incluyendo proporciones y datos categóricos. En capítulos posteriores se examinarán algunas otras pruebas no paramétricas usuales, incluso la llamada prueba de rango con signo de Wilcoxon, la cual es una alternativa sencilla para las pruebas correspondientes a dos muestras apareadas (o emparejadas), que se expusieron en el capítulo anterior.
13.2. EMPLEO DE LAJI-CUADRADADE ~ A R S O N PARA LA BONDAD DE AJUSTE
x2
Sin duda, el uso más importante del estadístico de Pearson es para comprobar si una distribución de frecuencias o de datos observados se ajusta o difiere de alguna distribución teórica previamente establecida. El estadístico de Pearson se define como sigue:
x2
donde la O significa frecuencias observadas y la E significa frecuencias esperadas. Naturalmente, tanto la suma de frecuencias observadas como la suma de frecuencias esperadas son iguales al total de frecuenciasN, es decir, =N, =N. De aquí que la expresión 1sea equivalente a:
m
a
x2
Si el número de categorías o clases es igual a k, entonces el estadístico de Pearson tenderá a una distribución ji-cuadrada con v = k - 1 grados de libertad (de ahí su nombre), en el caso de que las frecuencias esperadas puedan calcularse sin la necesidad de estimar parámetros a partir de los estadísticos muestrales. Como se ha explicado antes, la razón de restar 1a k estriba en que si se conocen k - 1de las frecuencias esperadas, entonces la frecuencia restante queda determinada en forma única. Por otra parte, puede ocurrir que las frecuencias esperadas sólo se puedan calcular estimando m parámetros de la población a partir de los estadísticos muestrales, en cuyo caso el número de grados de libertad se reduce a v = k - 1- m. Los criterios descritos aquí sólo deben emplearse cuando cada una de las frecuencias esperadas sea al menos igual a 5. Ejemplo 13.1. Los siguientes datos aparecieron en elJournal of tbe American Statistical AssociatlOn, vol. 31, pp. 376-380. Durante un periodo de 96 años se registraron
las vacantes para empleo en la Suprema Corte de Justicia de Estados Unidos, ya sea por muerte o renuncia de alguno de sus . El tamaño de muestra es n = 96.
""cantes
Cap. 13. La prueba ji-cuadrada de Pearson
36 7
Supóngase que se sospecha que tal vez se podrían ajustar estos datos mediante un modelo teórico de Poisson, en el cual el parámetro h se toma como la media aritmética ponderada de esta distribución empírica, esto es:
Se requiere hacer ahora un comparativo del modelo teórico (o esperado) 969 (k; 0.5), con respecto a los valores observados en la tabla señalada. Luego se realiza la prueba ji-cuadrada para la bondad de ajuste entre los datos reales observados y el modelo teórico que se presume (Poisson). Solución: La razón de suponer un modelo de Poisson estriba en que de los datos observados se aprecia que la ocurrencia de una vacante por muerte o renuncia es un acontecimiento de muy baja probabilidad en un intervalo corto de tiempo y que además las ocurrencias de vacantes son independientes. Siempre que se tienen ocurrencias independientes poco probables, se debe intentar el modelo de Poisson. Con ayuda de Excel, obtenemos la siguiente tabla:
Para el cálculo de la última fila se usó la siguiente sintaxis con Excel:
(Tmbién podría hallarse restando de 96 la suma de los cuatro valores anteriores.) El único defecto que hallamos ahora es que en las últimas dos filas las frecuencias esperadas son menores de 5, lo cual va en contra del supuesto establecido líneas arriba para la validez de la prueba. Este defecto se puede subsanar si reducimos las clases, agrupando las tres últimas en una sola clase bajo la etiqueta de "dos o más". De este modo tendremos sólo tres categorías o clases, a saber: n, = número k = número de años con de vacantes k vacantes durante el año t (observado) A
-
-59 !
27
nk=ndmero de años con k vacantes (modelo esperado con distribución de Poisson) 58.227 29.114
368
Parte N. Estadística no paramétrica
Ahora se procede a calcular el estadístico xZde Pearson como sigue:
Ahora veamos qué tan bueno result6 ser el ajuste. Sea H, la hipótesis nula de que las frecuencias observadas siguen una distribución de Poisson con parámetro h = 0.5. La hipótesis alternativa es que semejante ajuste no procede. Tomemos a = 0.05 como nivel de significación de la prueba. Ahora bien, en tablas (o con Excel) hallamos el valor crítico para una distribución ji-cuadrada con 3 - 1 - 1 = 1grado de libertad. (El número de grados de libertad se obh'me restando el número de clases o renglones menos uno, menos el número depardmetros desconocidos:v = k - 1 - m.) Obtenemos, por tanto:
En consecuencia,la zona de rechazo está a partir de este número y en adelante (fig. 13.1).Como 0.371 c 3.84, no hay motivos para rechazar la hipótesis nula, luego entonces la hipótesis de una distribución de Poisson es perfectamente plausible. Cuanto más cercano a cero sea el valor del estadístico jicuadrado de Pearson, tanto mejor será el ajuste entre los datos observados y el modelo teórico propuesto. En este caso, por ejemplo, el ajuste resultó extraordinariamentebueno.
Figura 13.1. Distribuciónji-cuadrada con un grado de libertad.
OBSERVACI~N: Cabe señalar, a propósito d e este ejemplo, que muchos científicos famosos (químicos, biólogos, médicos y físicos) lograron ajustes similares con una distribución d e Poisson a partir d e datos observados e n la realidad durante su trabajo experimental. Un ejemplo notable lo describió el famoso biólogo italiano Salvador E. Luria, ganador del Premio Nobel d e Medicina en 1969 (junto con Max Delbrück). En su ameno libro autobiográfico A Slot Macbine,A Broken
Cap. 13. La prueba ji-cuadrada de Pearson
3 69
Test Tube (Harper and Row, 1984), S. Luria describe con detalle cómo fue que sus conocimientos d e las distribuciones estadísticas le ayudaron a rechazar la hipótesis de que las bacterias resistentes al ataque d e virus bacteriófagos ("fagos") lograban su inmunidad gracias a mutaciones espontáneas que ocurrían durante el crecimiento bacterial, en contra d e la hipótesis prevaleciente de que las bacterias se volvían resistentes a causa de su o con los fagos. Como describe Luria con mucho detalle en su libro, la segunda hipótesis debería responder a una supuesta distribución de Poisson para las bacterias que se volvían resistentes. El análisis estadístico minucioso de sus observaciones lo condujo a la conclusión correcta, y ese fue un paso crucial en sus descubrimientos sobre la inmunidad de ciertas células ante el ataque de virus, lo cual a su vez permitió realizar avances en el estudio de la resistencia de algunas células contra invasiones cancerígenas. Lo curioso, según menciona Luria, fue que ese gran descubrimiento, que a la postre le reportó el Premio Nobel, pasó inadvertido a muchos otros químicos y biólogos, porque éstos soslayaron la importancia de la teoría de las probabilidades y la estadística en el análisis de las observaciones experimentales. Ejemplo 13.2. Johann Gregor Mendel (1822-1884) h e un religioso y botánico austriaco que estudió la herencia y la hibridación de los vegetales. En uno de sus experimentos con hibridación de chícharos (guisantes), de un total de 556 chícharos observó que había 315 lisos y amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su teoría de la herencia, estos números deberían presentarse en la proporción 9:3:3:1. Con la prueba ji-cuadrada de la bondad de ajuste, averiguar si hay evidencia que permita dudar de su teoría al nivel de significación de 0.05. Solucidn: Los números esperados (frecuencias teóricas), de acuerdo con su teoría de la herencia, deberían ser los siguientes: -
,
Lisos
Rugosos
Amarillos
9 x 55
Verdes
3 x 5 5 =~1 v r . ~ 5
3
16 16
1
I
-A D U =
16
3r.13
Tenemos entonces las siguientes cuatro categorías: AL
Observado Esperado
315 312.75
AR
101 104.25
VL 108 104.25
34.75
El valor del estadístico ji-cuadrado de Pearson es aquí:
Al igual que en el ejemplo anterior, es un valor muy próximo a cero, lo cual indica que sin lugar a dudas el ajuste será otra vez irable. En efecto, como hay cuatro cate-
370
Parte N. Estadística no paramétrica
gorías, se va a contrastar con el valor crítico x&, de la distribución ji-cuadrada con 4 - 1 = 3 grados de libertad. A diferencia del ejemplo anterior, aquí se trata de unapoblación multinomial en donde no había ningún parámetro desconocido. En estos casos, el número de grados de libertad es v = k - 1.Con Excel hallamos:
También se puede hallar este valor en una tabla de percentiles de la distribución jicuadrada. Como anticipamos, el valor del estadístico de prueba (0.470) resultó ser menor que este número (y por mucho), así que no hay motivos para rechazar la teoría de Mendel sobre la base de este experimento; por el contrario, el ajuste entre el modelo teórico y las observaciones reales es bastante irable. En la figura 13.2 aparece la gráfica de la distribución ji-cuadrada con tres grados de libertad, cuya ecuación matemática se puede reducir a esta expresión:
7.81
Zona de rechazo de la hip6tesis H, -
Figura 13.2. Distribución ji-cuadrada con tres grados de libertad.
En resumen:Para ejemplos de aproximación con modelo de Poisson se deben tomar v = k - 2 grados de libertad, mientras que para ejemplos de población multinomial se deben tomar v = k -1 grados de libertad (como en el ejemplo 13.2). Aquí k es el número de categorías o clases, es decir, el número d e términos en la suma. Cuando ocurra que algunas de las frecuencias esperadas sean menores que 5, se deberán agrupar previamente algunas clases (generalmente son las primeras olas últimas), como hicimos en el ejemplo 13.1. Proponemos ahora al
Cap. 13. La prueba ji-cuadrada de Pearson
37 1
estudiante que intente resolver el siguiente ejercicio por sí solo en unas hojas de papel o un cuaderno. Ejercicio 13.1. En el Aeropuerto Internacional de la Ciudad de México se trata de averiguar si el flujo de llegadas de aviones por cada intervalo de cinco minutos se puede aproximar con un modelo de Poisson. El investigador observó los siguientes datos, donde c = cantidad de aviones que aterrizaron en un intervalo de cinco minutos. Se tomaron 128 mediciones aleatorias para este parámetro c.
De manera análoga al ejemplo 13.1, obtenga la media de estos datos para tener el parámetro p = h en el modelo de Poisson sugerido. Notará que las frecuencias esperadas de las primeras dos clases son menores que 5 en cada caso, así que puede agruparlas en una sola clase ("Oo 1"). Lo mismo ocumrá con las últimas dos clases (9 y 10 o más), en cuyo caso podrá agruparlas también en una sola clase: "9 o más". Use a = 0.05. Al aplicar la prueba de bondad de ajuste de Pearson, debe tomar 9 - 1- 1= 7 grados de libertad. Después de resolver el ejercicio, compare con la respuesta que damos a continuación, pero no la mire ahora, por favor. Respuesta del ejercicio:El estadístico X* de Pearson vale 10.9766.Por otra parte, en tablas de percentiles de la distribución ji-cuadrada (al final del libro), hallamos que x::,, (con v = 7) tiene el valor de 14.0671. A partir de ese punto y a la derecha es zona crítica (zona de rechazo). Como 10.9766 queda a mano izquierda de ese valor, entonces no se de un modelo de Poisson para el flujo de llegadas de aviopuede rechazar la hipótesis H,, nes por unidad de tiempo en el Aeropuerto Internacional de la Ciudad de México. Si su respuesta coincide con todo esto, ¡felicitaciones!
Como la distribución ji-cuadrada es una distribución continua, entonces es posible y deseable introducir una corrección por continuidad, sobre todo cuando las frecuencias observadas y esperadas no son muy numerosas. Esto es análogo a lo que se hace con la distribución normal cuando se usa como aproximación de la distribución binomial.
3 72
Parte N. Estadistica no paramCtrica
La wrreccibn de Yates para la continuidad es la siguiente:
=E(1 k
n2(corregida)
i=l
0, - 4
1 -u2
E,
Esta corrección, ideada por el estadístico inglés Frank Yates (1902-1994), puede considerarse como opcional, aunque se recomienda cuando las frecuencias observadas y esperadas son menores que 10, pero no menores o iguales a 5, en cuyo caso es mejor usar otra prueba especial, llamada la prueba de Fisher-Irwin. Si las frecuencias observadas y esperadas son mayores o iguales a 10, los resultados obtenidos con la corrección de Yates o sin ella son casi iguales. Ejemplo 13.3. El gerente de un supermercado quiere averiguar si los clientes tienen preferencia por alguna de las 10 cajas (sin contar la caja rápida) o si todas reciben en promedio la misma cantidad de clientes. Para elio, en un día cualquiera realizó un registro del número de clientes que habían ingresado a cada caja (excepto la caja rápida), con los siguientes resultados:
2 3 4 5 6 7 8 9 1 0 Núm. declientes 145 168 154 170 150 147 166 159 149 172
Caja
1
Realizar una prueba de hipótesis con un nivel de significación de a = 0.05 usando la corrección de Yates. SolucMn: En total se registraron 1580 clientes ese día, así que el número esperado de clientes en cada caja (bajo la hipótesis de no preferencia) es de 158. Podemos calcular el estadístico X' de Pearson, como en los ejemplos anteriores, o bien podemos usar la corrección de Yates, que es siempre preferible. Veamos:
Como son k = 10 categorías, buscamos el valor crítico (o percentil) de la distribución ji-cuadrada con 10 - 1= 9 grados de libertad. Obtenemos (con Excel):
La hipótesis de no preferencia se rechazaría si la x2 corregida que calcularnos hubiese sido mayor que este número, lo cual está muy lejos de ser el caso. Por consiguiente, se concluye que no hay, ni remotamente, argumentos para pensar que los clientes tienen preferencia por alguna de las cajas del supermercado.
13.4. TAsm DE CONTINGENCIA E INDEPENDENCIA DE DATOS ASOCIATIVOS
En los ejemplos anteriores, las frecuencias observadas ocupaban una sola fila y k columnas (o categorías). Ese tipo d e tablas s e llaman tablas de 1 x k o tablas de clasificación simple. Este concepto se puede generalizar para tablas d e b filas y k columnas, las cuales se llaman tablas de clasificación múltiple o tablas de contingencia En tales casos, el estadístico ji-cuadrado d e Pearson adquiere la siguiente expresión:
Con un nivel d e significación a,se rechazará H, si el valor calculado d e este estadístico excede al valor crítico X: con (b - l)(k - 1) grados d e libertad. Esto, naturalmente, e n caso d e que las frecuencias esperadas puedan calcularse sin necesidad d e estimar parámetros poblacionales a partir d e los estadísticos d e muestra. Si no fuera ese el caso, esto es, si dichas frecuencias sólo pudiesen calcularse estimando m parámetros poblacionales a partir de los estadísticos d e muestra, entonces habría que tomar (h - l)(k - 1) - m grados d e libertad. Las pruebas que se realizan con tablas d e contingencia tienen como finalidad averiguar si hay independencia entre varios atributos. Veamos un caso concreto. Ejemplo 13.4. En un estudio de mercadotecnia realizado en una universidad, se trata de averiguar si el estado ocupacional de una persona (o el gremio al que pertenece) se puede asociar con el mayor o menor apego a las marcas de productos que compra. Para ello se realizó una encuesta entre personas al azar, de los tres tipos principales de ocupación dentro de la universidad: burócratas, profesores y estudiantes. En total se realizó la encuesta con 230 personas dentro de la universidad (90 estudiantes, 65 profesores y 75 burócratas). Las tres categorías de la encuesta eran: muy apegado (muy leal) a las marcas de productos que compra; moderadamente apegado (más o menos leal) a las marcas de productos que compra; y no es apegado a las marcas (o no le importan las marcas de las cosas que compra). Se registró la siguiente tabla de contingencia de 3 x 3:
Muy Oczacfdn apegada Estudiante 30 14 Profesor Burócrata 34 Totales ' 78 -.
Moderadamente No es apegado Torales . apegado 42
18
90
20
31
65
25
16.
75
87
65-
/
230
Realizar una prueba con un nivel de significación de a = 0.01 para ensayar la hipótesis de independencia entre el estado ocupacional y la característica de apego a las marcas de productos que compran estos tres tipos de personas, sin emplear corrección de Yates. Solución: Las frecuencias esperadas se obtienen multiplicando las frecuencias relativas observadas de cada característica por los totales de las personas en cada gremio. Por ejemplo, para hallar la frecuencia esperada de estudiantes que son muy apegados a las
3 74
Parte N. Estadística no paramétrica
marcas, observamos que 78 de 230 personas fueron muy apegadas a las marcas, así que 78 como probabilidad empírica para esa característica. Multiplicando este tomamos 230 número por cada uno de los totales de personas en cada gremio (90,65 y 7 9 , obtenemos, respectivamente, 30.5,22.1 y 25.4. De la misma forma, procedemos con las demás características, y con los resultados elaboramos la siguiente tabla:
Ocupación
Estudiante Profesor
~ode&ente apegado -7- -E O
Muy apegado O E
--.
'
Burócrata
No es apegado
E-T
O
30 14
30.5 22.1
42
34.1
18
25.4
20
24.5
18.4
34
25.4
25
28.4
31 16
Ahora se procede a calcular el estadístico
21.2
xZde Pearson:
x:,,,,
Por otra parte, el valor crítico de con (3 - 1) x (3 - 1) = 4 grados de libertad es precisamente el percentil99 de la distribución. Con tablas (o con Excel) hallamos que vale 13.2767. Como el valor calculado para el estadístico de prueba (21.078) está a la derecha de este punto, entonces se rechaza la hipótesis de independencia y se concluye que la ocupación de las personas dentro de una universidad está asociada de alguna manera a su grado de apego o lealtad a las marcas de los productos que compra. ¿Por qué? Misterios de la psicología laboral, o quizá la explicación estriba en que los profesores están muy inmersos en su trabajo académico y de investigación,y tienen poco tiempo libre para algo que consideran tal vez frívolo. Ejemplo 13.5. En una fábrica de resistencias para parrillas eléctricas, los obreros trabajan en tres turnos (diurno, vespertino y nocturno). El gerente tiene la curiosidad de saber si la cantidad de parrillas defectuosas que salen de la línea de producción está asociada al horario de trabajo de los obreros o si no depende de ello. Para averiguarlo indicó a los obreros de cada turno que pusieran una pequeña marca de color distintivo a las parrillas que producían. Al final se obtuvieron los siguientes datos:
1 Defectuosas
1 1
Diurno 45
No defectuosas
905
Totales
950
1 Vesbertim / 55 1
1
890 945
Nocturno 70
t
Totales
170
1 1
1 930 1 1 2665 2835
Realizar una prueba con un nivel de significación de a = 0.05 para ensayar la hipótesis de que las parrillas defectuosas de la línea de producción son independientes del turno de trabajo. Solución:Las frecuencias esperadas se calculan de la misma forma que en el ejem950 = 0.3351 que una parriplo anterior. Así, tomamos como probabilidad empírica 2835
Cap. 13. La prueba ji-cuadrada de Pearson
375
iia al azar haya sido producida en el turno diurno. Si multiplicamos este número por los respectivos totales de parrillas defectuosas y no defectuosas, obtendremos las frecuencias esperadas para el turno diurno, las cuales podemos redondear a un dígito decimal después del punto: 0.3351 x 170 = 57.0, etc. Así se obtiene la siguiente tabla comparativa de frecuencias observadas y esperadas: Diurno O
Defectuosas Nodefectuosas
45
*
905
i
Vespertino
.
E
O
57.0 893.0
E
N&O
O
E
55
56.7
70
56.3
890
888.3
870
883.7
Tenemos, entonces:
Por otra parte, la distribución ji-cuadrada con (3 - 1) x (2 - 1) = 2 grados de libertad coincide, casualmente, con la distribución exponencial cuyo parámetro es h = 'h. El valor para este número de grados de libertad es 5.33. Como 6.29 > 5.33, se rechaza la hipótesis de independenaa y se concluye que es muy probable que la cantidad de parrillas defectuosas tenga que ver con el horario de trabajo de los obreros. La explicación podría atribuirse a la mayor fatiga o menor concentración de las personas en determinados horarios.
~ 0 , ~ ~
13.5. FORMA MATEMATICA Y G R A ~ C ADE UNA D I S ~ ~ B ~ CJI-CUADRADA I ~ N
La distribución ji-cuadrada con dos grados de libertad es una distribución gama con parámetro de forma r = 1 y parámetro de escala h = '/z, o distribución de Erlang con esos parámetros. También coincide con una distribución de Weibull con los mismos parámetros mencionados y, por consiguiente, con una distribución exponencia1 cuyo parámetro es h = '/2. Es un caso curioso que una misma expresión matemática se ajuste a cinco (!) distribuciones famosas diferentes (gama, Erlang, exponencial, Weibull y ji-cuadrada). Sin duda, es una marca única en la teoría de las distribuciones estadísticas. Su gráfica se ilustra en la figura 13.3.
Figura 13.3. Distribución ji-cuadrada con dos grados de libertad.
George Waddell Snedecor (1 882- 1974). Nació en Memphis, Tennessee, pero enseñó estadística en lowa. Fue el creador de la metodología de regresión múltiple e hizo también valiosas aportaciones a la teoría de correlación y regresión, así como en el análisis de varianza. Junto con R. A. Fisher, creó la famosa distribución F de Snedecor-Fisher. Sus libros más famosos fueron Analysis of Variance and Covariance (1 934) y Statistical Methods ( 1 937).
Aleksander Y: Khinchin (1 894- 1959). En 1927, publicó algunos trabajos de enorme importancia acerca de la ley de los grandes números y sentó las bases matemáticas rigurosas de la teoría de las probabilidades. Realizó también valiosas contribuciones a la mecánica estadística y la teoría de nhmeros. Sus dos libros más notables fueron Principios matemáticos de [a mecánica estadística (1 943) y Fundamentos matemáticos de la estadística cuántica (1 95 1 ) . Entre sus alumnos más distinguidos se destacó B. V. Cnedenko, quien llegaría a ser otro famoso probabilista y estadístico.
& %
re
'
.
*
44.w
a L.
Frank Yates (1 902- 1994). Matemático inglés que contribuyó al desarrollo de métodos estadísticos aplicados a la biología experimental. Fue un entusiasta impulsor del uso de computadoras en la estadística.
La prueba ji-cuadrada d e Pearson que se examinó en el capítulo 13 es, sin duda, la prueba no paramétrica que goza de mayor popularidad. En este capítulo, expondremos otras pruebas no paramétricas útiles. Las pruebas estadísticas no pararnétricas no requieren de suposiciones acerca de la distribución de las variables que se manejan, y por lo mismo, son menos eficientes que las pruebas pararnétricas, ya que no utilizan toda la información proporcionada por la muestra. Sin embargo, las pruebas no paramétricas son especialmente útiles cuando no se puede justificar la normalidad de la población, o cuando las variables d e estudio son categóricas o cualitativas.
Para ensayar la hipótesis nula y = p, contra la alternativa adecuada sobre la base de una muestra aleatoria de tamaño n, se sustituye cada valor d e la muestra mayor que p., con un signo positivo (+) y cada valor menor que dicho número con un signo negativo (-). Los valores que coincidan con CL, se descartan. El número total d e signos positivos es un valor d e una variable aleatoria discreta que tiene distribución binomial con parámetrop = l/2. Para pruebas de cola izquierda o d e cola derecha, la hipótesis nula se rechazará si el número d e signos positivos que se obtiene es perceptiblemente menor o mayor que l/z, respectivamente.
378
Parte /V. Estadística no paramétrica
Ejemplo 14.1. La calidad de una gasolina se mide por octanaje. El octano (C,H,$ es el octavo miembro de la familia de hidrocarburos afines conocidos como alcanos.' Supóngase que se afirma que un nuevo tipo de gasolina tiene en promedio un octanaje de p = 97. Se toman 16 muestras aleatorias de esa gasolina y en cada caso se mide en un laboratorio su octanaje, registrándose los siguientes datos:
Aplicar la prueba de los signos para ensayar la hipótesis nula Ho:{p 1 97) contra la alternativa Ha:{pe 971, con un nivel de significación de a = 0.05. Solución: De acuerdo con la regla de los signos, anotamos un signo positivo por cada valor que exceda a 97 y un signo negativo por cada valor que sea menor que 97. Los valores que sean iguales a 97 se descartan:
Sea X el número de signos positivos (éxitos) en un ensayo binomial donde n = 14. Como sólo salieron cuatro signos positivos, la hipótesis nula Hose rechazará si P ( X I 4) e 0.05. Con Excel calculamos rápidamente P(X I 4):
Se obtiene 0.0898 > 0.05. No se puede rechazar la hipótesis nula y se concluye que, efectivamente, el índice promedio de octano de ese nuevo tipo de gasolina es por lo menos 97, tal como se anuncia.
Para un ensayo de hipótesis bilateral H,:{p = CL,),Ha:{pz q,), se emplea la siguiente regla:
n el valor calculado 2P(Xlx cuandop = l/2) S a , entonces se recha- Six< -y 2
za H,.
- Six> n y e l valor calculado 2 P ( X l x cuandop = l/2) Ia , entonces se recha2
za H,. Además, si n > 10, las probabilidades binomiales pueden aproximarse mediante la curva normal, lo cual resulta cómodo si no se tiene computadora a la mano y los valores de los parámetros usados caen fuera de las tablas binomiales. 'El índice de octano de una gasolina es una medida de su capaadad antidetonante, y se obtiene por comparación del poder detonante de la gasolina con el de una mezcla de isooctano (2,2,4 trimetilpentano) y heptano (C,H,,). Al isooctano se le asigna un poder antidetonante de 100y al heptano de O. Una gasolina de 97 octanos, por ejemplo, se comporta en cuanto a su capacidad antidetonante, como una mezcla que contiene 97%de isooctano y 3 % de heptano.
Cap. 14. Las pruebas no pararnttricas más usuales
379
Ejemplo 14.2. La pila recargable de cierto tipo y marca de computadora portátil (laptop) debe durar en promedio 1.8 horas trabajando antes de que necesite recargarse de nuevo, pero no se está seguro de si el tiempo es mayor o menor que ése. Para averiguarlo, se tomó una muestra aleatoria de n = 11laptops nuevas de esa marca y tipo y se comprobó cuánto tiempo (en horas) trabajaron antes de que necesitaran que la pila se tuviera que recargar. Se registraron los siguientes datos:
Realizar un ensayo de hipótesis Ho:{p = 1.81,Ha:{p# 1.81, con a = 0.05, usando la prueba de los signos. Solución: Empezamos por anotar un signo positivo (+) por cada valor que exceda 1.8, y un signo negativo (-) por cada valor que sea inferior a 1.8, y descartar aquellos que sean iguales a 1.8:
Designemos como éxito a la ocurrencia de un signo positivo, y sea X la variable binornial que representa el número de éxitos en n = 10 ensayos de Bernoulli, conp = l/z. Observamos que ocurrieron sólo tres éxitos; luego: 2 P ( X Í 3 cuando*
= Y,) = 2 x b ( r , 10,
Y,)
M
Esto lo haliamos con Excel usando la sintaxis siguiente:
Se obtiene 0.3438 > 0.05. Entonces, no se puede rechazar la hipótesis Ho:{p = 1.81, es decir, los datos observados no pueden usarse de modo significativo (perceptible) para argumentar contra esta hipótesis, a reserva de tomar una nueva muestra (mayor) y repetir el ensayo.
La prueba d e los signos también puede emplearse para comparar dos conjuntos d e muestras apareadas (o emparejadas), usando un signo positivo (+) por cada diferencia d, positiva y un signo negativo (-) por cada diferencia di negativa. Para ilustrarlo, usaremos el ejemplo 11.6 d e las vacas lecheras, que se resolvió usando la técnica usual para muestras apareadas. Ejemplo 14.3. A 15 vacas lecheras se les suministró cierto tipo de alimentación (dieta) durante cinco días consecutivos y luego otro tipo de alimentación durante otros cinco días consecutivos, y en cada caso se midió la cantidad de leche (en litros) que se les pudo ordeñar (redondeada al litro más cercano):
Nótese que en este caso sólo nos interesa el signo de la diferencia, mientras que con la técnica del capítulo 11 se usó el signo y además la magnitud numérica de la diferencia. Ensayar la hipótesis Ho:{p, - p2 = O} contra la alternativa Ha:{p, - p., > O},con un nivel de significación de a = 0.05. Solución: El estadístico de prueba es la variable aleatoria biomial X con p = l/z, donde X denota el número de éxitos (signos positivos) en n = 14 intentos. De las observaciones se tienex = 9. Luego: 14
P(X 2 9 cuandoP = Y, ) = z b ( x , 14,
Y,) = 1- DISTR.BINOM.(8,14,0.5,1)
x =9
Se concluye que no es posible rechazar la hipótesis nula Ho:{p, - CL, = O},es decir, es muy probable que sea una mera ilusión la apariencia de que las vacas producen más leche en promedio con la dieta 1.Recuérdese que habíamos concluido lo mismo usando la distribución t de Student y la técnica usual para muestras apareadas. Sin embargo, en aquel cálculo se usó como hipótesis alternativa Ha:{pl - CL, $ O}, esto es, se trató como una prueba de dos colas. Podemos hacer también aquí un ensayo de dos colas, en cuyo caso calculamos: 2P(X 2 9 cuandop = l/2) = 2 x 0.212 = 0.412 > 0.05
Entonces con mayor razón se concluye que no es posible rechazar la hipótesis nula Ho: {p, - p, = O).
En 1945, el químico y estadístico estadounidense Frank Wdcoxon (18821965), nacido en Irlanda, publicó una versión mejorada d e la prueba de los signos, en la cual sí se toma en cuenta la magnitud cuantitativa de las diferencias observadas y no sólo los signosazEsto la convierte en una prueba más eficiente, F. Wdcoxon y R. A. Wilcox, Some Rapid Appmrr'vnute Statfstical Procedures, Pmeedings of the American Statistical Society,Nueva York, 1945.
Cap. 14. Las pruebas no paramétricas más usuales
38 1
aunque no tanto como la prueba usual para muestras apareadas que usa la distribución t d e Student, la cual, no obstante, es una prueba paraméuica, toda vez que supone una distribución normal en la población de donde se toman las muestras, mientras que la prueba de Wilcoxon no hace tal suposición, esto es,se trata de una prueba no paramétrica. Esta prueba funciona como sigue. Para ensayar la hipótesis nula H,:{y = po) contra alguna alternativa apropiada, se resta p, de cada valor muesval y se eliminan todas las diferencias iguales a cero. Las diferencias que quedan se clasifican entonces, sin tomar en cuenta los signos, y se les van asignando en forma consecutiva los números 1,2,3,. . . , etc. Si ocurriese que el valor absoluto de dos diferencias fuese el mismo, entonces se asigna a ambas el promedio aritmético de los valores que se les habría asignado si hubiesen sido distintas. La idea d e Wilcoxon se basa en que si la hipótesis nula H,:{y = yo) fuese verdadera, entonces el total d e las sumas positivas debería ser aproximadamente igual al total de las sumas negativas. Dichos totales se representan por w+y w-, respectivamente. Se define además w = mín {w+,w-1. De esta manera, la hipótesis nula H,:{p = po) se rechazará a favor de la alternativa p < y, sólo si ocurre que w+es pequeña y w- es grande, mientras que la alternativa y > pose aceptará si w+es grande y w- es pequeña. Para una prueba de dos colas, se rechazará la hipótesis Ho:{y = yo) en favor d e la alternativa Ha:@ # 1.1,) si ambos w+ y w- (por tanto, w = mín {w+,w-)) son pequeños. Como los términos "suficientemente pequeño" o "suficientemente grande" son vagos, se usa la tabla 14.1, elaborada por Wilcoxon y Wilcox, y empleada en sus estudios con pesticidas en la empresa American Cyanamid Company. Tabla 14.1. Valores críticos para la prueba de rango con signo de Wdcoxon.*
*Para una tabla más detallada y extensa, consúltese el trabajo de Robert L. McComack, "Extended 'Cables of the Wdcoxon Matched Pair Signed Rank Statistic", en J o u m l of tbe American Statistical Asociatim, vol. 60, septiembre de 1965.
En cualquier caso, la hipótesis nula se rechaza sólo si el valor calculado de w+,w O W,según corresponda, es menor o igual al valor hallado en la tabla 14.1. La siguiente tabla indica cuál valor hay que escoger en cada caso:
Todo ello se comprenderá mucho mejor con un ejemplo concreto. Ejemplo 14.4. Retomemos el primer caso que se examinó al principio del capitulo (ejemplo 14.1 con 16 muestras del índice d e octano de cierto tipo de gasolina). Recuérdese que se tenían las siguientes observaciones:
Cap. 14. Las pruebas no paramétricas más usuales
383
Ensayar la hipótesis nula H,:{p 2 97) contra la alternativa ~=:{p e 971, usando un nivel de significación de a = 0.05,mediante la prueba de rango con signo de Wilcoxon. Solución:A cada uno de los números se le resta 97,por lo que se obtienen las siguientes diferencias:
Ahora se eliminan las dos diferencias nulas y se ordenan las restantes 14 de menor a mayor (sin importar el signo). Debajo de ellas anotamos el respectivo rango que les corresponde, de acuerdo con la convención mencionada:
Luego se suman los rangos (no las diferencias) por separado, de las diferencias negativas y las positivas:
Además: w = mín (71.5,33.5)= 33.5
La hipótesis nula H,:{p 2 97) se rechazaría si w+= 33.5 fuese menor que 26 (ya que en la tabla aparece el valor crítico 26 cuando n = 14 y a = 0.05 en una prueba unilateral). Por consiguiente, no se puede rechazar H,, y se concluye que el contenido de octano de esa gasolina sí corresponde con el anunciado.
¿Qué pasa cuando n supera el mayor valor de la tabla, es decir, 30? En tal caso, tanto la distribución muestra1 de W+como la de W se aproximan a una distribución normal cuya media y varianza son, respectivamente, las siguientes (para prueba de cola izquierda):
En ese caso se emplea el siguiente estadístico para determinar la región d e rechazo:
y se compara con las tablas de la distribución normal estándar. Para prueba de cola derecha o d e ambas colas, sólo hay que cambiar W por W o por W, respectivamente.
384
Parte N. Estadística no paramétrica
Ejemplo 14.5. Supóngase que se trata de ensayar cierta hipótesis H,:{p 2 p,} contra Ha:{pe po}, usando el nivel a = 0.05, para una muestra de n = 45 observaciones. Al realizar los cálculos de rango se obtiene finalmente que w+= 373. ¿Se debe rechazar o no la hipótesis H,? Solucidn:
El valorp de la prueba es:
Véase la figura 14.1. Por tanto, no puede rechazarse la hipótesis H,. NOTA:Si hubiésemos usado las tablas extendidas de Roben L. McCornack (véase la nota de la tabla 14.1 en la página 382), para n = 45, a = 0.05 en prueba unilateral, habríamos hallado la cifra 343. Como w+ = 373 excede este valor, la conclusión habría sido la misma: no puede rechazarse la hipótesis H,.
Figura 14.1
14.5.PRUEBA DE RANGO CON SIGNO DE WILCOXON PARA MUESTRAS APAREADAS
Para muestras apareadas (o emparejadas), la prueba de rango con signo de Wdcoxon es también una buena opción. La tabla siguiente sirve como esquema guía:
&ra ensayar H,
P,2 Cl, P,5 P2 P$=P2
Contra Ha Se calcula -
CLi < P2 Pl P2 Y *P2
'
A
W
Ejemplo 14.6. Un señor es dueño de dos zapaterías en distintos rumbos de una misma ciudad y tiene curiosidad en averiguar si en alguna de ellas vende, en promedio, más pares de zapatos o si en ambas vende aproximadamente lo mismo. Para ello comparó las ventas de 16 días elegidos al azar:
Con la prueba de rango con signo de Wilcoxon para muestras apareadas, con un nivel de significación de a = 0.05, ensayar la hipótesis nula de que ambas zapaterías venden en promedio el mismo número de pares de zapatos, contra la alternativa de que las ventas difieren. Solución:Primero hay que tabular las diferenciasy sus respectivos rangos con signo:
Luego se suman, por separado, los rangos correspondientes a diferencias positivas y diferencias negativas: w = G + 12 + 8.5 = 26.5 w+= 3+12+6+10+15.5+15.5+1+8.5+12+3+G+14+3=109.5 w = mín (26.5, 109.5) = 26.5
386
Parte N. Estadística no paramétrica
Finalmente, con a = 0.05 para una prueba bilateral en la que n = 16, hallamos en la tabla el valor crítico 30. Como 26 c 30, se rechaza H,, y se concluye que la venta en ambas zapaterías difiere. Nótese que con el mismo nivel de significación también se rechazaría H,,si la hipótesis alternativa fuese p, > p, (lo cual se sugiere por la gran cantidad de diferencias positivas). En efecto, en tal caso el valor crítico de la tabla sería 36 que también es mayor que el valor calculado para w-.
Hay dos pruebas no paramétricas usuales basadas en la suma de rangos. Una de ellas es la llamada prueba d e Mann-Wbitney-Wlcoxon de la s u m d e rangos, también llamadaprueba Ude Mann o, sencillamente,prueba U. La otra prueba es la llarnadaprueba H (también llamada prueba H de Kwkal-Wallis), que se expondrá en la sección siguiente. Henry Berthold Mann (1905-2000) fue un destacado matemático austriaco que emigró a Estados Unidos en 1938. Uno de sus discípulos fue Donald Ransom Whitney La prueba Ues una prueba de comparación para medias de dos poblaciones. Se selecciona una muestra aleatoria de cada una de las dos poblaciones, denotando por n, y n,, respectivamente, al número de observaciones de la muestra menor y de la muestra mayor. Si ambas muestras fuesen del mismo tamaño, pueden asignarse libremente las etiquetas n, y n?. Luego se ordenan todas las n, + n, observaciones combinadas (en orden creciente) y se sustituye un valor de la sucesión de números 1,2, .. . , n, + n, para cada observación. Al igual que en la prueba de rango con signo, si hubiese dos observaciones iguales, el rango que les tocaría a ambas sería el promedio aritmético d e los números que serían si fuesen distintas. Denótese por rly r,, respectivamente, a la suma de los rangos correspondientes a las n, y n, observaciones de las muestras pequeña y grande. Como sabemos que la suma de los primeros k números enteros positivos es k(k + 1)D, entonces:
+
ri r2=
(n, + n3 (n, + n2 + 1) 2
Resulta claro que si se eligen distintas muestras de tamaños n, y n,, respectivamente, de las poblaciones dadas, se espera que r, y r, varíen. Por tanto, las podemos considerar como valores específicos de las variables aleatorias R, y R,, respectivamente. Para una prueba d e cola izquierda Ho:{p 2 CL,)contra Ha:{p < po), se rechazaría la hipótesis nula si r, fuese pequeño y r, fuese grande. Para una prueba de cola derecha Ho:{p I pO}contra Ha:{p> p,,), se rechazaría Hosi r, fuese grande y r2fuese pequeño. Por último, para una prueba de dos colas, se rechazaría Ho si cualquiera de r, o r, fuese grande y el otro pequeño. En consecuencia, se introducen los estadísticos de prueba U,, U, y U= mín {U,, U,), cuyos valores se calculan en la práctica de la manera siguiente:
Cap. 14. las pruebas no parametricas más usuales
387
El esquema para esta prueba es el siguiente: ~ ~ m a y a i - ~contra , , Y
Pi 2 P2 P,5 P, P1= P2
Pr < w 2 Pl P2 Pl ri.2
'
"
1 Se calcula u2
u
La hipótesis nula será rechazada si el estadístico de prueba correspondiente toma un valor menor o igual al tabulado. En las tablas 14.2 a 14.5 transcribimos tablas de valores críticos correspondientes a la prueba U de Mann. Se encuentran tablas más detalladas y extensas en D. Auble, "Extended Tables for the Mann-Whitney Statistic", en Bulletin of tbe Institute of Eáucational Researcb at Indiana University,vol. 1, núm. 2,1953. Tabla 14.2. Prueba unilateral para a = 0.001; prueba bilateral para a = 0.002.
388 Tabla 14.3. Prueba unilateral para a = 0.01; prueba bilateral para a = 0.02.
Tabla 14.4. Pmeba unilateral para a = 0.025; pmeba bilateral para a = 0.05.
Tabla 14.5. Prueba unilateral para a = 0.05; prueba bilateral para a = 0.10.
.
390
Parte N: Estadística no paramétrica
Ejemplo 14.7. Un negocio de comida rápida tiene dos empleadas A y B, que atienden los pedidos de los clientes. El tiempo de atención a un cliente raramente rebasa los cinco minutos. Para averiguar si en promedio ambas empleadas se tardan lo mismo o no, se registraron los siguientes tiempos en minutos:
Para simplificar la tarea de sumar rangos, sólo se suman los rangos de la muestra menor (r, = 93), y los de la muestra mayor se calculan así:
Realizar una prueba de hipótesis, con un nivel de significación de a = 0.05, para ensayar la hipótesis H,: { p = po) contra Ha:{p f p,) . Solución:Se tiene:
Entonces:
u = mín (57,231 = 23 Ahora buscamos en la tabla la región de rechazo (región critica). Para n,= 8, n,= 10, en una prueba bilateral con a = 0.05, hallamos el valor crítico 17. La hipótesis nula H,:{p = po} se rechazaría sólo si el valor calculado para u hubiese sido I 17, lo cual no es el caso. Por tanto, no se puede rechazarti, y se concluye que no hay diferencia perceptible entre los tiempos promedio que hacen las dos empleadas para atender a los clientes. Obsérvese que tampoco se podría haber rechazado la hipótesis con un nivel de significación mayor, digamos a = 0.10 (lo cual significaría itir una mayor probabilidad de equivocarse al rechazar la hipótesis cuando ésta fuese cierta), toda vez que en la tabla habríamos hallado el valor 20, que todavía es mayor que 23.
Cap. 14. las pruebas no paramétricas más usuales
39 1
Si n, y n, son mayores a los valores que aparecen en la tabla, entonces la distribución muestral de cualquiera de los estadísticos U,, U, y U se apega a la distribución normal. Por ejemplo, la distribución muestral para el estadístico U, sería normal con los siguientes parámetros (media y varianza):
En tal caso, se emplea el estadístico de prueba:
y se realiza el contraste con valores críticos de la distribución normal estándar.
La prueba no paramétrica d e Kruskal-Wallis (prueba H) se usa para comprobar si un grupo de muestras independientes procede o no d e la misma población. En cierto modo, es una versión no paramétrica del análisis d e varianza en una dirección (ANOVA) y puede considerarse como una generalización de la prueba U de Mann-Whitney. La prueba H s e emplea para ensayar la hipótesis nula H, de que k muestras independientes (k > 2) provienen de la misma población o de poblaciones con idéntica media. Tiene la ventaja de que se evita la suposición de que las muestras se seleccionaron d e poblaciones normales. Esta prueba fue introducida en 1952 por los economistas William H. Kruskal (de la Universidad de Chicago) y W Allen Wallis (de la Universidad de Rochester, Nueva York) . La prueba H funciona d e la siguiente manera. Se tienen n observaciones (o datos) provenientes de k muestras, en donde se usa el símbolo ni para denotar el número d e datos en la i-ésima muestra. Luego se ordenan en forma creciente todas las n = n, + n2+ + n, observaciones (aquí puede hacerse en forma decreciente también), etiquetando cada observación con el número natural correspondiente: 1 , 2 , 3 , . . . ,n. Como en las pruebas descritas anteriormente, en caso de empates entre dos o más observaciones, se les asigna a cada una el promedio aritmético de los números que les tocarían si fuesen diferentes. Luego se denota por R, a la suma de los valores (rangos) correspondientes a las ni observaciones de la i-ésima muestra. Se usa el siguiente estadístico de prueba:
392
Parte N. Estadística no paramétrica
el cual tiende a una distribución ji-cuadrada con v = k - 1 grados d e libertad en el caso d e que H, sea verdadera, suponiendo que todas las n,2 5. En la expresión 1, las letras mayúsculas denotan variables aleatorias (en general), así que para valores específicos d e dichas variables se usan las mismas letras, pero minúsculas. Así, se emplea el siguiente estadístico d e prueba:
, v =k - 1 Si el valor d e este estadístico es mayor que el valor crítico ~ 2con grados de libertad, entonces se rechaza la hipótesis nula H,, d e que las muestras provienen d e poblaciones con medias iguales. Recuérdese que, con Fkcel, el valor crítico ~ 2se, calcula con la siguiente sintaxis: La figura 14.2 ilustra la zona de rechazo.
Figura 14.2. Distribución x2 con k - I grados de libertad. Ejemplo 14.8. Los estudiantes de tercer año de preparatoria (60. año de bachillerato) de una escuela técnica se dividen en tres áreas, dependiendo de las profesiones que tengan en mente estudiar: área químico-biológica (QB), área físico-matemática (FM) y área económico-istrativa (EA). Se quiere averiguar si los estudiantes de las tres áreas tienen más o menos la misma habilidad para ortografía y redacción o difieren en ella. Para ello, se escogieron al azar 21 estudiantes (7 del área QB, 8 del área FM y 6 del
Cap. 14. Las pruebas no paramitricas más usuales
393
área EA) y se les aplicó un examen básico y sencillo sobre temas d e redacción y ortografía, con los siguientes resultados (en escala del O al 100) [datos publicados por Stockton and Clark, 19801:
Aplicar la prueba H de Kruskal-Wallis para ensayar la hipótesis nula de que no hay diferencia significativa (perceptible) entre los estudiantes de cada una de las tres áreas en cuanto a su habilidad promedio para la ortografía y la redacción. Usar un nivel de significación de a = 0.05. Solución: A primera vista parece que los estudiantes del área físico-matemática salieron mejor (en términos generales) en el examen, pero ¿podría ser sólo una ilusión o una casualidad?Veamos:
Entonces se calcula la suma:
Por consiguiente:
394
Parte IV. Estadística no paramétrica
Como el número de categorías es k = 3, comparamos este dato con el valor critico de la distribución ji-cuadrada con k - 1 = 2 grados de libertad, el cual es:
Obviamente, 8.52 queda a la derecha de este valor critico, es decir, queda en zona de rechazo. Por tanto, se rechaza la hipótesis y se concluye que, en términos generales,los estudiantes de las tres áreas tienen diferente habilidad para la ortografía y la redacción.
Esta prueba no paramétrica se basa en el orden en que se van obteniendo las observaciones muestrales para datos dicotómicos (dos muestras independientes). Puede usarse para datos categóricos o para datos cuantitativos. En este caso, se define la variable aleatoria V, que representa el número total de rachas que ocurren en la sucesión completa de los datos observados. Los contrastes de valores calculados se hacen cotejando unas tablas especiales (tablas 14.6, 14.7, 14.8, 14.9 y 14.10). Dichas tablas fueron elaboradas por C. Eisenhart y F. Swed, y publicadas en la revista Annals of Mathematical Statistics, vol. 14, 1943, en un artículo cuyo título es "Tables for Testing Randomness of Groupings in a Sequence of Alternatives". Tenemos una sucesión de dos símbolos en donde pueden ocurrir algunas rachas de uno u otro símbolo. Denotamos por n, al número de símbolos asociados con la categoría que tiene la menor frecuencia observada y por n, al número de símbolos asociados con la otra categoría. Por ejemplo, en una línea de producción de artículos de plástico hechos con molde, denótese por D al artículo defectuoso y por N al no defectuoso. Supongamos que 12 artículos consecutivos salen de la línea de producción en el siguiente orden:
Entonces, observarnos la ocurrencia de v = 5 rachas, donde n, = 5, n, = 7. Sea Hola hipótesis nula de que los artículos defectuosos y no defectuosos aparecen de manera aleatoria. Para una prueba bilateral, la región crítica (rechazo de H,) ocurre cuando: R = 2P(V 5 v, cuando Hoes cierta) 5 a
Para una prueba unilateral, la región crítica (rechazo de H a ocurre si:
R = P(V5 v,cuando H, es cierta) 5 a Por ejemplo, en la tabla 14.9se observa que para n, = 5, n, = 7, v = 5 aparece el número 0.197. Por tanto, para una prueba con a = 0.05, se tiene R = 0.197 > 0.05, así que no existe evidencia para rechazar la hipótesis de aleatoriedad en la muestra observada.
Tablas de valores críticos P(VI V, cuando H,, es cierta) Tabla 14.6
Tabla 14.7
Tabla 14.8
Tabla 14.10
Ejemplo 14.9. Durante 15 lunes consecutivos (de 2002) se cotejó la paridad del peso mexicano frente al dólar estadounidense (precio d e compra), con los siguientes registros (redondeados al centavo más cercano): 9.60,9.90, 10.10,9.60, 9.80,9.70,9.40, 10.00, 9.95, 10.10, 9.90, 10.00, 9.80, 10.20 y 10.10. Aplicar la prueba de las rachas para averiguar si hay razones para suponer que la fluctuación (o variación) semanal de la paridad peso mexicano vs. dólar estadounidense puede considerarse como aleatoria. Tome a = 0.05. Solución: La hipótesis nula H, es que la fluctuación semanal es aleatoria; la hipótesis alternativa es que la fluctuación semanal no es aleatoria (prueba bilateral). La mediana de los datos es 9.90. Ahora vamos a remplazar cada dato superior a este promedio con un signo positivo (+) y cada dato inferior con un signo negativo (-), omitiendo aquellos valores que por casualidad coincidan con la mediana (9.90). Tenemos entonces la siguiente sucesión:
Como n, = 6, n, = 7, v = 6 (porque son seis rachas, sin considerar los huecos), hallamos en la tabla 14.9 el valor crítico 0.296. Luego: R = 2P(VI v, cuando H,, es cierta) = 2 x 0.296 = 0.592 > 0.05
En consecuencia, no se rechaza la hipótesis de que la fluctuación semanal del peso mexicano frente al dólar estadounidense es aleatoria, al menos durante ese periodo observado.
Cuando n, y n, exceden los valores de la tabla, se puede aproximar la distribución muestra1 de V usando la distribución normal con los siguientes parámetros (media y varianza): CLv =
2nlnz
n, + n2
+1;
a:=
2n1n2(2n1n2 - n, - n,) (n, + n2>2(nl+ n2 - 1)
398
Parte N. Estadística no paramétrica En cuyo caso se coteja el estadístico de prueba:
con los valores críticos de la distribución normal estándar. La prueba d e las rachas también puede usarse para el caso d e muestras apareadas, c o m o alternativa a la prueba U d e Mann-Whitney. Ejemplo 14.10. Supóngase que en un laboratorio de medicamentos quieren poner a prueba una variante del mesilato de Imatinib (Glivec) para inhibir la producción d e una proteína, con lo cual se espera prolongar la vida en pacientes que padecen leucemia aguda linfoblástica de grado avanzado. Se escogieron al azar nueve pacientes con esa enfermedad en grado avanzado, a quienes se pronosticaban muy pocos años d e vida, quizás uno o dos. Sólo a cinco de ellos se les trató con el medicamento. Transcurridos cinco años después del estudio, los nueve pacientes habían fallecido. Sus tiempos de supervivencia fueron los siguientes (en años): Con eltratamiento
2.1
5.3
1.4
4.6
Sin el tratamiento
1.9
0.5
2.8
3.1
0.9
Aplicar la prueba de las rachas para determinar si el tratamiento médico resultó de alguna utilidad. Solución: Ordenamos de manera creciente las nueve observaciones, etiquetando cada observación con una C o una S, según haya recibido el tratamiento con ese suero o no, respectivamente: 0.5 0.9 S C
1.4 1.9 2.1 2.8 3.1 4.6 5.3 C S C S S C C
Tenemos entonces v = 6 rachas, n, = 4, n, = 5. Se trata de una prueba unilateral, ya que sólo nos interesa comprobar si los pacientes que no tuvieron el tratamiento descrito viven menos que los otros. Hallamos en la tabla que: R = P ( V 2 v, cuando H, es cierta) = 0.786
el cual es un valor muy grande, mucho mayor que cualquier nivel de significación razonable, en particular, es mayor que 0.05. Así, no se puede rechazar la hipótesis de igualdad de medias (lo cual sería implicado por la aleatoriedad d e las rachas). En consecuencia, se infiere que el tratamiento no ha mostrado ninguna utilidad perceptible para prolongar la vida d e los enfermos. Desde luego, la prueba puede repetirse con una mayor muestra, aunque siempre está el inconveniente de que es una prueba que tomará varios años para realizarse en humanos.
/+
9
--
-.
*w--=
""a
"Ls,
Calyampudi Radhakrishnan Rao (n. 1 920). Notable matemático hindú contemporáneo. Obtuvo su doctorado en Cambridge, Inglaterra donde trabajó junto con sir Ronald A. Fisher. La mayoría de sus trabajos se refieren a temas de inferencia estadística avanzada. Ha recibido 19 doctorados honorarios en universidades de todo el mundo. Su trabajo en análisis multivariado ha tenido un impacto significativo en aplicaciones para el diagnóstico médico, la genética evolutiva y la teoría de detección de señales. En el año 2002 recibió la Medalla Nacional de Ciencia en EUA.
John Wilder Tukey (n. 19 15). Uno de los más distinguidos estadísticos contemporáneos. Nació en New Bedford, Massachusetts, EUA. En 1937 obtuvo su doctorado en matemáticas por la Universidad de Princeton. Originalmente se dedicó a la topología y luego a la estadística. Fue profesor en Princeton durante muchos años y ha dejado un legado valioso en la estadística matemática.
En el siguiente cuadro, anote sus respuestas con lápiz suave. Los procedimientos y operaciones los puede anotar en hojas separadas.
1. Los siguientes datos representan el número de horas de entrenamiento de vuelo recibido por 18 estudiantes para piloto aviador de un cierto instructor, antes de que pilotearan un avión sin ayuda:
400
Parte N. Estadistica no paramétrica
Use la prueba de los signos, con un nivel de significación de a = 0.02, para ensayar la hipótesis de que, en promedio, los estudiantes aprenden a pilotear sin ayuda del instructor después de 12 horas de entrenamiento.
a) P = 0.5456, no se rechaza H, b) P = 0.4544, no se rechaza H, C) P = 0.4544, se rechaza H, d) P = 0.5456, se rechaza H,. 2. Un fabricante de pinturas sostiene que un nuevo aditivo reducirá el tiempo de secado de su pintura acrílica. Para ensayar esa afirmación, se pintaron 12 es de madera, la mitad de cada uno de ellos con pintura que contenía un aditivo normal y la otra mitad con pintura que contenía el nuevo aditivo. Los tiempos de secado (en horas) registrados fueron los siguientes:
6 2 3 7 8 9 1 0 1 1 1 2 4 5 Aditivonuevo 6.4 5.8 7.4 5.5 6.3 7.8 8.6 8.2 7.0 4.9 5.9 6.5 Aditivonomial 6.6 5.8 7.8 5.7 6.0 8.4 8.8 8.4 7.3 5.8 5.8 6.5
1
Aplique la prueba de los signos, con un nivel de significación de a = 0.05, para ensayar la hipótesis nula de que el aditivo nuevo no es mejor que el aditivo normal en lo que respecta a la reducción de los tiempos de secado de ese tipo de pintura.
a) b) C) d)
P = 0.0547, no se rechaza H, P = 0.0457, no se rechaza H,
P = 0.0457, se rechaza H, P = 0.0547, se rechaza H,.
3. En un experimento sobre la contaminación del aire, se compararon dos tipos de dispositivos (A y B) para medir la cantidad de monóxido de azufre en la atmósfera. Las siguientes lecturas corresponden a 14 días elegidos al azar:
Usando la aproximación normal a la distribución binomial, efectúe la prueba de los signos para determinar si los dos dispositivos producen resultados perceptiblemente distintos. Utilice un nivel de significación de a = 0.05.
a) P = 0.0160, no se rechaza H, b) P = 0.0262, no se rechaza H, C) P = 0.0160, se rechaza H, d) P = 0.0262, se rechaza H,. 4. Los siguientes datos representan el tiempo (en minutos) que tuvo que esperar un paciente en 12 visitas al consultorio de una médica antes de ser atendido:
Cap. 14. Las pruebas no pararnitricas más usuales
46 1
Aplique la prueba de rango con signo de Wilcoxon, coti un nivel de significación de a = 0.05, para poner a prueba la afirmación de la médica en el sentido de que, en promedio, sus pacientes no esperan más de 20 minutos antes de ser atehdidos.
a) w- = 14.5, no se rechaza H, b) w- = 12.5, no se rechaza H, c) w = 12.5, se rechaza H, d) w = 14.5, se rechaza Ho.
5. Los pesos de cinco personas (en kilogramos) antes de que dejasen de fumar y cinco semanas después de que dejaron de fumar son los siguientes:
Utilice la prueba de rango con signo de Wilcoxon para muestras apareadas, con un nivel de significación a = 0.05, para ensayar la afirmación de que fumar no tiene efecto perceptible en el peso de una persona, contra la alternativa de que el peso de un individuo se incrementa si abandona el hábito de fumar:
a) w+ = 4.5, no se rechaza H, b) w+ = 3.5, no se rechaza Ho C) W+ = 3.5, se rechaza H , d) w+ = 4.5, se rechaza H,.
6. Los siguientes datos muestran los goles anotados por el equipo de futbol Pumas de la UNAM como local y como visitante, durante 20 temporadas de juegos regulaies (sin contar las liguillas) en el futbol de primera división de México:
Mediante la prueba de Wilcoxon, con un nivel de significación de a = 0.01, detemine si, en promedio, el número de goles que anotan los Pumas de la UNAM son los mismos
402
Parte N. Estadística no pararnétrica
como local que como visitante, contra la alternativa de que, en promedio, anotan más goles cuando juegan en su propio estadio de Ciudad Universitaria. a) b) C) d)
z = 2.60, no se rechaza Ho z = 2.80, no se rechaza Ho z = 2.60, se rechaza Ho z = 2.80, se rechaza Ho.
7. Un señor desea averiguar si su esposa se demora más tiempo en el teléfono cuando ella hace la llamada que cuando la recibe. Sin que ella lo supiera, midió al azar el tiempo (en minutos y redondeando al minuto más cercano) de nueve conversaciones telefónicas que sostuvo su esposa, de las cuales cinco fueron hechas por ella y las otras cuatro fueron llamadas que ella recibió:
Aplique la prueba U de Mann-Whitney, con un nivel de significación de a = 0.05, para determinar si hacer o recibir la llamada telefónica tiene alguna influencia perceptible en la duración promedio de la conversación que la esposa sostendrá. a) b) c) d)
u, = 8, no hay diferencia u, = 8, sí hay diferencia u, = 6, no hay diferencia u, = 6, sí hay diferencia.
8. Se analizó el contenido de nicotina en cuatro marcas de cigarrillos en muestras aleatorias. Los siguientes números muestran los miligramos de nicotina hallados en los 16 cigarrillos que fueron sometidos a análisis químico de laboratorio: Marca A
Marca B
1
Marca C
Marca D
14
16
16
17
10
18
15
20
11
14 15
14
19
12
21
13
Mediante la prueba H de Kruskal-Wallis para análisis de varianza (ANOVA), con un nivel de significación de a = 0.05, averigüe si hay diferencia perceptible en el contenido promedio de nicotina de las cuatro marcas de cigarrillos. a) b) c) d)
h = 10.27, no hay diferencia h = 10.27, sí hay diferencia h = 11.27, sí hay diferencia h = 11.27, no hay diferencia.
9. Se utilizaron cuatro laboratorios (A, B, C y D) para realizar unos análisis químicos. Se enviaron a los laboratorios muestras del mismo material para ser analizadas como parte de un estudio cuya finalidad es averiguar si esos laboratorios proporcionan o no,
Cap. 14. Las pruebas no paramktricas más usuales
403
en promedio, los mismos resultados. Los datos que se obtuvieron despues del estudio fueron los siguientes:
hbw&
A
B
C
D
58.7 61.4 60.9 59.1 58.2
62.7 64.5 63.1 59.2 60.3
55.9 56.1 57.3 55.2 58.1
60.7 60.3 60.9 51.4 62.3
Con un nivel de significación de a = 0.05, utilice la prueba H de Kruskal-Wallis para análisis de varianza (ANOVA), y determine si hay diferencia perceptible entre los resultados que proporcionan esos laboratorios.
a) h = 12.83, no hay diferencia b) h = 10.08, sí hay diferencia C) h = 10.08, no hay diferencia d) h = 12.83, sí hay diferencia. 10. En una calle de la Ciudad de México, una encuestadora entrevistó al azar a 15 adultos que estaban haciendo cola para entrar a un cine, y en cada caso, les preguntó si estaban en general satisfechos o no con el trabajo que hacían los políticos del país. La encuestadora anotó un tache (8) para respuesta negativa y una paloma (J)para respuesta afirmativa, y obtuvo la siguiente sucesión de signos:
Con la prueba de rachas de Wald-Wolfowitz, con un nivel de significación de a = 0.01, determine si la sucesión de signos obtenida por la encuestadora resiste la afirmación de que la muestra fue seleccionada en forma aleatoria.
a) P = 0.810, muestra no aleatoria b) P = 0.810, muestra aleatoria C) P = 0.910, muestra no aleatoria d) P = 0.910, muestra aleatoria. 11. Mediante un proceso de baño de plata se ha recubierto cierto tipo de bandeja. Cuando el proceso está bajo control, el grosor del recubrimiento en las bandejas varía de manera aleatoria, siguiendo una distribución normal, con una media de 0.02 mm y una desviación estándar de 0.005 mm. Suponga que se examinaron 12 bandejas, en las cuales se encontraron los siguientes grosores en recubrimiento de plata (en milímetros): 0.019, 0.021, 0.020, 0.019, 0.020, 0.018, 0.023, 0.021, 0.024, 0.022, 0.023, 0.022. Aplique la prueba de rachas de Wald-Wolfowitz, con un nivel de significación de a = 0.05, para determinar si las fluctuaciones en el grosor del recubrimiento de plata de una bandeja a otra son aleatorias.
404
Parte N. Gtadística no paramétrica
a) P = 0.082, muestra no aleatoria b) P = 0.082, muestra aleatoria c) P = 0.016, muestra no aleatoria d) P = 0.016, muestra aleatoria.
12. El gerente de una sucursal bancaria observó el tiempo (en minutos) que demoraban dos cajeras en atender al cliente en turno desde el instante en que este llegaba a la ventanilla, con los siguientes resultados:
Utilice la prueba de rachas de Wald-Wolfowitz, con un nivel de significación de a = 0.01, para averiguar si hay una diferencia perceptible en el tiempo promedio que demoran ambas cajeras en atender a los clientes.
a) P = 0.044, sí hay diferencia b) P = 0.044, no hay diferencia C) P = 0.024, no hay diferencia d) P = 0.024, sí hay diferencia. 13. En una línea industrial de producción, se inspeccionan periódicamente las piezas. La siguiente es una sucesión de piezas defectuosas (D) y no defectuosas (N) producidas por la línea: D D N N N D N N D D N N N N N D D D N N D N N N N D N D Use la prueba de rachas de Wald-Wolfowitz para muestras grandes, con un nivel de significación de a = 0.05, para determinar si las piezas defectuosas están apareciendo de manera aleatoria o no. a) z = -0.55, las piezas defectuosas aparecen de manera aleatoria b) z = -0.55, las piezas defectuosas no aparecen de manera aleatoria C) z = 0.45, las piezas defectuosas aparecen de manera aleatoria d) z = 0.45, las piezas defectuosas no aparecen de manera aleatoria.
distribu ció 11
Esta importante distribución fue propuesta y desarrollada por el físico Waloddi Weibull (oriundo de Lund, Suecia) en 1939 y fue perfeccionada por él mismo y por el famoso probabilista ruso Boris Gnedenko en los años cincuenta del siglo m. Es también una generalización de la exponencial, pero desde otra perspectiva matemática. La variable aleatoriax tiene distribución de Weibull, si su función d e densidad de probabilidad está dada por: w(x, r, h) =
[rhrXr-l ~ [ - ( L X ) ~ I si x 2 O. en otra parte.
Una manera más fácil de recordar esta expresión consiste en introducir la variable intermedia u definida así: u = u(x) = @)', porque entonces u' = rhljlP1. De este modo, la función de densidad (parax 2 O) se expresa en forma más concisa como e" u'. Por otra parte, si r = 1, la distribución de Weibull se reduce a la distribución exponencial con parámetro d e escala h. La figura 15.1 ilustra la forma que adopta la curva de una distribución d e Weibull, para algunos valores escogidos de sus parámetros r y h. El valor esperado y la varianza de la variable aleatoria con distribución de Weibull están dados, respectivamente, por:
-
i
1.4.-
h = 1 en todas las curvas
F
1 i 1I
Figura 15.1
La distribución de Weibull tiene importantes aplicaciones en la teoría de confiabilidad, durabilidad y control de calidad, por lo que se introducen las siguientes funciones asociadas:
- La función de supervivencia (confiabilidad) en la distribución de Weibull S(x) > O se define como:
- La funáón riesgo de falla (o rapidez de fáüa) en la distribución de Weibull se denota por h(x) o también por Z(x), y está dada por:
- El riesgo acumulado de faiia se expresa mediante la integral (o antiderivada) de la función anterior:
Con estas definiciones en mano, la función de densidad de probabilidad para la variable aleatoria continua con distribución de Weibull puede redefinirse así: w (x) =
{"y(x)
si x 2 O. en otra parte.
Cap. 15. la distribución de Weibull y otras
409
El lector no tendrá ninguna dificultad en comprobar que en la distribución de Weibull se verifica:
*
1. O < r < 1 h(x) es decreciente H "(x) < 0. 2. r = 1 h(x) es constante a H"(x) = 0. 3. r > 1a h(x) es creciente a H "(x) > 0.
La distribución acumulada de probabilidad en la distribución de Weibull está dada por:
En función de los parámetros h y r, se tendría: W(x) = 1 - exp [-( hx)' ] La mediana para la distribución de Weibull se calcula mediante:
.
En general, el cuantil de ordenp, es decir, el valorxp tal que W-'(x,) =p,es xp= 1 [-ln(1 -p)]lh. En especial, me=x,,,. h La moda para la distribución de Weibull es:
De todo lo anterior, se deducen muchas relaciones interesantes; por ejemplo: H(x) = -1n S(x). En general, si X es el tiempo d e duración de vida de algún artefacto o dispositivo electrónico o mecánico, o incluso d e un ser viviente, bajo condiciones normales, dicha variable aleatoria debe seguir una distribución de Weibull. De ahí su importancia en teoría de confiabilidad y control de calidad. Ejemplo 15.1. La vida útil en años del mecanismo de una aspiradora de cierta marca y utilizada de manera racional tiene una distribución de Weibull con parámetros
5 1 v = -y h = -. Determinar: 2
4
a) El tiempo más probable de duración sin fallar (moda). 6 ) El promedio de duración sin fallar (media). c) El tiempo a partir del cual está 50 % de las aspiradoras que operan más tiempo sin fallar (mediana).
4 10
Parte V. Otras distribuciones notables Proporcionar las repuestas en años y días. Solución:
a) m. = 3.26077 años = 3 años y 95 días. 6) p = 3.54904 años = 3 años y 200 días (se usó la tabla de valores de la función gama). c) me= 3.45454 años = 3 años y 166 días. Ejemplo 15.2. Con referencia al ejemplo anterior, calcular:
a) La probabilidad de que la aspiradora dure más de cuatro años sin fallar. b) La desviación típica del tiempo que dura la aspiradora sin fallar. c) El noveno decil, esto es, el tiempo por encima del cual está 10% de las aspiradoras que más duran sin fallar. Solución : l
a ) S(4) = exp(-1) = -= 0.3679.
e
-
b) o = 0.75933 años (se us6 la tabla de valores de la función gama). 6) Dg= 5.58401 años 5 años y 213 días. Ejemplo 15.3. Rapidez de falla. Si T es una variable aleatoria continua que representa el tiempo de vida útil de algún artefacto o dispositivo, con función de densidad de probabilidad f (t), entonces el índice de falla, o rapidez defalla, se define como Z(t) = . f (t) Demostrar que si la f.d.p. de T es Weibull w(x, r, h), entonces Z(t) = h(t) = 1 - F(t) Solución: Es trivial:
donde u(t) = (ht)'. Ejemplo 15.4. Cierto tipo de pila para relojes eléctricos de pared tiene una vida útil de servicio, en años, que se rige según una distribución de Weibull. Si la rapidez de 1
falla está dada por h(t) =Z(t) = -,calcular la probabilidad de que esa pila continúe sirviendo después de:
Jt
a ) 3 años 6) 4 años. Solución: Si u(t) = (ht)'y u'(t) =-
1
Jt
,entonces:
Cap. 15. La distribución de Weibull y otras
411
De aquí que los parámetros de la distribución sean r = l/2, h = 4. Luego:
Ejercicio 15.1. Con respecto al ejemplo 15.4,calcule:
a) la mediana 6) la media.
de la duración de esa pila para relojes eléctricos de pared. Respuestas: a) me = poco menos de 44 días (43.87 días) 6) p = medio año exactamente. Ejercicio 15.2. Un televisor marca Sony modelo Tdnitron 39TS20 tiene una vida útil (en
1 25 años) que se rige por una distribución de Weibull con parámetros h = -, r = -. Los 9 12 fabricantes ofrecen cuatro años de garantía. Calcule: a) El porcentaje de veces que tendrán que hacer efectiva la garantía. 6) El tiempo a partir del cual está 10% de los televisores que más van a durar sin fallas (noveno decil) . c) La función de riesgo de falla (rapidez de falla). 6) El riesgo acumulado de falla a los 10 años de uso del aparato. e) El tiempo más probable de duración sin falla de dicho televisor (moda). f) El tiempo promedio de duración sin falla (media). gj La probabilidad de que un televisor de ese tipo siga funcionando sin fallar a los 12 años de uso. h) El tiempo máximo que operan sin fallar 50 % de los aparatos (mediana).
Aproxime siempre hasta el día más cercano, y recuerde que se toma 1año = 365 1/4 días. Respuestas: a) = 4.6 %, ya que P(X < 4) = 0.046178 6) = 16 años y 74 días C) h(x) = 0.0027924~'~'~
1
d) H(10) = h(x)& = 0.60264 e)
m. = 10 &os y 80 días
f) p = 10 años y 249 días 1 gj S(12) = 7 = 0.367879 h) me = 10 años y 189 días.
La siguiente propiedad de la distribución d e Weibull es muy importante e n la práctica:
Teorema. Supóngase que el tiempo de vida de algún artefacto o dispositivo es una variable aleatoria T con distribución de Weibull w(t, r, h). Si se sabe que 1- F(t,) = q,, y 1- F(t,) = q2 (donde t, < t,), entonces los parámetros r y h de la distribución se obtienen mediante las siguientes expresiones:
Primera demostración: Como 1- F(t) = S(t) = exp[-(ht)'], se tiene que exp[-(ht,)'] = q,. Tomando logaritmo natural en ambos , se sigue que -(ht,)' = ln q,, esto es, (ht,)' = -1n q,. De nuevo se toma logaritmo natural a ambos y se obtiene que r ln(ht,) = ln(-ln q,), lo cual implica que: r ln h + r ln t, = ln(-ln q,)
De manera análoga: r ln h + r ln t, = In(-ln q,)
Finalmente, restando la primera expresión de la segunda y despejando se halla que:
Por último, de la igualdad (ht,)' = -1n q,, se sigue que:
Segunda demostración: Hágase u = u(t) = (ht)' y denótese pory = ln u, así como x = In t. Se tieney = ln(ht)' = r ln h + m, ecuación que identificamos con la línea rectay = mx + b, cuyos parámetros son: pendiente: m = r, y ordenada en el origen b = r In h. Si se recuerda que la función de supervivencia es S(t) = 1F(t) = exp[-(ht)'] y que u(t) = -1n S@),y dado que según la hipótesis q, =S&), q, = S($), entonces la pendiente de dicha recta es, según la geometría analítica plana: Pendiente: m = r =
Y2
3C2
-Y1 = ln[-lnS(t,)l -W-lnS(t,)l - Xl lnt, -lnt,
Cap. 15. La distribución de Weibull y otras
4 13
Ejemplo 15.5. La vida en horas de cierto tipo de adornos luminosos para árboles de Navidad se considera una variable aleatoria T. Experimentos realizados con muestras muy grandes confirmaron que 52.5% de los adornos duran más de 319 horas, mientras que 78 % de los adornos duran más de 290 horas. Hallar el tiempo esperado de vida de esos adornos luminosos, si se supone una distribución de Weibull. Solución: De acuerdo con el teorema que acabamos de demostrar, si se supone una distribución de Weibull, entonces S(290) = q, = 0.78; S(319) = q, = 0.525. Luego, el parámetro de forma Y es: Y
=
h(-hq,) - h(-hqJ lnt, - lnt,
+1.39246794 5.76511911- 5.6698809
- -0.4395023
-
= 9.99857 = 10
Y el parámetro de escala es:
Por consiguiente, el tiempo de vida esperado es:
(= 317 horas y 7 minutos), y que T(1.1) = 0.95135 según las tablas de la función gama (o Excel). Ejemplo 15.6. Con respecto al ejemplo anterior, encontrar:
a) El tiempo más probable de duración de los adornos luminosos. b) El porcentaje de adornos luminosos que duran más de 400 horas. c) El noveno decil, esto es, el tiempo a partir del cual está 10% de los adornos con vida más larga. Solución: a) m,= - - = 333.3(0.9)~''= 329.83966 = 329 horas 50 minutos y 23 segundos. Observe que la moda resultó mayor que la media, lo que presupone un sesgo negativo (esto se puede demostrar con rigor). b) S(400) = exp{-[(0.003)(400)]10}= 0.002046, así que 2 % de los adornos luminosos tienen una vida superior a las 400 horas de servicio. c) El noveno decil es: .- 362 horas, 19 minutos y 36 segundos
Esta distribución también tiene aplicaciones en ingeniería y en otros campos d e la ciencia. La variable aleatoria continuax tiene una distribución beta, con parámetros a > O y B > O, si su densidad de probabilidad está determinada por:
10
en cualquier otro caso.
En la figura 15.2 se muestra el aspecto de la distribución beta para dos combinaciones posibles de los parámetros a y P. La distribución beta está asociada con la siguiente función, llamada la función beta:
que tiene, entre otras, la propiedad notable: B(m, n) = B(n, m). Las funciones beta y gama se relacionan por medio de la siguiente fórmula, que se demuestra en cursos de cálculo:
Figura 1 5.2
Cap. 15. fa dutribución de Weibull y otras
4 15
Así, la función de densidad de probabilidad, para O IxI 1, queda expresada de la siguiente manera:
Los parámetros media y varianza en la distribución beta están dados, respectivamente, por:
Si a > 1, p > 1, entonces la distribución beta es unimodal, con
Ejemplo 15.7. En la sección de Economía del diario ElFinanciero, del miércoles 25 de abril de 2001, apareció un comunicado que dice textualmente: "El Presidente Vicente Fox dijo que la reforma hacendaria es necesaria, porque 85 % de los recursos disponibles del Gobierno está comprometido en la solución de los errores de los gobiernos anteriores." Supóngase que la fracción del presupuesto del Gobierno destinada a pagar los "errores" cometidos por gobernantes pasados de México es una variable aleatoria con distribución beta. Si la media es 85 % y se estima que = 3, calcular:
P
a) La desviación estándar 6) La probabilidad de que en un a150 cualquiera más de 90 % de los recursos financieros del Gobierno de México estén comprometidos en pagar errores de gobiernos anteriores. Solución: Usando las fórmulas se obtiene:
Ejercicio 15.3. Suponga que la fracción más probable (moda) de trabajadores mexicanos que ganan menos del equivalente a 140 dólares al mes en un momento cualquiera es 2 (= 66.67%). 3 a) Explique si la hipótesis de una distribución beta para dicha fracción de trabajadores es consistente con las declaraciones de la Consultoría Mc Kinseyl en el sentido de que el 'Declaraciones publicadas en El Financiero,25/04/2001, p. 16.
4 16
Parte V. Otras distribuciones notables
3 valor esperado (media) para dicha fracción de trabajadores es de 60% (es decir, -). 5 De ser así, ¿cuáles son los parámetros de la distribución? b) Suponiendo una distribución beta, ¿cuál es la probabilidad de que en un momento dado el porcentaje de trabajadores mexicanos que perciben menos de 140 dólares al mes sea inferior a 50 %? Respuestas:a)Sí es consistente; a=3, = 2. 6) -=5 16
0.3125.
15.3. RELACI~NENTRE LA DISTRIBUCI~NBETA Y LA DISTRIBUCI~NBINOMIAL
Supóngase que X es una variable aleatoría continua con distribución beta B(x, a , B), tal que sus parámetros a y B son enteros positivos. Sea Yuna Variable aleatoria discreta con distribución binomial, cuyos parámetros son n = a + P - 1 y p (con O < p < l), es decir, b ( y , a + B - 1,p). Entonces se verifica la siguiente relación entre la distribución beta y la distribución binomial:
o bien,
Ejemplo 15.8. Del total de horas de sueño de una persona normal, los psidólogos estiman que sólo una fracción pequeña corresponde al llamado sueño MOR (movimiento ocular rápido), en el cual la persona sueña profundamente y los ojos se mueven. Se estima que dicha fracción sigue una distribución beta, con parámetros a = 3, P = 12. Hallar la probabilidad de que más de 30 % del total de tiempo de sueño de un individuo sea sueño MOR. 2
Solución: P(X > 0.3) = x b ( k , 14, 0.3) = 0.160836 (directamente de las tablas). k=O
Ejercicio 15.4. Del total de la cosecha de ciertos frutos de una finca, hay una fracción X que está dañada por una plaga. El dueño de la finca estima que X tiene distribuci6n beta con parámetros a = 1, fi = 4. Calcule:
a) El porcentaje esperado de la cosecha que debe estar danado por esa plaga. 6) La probabilidad de que al menos la cuarta parte de la cosecha esté dañada por la plaga.
Ejercicio 15.5. El porcentaje (o fracción) de los días en los que la contaminación atmosférica sobre el D. F. alcanza niveles considerados alarmantes, sigue una distribución beta con a = 3, fi = 8. Determine:
,
Cap. 15. La distribución de Weibull y otras
4 17
a) La moda 6) La media c) La probabilidad de que en un año cualquiera el porcentaje de días en los que la contaminación atmosférica alcance niveles alarmantes, sea superior a 30 %.
2 3 Respuestas: a)m, = - ~ 2 2 . %; 2 6) p = -~ 2 7 . %; 3 9 11
x 2
c)
(k, 10, 0.3) = 0.38278.
k=O
Ejemplo 15.9. Del total de lavadoras automáticas de marca Kenmore que son vendidas, se estima que una fracción va a requerir servicio de mantenimiento antes de que transcurran dos años. Si dicha fracción sigue una distribución beta con parámetros a = 2, B = 6, calcular la probabilidad de que menos de la cuarta parte de las lavadoras vendidas de esa marca requieran servicio de mantenimiento antes de dos años. Solucidn:
Esta distribución es el equivalente continuo de la distribución discreta uniforme que examinamos en el capítulo 6. Su valor es constante en un intervalo (a, p) y cero en todos los demás lugares:
1
para a < x < P .
f(x)= en otra parte.
10
Para a < x < j3 se tiene:
dt a
Luego:
x-a P-a
4 18
Parte V. Otras distribuciones notables
Los parámetros media y varianza de la distribución rectangular son, respectivamente, los siguientes:
Ejemplo 15.10. Supóngase que el error de redondeo en la lectura de un amperímetro2 está distribuido uniformemente en el intervalo entre dos divisiones enteras contiguas. Si el valor de una división de la escala del amperímetro es igual a 0.1 amperes y la indicación del aparato de medida se redondea hasta la división entera más próxima, hallar la probabilidad de que al leer se cometa un error superior a los 0.02 amperes. Solución: Si X es el error de redondeo referido, entonces la longitud del intervalo en el que están acotados los valores posibles d e X es igual a 0.1 amperes. Luego, a = 0, B = 0.1. El error de lectura será mayor a 0.02, si éste queda comprendido en el intervalo (0.02,0.08).De aquí que la probabilidad buscada sea:
Ejemplo 15.11. La cotización diaria del precio de compra del dólar estadounidense (interbancario), frente al peso mexicano en mayo de 2001, podía considerarse como una variable aleatoria X con distribución uniforme en cierto intervalo [a, $1 -según opinión de economistas expertos-. Dichos expertos estimaban que E(X) = 9.40 pesos y
a ) De ser así, determinar la probabilidad de que la cotización del precio de compra del dólar en un día cualquiera, de esa fecha, haya sido: - menor que 9.50 pesos
- inferior al valor del sexto decil. 6) Si Q, y Q, denotan el primero y tercer cuartiles, respectivamente, determinar el valor de la desviación cuartil Q = '/z(Q, - Q,) y compararla con la desviación estándar a. c) ¿Cuáles eran las cotizaciones mínima y máxima del precio de compra del dólar interbancario en pesos mexicanos? Solución:
3 = 0.75; 3 = 0.6 (el sexto decil es 9.44 pesos). a) 4 5 7
c) Las cotizaciones mínima y máxima eran a = 9.20 pesos y $ = 9.60 pesos, respectivamente. 'Aparato que sirve para medir la intensidad de una corriente eléctrica. La unidad de medida (amper) se Uarna así en honor del ilustre matemático y físico francés André Marie Amptre (1755-1838),quien creó la electrodinámica, inventó el electroimán y el telégrafo electromagnético, y realizó valiosas contribuciones en química, electromagnetismo y matemáticas.
Cap. 15. La distribución de Weibull y otras
4 19
Ejemplo 15.12. Si de alguna manera se elige, en forma completamente aleatoria, un número real x en el intervalo (O, 1) y se escribe en notación decimal, calcular la probabilidad de que:
a ) Su primer dígito después del punto decimal sea 1. b) Su segundo dígito después del punto sea 5. c) El primer dígito después del punto decimal en el número
& sea 3.
[T. Cacoullos, Exercises in Probability, Springer Verlag, N. Y, 1989.1 Solución: SiXes la variable aleatoria que representa el número real elegido, entonces la distribución de probabilidad deXes uniforme en el intervalo (O, l), ya que todos los números reales en ese intervalo tienen la misma oportunidad. Por consiguiente:
Una variable aleatoria continua X tiene una distribución d e Rayleigh con parámetro a > O si su densidad d e probabilidad está dada por:
f (33=
2axe+'
parax > 0. en otra parte.
En realidad, esta distribución es un caso particular de la distribución de Weibull. Fue usada por el famoso físico y matemático inglés Lord Rayleigh, ganador del Premio Nobel d e Física y uno d e los precursores d e la teoría cuántica, casi 50 años antes de que Weibull introdujera su distribución más general. Rayleigh empleó esta distribución en fenómenos físicos relacionados con la propagación de la luz y el comportamiento de partículas subatómicas. La media y la varianza d e la distribución d e Rayleigh son, respectivamente:
Ejemplo 15.13. La duración en años de la pila que suministra energía a los relojes de pulsera Casio tipo F-91W, fabricados en China, es una variable aleatoria que sigue una distribución de Rayleigh, con parámetro a = 0.04. Determinar:
420
Parte V. Otras distribuciones notables
a) 6) c) d)
La duración esperada de la pila El valor mediano de la duración La moda de la duración La probabilidad de que la pila dure más de un tiempo t , medido en años.
Si los fabricantes de ese reloj garantizan la reposición del mismo cuando la pila dure un tiempo inusualmente corto, calcular:
e) Por cuántos años deben estipular la garantía, si desean que la probabilidad de que se cumpla no exceda al valor 0.05. Solución:
a) La distribución de Rayleigh es un caso particular de la de Weibuli, específica?
mente cuando h = da,r = 2. Entonces, aplicando la fórmula para el valor esperado en la distribución de Weibull, se tiene que la media en la distribución de Rayleigh es:
Para este caso, como a = 0.04, se tiene:
(aproximadamente 4 años con 5 meses y 5 días). b) Aplicando la fórmula para la mediana de la distribución de Weibull, encontramos fácilmente que en el caso de la distribución de Rayleigh, la mediana está dada por:
En este caso, como a = 0.04, tenemos:
m, = 5Jin 2 = 4.1628 años lo cual implica que 50 % de las pilas llegan a durar esa cantidad de d o s o menos (o esa cantidad de años o más). c) Ahora, usamos la fórmula para la moda de la distribución de Weibull. Entonces se obtiene, para el caso de la distribución de Rayleigh:
Cap. 15. La distribución de Weibull y otras
42 1
En este caso particular, con a = 0.04, obtenemos:
m, =
5 6= 3.5355 años 2
una respuesta sorprendente, porque resulta más de 10 años inferior a la mediana. d) La probabilidad de que la pila dure más de un tiempo t (en años) es 1- F(t) = e~p[-(0.2t)~]. Por si existiera alguna duda, podemos comprobar, de paso, que nuestro cálculo de la mediana fue correcto: simplemente se sustituye el valor t =5 f i
y se verifica que el resultado sea ' / I . En efecto:
e) El 5% de las pilas de esos relojes que menos tiempo duran se hallan en el cuantil (o percentil) x,,,, el cual equivale a F-' (0.05). Usamos la fórmula para el cuantilxpen la distribuaón de Weibull (en este caso especifico, con parámetros r = 2, h = 0.2), y hallamos:
x,, = 54-ln 0.95 = 1.1324 años de -tía (un año, un mes y poco más de 17 días de garantía), aunque, ciertamente, ninguna empresa ofrecería una garantía tan precisa, porque despertaría sospechas entre los compradores del producto acerca de la verdadera calidad. Así que en este caso, es razonable redondear el tiempo de garantía de esos relojes a un año exactamente, aunque en lugar de amparar a 5% de los relojes, se estaría amparando tan sólo a 3.9%.
En resumen, en la distribución d e Rayleigh con parámetro a > O, el cuantil d e áreap está dado por:
En particular, la mediana es:
y la moda es:
Frank Wilcoxon ( 1 892- 1965). Estadístico y químico irlandés. Introdujo las pruebas de la suma de rangos y de rango con signo, las cuales continúan siendo importantes para la estadística no paramétrica.
Henry B. Mann ( 1 905-2000). Matemático austriaco que hizo importantes contribuciones en álgebra, teoría de números, análisis combinatorio y estadística. En relación con la última. escribió la obra Análisis y diseño de experimentos, en 1 949.
El análisis d e regresión y correlación es una de las herramientas estadísticas y econométricas d e mayor utilidad. Básicamente, se trata d e describir y evaluar la relación que hay entre una variable dependiente Y (también llamada variable explicada) y una o varias variables independientes X,,.. . ,X,, llamadas también variables explicativas. El objetivo de tal relación es hacer predicciones o pronósticos. Si hay una sola variable explicativa, esto es, si k = 1, entonces se habla d e regresión simple, y si k > 1,se habla d e regresibn mbltiple. El nombre de regresión suena un tanto curioso y no es muy afortunado, ya que da la idea d e algún movimiento retrógrado o hacia atrás, pero en la práctica es todo lo contrario, es decir, se trata de observar un movimiento hacia adelante para poder realizar ciertas predicciones. Ese nombre se usa porque fue introducido por el inglés sir Francis Galton (1822-1911), pariente de Darwin y maestro de Karl Pearson. Galton fue el fundador de la dudosa doctrina de la eugenesia. En sus trabajos estudió la relación entre las estaturas de muchos niños ingleses y sus respectivos padres. Lógicamente, observó que los padres altos tendían a procrear hijos altos y los padres bajos tenían hijos bajos, pero por la diversificación o mezcla de los caracteres hereditarios, Galton supuso que las estaturas deberían converger hacia una estatura promedio, es decir, una "regresión hacia el promedio o la mediocridad, como él lo escribió. Cabe señalar que Galton era aristócrata, conservador e incluso racista, y nunca llegó a comprender bien los detalles importantes del proceso evolutivo a través de la herencia, los cuales fueron descubiertos por los biólogos muchos años después. La palabra eugenesia significa "bien nacido" y nada tiene que ver
426
Parte VI. Regresión y correlación
con la genética. En 1833,Galton escribió un trabajo en el que se usó por primera vez el término regresión, y en el cual proponía métodos para mejorar la especie humana, tal como se mejoran las razas de ganado o animales, mediante el fomento de uniones adecuadas y la prohibición o supresión de uniones inadecuadas. Como señaló Isaac Asimov en años más recientes (The Welkprings of Life, 1960): "el edificio de la eugenesia, fundado por Galton, se basó en la roca de la ignorancia y la utopía". El fracaso de la eugenesia lo explica Asimov de manera elocuente: El argumento de Galton parece bueno a simple vista y se utilizó por los antiguos espartanos 700 años antes de Cristo [. ..] En el caso de animales domésticos sabemos muy bien qué es lo que buscamos con la "mejoría de la raza". Si queremos que una vaca dé mucha leche, cruzamos toros y vacas que desciendan de buenas lecheras y tomamos lo mejor de las crías (sobre este único aspecto) para nuevos cruzamientos. Al final vamos a obtener especialistas lecheras que son apenas algo más que fábricas vivientes diseñadas para convertir el pasto en leche y mantequilla. Lo hemos logrado, pero nuestro ganado actual es suficientemente plácido y estúpido para no ser capaz de proteger sus terneros, ni siquiera protegerse ellos mismos contra animales salvajes [. . .] Pero, en el caso del Horno sapiens, ¿qué criaríamos?A los espartanos les interesaban las diversas cualidades que forman un buen guerrero (fuerza, resistencia y valor) y lograron crear así guerreros y soldados dignos de iración, pero al despreciar todas las demás características se produjo una cultura espartana que, en conjunto, es digna de todo menos de iración y que, en realidad, es el más claro ejemplo de cultura psicótica de larga duración que registra la historia [.. .] Naturalmente, hay característicashereditarias extremadamente negativas, tales como la idiotez o la manía homicida, que quisiéramos eliminar genéticamente si supiéramos cómo. Sin embargo, no estamos seguros de.que siquiera podamos eliminar los genes indeseables sin eliminar también cierta proporción de los deseables.
La genética actual ha puesto en entredicho a la eugenesia, pues está demostrado que en un mismo cromosoma pueden estar impresas características deseables e indeseables, y es imposible fomentar una característica deseable sin fomentar una indeseable también. Como señala Asimov: "ha habido muchos grandes hombres por cuya existencia la humanidad debe sentirse agradecida y que han sido epilépticos, diabéticos, esquizofrénicos, homosexuales o neurótic o graves". ~ Pero, volviendo al tema que nos ocupa, el estudio de las relaciones entre k variables explicativas o independientes X,, .. . , Xk y una variable explicada o dependiente Y tiene como objetivo no sólo realizar predicciones para valores futuros de Y, sino también averiguar si alguna de lasXi pudiera mostrar un efecto importante sobre la variable explicada Y. Cabe señalar que hay muy diversas etiquetas para las variables Xi y la variable Y. Por ejemplo, en econometría se acostumbra llamar a Y variable endógena, mientras que las X,, ... , Xk se llaman variables exdgenas. También es posible llamar a Y variable objetivo y a las X,, ... ,Xk variables de control. Sin embargo, en trabajo estadístico se prefiere llamar a la variable Y predictando (o regresando) y a las X, , ... ,Xk se les llama predictores (o regresores). En este capítulo, expondremos únicamente el caso de una sola variable in-
Cap. 1 6. Regresión lineal simple y correlación
42 7
dependiente X, es decir, abordaremos sólo el tema de la regresión simple. No obstante, hay que mencionar que no se busca una relación matemática exacta de la forma y =f (x), sino que s e busca describir la relación más precisa entre dichas variables en témzinosprobabilzSticcxs,para ajustar datos u observaciones estadísticas. Una relación lineal estocástica (del griego stokos = adivinar) entre las variables X y Y es de la forma:
en donde Po y P, se llaman coeficientes de regresión de la población y el término u se llama trastorno ai azar (o residuai) y constituye la parte estocástica de la ecuación, mientras que Po+ P,x constituye la parte sistemaítica de la ecuación. Es claro quey = Po + p,x describe una línea recta en el plano, cuya pendiente es B, y cuya ordenada en el origen es Po. Hemos supuesto el modelo más sencillo posible de regresión lineal simple, que es una línea recta con un término de error aditivo u. Hay tres razones para introducir este término de error o trastorno: 1. Hay un elemento impredecible d e aleatoriedad en las respuestas hu-
manas. 2. Hay el efecto de posibles variables omitidas, las cuales incluso podrían ser no cuantificables. 3. Casi siempre hay errores d e medición en la variable explicada Y. La parte sistemática d e la ecuación 1 representa la media o valor esperado del predictando Y para un valor dado del predictorx, esto es, representa el valor esperado de Y dado que X =x. Por tanto, se escribe:
En consecuencia, el error aleatorio u en la ecuación 1 no es otra cosa que la diferencia entre el valor observado (y) del predictando y su valor medio para ese valor de la variable predictora o explicativaX. Suponga que se tienen n observaciones (x,,y?),(x2,y,), ... , (xn,yn). Entonces, para cada i = 1,2, . .. ,n se escribe la ecuacion 1como:
El objetivo principal del modelo de regresión lineal simple consiste en hallar estimaciones de los parámetros desconocidos Po y P, para ese conjunto de observaciones. Para ello, se requieren algunas suposiciones (o hipótesis) acerca de los términos de error u,, vistos como valores de una variable aleatoria U, @ara cada i = 1, 2, ... , n). Dichas suposiciones son las siguientes: 1. El valor esperado (media) de cualquier Uies cero, esto es, E(U,) = O, para toda i = l , 2 , . . . , n.
428
Parte Vi. Regresión y correlación
2. Todas las Ui tienen la misma varianza, es decir, Var(U,) = 0 2 ,para toda i = l , 2 , ... , n . Esta propiedad se conoce como homoscedasticidad (que significa igual dispersión). Lo contrario sería heteroscedasticidad. 3. Las variables aleatorias U, y U, son independientes para i #j. 4. La distribución de probabilidad de la variable aleatoria U, no depende de los valores de x, . 5. Para cada i = 1,2, .. . ,n , la variable aleatoria U, tiene distribución normal con media O y varianza 02.
Incidentalmente, esta última hipótesis explica por qué en la ecuación 2 no hizo falta incorporar el término E(U) en el miembro derecho. En la figura 16.1 se ilustra de manera gráfica cómo se distribuyen normalmente los valores del predicando y para cada valor del predictor x, estando la media de la distribución siempre sobre la línea de regresión.
Figura 1 6.1
En el siglo xm se desarrolló el método de ajuste por mínimos cuadrados gracias a los trabajos de Laplace en Francia y C. F. Gauss en Alemania. y,,) se dibujan Suponga que n observaciones (x,, y,), (x2,y,), ... , (x,,, como n puntos dispersos en el plano y que se dibuja una línea rectay = 6, + b,x que más o menos se ajuste a la posición de los puntos (véase fig. 16.2). Entre todas las rectas posibles que se pueden dibujar alrededor de los puntos dispersos, se trata de hallar cuál es la que proporciona el mqor ajuste. ¿Pero qué debe entenderse por mejor ajuste? Veamos, si se consideran a 6, y 6, como estimadores de a y j3, respectivamente, que son lineales en las y,, entonces se trata de encontrar aquellos estimadores que sean los más eficientes en el sentido de que su varianza sea la más pequeña posible. Resulta que tales estimadores son precisamente los llamados estimadores de mínimos cuadrados, es decir, aquellos
Figura 16.2
que tienen la propiedad de que la suma de los cuadrados de los segmentos verticales de cada punto hasta la recta de ajuste es la mínima posible (fig. 16.2). En otras palabras, el modelo de mínimos cuadrados consiste en determinar los valores de boy b, tales que minimizan el siguiente parámetro:
Para cada conjunto de puntos (x,, y,), (x,, y,), ... , (x,,, y,), la recta de mejor ajuste es precisamente la recta basada en ese principio de mínimos cuadrados, y su ecuación se expresa:
y=Bo+ p l x Hoy día, con la proliferación de software científico y estadístico es relativamente sencillo obtener la ecuación de la recta de mínimos cuadrados usando directamente la computadora. Por supuesto, también es posible hacerlo mediante fórmulas y una calculadora. Esas fórmulas las veremos más adelante. Ejemplo 16.1. Con Excel obtener la ecuación de la recta de mínimos cuadrados correspondiente a las siguientes cinco observaciones parax y y:
430
Parte VI. Regresión y correlación
Solución: Anotamos las observaciones así como están (en dos columnas, pero sin encabezado) en una hoja de cálculo de Excel. Luego abrimos el menú Herramientas y pulsamos donde dice Análisis de datos. Esto se ilustra en la figura 16.3. Si en su computadora no aparece esa opción (Análisis de datos), entonces debe darla de alta con la utilería que se indica arriba (Complementos, o A d d ins en inglés). Si no tiene instalada la versión completa de Excel, es posible que le pida el disco de instalación de OSJice. Al pulsar en Análisis de datos, aparece un nuevo menú de opciones, como se indica en la figura 16.4. Enseguida se pulsa donde dice Regresión, y entonces el lector podrá seguir las instrucciones para obtener todos los detalles matemáticos y gráficos de la recta de mínimos cuadrados (fig. 16.5). En este caso, observamos que la recta de mínimos cuadrados pasa por tres de los cinco puntos. El dato RZque aparece se llama coeficiente de determinación y se explicará más adelante.
Figura 16.3
Figura 16.4
Figura 16.5
En el trabajo estadístico, aparecen con frecuencia variables que están relacionadas linealmente, aunque no se pueda decir que una de ellas es influida por la otra o que depende de ella. Se sabe, por ejemplo, que hay cierta relación entre las horas de sueño promedio que tiene una persona al día y el número de años que se espera que viva, o entre el peso d e un individuo y su estatura. En tales casos, se dice que las variables están correlacionadas y se cuenta con un estadístico denotad o por r y que se llama coeficiente de correlación muestrd, y es tal que -1 < r 5 1. Si el coeficiente de correlación fuese 1, entonces habría un ajuste lineal perfecto entre las dos variables, en el sentido de que al aumentar una d e las variables, se registraría en forma invariable un incremento lineal de la otra siempre en la misma proporción. Si r fuese igual a cero, entonces no habría correlación alguna entre las variables, mientras que una correlación negativa implicaría una relación inversa, en el sentido de que al incrementar una d e las variables, la otra disminuiría, y viceversa. Una correlación negativa debería esperarse, por ejemplo, entre la cantidad de kilómetros que ha recorrido un automóvil y su precio en el mercado. El coeficiente d e correlación muestral r se calcula mediante la fórmula:
donde:
Ejercicio 16.1. Con ayuda de una calculadora solamente, calcule el coeficiente de correlación muestral de las siguientes parejas ( x ,y): (2, 5), (1,3), (5,6), (0,2).
Respuesta: Si sus cálculos son correctos, entonces deberá haber obtenido el valor r = 0.930, que resulta de dividir 11entre la raíz cuadrada de 140.
432
Parte VI. Regresión y correlación
Aun en los casos donde se observa una cierta correlación entre dos variables, sería un error pensar automáticamente que debe existir una relación de causa-efecto entre ambas variables. Ello es falso, ya que la correlación observada podría bien deberse a la influencia de una tercera variable. Por ejemplo, podría observarse que en una ciudad hay una correlación positiva muy clara entre el número de asaltos o crímenes y el número de nuevas escuelas que se crean, pero ello se debe a que hay una tercera variable (el incremento de la población en esa ciudad), que es la causa real de que las otras dos variables sufran ambas un incremento sin ser ninguna de ellas causa de la otra.
El estadístico de muestra P recibe el nombre de coeficiente de determinación y mide el porcentaje de variabilidad en la variable dependiente Y, que puede explicarse a través del conocimiento de la variable independiente X. Se mide en un valor que oscila entre O y 1. r2
= Desviación total - Desviación no explicada
Desviación total =1- Desviación no explicada Desviación total
Las desviaciones o diferencias se toman para cada uno de los puntos (x,y) de una muestra de datos, se elevan al cuadrado @ara evitar signos negativos) y se suman. Esto es:
Si se trabaja en una gráfica de la Iínea de regresión dibujada por el Excel, el valor de r2se obtiene directamente al picar la Iínea de regresión con el botón derecho del ratón. En realidad, puede demostrarse que r 2viene siendo precisamente el cuadrado del estadístico r, que representa el coeficiente de correlación muestra1 del conjunto de datos (x,y) de la muestra.
16.5. EJEMPLOS Y F~RMULASIMPORTANTES Consideremos el siguiente ejemplo típico: X = precio por galón de leche (en dólares); Y = venta semanal de leche en miles de galones, con una muestra de 10 observaciones, las cuales son:
Cap. 16. Regresión lineal simple y correlación
433
Directamente con el Excel se obtiene la siguiente información:
- Coeficiente de determinación: r 2= 0.7456 - Coeficiente de correlación: r = -0.86 - Recta de regresión: 5= -14.539~+ 32.136 Redondeando: f = 32.14 - 1 4 . 5 4 ~ - Promedios muestrales: (F,y)= (1.44, 11.2) La gráfica también se obtiene con Excel (fig. 16.6).
Figura 16.6
Para ilustrar el significado d e r 2 , considérese un solo dato d e la muestra, como el punto (1.70, 5). Obsérvese la figura. De acuerdo con los datos de la muestra, el valor esperado d e y (o promedio) es 11.2 (miles de galones semanales) a un precio promedio de 1.44 dólares por galón. Si el precio se incrementa de su promedio (1.44) al valor 1.70, entonces es de esperarse que la demanda (o el volumen de ventas) baje de su promedio (11.2) al valor predicho por la recta de regresión: 7.422. Esta disminución se explica por el incremento del precio x. Sin embargo, en la realidad se observó que a un precio de 1.70 dólares por galón, el volumen d e ventas no fue el pronosticado (7.422), sino que fue d e 5 mil galones por semana. Por consiguiente, la diferencia (en valor absoluto) 7.422 - 5 = 2.422 no puede ser explicada por el incremento del precio (para este dato específico). La explicación puede atribuirse al clima, a la publicidad, a la elasticidad-precio
434
Parie VI. Regresión y correlación
de la demanda de leche, o a algún otro factor no considerado en el análisis de regresión. El estadístico r 2recoge la información total de aquellas y sólo aquellas variaciones de y que si pueden explicarse por medio de las variaciones de x. En trabajos prácticos con calculadora, el valor del estadístico r 2puede calcularse por medio de la siguiente fórmula, que es equivalente:
Ejemplo. Los siguientes datos son estaturas de padres y sus hijos respectivos, en donde se calculará el coeficiente de determinación.
-
Estatura del Estadura cieE padre ( x ) 1 hijo ( y )
1
1.65
2
xZ
3cy
1.73
2.7225
2.8545
2.9929
1.60
1.68
2.5600
2.6880
2.8224
3
1.70
1.73
2.8900
2.9410
2.9929
4
1.63
1.65
2.6569
2.6895 -
2.7225
5
1.73
1.75
2.9929
3.0275
6
1.57
7
-1.78
'
8
1.68
1.65
2.8224
2.7720
9
1.73
1.80
2.9929
3.1140
10
1.70
1.70
2.8900
2.8900
11
1.75
1.73
12
1.80
x
-
3.0625
-
3.0275
1.78
3.2400
3.2040
20.61
34.4634
34.9250
1
20.32
' ;:;ti;
3.0625
2.7225 3.2400
1 1
/
2.8900 2.9929 3.1684 35.4223
Otros datos: 6, = 0.9336; b = 0.4629 Otras fórmulas: Error estándar de la estimación:
NOTA:LOS autores de algunos libros de estadística o pronósticos usan el símbolo S,, .xpara este estadístico. Otros libros usan el símbolo se, el cual es también muy común.
Coeficientes de la recta de regresión:
Zy b,=---. n
EX
1
b=
n
~ZW-ZXZY ~C-X~-(ZX)~
Error estándar de pronóstico para un vaior dado X,:
En la siguiente sección, veremos qué es S,.
Intervaio de confianza de (1 - a) 100% para la respuesta media p
x,:
y1 %
dado
zai2s, (muestra grande) - Yf t.a 2 S/ (muestra pequeña; se toman n - 2 grados de libertad en la distribucdn r ) .
-fk
16.6. ABREVIATURAS M& USUALES EN LA n 0 R A f DE REGRESI~N Y CORRELACI~N Con objeto d e evitar que las fórmulas se vuelvan muy aparatosas, se introducirán aquí las siguientes abreviaturas para simplificar la notación:
Otras abreviaturas usuales: SSE = "Error de la suma d e cuadrados" = Z ( Y - ?)2 = Desviación no explicada SSR = "Suma de cuadrados residual" = &Y- Y)2 = Desviación explicada SST = "Suma total de cuadrados" = Z ( Y= Desviación total
4 36
Parte VI. Regresidn y correlación
La relación entre estas cantidades y las anteriores es la siguiente:
1 Además:
1 También:
l
OBSERVACI~N IMPORTANTE:Algunos autores de libros de estadística, microeconomía y pronósticos definen S, S, y S, en la siguiente forma:
Sin embargo, otros libros definen estos símbolos como lo hicimos líneas arriba, que es lo mismo, pero dividido entre n. La notación alternativa tiene quizá la ventaja de que proporciona fórmulas más compactas, pero entonces el estudiante debe ser cuidadoso si estudia en varios libros a la vez, en cuanto a que el S, de un libro es igual al S, d e otro libro multiplicado por n (o dividido entre n).Esta discrepancia puede afectar el cálculo del error estándar de la estimación s (o también llamado se) por un factor de& si se mezcla la nomenclatura de libros distintos: 1 S, =Cx2--(Zx)2
n
Es muy importante que el estudiante esté consciente de cuál de los dos tipos d e simbología va a adoptar en su trabajo. Nosotros preferimos esta última. Con esta notación abreviada, la línea de regresión ?= b, + bX tiene pendiente:
y ordenada en el origen: b,=Y- bX
Cap. 16. Regresión lineal simple y correlación
43 7
El coeficiente de correlación muestra1 es:
y el coeficiente de determinación muestra es:
Como se explicó, el coeficiente de determinación r2expresa la proporción de la variación total de los valores de la variable Y, que puede ser explicada por una relación lineal con los valores de la variable independiente X.
Un intervalo de confianza de (1 - a)100 % para el parámetro en el origen) de la recta de regresión Y = Po+ es el siguiente:
Po (ordenada
donde t , es un valor de la distribución t de Student con n - 2 grados de libertad. En esta fórmula, s es el error estándar de la estimación (también denotado por se):
Ejemplo 16.2. Edades de esposos ( y ) y de sus respectivas esposas ( x ) :
438
Parte Vi. Regresión y correlación Información relevante obtenida con el Excel:
Información adicional que no se usa aquí: Calcular un intervalo de confianza de 95 % para Po que es la ordenada en el origen de la recta de regresión. Solucidn: En primer lugar, se busca, en la tabla de percentiles de la distribución t de Student el valor crítico to,02,con 14 grados de libertad. Se halla el número 2.145. Haciendo los cálculos se obtiene el siguiente intervalo de confianza para Po: Desde -1.36 hasta 20.12
Para ensayar la hipótesis nula Ho:{Po= c ) contra alguna alternativa H,, se basa la decisión en el valor de:
Ejemplo 16.3. En el ejemplo 16.2 sobre los matrimonios, probar la hipótesis Ho:{Po = O) contra H,:{P, # 0) con un nivel de significación de a = 0.05. Sirve la misma t crítica
del ejemplo anterior. Solución: La región crítica es, por tanto:
Las operaciones dan:
Cae en zona de aceptación, por lo que no se rechaza H,. I n t e d o de confianzapara f3 (pendientede la recta de regresión). Un intervalo de confianza de (1 - a)100 % para el parámetro P está dado por:
donde t, tiene n - 2 grados de libertad.
Cap. 16. Regresión lineal simple y correlación
43 9
Ejemplo 16.4.En el ejemplo de los matrimonios, construir un intervalo de confianza de 95%. Solucidn: Tenemos los datos siguientes:
Haciendo los cálculos se obtiene 0.9979 f 0.3095. Por consiguiente:
Pruebas de hipótesis para f3 (pendiente de la recta de regresión). Para probar la hipótesis nula H,:{B = m) contra alguna alternativa H,, se basa la decisión en el valor de:
t=
b-m - ( b - m ) , / ~ ,
Ejemplo 16.5.En el ejemplo de los matrimonios, probar la hipótesis nula H,:@ = 1) contra la alternativa H,:{P < 11, con un nivel de significación de a = 0.01. Solucidn: Cálculos:
Se halla en tablas t,,, (con 14 grados de libertad) = 2.624. La región crítica es:
En consecuencia, se acepta H, y se concluye que f3 no es perceptiblemente menor que 1 con un nivel de significación de 0.01.
16.9. INTERVALO DE CONFIANZA MEDIA py~, DADO
xO
PARA LA RESPUESTA
Para cadax, específico, el intervalo de confianza para Y, o más precisamente 1 % un valor particularx, está dado por: para la respuesta media ~ ~ dado
donde t , tiene n - 2 grados de libertad. Ejemplo 16.6. En el ejemplo de los matrimonios, construir límites de confianza de 95 % para la respuesta media pylxocuando una mujer tiene 28 años de edad.
0
440
Parte VI. Regresión y correlación Solución: Datos:
X0 =
28 años (edad particular de esposa) Yo = 9.38 + (0.9979)(28) = 37.3212 = 37 años (predicción de la edad de su esposo
por la recta de regresión) t,.,, = 2.145 tomado de la tabla de percentiles de la distribución t de Student (con 14 grados de libertad) k = 31.875 (promedio de edad de la muestra de esposas) S = 7.91663 S, = 3009.75
Operaciones aritméticas:
El intervalo de confianza es, por tanto: 37.3212 f (2.145)(7.91663)(0.259786) = 37.3212 f 4.41148 años
El intervalo resulta ser desde 32.9 hasta 41.7 años. Por tanto, de acuerdo con los datos de la muestra, hay 95 % de confianza de que el esposo de una mujer de 28 años tenga una edad que oscila entre los 32.9 y los 41.7 años, o en números redondos, desde los 33 hasta los 42 años aproximadamente. Nótese que para cada edad xo la amplitud del intervalo será distinta, donde la mínima es para el valor de la media aritmética.
Algunas veces se pasa por alto que cuando se calcula r sobre la base d e datos d e muestra, se puede obtener una correlación positiva o negativa apreciable por suerte o d e manera fortuita, aunque en realidad no haya ninguna relación verdadera entre las dos variables que se consideran. Para ejemplificar esto con un caso extremo, supóngase que se toma un par d e dados, uno rojo y uno verde, se tiran cinco veces y se obtienen los siguientes resultados:
~ a d rojo o r
I
Dado verde (Y) 5
1
Cap. 16. Regresión lineal simple y correlación
44 1
Calculamos el coeficiente d e correlación (ya sea con fórmula o con el Excel), así como la recta d e regresión y los siguientes datos: r = 0.65558 = 0.66; r2= 0.4289; bo= -0.6538; b = 1.1923. Desde luego, es imposible que exista una correlación porque un dado no puede saber lo que el otro está haciendo. Para ensayar la hipótesis nula de que p = O contra una alternativa, se usa la tabla 16.1de valores críticos para r. Se rechaza la hipótesis nula (en el sentido de que no hay correlación) si r c -r, o bien r > r,, donde el valor d e este término se puede obtener en la tabla 16.1. En caso d e rechazar la hipótesis nula, se dice que hay una correlacibn significativa; en caso contrario, se concluye que el valor de r obtenido en la muestra no es estadísticamente significativo. En nuestro ejemplo de los dados, usemos el nivel de significación a = 0.05 para probar la hipótesis nula de no correlación. Los pasos son los siguientes: 1. Hipótesis nula: Ho {p = 0); hipótesis alternativa: H , {p # O ) . 2. Nivel de significación: a = 0.05. 3. Criterio de decisión: rechazar Ho si r c -0.878 o bien r > 0.878, donde este es el valor hallado en la tabla para T,,~,, con n = 5; en caso contrario, aceptar Ho y concluir que el valor de r obtenido con la muestra no es significativo. 4. Cálculo del coeficiente de correlación muestral: r = 0.66. 5. Decisión: Como r = 0.66 está dentro del intervalo de -0.878 hasta 0.878 (zona de aceptación), se acepta H se concluye que el coeficiente de 0 ! ' correlación de la muestra no es significativo y la aparente correlación es pura casualidad. Tabla 16.1. Valores críticos para el coeficiente de correlación.
442
Parte VI. Regresión y correlación
Ejemplo 16.7. Con el caso que aparece en el ejercicio de autoevaluación (número de años que se ha estudiado inglés en la preparatoria o en la universidad y calificación en una prueba estándar de inglés), calcular el coeficiente de correlación de la muestra r y probar la hipótesis nula de no correlación con un nivel de significación de 0.01. Solución:n = 10; EX = 35; XxZ= 133; EY = 697 y &'Y= 2554; X y Z= 50085. Recordamos las fórmulas:
Operaciones:
1. Hipótesis nula: Ho.{p = 0 ) ; hipótesis alternativa: H , { p # 0 ) . 2. Nivel de significación:a = 0.01. 3. Valor crítico de la tabla: 0.765 4. Criterio: Rechazar Ho si r < -0.765 o bien r > 0.765. 5. Decisión: Como 0.91 > 0.765, se rechaza Ho y se concluye que sí hay correlación
entre las variables consideradas.
William H. Kruskal (n. 19 19) y W. Allen Wallis ( 1 9 12- 1998). Ambos, economistas estadounidenses. La prueba de Kruskal-Wallis fue propuesta en el artículo "Use of Ranks in One-Criterion Variance Analysis", publicado en el lournal ofAmerican Statistics Association, en 1952. Es de utilidad cuando no es aplicable el análisis de varianza debido a incumplimientos de las hipótesis del modelo.
Un pequeño grupo de 10 estudiantes que han estudiado algo del idioma inglés en la preparatoria o en la universidad resolvieron una prueba estándar de inglés. Las calificaciones respectivas en esa prueba (en escala del O al 100) fueron las siguientes:
1 '",y1 estudiado
""Os inglés
--3
Calzjicación en la prueba ( y )
1
/I
1. Ajuste una recta de mínimos cuadrados a los datos de esta tabla. 2. Con la recta de regresión obtenida, estime la predicción que se puede hacer sobre la
3. 4.
5. 6.
calificación que podna obtener en el TOEFL un alumno que ha estudiado inglés durante dos años en la preparatoria o en la universidad. Obtenga el error estándar de la estimación. Ensaye la hipótesis Ho en el sentido de que cada año adicional de estudio del idioma inglés en la preparatoria o en la universidad suma otros 12.5 puntos a la calificación esperada en la prueba del TOEFL. Utilice la hipótesis alternativa P # 12.5 y un nivel de significación de 0.05. Construya un intervalo de confianza de 99% de B, el incremento esperado de la calificación en la prueba del TOEFL por cada año de estudio adicional de inglés en la preparatoria o en la universidad. Suponga que el objetivo final del estudio fue estimar la calificación promedio en la prueba del TOEFL para solicitantes que han estudiado dos años de inglés en la preparatoria o en la universidad. Construya un intervalo de confianza de 99 % para esta media.
1. La recta de regresión Y= 6, + bXqueda determinada por su pendiente b y su ordenada en el origen b,. Estos parámetros están dados por las fórmulas siguientes:
444
Parte VI. Regresión y correlación
Ahora bien, con ayuda de una calculadora de bolsillo (poniéndola en modo estadís2554; ZX = 133; C Y = tico), se halla rápidamente que ZX = 35; C Y = 697; ~ X Y = 50085. Además, n = 10. Sustituyendo estos datos en las fórmulas de arriba, se obtiene entonces:
En consecuencia, la ecuación de la recta de regresión es:
O en forma aproximada: Y= 31.533 + 10.90% 2. Sustituyendo el valorX= 2 en la ecuación obtenida en la pregunta anterior se obtiene:
3. Con la fórmula original se obtiene:
Entonces, el error estándar de la estimación es:
Aquí procede una observación importante, de la que ya se habló antes. Hay dos tipos básicos de nomenclatura en los diversos libros. Por un lado, algunos autores definen los símbolos S, S, y S,, de la siguiente manera, llamémosla versión A:
Para estos autores, se aplica la fórmula siguiente:
Cap. 16. Regresión lineal simple y correlación
445
En cambio, otro grupo d e autores usamos la siguiente nomenclatura, que denotaremos la versión B:
Obviamente son los mismos valores que en la versión A, pero divididos entren. Como nosotros hemos adoptado esta notación, podemos calcular el error estándar de la estimación así:
Resulta claro que el valor d e s obtenido en el ejemplo de los matrimonios puede queen comparación con el valor verdadero si se usa la fórmula dar multiplicado por equivocada. 4. Usamos aquí la fórmula para un intervalo de confianza relativo al parámetro B, que es la pendiente de la recta de regresión poblacional:
&,
t=- b-m S
G Es interesante observar que aquí no pasaría nada si se hubiera usado el valor equivocado de s (es decir, 17.871), en vez del valor correcto (o sea, 5.651), ya que el valor de G e s t a r í a en exceso en el numerador y también en el denominador, por lo que se cancelarían. Así, esta fórmula es válida tanto en la versiónA como en la versión B por igual. En efecto, usando el valor equivocado en la fórmula se obtendría:
mientras que usando el valor correcto se tendría:
En las tablas de percentiles de la distribución t de Student se halla que el percentil con ocho grados de libertad es 2.306 (recuérdese que es un ensayo bilateral). Por consiguiente, la regla de decisión es rechazar la hipótesis nula H,:{B = 12.5) si ocurre que el valor calculado de t es < -2.306 o bien > 2.306; en caso contrario, se acepta Ho. Como -0.91 cae en la zona de aceptación (obviamente), no hay motivos para rechazar Hoy se concluye que con un nivel de significación d e a = 0.05 debe aceptarse H,.
t,,
446
Parte VI. Regresión y correlación
5. Usamos la fórmula para el intervalo de confianza de 100(1- a ) % relativo al parámetro poblacional B. Por lo general, se toma a = 0.05 o a = 0.01 como en este caso específico. Dicha fórmula es:
Aquí a = 0.01; y en las tablas de percentiles de la distribución t de Student hallamos el valor crítico es 3.355. De nuevo, aquí da lo mismo usar el valor equivocado de s o usar el valor correcto, pues ambos conducen a la misma respuesta, porque el valor equivocado contiene un exceso de dn tanto en el numerador como en el denominador, los cuales se cancelan. En efecto, usando el valor equivocado se halla que el intervalo es:
mientras que con el valor cowecto sale igualmente:
El intervalo de confianza buscado es, por tanto, desde 5.05 hasta 16.75 de incremento esperado en la calificación del examen de idioma inglés (en escala del O al 100) por cada afio adicional que se estudie inglés en la preparatoria o en la universidad (por supuesto, con una confianza de 99 %) . 6. El intervalo de confianza de 100(1- a ) % para la respuesta media klxo está dado por:
Primero hay que calcular la ordenada en la recta de regresión que corresponde al punto de abscisax, = 2. De hecho aquí no hace falta calcular nada, porque se obtuvo ya ese dato en la pregunta 2. Recuérdese que se obtuvo el valor Y= 53.34. Tenemos entonces todos los datos para aplicar esa fórmula directamente. La respuesta correcta se obtiene con el valor s = 5.561. Resulta ser:
Es un intervalo que va desde 42.7 hasta 63.9. Esto se interpreta diciendo que aquellos estudiantes que tienen exactamente dos años de estudio de inglés en la preparatoria o en la universidad, deberán obtener en el examen de inglés una calificación que oscile entre 42.7 y 63.9 (en escala del O al 100). Por supuesto, no es seguro, pero hay 99 % de probabilidad (confianza) de que así sea.
1. En una sección de la cafetería de una escuela, las órdenes de paquetes de hamburguesas, papas, refresco y pie de manzana constituyen la mayoría de las ventas de alimentos. El gerente de la cafetería desea evaluar cómo afecta el precio de esos paquetes a sus utilidades semanales, de manera que ha experimentado variando el precio de los paquetes durante nueve semanas diferentes, con los siguientes resultados:
a) Ajuste una recta de mínimos cuadrados a estos datos y construya un intervalo de confianza de 95 % para el coeficiente de regresión B.
b) Calcule el coeficiente de correlación r de la muestra dada y úselo para probar la
+
hipótesis nula de que p = O contra la alternativa de que p 0. c) iQué porcentaje de la variación en las utilidades semanales se puede atribuir a la relación entre la utilidad semanal y el precio de los paquetes?
2. Los datos siguientes pertenecen a un estudio acerca de los efectos que la contaminación ambiental tiene sobre la vida terrestre; en particular, el efecto de pesticidas en el espesor de los cascarones de ciertas aves:
Residuos de pesticidas Espesor r
del huee
Calcule el coeficiente de correlación r de estos datos y úselo para ensayar la hipótesis de que p = O contra la alternativa de que p # 0, con un nivel de significación de a = 0.01. 3. Algunos psicólogos sostienen que la velocidad con que las personas escriben en el teclado de una computadora está correlacionada con la velocidad a la que acostumbran leer las palabras impresas en un libro o revista. Se hizo un experimento con nueve estudiantes de una universidad y con cronómetro se les registró el número promedio de palabras por minuto que leen y el número promedio de palabras que escriben por minuto en un teclado:
a) Mida el grado de relación aparente entre la velocidad de mecanografía y la velocidad de lectura, calculando el coeficiente de correlación.
b) Pruebe la hipótesis nula de no correlación en el nivel de significación de a = 0.05. c) ¿Quéporcentaje de la variación en la velocidad de mecanografía se puede atribuir a la relación entre la velocidad de mecanografía y la velocidad de lectura?
4. Si calculamos r para cada uno de los conjuntos de datos siguientes, ¿debe sorprenderse uno si se obtiene r = 1y r = -1, respectivamente? Explique su respuesta.
5. En cada inciso, haga una prueba de hipótesis rápida para verificar si el valor de r es significativo, usando un nivel de significación de a = 0.05:
6. Verifique en cada inciso si r es significativo, usando un nivel de significación de a = 0.0 1:
7. La tabla siguiente muestra los porcentajes de la votación que predijo la empresa de consultoría Mitofsky en sondeos de preferencias sobre siete candidatos a gobernadores estatales de los partidos políticos principales de México, y los porcentajes de votación que finalmente obtuvieron:
Encuesta ( x )
Ekcciún (y )
42 %
51 %
34 %
31 %
59 %
56 %
41 %
42 %
53 %
';3 %
40 %
5%
55 %
54 %
Cap. 16. Regresión lineal smiple y correlación
449
a) Calcule r en relación con estos datos. b) Como r no depende de las escalas de x y y, su cálculo a menudo se puede simplificar sumando un número positivo o negativo adecuado a cada términox, a cada término y o a ambos. Vuelva a resolver el inciso a después de restar 34 de cada x y 31 de cada y.
8. Se escogieron al azar 16 estudiantes de nivel profesional del ITESM (sin importar la carrera que cursaban) y se les sometió improvisadamente a un examen informal de matemáticas básicas de nivel preparatoria y otro examen general y básico de redacción y ortografía. En escala del O al 100, las calificaciones obtenidas por cada uno de ellos fueron:
;1
Matemáticas 1 Redacción x )
a) Calcule el valor de r. b) Calcule otra vez r, pero ahora restando constantes adecuadas para cada valor de x y y, tal y como se sugirió en el ejercicio 6b. c) Pruebe la hipótesis nula p = O en el nivel de significación de a = 0.05. d) Estime el porcentaje de la variación de las calificaciones en el examen de redacción que se puede atribuir a (o explicar por) la relación intrínseca entre la aptitud para las matemáticas y la calidad de la ortografía y redacción de una persona. 9. Una compañía de refrescos está estudiando el efecto de sus campañas publicitarias por TV entre los estudiantes de una universidad. A un grupo de ocho estudiantes elegidos en forma aleatoria se les preguntó cuántas latas del nuevo refresco habían comprado en la semana anterior y cuántos anuncios de dicho refresco habían visto por TV en esa misma semana: x (número de anuncios) Y
(número de latas)
4 9 3 12 14 7
O 6
1 3
6 5
2 6
1
5 101
a) Desarrolle la ecuación de la recta de regresión (mínimos cuadrados). b) Calcule el coeficiente muestra1 de determinación y el coeficiente de correlación.
1. Exprese en cada caso si esperaría obtener una correlación positiva, negativa o no obtener ninguna correlación (explique brevemente la razón de su respuesta):
a) Las edades de los esposos y las esposas. b) La cantidad de hule que contienen los neumáticos (llantas) de los automóviles y el número de kilómetros que han recorrido.
450
Parte VI. Regresión y correlación
El ingreso o dinero de una persona en México y la educación que tiene. La talla de camisa y el sentido del humoc El número de horas diarias que estudia ajedrez un ajedrecista y su rating (o puntuación). El número de problemas y ejercicios que ha intentado resolver un alumno de estadística y su calificación en los exámenes de la materia. El número de veces que un estudiante ha faltado a las clases de matemáticas y la calificación obtenida en los exámenes de la materia. La inteligencia de una mujer y el tamaño de su busto. El número de horas que una persona ha pasado practicando boliche y las puntuaciones promedio que obtiene en ese juego. La inteligencia de una persona y el tamaño de su cabeza. El número de horas que una persona duerme cada día y el número de años que llega a vivir. La rapidez para aprender un nuevo idioma y el número de idiomas que ya domina una persona. La edad de una persona y el número de palabras y conceptos que es capaz de retener en la memoria.
2. Explique por qué una ecuación de estimación es válida únicamente sobre el intervalo de valores empleados en su desarrollo, es decir, sólo dentro del intervalo de donde se extrajo inicialmente la muestra. 3. Explique si es correcto emplear el coeficiente de determinación r 2 para describir el porcentaje del cambio en la variable independiente x que se debe a un cambio en la variable dependiente y, y si no es así, entonces ¿en qué sentido debe interpretarse r *?
Los siguientes siete ejercicios (que pueden utilizarse como exámenes) contienen una tabla de datos que representa un conjunto de observaciones para la variable explicativa (o independiente) x, con los correspondientesvalores para la variable explicada (o dependiente) y. El tiempo límite para contestar cada ejercicio es de una hora. En cada ejercicio, conteste las siguientes seis preguntas, que debe resolver usando s61o una calculadora, tablas de valores críticos para la distribución t de Student con v grados de libertad y tablas de valores críticos para el coeficiente de correlación, así como un formulario (lista de fórmulas) elaborado por usted mismo:
a) Obtenga la ecuación de la recta de regresión por ajuste de mínimos cuadrados. b) Calcule el valor numérico del error estándar de la estimación S = se. C)
Obtenga el valor numérico del coeficiente de determinación.
d) Construya un intervalo de confianza de 95% para el parámetro B, (ordenada en el origen de la recta de regresión poblacional). e) Determine un intervalo de confianza de 95 % para el parámetro B (pendiente de la recta de regresión poblacional). f ) Elabore una prueba de hipótesis con un nivel de significación de a = 0.05, para ensayar la hipótesis nula de que no hay correlación a nivel poblacional entre ambas variables, contra la alternativa de que sí hay alguna correlación. Para ello debe especificar clara. mente las siguientes cinco etapas de la prueba:
i ) Hipótesis nula e hipótesis alternativa ii) Valor calculado del estadístico de prueba que use
Cap. 16. Regresión lineal simple y correlación iii) Valor crítico hallado en la tabla i w ) Intervalo de valores donde se rechazaría la hipótesis nula U) Conclusión (rechazar o no rechazar la hipótesis nula).
1. Datos:
2. Datos:
3. Datos:
4. Datos:
5. Datos:
452 6. Datos:
7. Datos:
Formulario sugerido para resolver las preguntas de estos ejercicios:
SSE =Sw - bS,
1 Intervalo de confianza para Po: / Intervalo de confianza para p:
I
I
1
gunos conceptos undamentales de probabilidad Regla multiplicativay probabilidad condicional Probabilidad condicionai. Con frecuencia ocurre que la probabilidad de un suceso puede verse afectada por el conocimiento de otro suceso cuyo resultado influye en el primero. Esta idea conduce al concepto de la probabilidad condicional de eventos, la cual se define de la siguiente manera. Para cualesquiera dos eventos A y B (no vacíos), se define la probabilidad condiaonai de B dado A mediante la relación multiplicativa:
Como la intersección de conjuntos es conmutativa, ello es equivalente a escribir:
Regla multiplicativa. Para más de dos eventos se puede generalizar la regla multiplicativa dada por la definición anterior; por ejemplo, para tres eventos A, B y C se tendría:
Ejemplo Al. En el estante de una biblioteca hay ocho libros de física iguales (mismo autor, edición y título), excepto que cuatro de ellos están a la rústica y los otros cuatro están empastados (o encuadernados). Supóngase que en forma sucesiva vienen tres lectores y cada uno de ellos pide a la bibliotecaria un ejemplar de ese libro para llevar a casa. Si la bibliotecaria los elige al azar, ¿cuál es la probabilidad de que al primero le toque empastado, al segundo a la rústica y al tercero también a la rústica? Solución: Es claro que si denotamos por A, B y C a esos tres eventos y aplicamos la fórmula recién expuesta, la solución será:
454
Apéndice A. Algunos conceptos fundamentales
Nótese que la respuesta l/7 es exacta, mientras que el valor 0.1429 es sólo una aproximación redondeada a cuatro dígitos decimales. Siempre que sea fácil o posible se prefiere dar la respuesta en forma de una fracción o número racional; en su defecto, se acostumbra dar una aproximación redondeada a por lo menos cuatro dígitos después del punto decimal. Es frecuente entre los estudiantes que se inician en el estudio de la teoría de las probabilidades, que surja en ellos cierta confusión entre los eventosA nB (intersección) y A 1 B (condicional de A dado B). En uno y otro caso se habla de la ocurrencia de ambos eventos, A y B. Pero la diferencia estriba en que en el caso de A 1 B de antemano se conoce que B ha ocurrido y esta información de alguna manera modifica la probabilidad de A, toda vez que el espacio muestral (o casos totales) se reduce al conjunto B. Los siguientes ejemplos aclaran esto. Ejemplo A.2. Un maestro lanza dos dados sobre la mesa, mira los números que salen y los cubre con la mano para que sus alumnos no puedan verlos. Entonces, el maestro les pregunta lo siguiente:
a ) ¿Cuál es la probabilidad de que uno de los dados muestre un 4 y el otro un 5? 6) Supóngase que el maestro les proporciona a sus alumnos la información de que en uno de los dados salió el 5. Conociendo ese dato, ¿cuál es entonces la probabilidad de que el otro dado muestre el 4? Solución: a ) Los dados son distinguibles y podemos llamarlos "dado 1"y "dado 2". Si en el dado 1sale n y en el dado 2 sale m, entonces escribimos (n, m), donde n y m son cualesquiera números del 1 al 6. Entonces, el espacio muestral R consiste de 36 posibles parejas ordenadas de este tipo, es decir, 51 = ((1, l), (1,2), ... , (6,6)). Si E es el evento de que un dado muestre un 4 y otro dado un 5, entonces E = ((5, 4), (4,5)). Para hallar la probabilidad de este suceso E, se divide el número de casos favorables (2) entre el número total de casos (36). Por tanto, la respuesta a la primera pregunta es: probabilidad de que un dado muestre un 4 y el otro un 5:
b) Los alumnos saben que en uno de los dos dados salió el 5. Entonces esta información reduce el espacio muestral al siguiente conjunto:A = ((1, 5), (2,5), ( 5 3 , (4, 5), (5, 5), (6, 5), (5, l), (5, 2), (5,3), (5,4), (5,6)). Es decir, de los 36 elementos originales de Q ahora el espacio muestral se ha reducido a los 11 elementos del conjunto A. Nótese que son 11 y no 12, porque doble 5 sólo hay uno. En consecuencia, sabiendo que en un dado salió un 5, la probabilidad de que salga un 4 en el otro dado es el cociente del número de elementos de E = ((5, 4), (4, 5)) 2 entre el número de elementos de A, es decir: -. Los restantes 25 elementos 11 de 51 ya no tienen que tomarse en cuenta, porque se tiene la certeza de que no ocurrieron. Asimismo, podríamos haber resuelto este inciso mediante la fórmula. Sean los eventos: A = {En uno de los dos dados salió el 5 ) ;B = {En uno de los dados salió el 4). Entonces,A n B = E = {(5,4), (4, 5)) y por tanto:
Algunos conceptos fundamentales de probabilidad
455
Ejemplo A.3. En un grupo de 36 estudiantes universitarios hay nueve que dominan el idioma inglés, cuatro que dominan el francés y dos que dominan ambos idiomas (ya contados entre los anteriores). Se selecciona un alumno al azar en ese grupo y se comprueba que domina el inglés. ¿Cuál es la probabilidad de que domine el francés? Solución: Sean los eventos I = {Domina el inglés.); F = {Domina el francés.). Para un alumno cualquiera del grupo se tendrá:
Entonces:
Nótese que el conocimiento previo de que el estudiante dominaba el inglés aumentó la probabilidad de que dominara ambos idiomas de '/18 a 2/9 porque el espacio muestral se redujo a los nueve que dominan el inglés y los restantes 27 alumnos no necesitaron ser considerados. Eventos independientes
Por definición, dos eventos A y B no vacíos se llaman independientes si ocurre que P(A B) = P(A) o bien P(B A) = P(B). Queda claro que cualquiera de estas dos igualdades P(A n B ) P(A n B ) implica a la otra, ya que = P(B). De mane= P(A) equivale a escribir P(B) P(A) ra equivalente, es lo mismo decir que dos eventos A y B son independientes si y sólo si se cumple la relación P(A nB) = P(A)P(B). Es interesante observar que de acuerdo con esta definición, puede darse el caso de
1
1
que un evento sea independiente de sí mismo. En principio, sólo el espacio muestral !2 tiene esta curiosa propiedad: P(sz 1 sz) =
P(Q nQ ) P(Q)
- P(Q) -l = p ( s z ) P(Q)
Por regla general, es posible decir a simple vista si dos eventos son independientes o no, pero si hay alguna duda, debe comprobarse con la fórmula. En principio, si dos eventos son físicamente independientes, entonces deben ser estadísticamente independientes también. Nótese que para que dos eventos sean independientes se ha puesto como requisito que no sean vacíos. Si no se hubiese puesto esa condición, entonces también el conjunto vacío 0 podría ser considerado como independiente de sí mismo, toda vez que:
Ejemplo A.4. Se lanzan tres monedas al aire para ver si caen en águila (a) o sol (S). SeaA el evento: {En las tres monedas sale el mismo signo); sea B el evento {Por lo menos una de las monedas muestra águila) y sea C el evento {Por lo menos salen dos águilas). Determinar si A y B son eventos independientes, así como para B y C, y para A y C. Solución: El espacio muestral Q tiene ocho elementos: !2= {aaa,saa, asa, ssa,
456
Apendice A. Algunos conceptos fundamentales
aas,sus, m,sss). Además, A = {aaa, SS) ; B = {m, saa, asa, ssa, aus, sas,ass) y A n B = {aaa}.Tenemos:
1 2 7 Claramente, - -# así que A y B no son independientes. 8
8,
8 Por otra parte, C = {aaa,saa, asa, aas); A n C = {aaa}; B
n C = C. Entonces
se tiene:
2
1
8
2
Como - -=
1 , luego A y C sí son independientes. El lector debe comprobar 8
como ejercicio que B y C no son independientes. Ejemplo A.5. Si A es el evento {Brasil gana la próxima copa del mundo de futbol) y B es el evento {Mi tía María tuvo resfriado anoche). Determinar si se trata de a) eventos
independientes o 6)de eventos ajenos (o excluyentes). Solucidn: En efecto son eventos independientes, pero es un error típico pensar que se trate de conjuntos ajenos, puesto que sí tienen intersección. De hecho, su intersección es el conjunto {Brasil gana la próxima copa del mundo de futbol y además mi tía María tuvo resfriado anoche). En general, para que n eventos A,, A,, ... ,A" sean todos independientes (desde el punto de vista probabilístico) se requiere que sean independientes por parejas; o lo que es lo mismo, se requiere que P(A, n A, n ... n A") = P(A,) n P(AJ n . . . n P(AJ. En el ejemplo A.4 de las tres monedas, resulta claro que los tres eventos A, B y C no son independientes. Probabilidades posteriores y la Regla de Bayes
Los métodos estadísticos clásicos subrayan la importancia del papel que desempeña la opinión apriori acerca de la estimación de algún parámetro o parámetros. No obstante, hay otro enfoque diferente en análisis de decisiones, basado en los métodos y en el pensamiento bayesiano. Los métodos bayesianos proporcionan los medios que posibilitan la modificación formal de la opinión a priori, modificándola a la luz de información a posteriori. Los métodos bayesianos de pronósticos son útiles por sí mismos y también porque permiten comprender mejor las limitaciones de la estadística clásica y por ende las limitaciones de los métodos clásicos de pronóstico. Los términos latinos a priori y a posteriori significan "antes de la experiencia" y "después de la experiencia", respectivamente. En estadística, las probabilidades posteriores (o a posteriori) se deducen a partir de las probabilidades apriori (o anteriores) mediante el célebre Teorema de Bayes. Thomas Bayes fue un presbítero inglés que ideó una famosa regla o fórmula conocida como Teorema de Bayes. 'Ihomas Bayes fue un teólogo y ministro presbiteriano inglés. Su célebre fórmula no fue publicada sino hasta tres años después de su muerte, en 1763. Años más tarde, primero Laplace y más recientemente Jefferys y Jaynes, entre otros, desarrollaron el pensa-
Algunos conceptos fundamentales de probabilidad
457
miento de Bayes y fundaron la "inferencia bayesiana", así como la "estadística bayesiana". Bayes jamás supo del alcance que iban a tener sus ideas en la estadística. Hoy día hay más de cien sitios de Internet dedicados a la estadística bayesiana. Bayes nació en 1702 en Londres. Su padre fue uno de los primeros seis ministros "no conformistas" ordenados en Inglaterra, y Thomas siguió los pasos de su progenitor. En 1720, fue ordenado ministro en la capilla presbiteriana de Tunbridge Wells, en Kent, a unos 50 km de Londres. El título de su trabajo revolucionario fue Essay towards soluing a problem in the dochine of chances. Bayes murió en Tunbridge Wells el 17 de abril de 1761. Ilustración de la Regla de Bayes mediante algunos ejemplos simples
Ejemplo AG. Supóngase que en una oficina hay tres secretarias:Juanita (A,Lupita (L) y Rosita (R), las cuales manejan, respectivamente, 50%, 30%y 20% de los archivos (o informes) importantes de,sujefe. Las probabilidades (aprion3 de que ellas pierdan o trassituación papelen un informe son, respectivamente, 0.15, 0.05 y-O.lO. ~s~uematizar-esta mediante un diagrama de árbol. Solución:Aquí se usa el término latino aprion para asignar una probabilidad (quizá subjetiva) de un suceso que puede ocurrir, mas no ha ocurrido aún. Seguramente en los respectivos cum'cula de esas secretarias no se menciona el porcentaje de archivos que tienden a perder o a traspapelar, pero puede ser una estimación subjetiva de su jefe, con base en la experiencia de conocerlas durante muchos años. Denotemos por Te1 evento "informe traspapelado" y por N el evento "informe no traspapelado". Entonces, el árbol de probabilidades tendría el aspecto de la figura A. 1.
Figura A. l. Árbol a priori.
Obsérvese que todos los valores numéricos de probabilidades que aparecen en las ramas del árbol corresponden a datos del problema que se proporcionaron, y no hubo necesidad de hacer ningún cálculo. Este tipo de árbol se llama árbol a priori, ya que esquematiza cómo está la situación general antes de que se haya perdido ningún informe. En tanto no se llegue a perder o a traspapelar ningún informe, los valores numéricos del árbol son la única fuente disponible de datos.
458
Apéndice A. Algunos conceptos fundamentales
Sin embargo, si de repente se pierde un informe (evidencia empírica), surgen entonces nuevos eventos (llamados a posteriori) ue no están descritos en el árbol: concretamente, los eventos condicionalesJ / T,J 1 N, T. L 1 N, R 1 T y R 1 N Estos seis eventos a posterior? también tienen ciertas probabilidades (llamadas posteriores), pero para calcularlas se requiere una fórmula interesante que introdujo Thomas Bayes y que se describe a continuación. Obsérvese que si se sigue una trayectoria de ramas adyacentes o contiguas (es decir, "en serie"), entonces las probabilidades se van multiplicando, por cuanto se trata de intersección de eventos. Por ejemplo, en el árbol de la figura A.l, la probabilidad de que un informe manejado por Juanita se traspapele será el producto de las dos ramas que están hasta arriba:
Ll
Por otra parte, si se trata de trayectorias excluyentes ("en paralelo"), entonces las probabilidades se suman. Por ejemplo, en la figuraA.1, la probabilidad de que un informe sea manejado por Juanita o por Lupita es: Este sencillo principio hace que un diagrama d e árbol sea de gran utilidad para los cálculos rápidos de probabilidades: multiplicamos las probabilidades si se trata d e ramas adyacentes (contiguas), o bien las sumamos si se trata de ramas separadas que emergen de un mismo punto. Por lógica, la suma de probabilidades de todo un manojo de ramas que emergen d e un mismo punto (como los manojos o racimos de bananos o plátanos) es necesariamente igual a 1. Volviendo a la figura A . l , y siguiendo el principio mencionado, se calculan las probabilidades de las seis posibles intersecciones de parejas de conjuntos, en las que el primer conjunto esJ,L o R; y el segundo conjunto es T o N. Estas son las siguientes, en orden de aparición:
Por supuesto, estos seis eventos cubren todo el espacio muestra1!2, y por consiguiente, la suma de esas seis probabilidades tiene que ser igual a 1 por fuerza. El lector debe comprobarlo con una calculadora de bolsillo. En este caso, y siguiendo la metáfora de los plátanos, se trata ya no de un racimo o manojo, sino de toda la penca completa arrancada desde su punto de origen. La probabilidad a priori (o probabilidad anterior) de un suceso es la probabilidad que se le asigna antes de que se tenga noticia de que ha ocurrido. Por ejemplo, la probabilidad d e que explote el Sol la semana siguiente y por tanto se extinga el Sistema Solar debe ser muy pequeña, y los astrónomos pueden dar un valor numérico estimado de esa probabilidad con base en sus estudios sobre la estructura interna del Sol y las estrellas. Sin embargo, como es un suceso que nunca antes ha ocurrido, no podemos dividir casos favorables entre casos totales ni estimarla en forma directa. De manera análoga, cuando un individuo acude a una compañía de seguros a comprar una póliza de seguro de vida, la compañía debe hacer una estimación a pyiori de la probabilidad aproximada de que ese individuo específico muera. No hay otra manera
Algunos conceptos fundamentales de probabilidad
45 9
de calcularla, porque ese individuo jamás ha muerto antes, así que la estimación puede hacerse con base en estudios de mortalidad y tomando en cuenta los hábitos particulares, la edad, los antecedentes y la salud en general de este individuo. Es posible que la estimación sea un poco subjetiva, pero la compañía de seguros asume el riesgo y acepta pagar una fuerte cantidad a los deudos en caso de que el individuo fallezca, a cambio de unas cuotas módicas anuales (o mensuales) que estimará de acuerdo con las probabilidades a pn'ori de que muera. Al firmarse el seguro, es como si se hubiese pactado una apuesta: el individuo apuesta a que se va a morir, mientras que la compañía de seguros apuesta a que no se va a morir. Cada quien tiene sus respectivos riesgos, así como sus respectivas pérdidas o ganancias en ese pacto. Desde luego, el asegurado tiene la opción de ganar la apuesta cuando quiera si se arroja a las vías del tren en el momento que lo desee, mas no sería él quien disfrutara el triunfo en la apuesta, pues la compañía pone en el contrato varias cláusulas que la protegen contra semejantes contingencias. En un ejemplo menos trágico, y retomando el caso de las secretariasJuanita, Lupita y Rosita que se examinó (ejemploA.6), las estimaci* nes de su jefe en el sentido de que ellas pudieran perder o traspapelar un informe eran probabilidades condicionales aprion', quizá estimaciones subjetivas. Otro concepto relacionado es el de probabilidad total, que es la suma exhaustiva de las probabilidades de todos los casos mutuamente excluyentes que conducen a dicho evento. En el ejemplo A.6 (el caso de Juanita, Lupita y Rosita), si se quisiera averiguar cuál es la probabilidad total de que un informe cualquiera llegue a perderse o a traspapelarse, se observa el árbol de eventos y se suman las probabilidades de todas aquellas ramas excluyente~que conducen al evento T (traspapelar un informe):
lo cual equivale a decir que de acuerdo con los datos del ejemplo, 11% de los informes del jefe van a perderse o a traspapelarse. El concepto de probabilidad aposterion' (también Ilamadoprobabilidadposten'oro probabilidad de una causa) es la gran aportación que el reverendo Thomas Bayes hizo a la estadística. Bayes era un teólogo protestante que pasó gran parte de su vida tratando de demostrar la existencia de Dios para aquellos que no creían en él. Estaba empeñado en lograr una demostración matemática de la existencia de Dios, y para ello partió de la hipótesis de que Dios era por definición más que un ser necesario, el único ser necesario, es decir, la causa de todo lo que existe (o de todos los seres contingentes). Bayes razonó que las causas producen efectos y que éstos, a su vez, pueden ser causas d e otros efectos. Además concilió la idea d e Aristóteles de que un efecto es producido en general por varias causas y no sólo por una. Aristóteles les había dado nombres a las distintas causas que provocan un suceso: "causa eficiente", "causa material", "causa formal", "causa instrumental", etc. Pero Thomas Bayes fue mucho más lejos y trató de razonar en sentido inverso, partiendo del efecto y siguiendo hacia atrás el hilo de las causas que lo antecedieron, hasta llegar posiblemente a la causa última y final: la existencia de Dios como ser necesario y causa de todo lo que existe. Bayes dedicó muchos años de su vida a trabajar afanosamente en esta dirección, y jamás sabremos si al final quedó satisfecho con lo que encontró. Sin embargo, en su afán de demostrar la existencia d e Dios por métodos matemáticos, dio con una fórmula muy útil que hoy se conoce como Teorema de Bayes (o Regla de Bayes). Se trata de una fórmula sencilla que permite calcular las probabilidades de las causas dados los efectos, es decir, las probabilidades aposteriori. Como lo que ya ha ocurrido no puede cambiarse, el lector podría pensar que tal vez sea ocioso indagar por las probabilidades de las causas de eso que ocurrió; o como reza
460
Apkndice A. Algunos conceptos fundamentales
el dicho: Lo hecho, hecho está. No obstante, el concepto de probabilidad a postm'ori y la fórmula de Bayes son de gran utilidad práctica para deslindar responsabilidades o fijar culpas de algo que ya pasó. Por ejemplo, volviendo al caso de las tres secretarias: Juanita, Lupita y Rosita, si el jefe nota que se le ha perdido un informe importante, por más que haga o se enfade no lo va a recuperar ya; sin embargo, puede usar esa evidencia empírica para revalorizar la opinión que tenía de sus secretarias, y asignarles nuevas probabilidades (aposterioq por medio d e la Regla de Bayes. Esas probabilidades tendrían el siguiente formato: P( T ) ,P(L 1 T)y P(R 1 T ) . Si se observa el árbol de eventos de la figura A.l, tales probabilidades aposteriori no aparecen en ninguna parte. Sin embargo es posible calcularlas mediante fórmulas conocidas:
JI
Estas tres probabilidades apostm'ori proporcionan una nueva valoración de la eficiencia relativa de las tres secretarias, a la luz del hecho que un informe se perdió. Antes de que eso ocurriera, el jefe sólo sabía (véase fig. A.l) que Juanita manejaba 50 % de sus informes y tendía a perder tan sólo 15% de los informes que pasaban por sus manos. Gracias a la pérdida de un informe, ahora ya sabe que Juanita es en realidad responsable de más de 68 % de los informes que se pierden. Naturalmente, eso no se debe a que Juanita sea menos eficiente de lo que parecía, sino a que es ella quien tiene a su cargo el mayor volumen de informes que se procesan. Habiendo calculado ya la probabilidad total para que un informe se pierda, P(T) = 0.11 y para que un informe no se pierda, P(N) = 0.89, se puede ahora enfocar toda la situación desde una nueva perspectiva, a saber, de efecto a causa; en cuyo caso se obtendrá un nuevo árbol de probabilidades, llamado árbol a posteriori, ya que se construye a partir de las probabilidades totales calculadas y de las probabilidades a posteriori calculadas también. A diferencia del árbol apriori (cuyas entradas numéricas son estimaciones dadas), en el árbol aposteriori todos los valores de probabilidades tienen que calcularse por medio de fórmulas. Véase el árbol de la figura A.2.
Algunos conceptos fundamentales de probabilidad
46 1
Las tres ramas de la parte inferior derecha d e este árbol representan las probabilidades posteriores d e que un informe no se pierda. Es decir, la no pérdida de un informe también puede usarse como evidencia empírica para dar una nueva apreciación de la eficiencia relativa d e cada secretaria. En este caso, nótese que si todo marcha bien y no se pierde ningún informe, el jefe debe darle principalmente las gracias a Juanita, ya que carga con cerca de 48 % de la responsabilidad de que todo marche bien, en tanto no se pierda ningún informe del jefe. Las probabilidades de las tres ramas de la parte inferior derecha se calculan de manera similar:
Ejemplo k7. Una importante empresa que fabrica calzado está distribuida en tres sitios distintos L,, L, y L,, los cuales contribuyen, respectivamente, con 45 %, 30% y 25% a la producción total de esa empresa. Supóngase que se estima que para el sitio L, 8% de los pares de zapatos tienen defectos que se detectan en pruebas de control de calidad, mientras que las cifras correspondientes para los sitios L, y L, son 6% y 3 %, respectivamente. Si un par de zapatos es extraído al azar de la producción total y se observa que tiene defectos, encontrar la probabilidad de que haya sido fabricado en el sitio L,. Solución:Denotemos por D al evento "zapato defectuoso". Entonces, d e acuerdo con la fórmula de Bayes se tendrá que:
Aunque el Teorema d e Bayes se deduce de los axiomas de probabilidad y de la definición de probabilidad condicional, se trata de una proposición que ha sido objeto de controversia. No puede haber duda acerca de la validez del Teorema de Bayes, pero han surgido argumentos considerables acerca de la interpretación de las probabilidades aprz.0ri P(BJ. Asimismo, gran parte del misticismo que rodea al Teorema de Bayes se atribuye al hecho de que vincula un tipo de razonamiento hacia atrás o "inverso", es decir, razonamiento del efecto a la causa. Ejercicios de autoevaluacibn Al
1. En la competencia olímpica d e marcha o caminata, se supone que el atleta no debe
flotar, es decir, debe mantener siempre o con el piso. Sin embargo, lo:. videos muestran de manera inequívoca que aproximadamente 80 % de los marchistas flotan en algún momento de la competencia. Por otra parte, los jueces que se encargan de amonestar a aquellos marchistas que flotan suelen equivocarse a veces, de tal manera
462
2.
3.
4.
5.
6.
7.
Apéndice A. Algunos conceptos fundamentales
que 10 % de las veces amonestan a los que no flotan, mientras que 30 % de las veces pasan inadvertidas las flotaciones de los marchistas. Si el ganador de una competencia no recibió ninguna amonestación, icuál es la probabilidad de que realmente no haya flotado? Se tienen dos tarjetas: una es negra por ambas caras, y la otra tiene una cara negra y la otra blanca. Se meten en una bolsa y se extrae una de las dos tarjetas al azar, la cual se coloca sobre la mesa. Si la cara que muestra hacia arriba es negra, icuál es la probabilidad de que también la cara de abajo sea negra? Se tienen dos cajas: una caja 1 con cuatro esferas blancas y tres negras, y otra caja 11 con tres esferas blancas y cinco negras. Se elige una de las dos cajas al azar, de la cual se extrae una esfera blanca. Calcule la probabilidad de que provenga precisamente de la caja 1. Un ratón de laboratorio se introduce en un laberinto en forma de T. Del lado izquierdo hay un pedazo de comida protegido para que el ratón no pueda olerlo de lejos; y del lado derecho hay una pequeña descarga eléctrica que sería desagradable para el ratón, mas no mortal. Supóngase que la primera vez que se introduce el ratón, hay una probabilidad de 0.5 de que vire a cualquiera de los dos lados. Si en el primer intento viró a la izquierda, entonces hay una probabilidad de 0.6 de que vuelva a virar a la izquierda en el segundo intento; sin embargo, si en el primer intento viró a la derecha y recibió la pequefia descarga eléctrica, entonces hay una probabilidad de 0.75 de que vire a la izquierda en el segundo intento. Si se observa que el ratón efectivamente viró a la izquierda en el segundo intento, icuál es la probabilidad de que haya virado también a la izquierda en el primer intento? Durante la época de exámenes en cierto colegio, sólo 25 % de los profesores advierten por escrito a sus alumnos que no está permitido levantarse a hacer preguntas durante la prueba. No obstante, se ha observado que a pesar de esa advertencia, 20 % de los alumnos se levanta a preguntar durante la pmeba. Para los profesores que no establecen dicha advertencia, la cifra correspondiente es de 70%. Si durante un examen a cargo del profesorx, de pronto irmmpe un inspector en el salón y observa que hay alumnos que se levantan a preguntar, icuál es la probabilidad de que ese profesor no les haya advertido por escrito a sus alumnos que se prohíbe hacer preguntas en los exámenes? Una compañía fabrica empaques de hule para tuberías en tres sitios distintos de una ciudad, llamémoslos S,, S, y S,, los cuales producen, respectivamente, 45 %, 30% y 25% del total de la producción. Se estima que 8% de los empaques fabricados en S, son defectuosos, mientras que para S, y S, las cifras correspondientes son 6% y 3 96. Los empaques fabricados por los tres sitios se concentran luego en una bodega de la ciudad. Si un inspector de control de calidad toma un empaque al azar de la bodega y lo encuentra defectuoso, ¿qué probabilidad hay de que provenga del sitio S,? La siguiente tabla muestra la proporción de pacientes que ingresan en la clínica de especialidades Aranda de la Parra de León, Guanajuato, y las probabilidades aproximadas de curación completa:
/
1
/
' Enfermedades gastrointestinales
1
Especialidad médica Al Traumatología y ortopedia .A2 1 Enfermedades cardiacas y circdatorias A3 A4
i
1 Gínecología y obstetricia
Porcentaje Probabilidad del total que de curación l irtgrexan -_.cornpletaA 19 0.55 0.40 12 1 . 28.-1 0.801 1
1
14
0.96
A5 A6
-A7 A8 A9
/ Oftalmología y otorrinolaringología
1
Cancerología Dermatología
j Neumología 1 Sida
---
5 6
0.50 0.10
6
0.85 0.80
7
1
I
i 1
3
Si un enfermo de esta clínica fue dado de alta sano, calcule la probabilidad de que: a) haya sufrido algún padecimiento cardiaco o circulatorio; 6) haya sufrido algún golpe o lesión física.
8. En cierto país subdesarrollado aquejado por una fuerte inflación, los economistas
9.
10.
11. 12.
13.
14.
esbozan tres teorías: teoría 1: la inflación desaparecerá antes del cambio de gobierno; teoría 11: ocurrirá una depresión; y teoría 111: habrá una recesión. Ellos estiman que las probabilidades de que se lleguen a materializar las teorías 1, iI y 111son respectivamente 0.40, 0.35 y 0.25. Por otra parte, los expertos consideran que las probabilidades de que ese país salga del subdesarrollo, si ocurren realmente los eventos i, 11y 111, son de 0.90,0.60 y 0.20, respectivamente. Supongamos que el país de todos modos no logra salir del subdesarrollo. ¿Cuál es la probabilidad de que la inflación haya desaparecido antes del cambio de gobierno? En un salón 1hay siete alumnos, de los cuales cuatro estudian ingeniería y tres actuaría; en un salón 11 hay ocho alumnos, de los cuales tres estudian ingeniería y cinco actuaría. Se pasa al azar un alumno del salón 11al salón 1, y luego se elige al azar un alumno del salón 1. Determine la probabilidad de que sea estudiante de ingeniería. Una caja 1 contiene cuatro canicas blancas y tres negras; una caja 11contiene tres canicas blancas y cinco negras; y una caja 111contiene seis canicas blancas y tres negras. De la caja 1se extrae al azar unacanica y se deposita en la caja 11. Luego, de la caja 11 se extrae al azar una canica y se traspasa a la caja 111. Por último, se saca una canica al azar de la caja 111. Determine la probabilidad de que sea blanca. Una urna 1 contiene dos esferas blancas y dos negras; una urna 11contiene dos blancas y tres negras. Se selecciona una urna al azar y se extraen dos esferas juntas de manera aleatoria. ¿Cuál es la probabilidad de que sean del mismo color? Un niño usa calcetines de sólo dos colores: azul y negro. Sin embargo, no los tiene ordenados por parejas, sino que los tiene sueltos en dos cajones de su ropero. En el cajón de arriba tiene seis calcetines negros y dos azules; y en el cajón de abajo tiene tres calcetines negros y cinco azules. No puede prender la luz para ver, porque despertaría a su hermano menor; así que toma un calcetín de cada cajón, se los pone en la oscuridad, se viste y se va a la escuela. ¿Cuál es la probabilidad de que se haya puesto calcetines del mismo color? Supóngase que en cierto lugar llueve aproximadamente 40% de los días y hay cielo despejado 60% de los días. Supóngase además que la gente de ese lugar puede más o menos predecir si lloverá o no, consultando el barómetro; aunque ese instrumento no es del todo confiable, ya que en días lluviosos pronostica erróneamente "claro" 10% de las veces, y en días claros predice en forma incorrecta "lluvia" 20% de las veces. En un día cualquiera se consulta el barómetro y se comprueba que este instrumento pronostica que lloverá. Dada esa evidencia, ¿cuál es la probabilidad de que llueva? Dado el siguiente árbol de probabilidades aprz'ori, halle el árbol correspondiente de probabilidades a posteriori:
15. En una fábrica de piezas de poliuretano, hay dos máquinas automáticas (M, y MJ que producen piezas idénticas de ese material, las cuales son tiradas a un transportador común y empacadas manualmente por los obreros. La máquina M, tiene un rendimiento dos veces mayor que M,; sin embargo, M, es una máquina más antigua y produce s61o 60 % de piezas de calidad excelente, mientras que M, produce 84 % de piezas excelentes. Una pieza tomada al azar del transportador resultó ser de calidad excelente. Calcule la probabilidad de que haya sido producida por la máquina M,. 16. Cierto acontecimientoA puede ocurrir como consecuencia d e tres posibles causas mutuamente excluyentes: B,, B, y B,: las cuales forman un conjunto completo de eventos (es decir, la suma de sus probabilidades es igual a 1). Después d e que efectivamente ocurrió el acontecimiento A, se estimaron las probabilidades posteriores de las causas, hallándose que P(B, [A) = 0.6 y que P(B, 1 A) = 0.3. Determine la probabilidad condicional P(B, IA). Respuestas de los ejercicios de autoevaluación A l = 0.4286 = 0.6667 3. 32/53 = 0.6038
1. 2.
3/7
4. 5. 6. 7.
0.4444 0.9130 0.5853 a) 0.07397; ,119 = 0.1053 35/64 = 0.54687 403/630 = 0.6397 11/30 = 0.3667 7/16 = 0.4375 Denotemos por €),yO,, respectivamente, a los eventos "llueve" y "no llueve". SeanX, y X,, respectivamente, los eventos: "el barómetro pronostica lluvia" y "el barómetro pronostica día seco". Según esto, la probabilidad d e que llueva y el barómetro pronostique "lluvia" es:
8.
9. 10. 11. 12. 13.
2/3
Algunos conceptos fundamentales de probabilidad
465
En forma análoga, la probabilidad de tiempo despejado y predicción lluvia es:
La probabilidad de que el barómetro pronostique lluvia será entonces (probabilidad total):
Si en efecto, ocurre que el barómetro predice lluvia, entonces la probabilidad aposterion de que llueva es:
14. Por medio de la Regla de Bayes se halla el siguiente árbol aposteriori:
Tabla de Ia distriboci6n binomiaí a-ulads;
2
6 6 , n, p ) = L ( : ) p x ( l
==O
-P ) " - ~
==o
NOTA:Como algunos valores son demasiados cercanos a 1,se han puesto en notación científica abreviada usando la probabilidad complementaria. Por ejemplo, parap = .05, n = 4, r =3, aparece ~6.2500-6,lo cual significa 1 - 6.2500 x lo4= 1 - .O000062500 = .99999375. Este tipo de situaciones se aprecian hacia el final de valores grandes de n, y valores pequeños d e p (a mano izquierda). Por otra parte, a mano derecha hay algunos valores demasiado próximos a cero, los cuales también se han puesto en notación científica abreviada; por ejemplo, 2.3542E-8 significa 2.3542 x 104 = .000000023542.
A
Tabla de la distribución binomind acumulada (continuación)
a! 00
Para cada elección de n, r y p , la tabla proporciona el valor de 2 6 ( z , n, p ) = 2 ( : ) p X ( l x=O
==O
Tabla de la distribución binomind acumulada (continuación)
Para cada elecci6n de n, r y p , la tabla proporciona el Mlor de
2 x=O
b k , n, p ) = ~ ( : ) ~ ' ( p)'-' l ==O
' C C
-
!
:
____i__.-.__
Tabla de la distribución binominal acumulada (continuación) Para cada elecci6n de n , r yp, la tabla proporciona el valor de 2 6 0 1 , n, p ) = ==O
,-n
I
.
nnnr
2(:)px(i p)"-'
x=O
P
Tabla de la distribución binominai acumulada (continuación)
Para cada elección de n, r y p , la tabla proporciona el valor de
2
6 ( z , n, p ) = z(:)px(l - p)"-*
*=O
*=O
i
-
- 14
~2.6978-14 6.3994-10 2 1 10-l6 ~3.3389-11 15 ' 2 1- 1W16 ~1.7290-;2 16 1 i ~7.3497-14 -L1_7 2 1 18 L 1 - 10-l6 2 1- 1W16 2 1 - lWl6 19 2 1- lo-" 20 2 1- lW" 2 1 - 1WI6 21 2 1- 1V16 t 1 1W16
1 /
-
--.-
~1.4695-7 ~1.4336-8 ~1.1726-9 ~7.9394-11 ~4.3723-12
6.6643-6 ~9.1382-7 -~1.0516-7 c1.0027-8 c7.7810-10
.9998883 .9990165 - .9%702 -2.0221-5 --,9997736 9991405 ~3.0777-6 C4.3871-5 ,9998072 ~3.8855-7 c7.0618-6 ~3.59795 6.4792-6 ~3.9955-8 6.2694-7
~1.9151-13 ~7.1054-15 2 1- 1V16
4.7886-11 ~3.2611-9 ~9.6661-8 ~6.6339-7 c2.2476-12 c2.0323-10 ~7.7024-9 c6.1414-8 .~7.4385-14 ~9.0833-12 ~4,4050-10 ~4.0824-9
,9783419 .9924902
. -
. -- ..
.8462719 .9242052 ,9680427 .9886721 . .9966946 . , .9992281 ,9998614 c1.7941-5
--.
.5109198 .6720777 -
,1527816 ,2749630
p p p p
'
---
,9977959 .9994604
.S98919 61.7250-5 cZ.1080-6 ~1.8521-7
-
'
,8080548 .9040385 ,9600291 ,9865509 .&64966 --
-
,9993382
,
.O000521 -.O126211 ---~ ,0361750
,4353260 - ,08917131 .6114109 ,1889289 .TI1916 .3441076 ,5401227 .m89248 ,9576025 ,7361378 ,8854826 ,9881259
.0003213,0016841 -,0074561 .O276583 ,0850749 ,2142622.4357263
--
$719 6'
.m312
,3905236
,93047
1884 -
.04t .111
3.4574E-07
8.4698E-18 3.2220E-16
5549
,221
2.7674EO6
9.7340815 --
,
-- ' 111 68765-10
-
~
C9.8467-5 .9984599 ,9557535 .9082073 - ,9892657 1-~1.6890-5 L z s 1 0 .9966296 ,9584863 .9825303 c2.4936-6 ~7.6297-5 .Y340060 . .9990842 ,9982216 1 3 c1.3565 ,9997855 ,9943999 ~3.42284 ~2.0639-6 ~4.3079-5 ,9995465 ,9983504 6.1471-9 -.u~2.6690-7 ~7.3635-6 ~9.8624-5 .S95849 .C2.4337-10 ~2.9055-8 ~1.06086 ~1,8104-5 c8.8265-5 ~1.5626-11 c2.6280-9 ~1.2710-7 c2.7674-6 ~1.5646-5 c8.1857-13- -~1.9393-10 ~1.2435-8 ~3,4574-7 c2.2687-6 d.4639-14 c1.1375-11%.6769-~0 2 1- 1W16 ' t 1- lo-" C2.6207-7 2 1 10-16 > 1 - 1W16 2 1 ~5.0882-13 c5 7621-11 C2.6191-9 ~2.3193-8 c 1 . 4 8 4 ~ 2 . 4 6 4 - 1 ~1.434210 ~1.4765-9 21- O 21 Zi 1- lo-" lWk6 2 21 1-.1.10-16 2 1- 1WI6 4.6613-14 c5.0296-12 C6.0191-11 2 1 - 1V16 2 1- lW16 t 1 - lW16 2 1 - 1 c 2 1 - 1WI6 , ~8.7153-14 ~1.1787-12 1.0000000 1.0000000 1.0000000 1,0000000 1.0000000 1.0000000 1.0000000
~1.4839-6 12 ~3.5912-11 ~1.6208-7 13 c1.6099-12 ~1.5212-8 1 4 6,2506-14 c1.223%9 15 2 l - 1WI6 c8.4044-11 16 2 1- 10-l6 ~4.8946-12 ----, 17 2 1- 1WL6 c2.3881-13 18 t 1 10-l6 &.881&15 19 2 1 - 1WI6 . 2 1 1WI6 ,
-
,
,
-
,
-
y-' 'c3.43904 20 21
23 22 24 25
-
-
-
~
m
,732222.8462322 .9221989 9656085 ,9868309 ,9956736 .9987946 --
--
,9997193
6.35-90355--
,0778011 .1537678 .2677178 4142250
-,
.5000000 .6549810 7878219 ---
e -
,8852385 ,9461239 -.
,5753830 ,7264685
,9783574 - .M64483 ,9926834 ,9264347
1
~
.O059940 7.6297E-O5 ,0174697 3.6905E-04 .O442465 0015401 O978000 t - 4 9 .1894360 .O173319 ' ,3230719 ,0467742 .lo91228 .4881515 .2199647 ,6593451 ,8065116 ,3833106 _ .
'
.E613 .9706378 ~8.1646.6 '-9995447 1 &o5292 .9095281 6.5431-7 ~7.8261-5 ,997632%?5-c8.0333-8 c 9 . 7 1 5 ' ~ .99t34290 ~4.3347-9 ~7.7486-7 -.- -. .. ~1.1259-10 2.9M2-R -- 2.8430-6-.- --.999865Y_1.0000000 l.(M0M0 1.0000000 1.0000000 .
/
--
-
1.5212E-08 1.6208E-07 1.4839E-06 ,li1681E?5 7,8982805 ,0004575 -,0022613 ,0094764 -+--
,0333999 _.,5793257 .0979936: .76-0? -.236401(6 f ~ ~ { $ .972903 ,7287941 ,9962221 .-- ,9282102- q 1.0000000 q - -- - .1.0000000 .-
r
Tabla de la distribuci6o acumulada de Poisson: x 9 ( x , P))!=
p= x!
Para valores de probabilidad muy cercanos a 1, ésta aparece en términos de la probabilidad complementaria. Por ejemplo, para el caso de r = 3, p = 0.1, la probabilidad es 1- 3.8468 x lo4 = 1- 0.0000038468= 0.9999961532.
r
Tabla de la diniibuci6n nauouiada de Poisson (catinuucidn): z 9 ' ( x 9 P) =
z
e-'*pX x!
Áreas bajo la curva normal estándar a seis decimales
Los dos dígitos d e la primera fila son los centésimos d e cada valor d e z.
486 Tabla de la distribución nomai estándar inversa
,
PSPSO'E
1
66083'1
1
OF09P.Z
/
ZLZOE'Z
188Li.Z
1
W9LO.Z
1
808TL.Z
1
1
Z8SOI.E
L906P.Z
1
P18ZE'Z
1
6600Z'Z
1
P1960.Z
j 1
£6886.1
1
1EZI6.1
1
1OPP8'1
/
6ZZ8L.1
1
TI
99900.2
1
EP8Z6.1
1
íf848.1
1
8846L.1
1
TI
Percentiles importantes de la distribución t de Student con v grados de libertad
El último renglón (m grados de libertad) corresponde a la distribución normal estándar. Para percentiles simétricos a la izquierda del origen se usan los mismos valores pero con signo negativo; por ejemplo: to,,, = -t,,,,.
C
v
0.995 10.990
1 63.656 131.821
2 9.9250 16.9645 3 5.8408 4.5407 4 4.6041 3.7469 5 4.0321 6 3.7074 7 3.4995 8 3.3554
3.3649
/ 3.1427
1 2.9379 1 2.8965 1 2.8214 / 2.7638
9 3.2498 10 3.1693 11 3.1058 12.7181 12 .3.0545 12.6810
/
13 3.0123 14 12.9768
1
/ 2.6503
1 2.6245 1
15 2.9467 2.6025 16 2.9208 12.5835 17 2.8982
[ 2.5669
--18 2.8784&24 19 2.8609 ! 2.5395
0.985 10.980 15.895 5.6428 14.8487 3.8961 13.4819 3.2976 12.9985 ...---3.0029 j2.7565 2.8289 12.6122 2.7146 1 2.5168 2.6338 2.4490 . 2.5738 2.3984 21.205
1
0.975 12.706
0.970
0.965
10.579
4.3027
3.8964
3.1824
2.9505 2.6008
9.0579 3.5782 2.7626
2.7765 2.5706 2.4469
1 2.3646
2.3060
2.4216 2.3133 22.409 2.1892
1 2.0042
/ 1.9280
2.0554 2.0283 2.0067
1.9481
2.0600
2.4149
2.1448
2.0462
2.1315 2.1199
2.0343 2.0240
1 1.9509 1 1.9417
2.1098
2.0150 2.0071
1.9335 1.9264
2.0000
2.1009
2.3457
2.2047 2.1967
2.0930 2.0860
1.9937
,
1.9880 -
'
1.9092
20 2.8453 /2.5280
2.3362 2.3278
22 2.8188 12.5083
2.3202 12.1829
2.0739
1.9829
1 2.4999
2.3132 12.1770
2.0687 2.0639
1.9783 1.9740
1.9045 1.9003 1.8965
2.1666
2.0595
1.9701
1.8929
2.1620
2.0555 2.0518 2.0484
1.9665
1.8897 1.8867
23 2.8073 24 2.7970
/ 2.4922
2.3069
25 2.7874 12.4851 12.3011 26 2.7787 12.4786 2.2958 27 2.7707 2.4727 2.2909
1
28 2.7633 29 2.7564
/ 2.4671
2.2864
1 2.1715 / 2.1578
/ 2.1539
2.4620
2.2822
1 2.1503
2.4573
2.2783
2.1470
'
1.9632 1.9601
1.8989
1 1.9617
1.9200 1.9143
/ 1.8992
'
1.8768 1.8588
1.9284 1.9123 ,1.8440
1.9889 1.9742
21 2.8314 12.5176
' 2 1894 2.07% +-'
1.4149
2.0902
2.0764
/ 2.2137
1.4398
1.7702 1.7402
1.8946
2.1788
2.3562
1.8117
1.8297 1.7973
j 1.9662
2.1604
/ 2.2238
1.5332 1.4759
/ 2.0192
2.4358 12.2816
/ 2.2354
1.8727
2.1043
2.4607 12.3027
j 2.2485
2.0978
2.0475
2.0460 1.9727
1,8875 1.8777 1.8693 1.8619 1.8553 1.8495 1.8443
1.8123
1 1.8046 / 1.7864 1 1.7816
,
2.1562 1.9712
1.7729
1.7176 1.6998
1.3722
1.7959 1.7385 1.7823 11.7259
1.6856 1.6739
1.3634 1.3562
1.7709
1.6641
1.3502
1.7613
1.6558
1.3450
1 1.6921
1.6487 1.6425
1.3406
1.7341 1.7291
1.6812
1.6370 1.6322
1.7247
/ 1.6725
/ 1.6863
1.6766 l
1.6280 1.6242
'
1.3968 1.3830
1.7538
1.7459 1.7396
1 1.7978
1 1.7918
1.8595 1.8331 1.8125
i 1.7154 / 1.7064 1.7531 / 1.6988
1.8317
i 1.8213
1.3368 1.3334 1.3304 1.3277 .
I
1.3253
1
1
1.7207
1.6176
j
1.7171 11.6655 1.7139 1.6624 1.7109 1.6596
1.3232 1.3212
1 1.7081
1.6148 1.6122
1.3191 1.3178
'
1.6571
1.6098
1.3163
11
1.8219 /1.7610 '1.7056
1.6547
1.6076--
1.3150
t1
1.7033 1.7011
1.6526
1.6056
1.6506
1.6037
1.1 1.:
1.8397 1.7773 1.8354 ,1.7734
,
1.6377
2.3534 2.1318
2.1365
2.1504 2.0961
2.2494
2.4708 2.2261
2.2011
2.1202
2.3970 S.3815 2.3681
2.3329 2.1910
2.0150 11.9405 1.9432 1.8744
2.2281 2.2010
1 2.2638
2.6054
2.4559 2.2974
2.2622
1
2.5275 2.3593 2.4907 12.3281
0.960 10.955 0.950'0.945 0.940 0.900 7.9158 7.0264 6,3137 5.7297 5.2422 3.0777 3.3198 3.1040 2.9200 2.7604 2.6202 1.8856
1.8316 1.8!81 1.8248
1
1.7699 1.7667 1.7637
1 1.6688 -
1.6207
1
1
1
I
-*
1.8839 1.8813
1.8191 1.8166
/, 1.7585 i 1.7561
'
i i 30 2.7500
2.0452 2.0423
1.9573 1.9546 ,1.8789 .
1.8142
1.8120
1.7540
1.6991
1.6487
1.6020
1.7520
1.6973 11.6470
1.6004
l.! 1.3104 .
Distribución ji-cuadrada wn v grados de libertad: (Continuacion.)
Percentiles X:
de la distribución ji-cuadrada con v grados de libertad
Los tres últimos valores del primer renglón están en notación abreviada. Por ejemplo, si v = 1, entonces x:,,, = 3.9271E5 significa 3.9271 x = 0.000039271.
Percentiles X:
v
de la distribución ji-cuadrada con v grados de libertad (Continuacion.)
2
x o 995
X: m
~0.975
xg 9 9
X: m
X:
--
~0.01
~0.025
10
----
-
--
--
--
~0005
--
------v.-
---m-
--e
-10.982330
30 40 50 60 70 80 90 100 120 150 200 500 600 700 800
53.671868 66.766047 79.489839 91.951806 104.21477 116.32093 128.29868 140.16971 163.64848 198.35987 255.26380 585.20597 692.98094 800.13079 906.78634
50.892181 63.690771 76.153802 88.379430 100.42505 112.32879 124.11620 135.80689 158.95003 193.20750 249.44517 576.49314 683.51546 789.97352 895.98408
46.979218 59.341679 71.420194 83.297706 95.023149 106.62854 118.13591 129.56125 152.21133 185.80037 241.05784 563.85137 669.76903 775.21048 880.27534
43,772954 55.758487 67.504805 79.081954 90.531262 101.87947 113.14523 124.34210 146.56731 179.58061 233.93422 553.12686 658.09357 762.66072 866.91130
40.256017 20.599245 51.805044 29.050516 63.167113, 37.688637 46.458885 74.396999 85.527036 55.328945 64.277842 96.578196 107.56501 73.291079 118.49800 82.358127 140.23256 100.62363 172.58118 128.27504 226.02104 174.83527 540.93029 459.92609 644.80042 556.05603 748.35907 652.49732, 851.67119 749.18520
18.492667 26.509296 34.764236
60.391459 6G26018 77.929442 95.704619 122.69177 168.27855 449.14671 544.18009 639.61306 735.36239
-
9.54249447426806
16.790756 24.433058 32.357385 40.481707
14.953464 22,164201 29.706725 37.484796 45.441700
57.153152 65.646592 74.221882 91.572601 117.98457 162.72801 479.93601 534.01854 628.57702 723.51250
53.539983 61.754019 70.064995 86.923311 112.66757 156.43215 429.38739 522.36536 615.90736 709.89695
,
13.786682 20.706577 27.990825 35.534397 43.275305 51.17193 59.196327 67.327533 83.851714 103.14232 152.24084 422.30340 514.52854 607.37932 700.72547
/&@!-&>-/ 4
n
1 %
,
,"
:@, &M;-#- 2- +' .*x*e"H
,&
4 nd*
-
4
,-3'
"?1
-6'
-.
'
+-
-
-34
#
w
M'' 1
ii
Dudas típicas Y pregunt on ta -
= .
1. Pregunta de Eduardo Ríos, de Chihuahua
Doctor Velasco, tengo dos preguntas respecto al material del segundo capítulo: 1. No entiendo por qué se llama error a los conceptos de:
a ) Error absoluto medio 6) Error cuadrático medio c) Error típico de la media en una muestra de tamaño n. Acaso error = ajuste de las desviaciones estándar? ¿Es quizás un índice de confiabilidad? 2. Además, en el caso de los incisos a y b por qué se introduce el concepto de
constante a si estamos suponiendo que la desviación es la diferencia entre un valor x d e la población y la media poblacional. ¿La media poblacional puede ser constante? Si la respuesta es sí, ¿en qué casos se cumple esta aseveración? Respuesta: La palabra e w también se usa como sinónimo de desviación (de algo). Incluso en algunos países de Europa (como en Rusia), a la desviación típica la llaman error cuadrático medio. El error absoluto medio (de algo) es el promedio de los valores absolutos d e las desviaciones (de ese algo, que puede ser cualquier constante a, o la moda, la mediana o la media). En particular, el error absoluto medio de la media se llama desuiacidn media. Por otra parte, el término error cuadrhtico medio (o desviación cuadrática media) de algo es el promedio de los cuadrados de las desviaciones de ese algo (puede ser una constante cualquiera).En particular, si esa constante es la media, entonces en lugar de decir error cuadrático medio de la media se dice simplemente varianza, la cual es, además, el menor de todos los posibles errores cuadráticos medios. De ahí su importancia. Por último, el término error t@icode la media (también error estándar de la media o errorprobable de la media) es la desviación estándar de la distribución muestra1 de medias, para muestras de cierto tamaño específico con remplazo o sin él. La razón de
494
Apéndice C. Dudas típicas y preguntas con respuesta
llamar error a esta desviación estriba en que al multiplicarse por cierto valor tabulado, produce los verdaderos errores en la estimación de una media. Hay muchos tipos de "errores estándar" en estadística, y este es uno de ellos, pero hay también error estándar de una proporción, de un pronóstico, etc. Y es natural que una desviación de algo se llame "error". Por ejemplo, en el futbol, si un tiropenals, salió desiriado, entonces estarás de acuerdo en que fue un error de puntería del que lo tiró, ¿o no? Asimismo, el error cuadrático medio de cualquier constante a se llama también momento ordinuno de orden dos de esa constante, pero si esa constante es la media, entonces se llama momento central de orden dos (que también es sinónimo de varianza). Como puedes ver, la varianza tiene por lo menos cinco nombres distintos: 1.varianza, 2. variancia (en España), 3. dispersión (en Rusia), 4. momento central de segundo orden, y 5. error cuadrático medio de la media. 2. Pregunta de Alejandro Corona, de Mexicaii, Baja Caiifornia
Profesor Velasco: Tengo una duda sobre la respuesta del ejercicio 8, inciso c de la autoevaluación del capítulo 6. Ese ejercicio consiste en calcular el octavo decil de la distribución de probabilidad. De acuerdo con el resultado planteado en la sección de respuestas se encuentra que el último 20% de los datos se hallan a partir del punto 66.68 y hasta ahí estoy de acuerdo. Pero después dice: "por tanto, a partir de 66 tortas está 20% de los días de las mejores ventas". Sin embargo, si utilizamos el principio de continuidad en una función discreta vemos que el rango para 67 tortas corresponde a [66.5,67.5),por lo que el número encontrado de 66.68 está dentro de ese rango y no dentro de 66, que es [65.5, 66.5). Pienso que es a partir de 67 que está 20 % de los días de las mejores ventas. ¿Cuál es su opinión? Respuesta: Buena pregunta, pero no tienes razón. Mis alumnos me la plantean con frecuencia. Es una sutileza. La línea divisoria (frontera) real es el punto 66.68. Si tomas el 66, a mano derecha está todavía 20 % (y un pequeño 'pi16n" inevitable), pero si tomas 67, ya hay menos de 20 % a mano derecha. Veamos el siguiente caso. Si una persona va a la tienda y pide un kilogramo (exacto) de huevo, y si el que le pesa percibe que 14 huevos pesan 1.082 kg. @or ejemplo), pero que 13 huevos pesan 0.9910 kg, entonces ¿cuántos le debe dar? Si le da 13, despacha menos y no es justo. Por consiguiente, se ve obligado a dar 14 huevos, aunque tenga que darle un pequeñopilón a cuenta de él. ¿Comprendes? 3. Pregunta de Eduardo Lule, del Edo. de México
Hola, profesor Velasco: Respecto al capítulo 5, estoy frustrado: toda la tarde del 16 de septiembre estuve tratando de entender los problemas, pero no pude resolverlos. La parte teórica sí la entendí; por ejemplo, si es un problema de probabilidad con remplazo, uso la binomial; si no es con remplazo, uso la hipergeométrica; si es una serie de eventos con aparición secuenciada, como llamadas telefónicas, uso Poisson; cuando se quiere determinar en una secuencia la probabilidad de éxito en un determinado punto de la secuencia (al segundo, al tercero, al enésimo evento), uso la binomial negativa. En resumen, el concepto y uso de las distribuciones de probabilidad lo entendí. Lo que no entiendo, es cuando en la redacción del problema se dice "al menos", "por lo menos", "cuando más", "menos de" o "cuando mucho". ¿Cómo puedo transferir esto en términos matemáticos? Por otra parte, ¿por qué a veces se usa 1-DISTR.BINOM (ejercicio 1de autoevaluación)? ¿Cuándo usar O o 1 (éxito o fracaso)? ¿Cuándo aplico el 1o el O en Excel? ¿Dónde está el truco, qué parte del problema me indica cómo alimentar el Excel? Resprcesta: Muchos estudiantes tienen la misma duda respecto a esas frases, y en cada examen me lo preguntan. La frase "al menos" o "por lo menos" significa eso o más. Por ejemplo, si alguien te dice que tiene al menos 500 pesos, muy bien podría tener 501
Dudas típicas y preguntas con respuesta
495
pesos o quizás mil pesos o más, no sabemos cuánto, pero estamos seguros d e que no tiene menos de 500 pesos. En cambio, la frase "cuando mucho" significa todo lo contrario. Si alguien te dice que tiene cuando mucho 30 años de edad, muy bien podría tener 27, o quizás 15 años o induso menos, pero lo único que estamos seguros es que no tiene más de 30 aiios. Respecto a la otra pregunta. El 1 en Excel (o "verdadero") significa que te acumula los datos desde cero, es decir, significa "a lo mucho"; en cambio, el cero (o "falso") no te acumula, sino que te da la probabilidad para ese valor de la variable nada más. Por ejemplo, si se trata de lanzamientos de una moneda, al preguntar: ¿Cuál es la probabilidad de que en ocho lanzamientos se obtenga cuando mucho cinco águilas?, se escribe:
pero si se te pregunta: ¿Cuál es la probabilidad de obtener exactamente cinco águilas (ni más ni menos) en ocho volados?, debes escribir:
4. De Alejandro D'Urquiza Díaz, de Guadalajara,Jalisco Hola, doctor Velasco. Le envío atentamente un par de ligas que hallé, en las cuales se pueden encontrar más apoyos didácticos y notas de estadística:
Respuesta: Muchas gracias por tu correo y las ligas. Las vamos a poner en nuestro sitio de Internet sobre estadística que estamos construyendo. Seguro que serán d e utilidad para todos los alumnos estudiosos de la materia.
5. Mensaje de Aydée Bravo, de León, Guanajuato (le parece que la estadística es muy difícil) ¡¡Hola profesor!! Estoy muy preocupada. Tuve problemas en el examen para definir las variables y decidir cuál era el mejor procedimiento, y eso lo noté poco después de estar haciendo la tarea. Estoy llevando a la par de esta materia otra llamada Sistemas de Control de Procesos, en la cual ya me siento totalmente perdida. Ambas materias me gustan. Nunca he estado peleada con la estadística, sino que, por el contrario, siempre me ha gustado (eso no quiere decir que le entienda a la primera) y realmente me interesa, sólo que en la otra materia los temas están bastantes técnicos y para mi perfil los siento bastante complejos. Hoy me llevé una tremenda desilusión con la calificación de estadística, pues pensé que obtendría un mejor resultado, pero no ocurrió así. Como ya le comenté, tengo problemas en definir bien las variables para resolver los problemas. Además, me hago bolas con tantas fórmulasy me tardo mucho, y esto me pasa en las dos materias. No quiero dar de baja ninguna materia, pero en estadística estoy sola y en la otra parezco "frijol en olla"; todos los demás son Ingenieros y más o menos ahí la llevan, aunque también les resulta pesada. ¿Podría darme algún tip para no tener las mismas dificultades al solucionar un problema? Ya le pedí al otro profesor algún tipo de ayuda por el estilo. No quiero que me den respuestas, ni tampoco llevármela como si fueran recetas de cocina, quiero saber cómo hacerlo, pero se me dificulta. El otro profesor me comentó que así era el contenido y eso no me ayuda en nada, por lo que quiero ver si usted me puede aconsejar algo. De verdad estoy preocupada, no quiero dar de baja esta materia. ¿O me recomienda que así lo haga?
496
ApCndice C. Dudas típicas y preguntas con respuesta
Respuesta: Comprendo cómo se ha de sentir. Casi no conozco a nadie que pueda jactarse de que la primera vez que cursó estadística y probabilidad entendió todo con facilidad. Yo mismo pasé por esa situación hace muchísimos años, cuando tenía 19 años (iya llovió!). Mi primer curso de estadística y probabilidad (era optativo) lo estudié en la Facultad de Ciencias de la UNAM con el doctor Ariel Tejera (excelente profesor), y nuestro texto era el libro Modern Probabiliy Theoy a n d itsApp1ication.s de Emanuel Parzen, un libro demasiado avanzado y mucho muy matemático para un primer curso de la materia. A decir verdad, ni yo ni mis compañeros (entre los cuales creo que se hallaban nada menos que Julieta Fierro, famosa astr6noma ahora, y Julio Rubio, actual Subsecretario de Educación Superior de la SEP y antiguo rector de la UAM Iztapalapa, y otros "cerebritos") entendíamos casi nada. Tuve que aprenderme todo de memoria, porque me sentía, como se dice coloquialmente, "fuera de onda". Pensé darme de baja, pero me alentó saber que mis compañeros tampoco entendían absolutamente nada. Eso era algo muy común durante los primeros semestres en la Facultad de Ciencias en aquella época de oro de la UNAM. Los profesores eran estelares (iGraef, Barajas, Fregoso, Lluis, César Rincón, etc.!), pero tenían quizás el defecto de olvidar a veces que sus alumnos no eran colegas investigadores con doctorado. Al final logré pasar la materia (con 7 u 8,no recuerdo), pero casi no entendí nada. Sólo algún tiempo después,y estudiandoen libros por mi cuenta durante los fines de semana y en vacaciones, logré-empezara pescar el hilo y aentender la lógica y los conceptos detrás de la estadística matemática y la teoría de las probabilidades. Sólo entonces "me cayó el veinte", como se dice coloquialmente,y hastacomprendí que era algo muy bonito, fácil y útil. Ahora se me hace absurdo que haya gente que no comprenda esas cosas tan fáciles (aunque creo ser más paciente con mis alumnos de lo que tal vez aquellos maestros fueron conmigo). Le comento lo anterior porque me parece que, en todas las facetas de la vida, uno aprende por aproximaciones (creo que acabo de usar una frase de Serge Lang). No hay que darse por vencido a la primera. Fíjese en los bebés que están aprendiendo a caminar: cómo se caen y se golpean, vuelven a intentarlo y se vuelven a golpear, y sólo después de muchos intentos fallidos, un buen día se sueltan a andar solos y se les hace fácil, útil y agradable. Así pasa con la estadística y con todo: aprender a manejar auto, aprender a nadar, etc.; todo es difícil al principio, pero no hay que darse por vencido si uno no puede lograrlo en el primer intento. Le recomiendo estudiar algún texto muy elemental para empezar. Por ejemplo, consígase el libroJzlst the Essentials of Elementary Statistics de Johnson, o el libro Business Statistics: A First Course de D. M. Levine, T. C. Krehbiel y Mark L. Berenson. Son libros muy fáciles de entender y muy elementales, ideales para comenzar, como se dice, "desde cero". Mi consejo es que no se dé de baja. Siga adelante y verá que tarde o temprano todo se empezará a ver claro y lógico.
6. Pregunta de JosC Luis Gálvez, de Honduras Profesor Gabriel Velasco: No he podido hallar cómo se podría resolver el siguiente problema que aparece en un libro escrito por usted y por E! Wisniewski (Problemrio de probabilidad, ejercicio 1431): "En una caseta de cobro de la autopista Querétaro-Celaya, los automóviles llegan a un ritmo promedio de 2.4 autos por minuto (los camiones pasan por otra caseta). Cada auto paga una cuota de $62.50. Determine la probabilidad de que, a partir de un momento dado, el encargado de esa caseta logre recolectar 1000 pesos en menos de 5 minutos." Al final del libro aparece la respuesta: 0.1556, pero eso de nada me sirve para saber cómo atacar este problema. Respuesta: El problema se resuelve de la siguiente manera. Es distribución de Erlang, y el parámetro de escala es larnbda = 2.4 (la unidad de tiempo elegida es el minuto).
Dudas típicas y preguntas con respuesta
497
Para recolectar mil pesos se requiere 1000/62.50 = 16 autos. Por tanto, el parámetro de forma es r = 16. Luego, se trata de una variable aleatoria X con distribución de Erlang, cuyos parámetros son larnbda = 2.4 y r = 16, y se pide calcular P(X < 51, lo cual se realiza con la fórmula: P(X < 5) = 1- Poisson acumulada
(desde k = O hasta k = 15) de 2.4 x 5 = 12. Entonces, con Excel, queda:
que es la respuesta correcta. 7. Otra pregunta de Alejandro Corona, de Mexicali, Baja California
Doctor Velasco: Respecto a los conceptos de estadística descriptiva, no me quedó claro el manejo del rango semiintercuartil. En el ejemplo visto en clase, este rango fue de 6.54687. Mi pregunta es: ¿Cómo se lee este número, es decir, qué me dice específieamente? Algo que tampoco entiendo es por qué se divide entre dos el resultado de Q,Q, porque si quiero sea una aproximación rápida al punto medio, pero entonces ya no debería llamarse rango, visto desde el punto de vista de que ya no es la definición de un intervalo sino de un punto. Otra pregunta es sobre el error típico de la media. Por definición, sabemos que este valor es igual a la desviación estándar poblacional entre la raíz cuadrada del valor del tamaño de la muestra. Pero en Excel el resultado que arroja al utilizar la herramienta de Análisis de datos, asume que este valor es igual a la desviación estándar muestral dividida entre la raíz cuadrada del valor del tamaño de la muestra. ¿Es esto válido porque asumimos que la desviación estándar muestral es una buena aproximación a lo que debe ser la desviación estándar poblacional? RRFpuesta: Aquellas medidas de dispersión con las mismas unidades de la variable aleatoria (todas excepto la varianza) tienen casi siempre alguna interpretación práctica. Por ejemplo, la desviación estándar contiene en la mayoría de las veces cerca de 70 % de los datos en un entorno alrededor de la media. El rango semiintercuartil (o desviación cuartíiica) contiene cerca de 75 % de los datos alrededor de la media. Se dice "cerca" o "casi" porque no todas las distribuciones son iguales ni igualmente sesgadas, pero el dato es más o menos válido en casi todos los casos, de ahí su utilidad práctica. Lo que dices del Excel se debe a que en la mayoría de los casos uno trabaja con datos extraídos de una muestra. S610 en ejemplos teóricos muy forzados o irreales se trabaja con la población y con la desviación típica poblacional. La mayoría de los trabajos en estadística se realizan con muestras. 8. Pregunta de Luz Dorely Almaguer, de Tampico, Tamaulipas
Me interesa aprender a usar el s o h a r e Minitab. ¿Hay libros o manuales sobre éste? ¿Podría recomendarme uno? En la empresa donde hago prácticas lo tienen, y he entrado, pero varios cálculos aún no me salen.. . tal vez con un poco de tiempo.. . ¿Qué otro tipo de software estadístico me recomienda? Respuesta: Casi en cualquier biblioteca hay manuales para aprender a usar el Minitab, que es el software más popular para estadística. Con un manual y con la práctica cotidiana, lograrás dominarlo pronto. No es difícil. Otros programas muy populares son el SPSS (Statistical Packagefor the Social Sciences), el Eviews (Econometric Views) y los complementos comerciales (add-ins) para Excel, como el PHStat. Sin embargo, para un primer curso de estadística, el Excel de Microsoft Office es más que suficiente.
9. Pregunta de Luis Benavides, del Edo. de México Tengo la siguiente duda: ¿Qué representan en si los valores que se obtienen al calcular el error cuadrático medio y el error típico de la media, o cómo se interpretarían en un ejemplo práctico? Respuesta: El error cuadrático medio representa el promedio de los cuadrados de las desviaciones de cada valor con respecto a un dato específico. Ia razón de usar los cuadrados de las desviaciones y no las desviaciones solas, estriba en que al elevar al cuadrado se evita que desviaciones negativas se neutralicen con positivas. El dato que tiene el menor error cuadrático medio es precisamente la media, y el valor de ese error cuadrático medio mínimo es precisamente la varianza. El error estándar de la media (o de una proporción) juega un papel crucial al estimar intervalos de confianza o elaborar pruebas de hipótesis. No olvides que el error estándar de la media es la desviación estándar de la distribución muestra1 de medias. La precisión para estimar la media de una población aumenta cuando aumenta el tamaño de la muestra (n), pero no aumenta en la misma proporción, sino en proporción a la raíz cuadrada de n. En este sentido, la desviación estándar de una variable aleatona mide elgrado de concentración de la variable con respecto a su media. Si deseas duplicar la precisión de una estimación, debes tomar una muestra cuatro veces más grande. En todo ello, la clave es el error estándar de la media. 10. Pregunta de Víctor Rodríguez, de Guanajuato
Al realizar los ejercicios, me surgió la siguiente cuestión: ¿Qué pasa si los datos analizados no son exclusivamente enteros sino decimales?¿Qué pasa con la aproximación en este caso? Respuesta Si los datos agmpados no fuesen enteros sino decimales, la corrección por continuidad se aplicaría en la misma forma, a efecto de usar una escala continua. Por ejemplo:
11. Otra de Alejandro D'Urquiza Díaz, de G d a j a r a , Jaiisco
Doctor Gabriel Velasco: Dobroe U m !Además de saludarle, quiero comentarle que, en efecto, estoy de acuerdo con lo que usted comentó durante una trasmisión satelital en cuanto al rigor matemático de los libros rusos, no s610 en estadística, sino en otros campos de la ciencia.Tengo la fortuna de contar, entre mi colección de libros de mi profesión, con algunos libros escritos y publicados en la antigua URSS, los cuales me han sido muy útiles y valiosos en el desarrollo y estudio de algunos temas especializados en mis estudios profesionales. Uno de estos libros es el Curso deftsco-quimica (Kurs FisicheskoiJimii) del doctor Gueraismov (entre otros). El tratamiento matemático de los temas de fisicoquímica excede en rigor y detalle a los libros escritos en Occidente, lo cual resulta muy útil en la comprensión de varios temas de esta ciencia. Asimismo, poseo un libro de Ecuaciones
Dudas típicas y preguntas con respuesta
499
integrales del doctor Kiseliov, el cual aproveché muy bien como apoyo en mis cursos de Cálculo Vectorial y Ecuaciones Diferenciales Ordinarias durante la carrera. Por otra parte, durante el desarrollo de mis estudios de tesis de licenciatura estuve recurriendo mucho a un libro de Hidráulica del doctor Bakkmetev, pues a pesar de ser un libro viejo, contenía ecuaciones de gran utilidad en el cálculo de curvas d e energía potencial de caídas de agua en presas; jamás encontré tales ecuaciones en los libros occidentales. En lo particular, disfruto mucho de las materias en que puedo estudiar con un buen nivel de rigor matemático, ya que uno de mis principales intereses profesionales es la modelación matemática de fenómenos ambientales (la verdad es que me resultan muy pesadas -incluso tediosas- las.materias en que no hay ecuaciones o al menos fórmulas, pues me desespera mucho tratar una materia simplemente con puro "rollo''). Durante el verano anterior estuve muy contento al cursar la materia de Modelos de Calidad del Agua, y considero que dishutaré también la materia de Métodos Estadísticos. Por otra parte, ayer mencionó que los estadounidenses llaman chi a la letra griegaji (escrita en forma similar a una x). En efecto, la pronunciación correcta de dicha letra es j i (escrita en fonética castellana). No obstante, los alemanes para pronunciarji, según su fonética, la escriben chi (en alemán, leer chi se pronunciaría comojji -una jota larga-. Los alemanes influyeron mucho a la lengua inglesa, y pasaron la escritura deji como chi. No obstante, al separarse más y más la lengua alemana de la inglesa, también lo hizo su pronunciación. De hecho, la forma en que los ingleses y estadounidenses pronuncian chi es kai, según las "reglas" de fonética inglesa. En fin,sólo son dos comentarios "culturales" para iniciar el curso. Respuesta: Gracias por sus observaciones y lo felicito por compartir el gusto por las matemáticas y por la literatura matemática rusa. (Algunos de los libros que usted menciona son, como decía mi colega Nacho Gallardo: cañones d e alto calibre.) Bceuójorósheuo y dhzelaiu bac mnogo uspiéxou! 12. A question from Mary L. Wdliams, f'rom Oakland, Caifornia
Professor Gabriel Velasco: A question regarding confidence intervals for large samples. If 1 ask 200 randomly selected people how much money they spent on Internet purchases over the past week, and if 1 happen to find out that the sample mean for those 200 people is, say $50 dollars, can 1safely make the clairn that people spent an average of $50 dollars on Internet purchases last week? Answer: I'm afraid to te11 you that your claim is wrong. As a matter of fact, the population mean could sometimes be quite different from the sample mean. If we are dealing with a large population (as in your example), we can never know (even closely) what the population mean is. Just think what if one or two guys not polled in your sample happened to spend an unusually large sum (like a million bucks) on Internet purchases last week? Think what might have been of your figures (as regards the sample mean) had you included those people in your sample. But I'm not intent on meaning that the sample mean is useless. Not at all. You can use your data to construct a suitable confidence interval for the population mean, thereby drawing a useful (and statistically valid) conclusion. 13. A question from J. W. Herberger, from Linclon, Nebraska
Professor Velasco: My Spanish is rather poor, so 1 hope you don't mind my asking this question in English. How come mathematicians (or statisticians for that matter) have
500
Apéndice C. Dudas típicas y preguntas con respuesta
decided that a "large" sample starts with n > 30?Does that mean that we must take a sample of at least n = 30 before the Central Limit Theorem kicks in? If so, is there a proof of that assertion? A w m Oh, not at all! There's absolutely nothing scientific or mathematical in the number n = 30. It's just purely conventional. Some authors even pick out another figure, like n = 25, for instance. Appropriately enough though, the larger the value of n, the better the Central Lirnit Theorem will be kicking in, as you say. The figuren = 30 is thoroughly arbitrary, but it is practical. 14. Pregunta de 1. L. S., de Cuba
En un libro de probabilidad de Sheldon Ross (AFimt Course in Probability) aparece el siguiente ejercicio, el cual no se me ocurre cómo resolver. Al final del libro se proporpero de nada me sirve eso si ciona la respuesta numérica, que es 0.00106 = 1.06 x no sé cómo llegar a ese valor. ¿Podría ayudarme? El enunciado es el siguiente: "Dadas 20 personas, ¿cuál es la probabilidad de que de los 12 meses del año se registren exactamente 2 cumpleaños en 4 meses y 3 cumpleaños en otros 4 meses?" Respuesta: Usamos la fórmula de ocupación de r objetos en n celdillas, donde hay r, objetos en la celdilla 1, r2 objetos en la celdilla 2, . .. , hasta rn objetos en la celdilla n (llarnada ocupación de Maxwell-Boltzmunn), la cual es:
Por otra parte, los cuatro meses donde hay 2 cumpleaños pueden salir de maneras, y de los 8 meses restantes hay 4 en los que se celebran 3 cumpleaños, lo cual puede hacerse de
()
maneras. Tomando esto en cuenta, y ha-
ciendo n = 12, r = 20 en la fórmula de ocupación mencionada, la respuesta debe ser la siguiente:
15. Pregunta de JosCSaldafia, de Tampico, Tamauiipas
Doctor Velasco: En la empresa donde trabajo surgió un problema, y le pido que, por favor, me oriente cómo resolverlo; además, creo que es una contribución d e cómo aplicar la probabilidad y la estadística en la práctica. El problema es el siguiente: Enviamos 2000 productos a un cliente, de los cuales 10% era material sospechoso (que luego resultó ser defectuoso), por lo que nos lo devolvieron, pero faltaban 4 piezas, es decir, sólo nos regresaron 1996 piezas. Se requiere calcular la probabilidad de que entre las 4 piezas faitantes haya por lo menos una defectuosa. Respuesta: Tu pregunta es muy sencilla y es un típico ejemplo de cómo la distribución hipergeométrica tiende a la binomial. La probabilidad de por lo menos una pieza defectuosa es uno menos la probabilidad de ninguna defectuosa: 1 - h(0, 2000, 4,200). Con Excel obtienes:
Dudas típicas y preguntas con respuesta
50 1
que es la respuesta de tu pregunta. Puedes aproximar mediante la distribución binomial (io cual sería muy conveniente, por ejemplo, si sólo tuvieras a la mano calculadora, mas no computadora):
que es una excelente aproximación.
16.Otra pregunta de 1. L. S.,de Cuba De nuevo le pido atentamente su ayuda para otro problema del libro de Sheldon Ross (A Rrst Course in Probability). No tengo duda de que mi respuesta es la correcta y, sin em-o, no concuerda con la respuesta que trae el libro. Quisiera saber si soy yo o es el libro el que está mal. El enunciado del problema en inglés dice así: "Teams A and B play a series of games with the first team to win 3 games being declared the winner of the series. Suppose that team A independently wins each game with probabilityp. Find the conditional probability that team A wins: a ) the series given that it wins the first game; b) the first game given that it wins the series." El libro trae las siguientes respuestas, las cuales me parecen absurdas:
A mi modo de ver, estas respuestas son absurdas por el simple hecho de que p elevado a la cuarta o la quinta potencia implicaría cuatro o cinco victorias del equipo A, lo cual no puede ser, ya que la serie se termina cuando alguno de los equipos gana tres juegos. Según yo, la respuesta correcta del inciso a debe ser la siguiente:
Del mismo modo, para el inciso b obtuve un resultado muy distinto del que se da en el libro. Respueskt: Es un problema muy interesante (y muy antiguo). No es que la respuesta del libro esté equivocada, sino que el autor del libro considera una prolorgación imaginaria deljuego hasta que se cumplan cincojuegos d e la serie en cualquier caso, aun cuando uno de los equipos ya hubiese acumulado las tres victorias requeridas. ¿Por qué habría de considerarse una prolongación imaginaria del juego? La respuesta estriba e n que si por alguna causa la serie fuese interrumpida antes de que alguno de los equipos consiguiese las 3 victorias, el monto del premio debería repartirse adecuadamente tomando en cuenta esa prolongación imaginaria hasta que se completaran cinco rondas en cualquier caso. Se ha demostrado que esa sería la manera más justa de repanir el premio cuando la serie hubiese quedado inconclusa (ilo demostró Fermat!). Sin embargo, habría sido conveniente que Sheldon Ross mencionara esa prolongación imaginaria posible.
~udm típicas y preguntar con respuesta
503
Esta sería la respuesta correcta del inciso b, si no hubiese ningunapn>longaciónimaginaria de la serie. Sin embargo, si se supone que la serie continúa hasta que se completen las cinco rondas (aunque ya hubiese tres o más victorias de algún equipo), en ese caso (ficticio) la fórmula para la probabilidad de acumular n éxitos antes de que ocurran m fracasos, jugándose n + m -1 rondas, estaría dada no por la distribución de Pascal, sino por la binomial:
Así, las respuestas correctas de los dos incisos serían, respectivamente:
las cuales son las respuestas que vienen en el libro, según me dices en tu mensaje. (La notación de P con la flechita arriba la acabo de inventar, pero se sobreentiende su significado.) En resumen, tanto el autor del libro como tú están e n lo correcto, cada uno desde su respectivo punto de vista. 17. Pregunta de Eduardo Chew, de Mexicaii, Baja Caifornia
Estimado doctor Sotomayor: Le escribo para pedir una mayor explicación sobre-el desarrollo y los resultados de los problemas 7 y 8 del test de opción múltiple 6.1, pues aunque los resolvimos en equipo, no estamos muy conformes del resultado. Sobre todo, tuvimos problemas al acomodar las unidades de tiempo en el problema 7 y una polémica en la forma de la Erlang. Rcspmta A continuación transcribo las soluciones detalladas de las preguntas que tiene a bien plantear. Solucidn del problema 7: Los asaltos pueden considerarse como sucesos de Poisson independientes. Si se toma el año como unidad de tiempo, entonces la distribución del tiempo transcurrido hasta el próximo asalto del que será objeto un ciudadano es exponencial con parámetro h = 4.5 (según datos del problema; además no importa cuándo fue asaltado por última vez, de acuerdo con la propiedad de pérdida de memoria en la distribución exponencial). Por otra parte, la distribución del tiempo transcurrido hasta que los asaltantes completan su tercera captura consecutiva (y por tanto, reciben una nueva llamada de atención de la autoridad) es una distribución gama (o de Erlang) con parámetro de escala h = 4.5 y parámetro de forma r = 3. Por consiguiente, si T denota el tiempo (en años) entre una llamada de atención y la siguiente, se tiene que:
504
Apéndice C. Dudas típicas y preguntas con respuesta
Solucidn delproblema 8:Se sabe que en la distribución de Erlang (y en general en la distribución gama), la media y la moda están dadas, respectivamente, por:
r
C1=-; h
r-1
mo=h
De esta manera, el problema s e reduce al resolver el siguiente sistema d e ecuaciones:
Se obtiene fácilmente que r = 3, h = 1. Por cierto, un ejercicio casi idéntico lo resolví durante la sesión satelital correspondiente, pero tal vez usted no tuvo oportunidad de mirarla.
18.Pregunta de Gabriela Flores Méndez, de Ciudad Juára, Chihuahua Le enviamos en un attachent los procedimientos que realizamos para ver si, por favor, podría revisar nuestra solución del problema 10 del test de opción múltiple 5.1. No sabemos cómo se obtuvo el resultado de 0.8154, ya que a nosotros nos salió 0.4747 a través de la hipergeométrica. Respuesta: Con respecto a tu solución del ejercicio 10, tu error estriba en que supones que el viajero será arrestado sólo si se le encuentra exactamente un paquete con narcóticos (o sea que supones que si se le descubren dos o tres paquetes, no sería arrestado). No, eso es incorrecto. El viajero será arrestado si se le descubrepor lo menos un paquete con droga. Para resolverlo, calcula primero la probabilidad d e que no sea arrestado (es decir, que ninguno d e los tres paquetes examinados contenga droga). Al resultado que obtengas réstalo d e uno, y ésa será tu respuesta. Muchos estudiantes cometen el mismo error que tú, pero es más bien una cuestión d e semántica o de lógica. Por ejemplo, considera esta proposición: "Todas las nubes son blancas." ¿Cuál crees que sería la negación correcta d e esta afirmación: a ) "ninguna nube es blanca", 6) "por lo menos una nube no es blanca", o c) "exactamente una nube no es blanca". Piénsale.
19.Pregunta EhriraVillalvazo y otros estudiantes No supimos cómo resolver el ejercicio 5 del test de opción múltiple 7.1. ¿Nos podría indicar cómo se resuelve? Respuesta: En principio, recuerden que para la distribución de Erlang se demostró la siguiente fórmula (libro azul, p. 242):
Dudar típicas y preguntas con respuesta
505
Por otra parte, la media y la moda están dadas, respectivamente, por:
Por consiguiente, al sustituir, tendremos que y = 100; m. = 50. Ahora, con la fórmula mencionada se obtiene:
20. Adaración de Carlos Zea de C. Laguna,José Luis U v a de
Honduras, Alejandro Corona de Mexicaii, Amuo Farrera de Chiapas y muchos otros
Estimado Gabriel: Con referencia al segundo examen del curso de Métodos Estadísticos, pregunta numero dos del test general sobre intervalos de confianza y pruebas de hipótesis 10.3, le manifestamos nuestro desacuerdo con la calificación recibida, y pasamos a sustentar nuestra afirmación. Calculando mediante la fórmula del tamaño de muestra (caso de proporciones) se obtiene el valor de 96.036, el cual se aproxima al entero superior más próximo, o sea, 97, que es la respuesta (inciso c) del problema. La aproximación se tomó en forma similar en los siguientes casos, en los cuales sí se aceptó como válida la aproximación mencionada. Para confirmación, he resuelto el caso en forma iterativa (MS Excel), probando la respuesta planteada por el corrector del examen, en la cual indica que la respuesta acertada es 96. Probando dicho valor, no alcanza el valor de 95 % de confianza requerido, sino que sólo alcanza al valor de 94.9956%, lo cual no cumple con la especificación pedida en el problema. Por lo tanto, la respuesta correcta debe ser 97 y no 96 como indica su retroalimentación. Respuesta: Estimados Carlos, José Luis, Alejandro, Arturo (y todos los demás que señalaron lo mismo). Tienen razón, y les agradezco mucho su atento mensaje. Se les pondrá bien a todos los que pusieron cualquiera de los incisos b o c. 21. Pregunta de Francisco Torres G 6 m g de Quedtaro
Profesor: ¿Me puede ayudar con los planteamientos de los ejercicios 9 y 10 de los ejercicios de autoevaluación 7.1?No se me ocurre cómo plantearlos o resolverlos. Respuesta: En el ejercicio 9, como n es grande y p es pequeña, podemos muy bien usar la aproximación binomial 4 Poisson (con h = np). En este caso, se tiene h = np = 400 x 0.02 = 8. Ahora bien: a) Como 3 % de 400 es 12, se tiene:
Pero esta es sólo una aproximación. La respuesta más exacta se obtiene directamente con la distribución binomial:
6) Como 2 % de 400 es 8, se tiene en este caso:
506
Apindice C. Dudas típicas y preguntas con respuesta Si usamos la aproximación de Poisson, la respuesta será:
En este caso, la discrepancia entre ambos métodos fue mucho menor. También es posible usar la aproximación normal en ambos incisos, con lo cual se obtendrían respuestas aproximadas. Con el uso del Excel y de software estadístico, esas aproximaciones, que antes eran muy populares, empiezan a ser obsoletas e innecesarias. Para el ejercicio 10, tenemos: a) Respuesta exacta con computadora es:
Hace varios años (sin ayuda de computadoras) esto hubiese implicado una cantidad prohibitiva de trabajo, así que se habría resuelto por medio de la aproximación normal. En tal caso, la media es p = np = 200 x 0.46 = 92. La varianza es npq = 200 x 0.46 x 0.54 = 49.68. La desviación típica es, por tanto, 7.048404. Epificamos el punto x = 100.5 (mayoría usando corrección por continuidad) y se obtiene2 = 1.21.Ahora empleamos tablas (recuérdese que se supone que no hay computadora) y obtenemos:
6) La respuesta exacta (con computadora, usando Excel) es:
Si no se tiene computadora a la mano (o si no se permite usarla), entonces hay que emplear de nuevo la aproximación normal y las tablas, en cuyo caso se obtiene 0.0036. 22. Otra pregunta de 1. L. S., de Cuba
Tengo una duda sobre un tema de estadística pura. Digamos que se usa la notación siguiente para dos estimadores de la varianza poblacional oZcon muestras de tamaño n:
1 " i2=-x(x,-X): ,=*
1 s2=-
2
n-1 i=i
(x,- X)'
En el trabajo estadístico cotidiano, se escoge siempre el segundo, porque es un estimador insesgado de la varianza poblacional, mientras que el primero no lo es. Mis preguntas son: ¿Cuál de estos estimadores es más eficiente? ¿Cuál es exactamente la eficiencia (error cuadrático medio) del primero de estos dos estimadores? ¿Para qué valor constante k sería kC(x, - ;E)Zel más eficiente de todos los estimadores de la varianza poblacional?Como k no es igual a l/(n - l), ¿o sí?, ¿por qué se da preferencia al insesgo de un estimador sobre su eficiencia relativa? Respuesta: Si recordamos que para cualquier variable aleatoria Y se tiene E(Y z, = p2, + 02, (suponiendo, por supuesto, que existan tales esperanzas), podemos hacer Y = &!-
Dudas típicas y preguntas con respuesta
507
e
o2(donde es cualquier constante positiva), en cuyo caso se obtiene:
204 Ahora bien, si tomamos en cuenta que Var(s2) = -y que E(sZ) = o2@or n-1 ser un estimador insesgado), se sigue que:
Con esta expresión, podemos obtener no sólo los errores cuadráticos medios de tu pregunta, y compararlos, sino que además se puede hallar la derivada con respecto a 6 para descubrir cuál es el valor mínimo de esta función. Para el caso n-1 n -1 d e s =S', tenemos 5= -. Sustituyendo en la expresión i se obtiene:
,,
n
n
c
Por otra parte, derivando la expresión i con respecto a e igualando a cero, llegamos a:
y se halla entonces que la función i alcanza su valor mínimo para
n-1 . 5=-
n +l
Esto significa que para k = -resulta que kL(x, - Z)' es el más ejicitmn+l te de los estimadores de la varianza poblacional, porque es el que tiene el menor error cuadrático medio de todos. ¿Porqué se da preferencia al insesgo sobre la eficiencia al escoger un estimador de la varianza poblacional?El insesgo es muy importante, aunque la eficiencia de un estimador es también una cualidad importante. El estimador más eficientede todos es el estimador insesgado de varianza mínima, el cual se llama estimador 100 % eficiente. Hay un teorema famoso de Cramér-Rao que proporciona una cota inferior para la varianza de cualquier estimador insesgado. La razón que resulta de dividir la cota inferior de Cramér-Rao entre la verdadera varianza del estimador, es lo que se llama la eficiencia de dicho estimador. Por ejemplo, 1 = 2 veces si la eficiencia de un estimador es de 5096, entonces se requieren 0.5 más observaciones para que la estimación sea tan buena como sería con el estimador insesgado de varianza mínima (que es el más eficiente de todos).
23. Pregunta de Alejandro Corona, de Mexicaii, Baja Caiifornia Doctor Velasco: Me podría indicar cómo puedo resolver el ejercicio 1 del test de opción múltiple 7.2, ya que no se me ocurre cómo plantearlo para llegar a la respuesta. Solución: Toda distribución gama (o de Erlang) tiene una componente exponencia1 en el parámetro de escala h, además de un parámetro de forma r, así que en este caso se nos da información acerca de cómo obtener el parámetro h, toda vez que la varianza de la distribución exponencial es a2= -.1 Como se nos h2 dice que esto vale L,se deduce que entonces h = 6. Además, se nos propor36 ciona la información de que por cada 14 melodías que compone graba un CD nuevo, por lo que el tiempo transcurrido entre un CD que graba y el siguiente CD sigue una distribución gama, con parámetros r = 14, h = 6, y con el tiempo X medido en años. En consecuencia, sólo hay que calcular P(X< 2.5). Para resolver esto con Excel, debemos recordar que el Excel emplea otra nomenclatura para la distribución gama (lo cuai les mencioné durante una sesión satelital). El Excel, en lugar de r usa la letra a,y en lugar de h usa el parámetro P, 1 = h. Por tanto, para el Excel, aquí los parámetros de la distribución son tal que -
P
a = 14, p = L. La sintaxis con Excel (en español) es la siguiente: 6
Entonces, la respuesta del problema (con Excel) es:
lo cual da la respuesta correcta: 0.6368, que corresponde al inciso 6 .
24. Pregunta de Marilú Rodríguez, de Hidalgo, México Tengo una duda acerca de cómo resolver el ejercicio 12 del test de opción múltiple 8.1. Respuesta: El intervalo se calcula mediante la fórmula:
El valor crítico t, con a = 0.01 y v = 7 grados de libertad se halla con Excel:
o bien con tablas d e valores críticos t, para la distribución t de Student con v grados d e libertad:
Por tanto, el intervalo de confianza buscado es:
Esto da (redondeado a dos dígitos significativos):
lo cual concuerda con el inciso d.
25. Pregunta de Pavel Andrade Delgadillo, de Saltillo, Coahuila Profesor Velasco: Tengo 17 años y estoy cursando por primera vez la materia de probabilidad y estadística. Quisiera saber si usted puede orientarme en la solución del siguiente problema de probabilidad que me plantearon algunos amigos acá en Saltiiio: "Si se arreglan al azar las 28 fichas de dominó en forma de un rectángulo de 7 x 4,
¿cuál es la probabilidad de que por lo menos una de las cuatro fichas de las esquinas sea una mula?" Mis amigos y yo realizamos este experimento en la práctica y notamos que casi siempre aparece al menos una mula en las esquinas, pero ¿cómo calcular la probabilidad exacta? Respuesta: Cuando se arreglan las 28 fichas del dominó aleatoriamente en forma de rectángulo (o de cualquier otra manera aleatoria), la cuarta parte de ( - 7 )
son mulas, ¿cierto?, así que cualquier ficha (en especial una de las es-
7 =1 de ser una "mula" y de 21 3 de quinas) tiene una probabilidad de -28 4 28 4 no ser mula. La probabilidad de que ninguna de las cuatro esquinas tenga mula está dada por:
Esto se debe a la fórmula para la probabilidad de la intersección de varios eventos (regla multiplicativa):
5 10
Apéndice C. Dudas típicas y preguntas con respuesta
aunque también puedes llegar a este mismo número usando la fórmula para ensayos sin reposición (distribución hipergeométrica), con la cual obtendrías:
Por consiguiente, la probabilidad de quepor lo menos una de las fichas de las esquinas sea mula está dada por:
Es una probabilidad alta, por lo que ese fenómeno se va a observar con una frecuencia relativa superior a 70 % (más d e 7 de cada 10 veces en promedio), y no es raro que casi siempre lo hayas observado en la práctica. 26. Comentario de Roberto Aviia Antuna, del Estado de México Soy profesor d e la materia d e probabilidad y estadística en el Colegio de Ciencias y Humanidades de la UNAM (Universidad Nacional Autónoma d e México). Hojeando su libro Probabilidad y Estadistica para Ingeniería y Cierzcius, me llamó la atención el problema 23 de la página 47 y sobre todo la solución que usted propone al final del libro. Me parece que la solución está incompleta y quisiera abundar un poco al respecto, ya que es un problema al que casualmente hice referencia con mucho detalle en mi tesis de doctorado en matemática educativa, y no es tan sencillo como parece. Empecemos por el enunciado: Supongamos que en la prisión de AImoloya hay tres convictos incomunicados entre sí, que están sentenciados a purgar una condena de cadena perpetua. De pronto, el Juez anuncia que dos de ellos saldrán libres bajo fianza y sólo uno se quedará a cumplir su condena, pero no dice quién o quiénes serán. Sin embargo, el guardia o custodio lo sabe y sólo está autorizado a decirle a cualquierad e los tres que se lo solicite,el nombre de uno d e los otros dos que saldrá libre bajo fianza.Entonces, uno de los tres presos (cualquiera) puede razonar así: "Como dos de nosotros tres serán liberados, la probabilidad de que sea yo uno de los escogidos es de
-.L
3
Pero si le pregunto al guardia el nombre de uno de los otros
dos que saldrá libre, entonces podría excluir a él del razonamiento y s610 quedariamos dos convictos, uno de los cuales solamente saldrá libre. Por tanto, la 1 probabilidad de que sea yo se reduce a -." ¿No parece este argumento paradó2
jico? ¿Cómo puede ser que la ayuda del guardia (al darle información valiosa) disminuya la probabilidad de salir libre en vez de aumentarla? Explicar. La respuesta que usted plantea al final del libro es la siguiente:
Es un razonamiento engañoso. Enfoquémoslo desde este punto de vista: al momento en que anuncien oficialmente los nombres de los dos que saldrán libres, por fuerza uno
será leído primero y el otro después..Así, desde esta óptica tiene que haber un "primero" y un "segundo" en ser liberados. Si les ponemos a los convictos las etiquetas 1,2y 3,entonces cualquiera de ellos (por ejemplo, el número 2) sabe a prori que tiene 2/3 de probabilidades de ser el primero o el segundo en ser elegido, pero sólo 1:3 para ser el primero en ser elegido. Antes de cualquier evidencia empírica, el seiior 2 sabe que tiene una probabilidad de 1/3 de ser el primer elegido. Cuando el guardia le dice el nombre de otro de los elegidos (antes de que se elija oficialmente el primero), e9 probabilidad aumenta de 1/3a l/2,y esto pasa antes de que ocurra la primera elección de uno de ellos. De hecho, el guardia ni siquiera tiene que decirle nada a él, porque es ebrio que enue los otros dos, por fuerza uno tendrá que salir, sea quien sea. A mi modo de ver, la respuesta que usted propone no aclara en forrm la aparente paradoja. El asunto es un poco más complicado. Sugiero daaarpcu--LB C a los tres convictos y suponer queA es quien realiza el razonamiento en pñniprapzxxma La aparente paradoja en el razonamiento de A es que no ha listado los emzs g w s E h de manera apropiada. Técnicamente hablando, él no tiene el espacio El piensa que su experimento tiene tres posibles resultados: que se libereni-f_=--CzECZ cada uno con probabilidad de l/3.Desde este punto de vista, ese es ei w n r s s = ? ! correcto para el experimento, pero el propio experimento de A agrega m 3 ntc puesta del guardia. Los resultados del experimento propuesto y sus pm* xct
-
a) A y B son liberados y el guardia dice B, probabilidad 1B. b) A y C son liberados y el guardia dice C, probabilidad lb. c) B y C son liberados y el guardia dice B, probabilidad 1/6. d) B y C son liberados y el guardia dice C, probabilidad 1/6.
-
Si en respuesta a la pregunta de A, el guardia dice "B será l i M probabilidad de que A sea liberado será el resultado de dividir la probb&W &S ciani a y la suma de los eventos a y c.Esto es: 1/3/(1/3 + 1/6),o sea, 2/3,y las regresan al sentido común después de todo. Haciendo una revisión de esta paradoja y algunas otras similares, taremos de acuerdo en que para abordarlas se requiere un pensamiento p c k i h i i sin embargo, para su solución, no es suficiente este pensamiento prose requiere además el dominio de una o varias herramientas mate-m%c pueden asociarse diversos instrumentos psicológicos. En este problema argumento no utiliza ningún instrumento psicológico con el cual pueda r e & z 3 ciones, sino que opera directamente con el enunciado del problema, b ti m alto grado de dificultad. Tal como lo plantea, no resulta muy evidente que el -J tenga probabilidad de l/3y el d de 1/6.Lo mismo podríamos decir de su aicñsiriF ~r lo conduce directamente al resultado. Otro punto que considero necesario destacar, es el siguiente: Ciianlrr h gunta sobre la probabilidad de que A sea liberado, sabiendo que el guardia ~ Q rrZ uno de los liberados, de manera casi inmediata se propone como respuesa L 'L algunos se percatan de que el hecho de saber el nombre de uno de los que salárp-nker debe afectar la probabilidad de que salga libre, no logran encontrar la jus38t ta interesante que este sea el tipo de problemas que aparece en la literatura p f de lo paradójica que es la probabilidad. Un diagrama de árbol haría visible la estructura del problema y al míFnrr z?i sería el instrumento psicológico que nos permitiría encontrar los datos que mexplícitamente en el enunciado (fig. C.1).Los datos que van apareciendo en d son producto de la retórica, sino el resultado de la aplicación de las reglas de propias del mismo árbol.
--
5 12
Apéndice C. Dudas típicas y preguntas con respuesta
Figura C.1
Para poder contestar la pregunta utilizando el árbol, es necesario precisarla muy bien: Si sabemos que el guardia dijo B, ¿cuál es la probabilidad de que AB sea la pareja que obtendrá su libertad? En este caso, nuestro nuevo espacio muesval se reduce a los dos eventos en que el guardia contesta B, y de éstos, sólo en el primero aparece la pareja AB. Esto es:
En este momento es necesario ser muy precisos. Cuando hablo de una apropiación operatoria de las probabilidades, me refiero a este proceso que se inicia con la selección y construcción del árbol como instrumento psicológico. A partir del enunciado es posible vaciar los datos en un instrumento o representación que tiene reglas de funcionamiento muy precisas. Estas reglas precisas, sin ambigüedades, permiten que el resultado emerja de un proceso de cálculo. Por supuesto, no se trata simplemente d e efectuar operaciones a un nivel algorítmico y de manera mecánica, sino d e algo más profundo. En este problema, el árbol desempeña al menos dos Funciones importantes para acceder a la solución: por un lado, organizar la información que se presenta en el enunciado; y por el otro, servir como instrumento intermediario para encontrar, utilizando las reglas de tratamiento y realizando una serie de operaciones, los datos que no aparecen de manera explícita en el enunciado y que se requieren para hallar la solución. En este sentido, vale la pena retomar algunas de las ideas de Piaget. El estudio del desarrollo de la inteligencia de un niño permite poner en evidencia un nivel anterior a la consumación de las operaciones, donde las operaciones son esencialmente estáticas, de tal forma que el razonamiento en condiciones contemplativas fracasa en la resolución de los problemas más elementales de conservación. Las operaciones en tanto se constituyen, se apoyan en el aspecto figurativo del pensamiento e introducen en él un dinamismo que permite efectuar las transformaciones.Por tales motivos, resulta evidente que las operaciones son nudo vital del trabajo intelectual, y como tales presentan precisamente el conjunto de características a las que Bergson quería atribuir el privilegio de una intuición "supraintelectual" o "ultraintelectual".
Dudas típicas y pregun:as con respuerta
5 13
Por último, me parece que en cierto modo la teoría d e las probabilidades evolucionó gracias al esfuerzo por tratar de explicar las paradojas que aparecían. En este sentido, quisiera recomendar a usted y a sus lectores el excelente libro de Gábor J. Székelegr: Pares in Probability Tbewy and Mathellzatical Statistics. Re~pwskfi Muchas gracias por tan abundante y precisa explicación. ?Linto un servidor como los lectores de este libro la apreciaremos. Con respecto al libro de Székeley, lo conozco y lo he leído. Ciertamente es un libro muy estimulante.
isde l o s t e s t s
Cap. 3. Test sobre estadística descriptiva -
4. i )
1. i ) d ii) d iii) d
2. i ) a ii) b iii) a
3. a
6. c
7. i ) b ii) b iii) d
8.i)a ii) a
c
5. i )
c
ii) b iii) a
ii) c iii) b
9. i ) b
10. i ) a ii) c iii) c
ii) b iii) d iv) a
Cap. 5. Test sobre distribuciones discretas 1. i ) c ii) b iii) d
2. i) b ii) a
3. b
7. a
8. b
9.
c
4. a
5. d
6. b
10. a
11. b
12. c
Cap. 6. Test sobre distribuciones estadísticas (capítulos 5 y 6) 1. i ) d ii) b
2.i)a
6. b
7. d
3. a
4. i ) a
5. c
ii) c iii) c 8. c
9. a
10. c
515
5 16
Apéndice D. Respuestas de los tests
Cap. 7. Tests generales de diagnóstico (capítulos 1 a 7) Test 7.1 1. z > b ii) a iii) b
2.i)a ti) a
6. a
7. d
8. a
9. b
10. c
1. a
2. a
3. a
4. d
5. c
6. b
7. b
8. i) d ii) c iii) a
9. d
10.b
3.
c
4. i ) d iz') d
5. b
iii) c
Test 7.2
Cap. 8. Test sobre estimación de parámetros, intervalos de confianza y tamaños de muestra
Existen innumerables libros de texto y de consulta sobre estadística y probabilidad, con diferentes orientaciones, y escritos para niveles distintos. La siguiente lista comprende lecturas muy recomendables, dirigidas a un nivel semejante al de este libro. Se podrían mencionar cientos de referencias en muchos idiomas, pero se han escogido sólo 10 títulos que están entre los mejores, según la opinión del autor. La mayoría de ellos pueden conseguirse sin dificultad en librerías y bibliotecas. Anderson, Sweeney y Wdliams, Estadfstica para istración y Economfa, 7a. ed., Thomson, México, 2003. Falk, Ruma, UnderstandingProbability andstatistics.A Book of Prvblems, A K Peters, Wellesley Massachusetts, 1993. Godkey, M. G., E. M. Roebuck y A. J. Sherlock, Comise Starisrics, Edward Arnold, Londres, 1988. Hoel, Paul G.,Estadisci~elemental,CECSA, México, 1979. (Título en inglés:Elementary Statistics,John Wdey and Sons, NuevaYork, 1977.) Hoel, Paul G., Inhaiuccih a la estadística matemática, 2a. ed., Ariel, Barcelona, 1976. (Introductim to Matb-tical StatLrtics,John Wdey and Sons, Nueva York, 1971.) Hoel, Paul G., Sidney C. Port y Charles J. Stone, Introduction to Probability meory, Houghton Mifflin, Boston, 1971. Hogg, Robert i! y Allen T. Craig, Introductim to Matbematical Statístics, 5a. ed., Prentice H d , Nueva Jersey, 1995. Hogg, Robert i! y Ehot A. Tanis, Probability and Statistical Inference,3a. ed., Machúllan, Nueva York, 1988. Velasco Sotomayor, Gabriel y E M. Wisniewski,Probabilidady estadtktzcapara ingenieriay ciencias,2a. ed., Thomson, México, 2001. Velasco Sotomayor, Gabriel y F! M. Wisniewski,Problema& deprobatnlidad,Thomson, México, 2002.
Aiekhine, A, 290 Arnpere, André Marie, 418 Aristóteles, 459 Arreola, Juan José, 6 Asimov, Isaac, 426 Banach, 19711 Bátiz, Bernardo, 180 Bayes, Thomas, 14,456,459 Bernoulli, Jacques, 159,208,260 Borel, 14 Cardano, Gerolamo, 29 Chebishev, Pafnuti L., 14,257,299 Darwin, Charles, 425 De Moivre, Abraharn, 14,119,213,239,259 Feller, WiUiam, 14 Fermat, 14 Fisher, Ronald Aylmer, 14,344 Galton, Francis, 14, 97,425 Gamow, George, 65 Gauss, Friedrich Carl, 14,271 Gnedenko, Boris, 14,235,353,407 Gosset, William S., 14, 120,236,345 Graunt, John, 14,64 Huff, Daryl, 34 Hussein, Saddam, 34 Huygens, Christiaan, 139
Kárpov, 147 Khinchin, Aieksander Y, 290,376 Kolmogórov, Andréi, 14,235,324 Kruskal, William, H., 386,391,442 Laplace, Pierre Simon, 5, 14, 119, 128, 213, 240,259-260 Larsen, 147 Lyapunov, Alexander, 14,235,261,324 Mann, Henry B., 386,422 Markov, 14 Mendel, Johan Gregor, 34 Newton, Isaac, 5 Neyman, J e q 307,353 Pacioli, Luca, 28 Pascal, Blaise, 14, 139 Pearson, Karl, 14,290,295,332,425 Petty, William, 14,64 Poisson, Siméon Denis, 14, 168, 260, 271 Politanus, Helenus, 13 Quetelet, Adolphe, 14,97 Radhakrishnan Rao, Calyarnpudi, 399 Ramsés II,14 Ransom Whitney, Donald, 386
5 20
Índice onomástieo
Safnkit, diosa egipcia, 14, Schmeizel, Martin, 13 Seirawan, 147 Sierpinski, Waclaw, 197n Snedecor, George W, 14,376 Spearman, Charles, 332 Steinhaus, Hugo, 197n
Wallis, W Ailen, 386, 391,442 Weibull, Waloddi, 407 Wells, H. G., 13' Wílcox, R. A., 380n Wilcoxon, Frank, 380,422 Wilder Tukey,John, 399 Wisniewski, Piotr M., 50, GOn, 118n, 162n
Velasco, Gabriel, 50,60n, 118n, 162n
Yates, Frank, 376
Aieatoria, variable continuas, 114, 120, 124 discretas, 113-114, 121, 124 distribución de probabilidad en, 121 tipificación de una, 130-133 valor esperado de una, 124 Aleatorio, muestreo, 39 Amplitud de una clase, 76 Análisis de varianza diseño de experimentos y el, 17 Anchura de una clase, 76 Anomalía estadística, 42 Aproximación binominal con una curva normal, 224f Árbol a posteriori, 460 a priori, 457 Áreas, cálculo de, 114-117 con integrales indefinidas, 135 Asistente para gráficos en Excel, 82 Azar estadística y el, 15 probabilidad y el, 15 Bondad d e ajuste, 365 Botón derecho en Excel para las ojivas, 81 Calculadora científica combinaciones usando una, 158 estadística descriptiva con la, 61 modalidad estadística en la, 17
modalidades de operación de la, 18 uso de la, 17-19 Cálculo(s) de diferentes magnitudes, 76 de tamaño de una muestra, 286-287 Campana de Gauss, 120,215 Causa eficiente, 459 formal, 459 instrumental, 459 material, 459 Clase(s) definición de, 75 límites reales de, 75 moda1 y antimodal, 86 y sus características, 75 Coeficiente(s) de asimetría utilidad del, 118 y curtosis, 117-121 de correlación muestral, 431 valores críticos para el, 441 de determinación muestral, 432 de dispersión relativa, 48 de la recta de regresión, 435 de regresión, 427 de variación, 48-49 propiedades del, 49 Combinaciones características de las, 157 de n objetos, 157-159
522
hdice ana[ítico
Confianza intervalos de, 64,259 nivel de, 64 Constante de integración, 115 Contabilidad moderna, Pacioli padre de la, 28 Corrección de Yates para la continuidad, 371-372 por continuidad, 75,114,219 variable aleatoria discreta y, 123 Correlación, 431-432 análisis de, 425 Cuando más, significado de, 24 menos, significado de, 24 mucho, significado de, 24 Cuartiles, 58 Curtosis coeficiente curva normal y, 127 de asimetría y, 117-121 observación sobre el significado de la, 224-225 símbolos y cantidad de la, 127 Curva(s) aproximación binomial con una, 224 asintótica, ejemplo de, 116 con sesgo cero, 119-120 negativo, 119 de campana, 120 normal estándar a seis dígitos decimales, 217 sesgada, 117 Datos agrupados la moda para, 86-89 por intervalos, en Excel, 93 y leyes de la estadística, 90 y su interpretación geométrica, 86 aislados, manejo estadístico de, 37 independencia de, 365 Deciles, 58 Decisión, regla de, 310 Densidad de probabilidad, 96 Desigualdad de Chebishev, 133-134, 257, 258f ejemplo del uso de la, 257-258 Desviación cuadrática media, 45 estándar, 45
r.
alrededor de la media, 132 muestrai, 59-60 para datos agrupados, 89-91 símbolo de la, 126 media, 4546 para datos agrupados, 82-83 promedio de la mediana, 46 de una constante, 50 Diagramas de pastel, 25-27 Diseño de experimentos y el análisis de varianza, 17 Dispersión en tipo de gráfico de Excel, 82f medidas de, 44-46 relativa, coeficiente de, 48 Distribución(es) acumulada, 122 y ojivas, 80-82 beta, 414-416 y la distribución binomial, 416417. binomial, 159-163 aproximación de la, 222 ejemplos de la, 183-188 ejercicios de la, 189 Excel en la, 163-164 formulario de la, 182 media en la, 162 negativa, 173-175 ejemplos de la, 194 ejercicios de la, 199-202 formulario de la, 192-193 media de la, 174 varianza de la, 174 sesgo en la, 162-163 uso de tablas en la, 163-164 varianza de la, 162 carente de memoria probabilística, 230 combinadas, ejemplos de las, 210-212 con sesgo positivo, 118 en la naturaleza, 119 en variables aleatorias, 118-119 de Caucby, 237 de Erlang, 227-234 problema5 de espera con la, 233 ejemplos de, 233-234 y distribución binomial negativa, 228229 de Poisson, 167-168 ejemplos de la, 206-208,232
524
índice analítico
con calculadora científica, 61 con Excel de Microsoft, 62-65 pantalla de Excel con, 63f para datos agmpados, 37 en la evolución de los seres vivos 344 en la genética, 344 etimología de, 13 inferencia características, 14 objetivo de la, 17 matemática teórica, 235-236 no paramétrica, objetivo de la, 17 objetivo de la, 15 ramas de la, 14-15 y teoría delas probabilidades, 15,16 Estadístico(s)' definición, 39 no paramétricos, 365 Estimador definición, 39 insesgado, 39-40 Eugenesia definición de, 425-426 genética y, 426 Excel de MicrosoJt OGce, 6 en la distribución binomial, 163-164 de Poisson, 169-173 funci6n de Poisson con, 169 menú Herramientas en, 20 uso del, como apoyo, 20-23 valor crítico en, 282 Factorial de un entero no negativo, 157 Falla, rapidez de, 230 Flujo de sucesos de Poisson, 168 Fórmula de Bayes, 460 Formulario de la distribución binomial, 182 Frecuencia(s) acumuladas, 84 histogramas de, 77-78 polígono de, 79-80 relativa, definición, 40-41 Función de densidad de probabilidad, 122 de distribución acumulada, 122 de Poisson con Excel, 169 de supervivencia, 408 gama, 228 riesgo de falla, 408
Gauss, campana de, 120,215 Genética y eugenesia, 426 Glosario de términos, 307-310 Grados de libertad, 60 Gráfica d e ojiva, 81 sesgada, 127 Herramientas estadísticas, 425 para análisis en Excel de Microsoft, 62 Heteroscedasticidad, 428 Hipótesis aceptar una, 308 alternativa, 309 contraste de, 309 estadísticas, 307-310 nula, 308 ejemplo de, 322-323 idea de Wilcoxon y la, 381 rechazar, 308 Histogramas de frecuencia, 77-78,91 apreciación del, 198-199 características del, 78 dibujados a mano, 78 en Excel de Microsoft, 78 para la distribución binomial, 163f Homoscedasticidad, 428 Independencia d e datos, 365 Inferencia estadística, características de la, 14,17 Inferenciai, características de la estadística, 14 Integral(es) definida, cálculo de área mediante, 115 elementales y áreas bajo curvas, 114117 impropias del primer tipo, 117 indefinida de una funciónf(x), 114 Interpretación geométrica de la media, 54-56 de la mediana, 56-58 Intervaio(s) ampliado, 75-76 límites reales en el, 76 con anchuras variables, 91 y densidad d e frecuencia, 91-96 de confianza, 259 ejemplo para un, 289 esquema para, 283f
índice analitico método para construir un, 282 para la desviación estándar, 289-295 para la diferencia de medias, 336-337 para la media poblacional, 281 para la varianza poblacional, 289-295 para razones de dos varianzas, 352 para una proporción poblacional, 292-296
Lenguaje en estadística, términos del, 2425
Letras griegas y latinas, 16 Ley(es) básicas de teoría de las probabilidades, 15
de la estadística, 16 de los Grandes Números, 15, 114, 260261, 309-310
Abraham de Moivre y la, 260 Límites de integración, 116 *
525
Métodos de pronóstico, 17 estadísticos bayesianos, 17 no paramétricos, 121 no paramétricos, 39 Moda, la en la distribución binomial, 161 para datos agrupados, 86-89 interpretación geométrica de, 86-87 Momento@) alrededor de una media, 126 función generatriz de, 128 inicial de una variable aleatoria, 126 Muestra(s) apareadas, caso de, 339-342 ' cálculo del tamaño de, 286-287 determinación del tamaño de, 319-323 grande, 281 pequeñas tomadas de poblaciones normales, 338-339 Muestreo aleatorio, 39 con reposición, 159-163 sin reposición, 164-167
Manejo estadístico de datos aislados, 37 Marcas de clase, 76 Margen de error, 295 Media aritmética o muestral, 43-44 ajustada o trimmed mean, 42 Nivel de significación alternativa como, 88 de una prueba, 309 ejemplo de uso de, 89 experimental, 3 17-318 como parámetro, 41-42 criterios del valor de, 323-324 de muestra pequeña, intervalo de confi- Nomenclatura en estadística, 16 anza para, 287-289 Notación sigma para sumas, 53-54 distribución muestral de, 261-266 error Ojivas estándar de la, 265 dibujadas con Excel, 81 típico de la, 265 distribución acumulada y, 80-82 estimación de una, 286-287 Operador lineal, características de un, 115 muestral, cálculo de la, 43 para datos agrupados, 82-83 Paradojas de Bernoulli, 260 poblacional, 41-42 Parámetro(s) y promedio, 42 con valor promedio, 42 y varianza de la distribución de Poisson, de escala, 227 168 de forma, 227 Mediana definición de, 39 con gráñcos de tallo y hojas, 46-48 test sobre estimación de, 304 definición de, 43 varianza como, 45 ejemplos para calcular la, 43 Pay Véase Diagramas de pastel y cuantiles para datos agrupados, 84-85 Percentil(es), 58 Medidas crítico, 281 de dispersión, 44-46 de la distribución t destudent, 239,32Ot, de localización, 41-44 321t, 488 de tendencia central, 41-44 en Excel, cálculo de, 238
526
Indice analítico
Pérdida de la memoria, propiedad de, 229 Pioneros de la estadística moderna, 14 Población(es) combinadas, ejemplo con, 137-138 definición, 38 estudio de, 39 Polígonos de frecuencia, 79 superpuesto al histograma, 79-80 Porcentaje(s) de ajuste, 89 uso de, 25-26 Principio aditivo, 157 multiplicativo, 157 Probabilidad(es) a priori, 458 conceptos básicos de la, 6 condicional, 453 de una causa, 459 definición de, 15 frecuencia relativa y, 40 lenguaje en, 24-25 posteriores, 456-457 puntual en variables aleatorias, 121 sobre intervalos, 120 total, 459 Problemas de tiempo, soluci6n de, 231 Procedimiento de interpolación, 84 Propiedad de pérdida de la memoria, 229 Proporción(es) estimar una, cálculo del tamaño de muestra para, 196-299 fórmula para, 298 poblacional(es) inferencia5 acerca de la diferencia de dos, 343-344 intervalo de confianza para una, 295 pruebas de hipótesis sobre una, 325328 Prueba(s) de dos colas, 315 de hipótesis, 307 bilateral, 313 ejemplos de, 310-312 esquema para la, relativa a una media, 313-315 para la varianza de dos poblaciones, 352-353 procedimiento para una, 313 relativa a la desviación estándar, 328-331 a la varianza, 328-331
a una media poblacional, 319-323 al coeficiente de relación, 440-442 sobre una proporci6n poblacional, 325-328 de los signos, 377-379 para muestras apareadas, 379-380 de rango con signo de Wilcoxon, 380384 para muestras apareadas, 385-386 de Wald-Wolfowitz de rachas, 394-399 ejemplo de, 397 estadístico de, 309 H de Kruskal-Wallis, 386,391-394 empleo de la, 391 ji-cuadrada de Pearson, 365,377 nivel de significación de una, 309 no paramétricas, 365 para la media de una población, 316a 318 potencia de la, 309 U de Mann-Whitney, 386-391 Ramas de la estadística, 1415 Rango, definición de, 46 Rapidez de falla, 230 ejemplo de, 410 Redondeo de aproximaciones decimales, 23-24 Regla de Bayes, 456-457 ejemplos de la, 457-458 de decisión, 310 ejemplos de, 310 multiplicativa, 453 Regresión anáiisis de, 425 definición de, 426 múltiple, 425 objetivo de la, 17 simple, 425 Reposición, 38 Resumen de estadísticas en E5ccel deMicroso) Word,2 1 Riesgo acumulado de falla, 408 Sesgo. Véase también Coeficiente de Asimetría igud a cero, 119 negativo, 119 pequeño o sin, 133 positivo, 118-119 Símbolos griegos y latinos, 16
Sofware MINITAB, 76 Sucesos de Poisson ejemplo de, 168,232 flujo de, 168 Suma@) abreviada, propiedades de la, 53-54 notación sigma para, 53-54
del lenguaje en es- " ,2425 grande y pequeño, 343 Test de pruebas de hipótesis, 345348 sobre distribuciones disamis, 179182 sobre estimación de parámews, 304 sobre los intervalos de confianza, 332334 sobre pniebas de hipótesis, 332-334 estadísticas no paramétncas, 399-404 Xpificación de una variable aleatoria, 130-133 fórmula de, 213 Trabajos de Poisson, 259 'Pastorno al azar, 427
Tablas de clasificación de contingencia, 373 múltiple, 373 simple, 373 de contingencias e independencia de datos, 373-375 , de distribución acumulada binomiai, 467-477 Unidad(es) de Poisson, 478-483 de desviación estándar alrededor de la normal estándar inversa, 486-487 media, 132 de tiempo, definir la, 231 de percentiles en libros de estadística, Uso de porcentajes, 25-26 238 Tema de la distribución, importancia del, 15 Vaior máximo, 24 Teorema central del límite, 15, 261-266 Variable@) forma del, 262 aleatoria(s) de Bayes, 17,456 continuas, 114,120,124 de Chebishev. Véase Desigualdad de ejercicio con, 146 Chebishev discretas, 113-114, 121, 124 de De Moivre-Laplace, 259-260 ejemplo de, 134 en la distribución normal estándar, distribución de probabilidad en, 121 259 fórmula de aproximación del, 268 tipificación de una, 130-133 Teoría continuas, 113 de las decisiones, 17 discretas, 113 de las probabilidades explicativas, 425 distribuciones teóricas y la, 15 tipificación de la, 213 estadística y la, 15 Varianza leyes básicas de la, 15 como parámetro de dispersión, 45 de regresión y correlación, 435-437 muestral, 291 Términos poblacional, 44-45
La presente obra sintetiza las partes esenciales y más importantes de la materia: estadística descriptiva, inferencia estadística y estadística no paramétrica, con una breve introducción a los conceptos básicos de la probabilidad. El enfoque está orientado a mostrar la utilidad práctica de la estadística y sus múltiples aplicaciones en la istración, la Economía y las Ciencias Sociales, con el apoyo de una computadora personal; si bien se incluyeron tablas estadísticas en un apéndice, a fin de que los problemas y ejercicios puedan resolverse también sin computadora, con el apoyo de una calculadora científica de bolsillo. Los únicos prerrequisitos para abordar con éxito este libro son una '1 preparación matemática equivalente a la de un estudiante de bachillerato y un conocimiento elemental del programa Excel de Microsoft Opce. El autor logró esquivar, casi siempre, el empleo del cálculo diferen,czjal e integral, y cuando no le fue posible incluyó una breve sección desctipiiva de esta / herramienta. Como corresponde a su orientación práctica, la obra contiene abundantes ejercicios, así como tests y autoevaluaciones con rebpuestas.
T r , ~
di.,. I
/
Contenido Introducción Manejo de datos aislados Datos agrupados en clases o intervalos Variables aleatorias y distribuciones de probabilidad Las distribuciones discretas teóricas más importantes Las distribuciones continuas teóricas más importantes Teorema Central del Límite y distribuciones muestrales Estimación de parámetros, intervalos de confianza y tamaño de muestra Pruebas de hipótesis paramétricas: introducción y pruebas relativas a medias Pruebas de hipótesis relativas a una proporción, a la desviación típica y a la varianza de una población Inferencia estadística para dos poblaciones Comparación de las varianzas de dos poblaciones La prueba ji-cuadrada de Pearson Las pruebas no paramétricas más usuales La distribución de Weibull y otras distribuciones continuas notables Regresión lineal simple y correlación
ESTADISTICA CON EXCEL
' l
.