MÉTODOS ESTADÍSTICOS La materia prima de la estadística consiste en conjuntos de números obtenidos al contar o medir elementos. Al recopilar datos estadísticos se ha de tener especial cuidado para garantizar que la información sea completa y correcta. El primer problema para los estadísticos reside en determinar qué información y en que cantidad se ha de reunir. En realidad, la dificultad al compilar un censo está en obtener el número de habitantes de forma completa y exacta; de la misma manera que un físico que quiere contar el número de colisiones por segundo entre las moléculas de un gas debe empezar determinando con precisión la naturaleza de los objetos a contar. Los estadísticos se enfrentan a un complejo problema cuando, por ejemplo, toman una muestra para un sondeo de opinión o una encuesta electoral. El seleccionar una muestra capaz de representar con exactitud las preferencias del total de la población no es tarea fácil. Para establecer una ley física, biológica o social, el estadístico debe comenzar con un conjunto de datos y modificarlo basándose en la experiencia. Por ejemplo, en los primeros estudios sobre crecimiento de la población, los cambios en el número de habitantes se predecían calculando la diferencia entre el número de nacimientos y el de fallecimientos en un determinado lapso. Los expertos en estudios de población comprobaron que la tasa de crecimiento depende sólo del número de nacimientos, sin que el número de defunciones tenga importancia. Por tanto, el futuro crecimiento de la población se empezó a calcular basándose en el número anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta que las predicciones obtenidas utilizando este método no daban resultados correctos. Los estadísticos comprobaron que hay otros factores que limitan el crecimiento de la población. Dado que el número de posibles nacimientos depende del número de mujeres, y no del total de la población, y dado que las mujeres sólo tienen hijos durante parte de su vida, el dato más importante que se ha de utilizar para predecir la población es el número de niños nacidos vivos por cada 1.000 mujeres en edad de procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos sólo es útil para indicar el crecimiento de población en un determinado periodo de tiempo del pasado, el número de nacimientos por cada 1.000 habitantes sólo expresa la tasa de crecimiento en el mismo periodo, y sólo el número de nacimientos por cada 1.000 mujeres en edad de procrear sirve para predecir el número de habitantes en elfuturo. POBLACIÓN, INDIVIDUO, CARÁCTER El primer campo de actuación de la estadística, como se ha visto, es la demografía. De esta ciencia ha tomado la nomenclatura (población, individuo…). Se llama población al conjunto de todos los elementos cuyo conocimiento interesa. Cada uno de esos elementos es unindividuo. Si se está estudiando el resultado de ciertos experimentos químicos, cada uno de esos experimentos será un individuo estadístico y el conjunto de todos los posibles experimentos en esas condiciones será la población. Cada individuo puede ser descrito mediante uno o varios caracteres. Por ejemplo, si los individuos son personas, el sexo, el estado civil, el número de hermanos o su estatura son caracteres. Y si el individuo es una reacción química, el tiempo de reacción, la
cantidad de producto obtenido o si éste es ácido o básico serán posibles caracteres que pueden analizarse. Un carácter puede ser cuantitativo si es medible numéricamente o cualitativo si no ite medición numérica. El número de hermanos y la estatura son caracteres cuantitativos mientras que el sexo y el estado civil son caracteres cualitativos. Los distintos valores que puede tomar un carácter cuantitativo configuran una variable estadística. La variable estatura, en cierta población estadística, toma valores en el intervalo 147-205; y la variable número de hermanos toma los valores 0, 1, 2, 3, 4, 5, 6, 7 y 8. Una variable estadística como esta última es discreta, ya que sólo ite valores aislados. Una variable estadística es continua si ite todos los valores de un intervalo, como ocurre con la estatura. ESTADÍSTICA DESCRIPTIVA La estadística descriptiva analiza, estudia y describe a la totalidad de individuos de una población. Su finalidad es obtener información, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los siguientes pasos: Selección de caracteres dignos de ser estudiados. Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres seleccionados. Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos dentro de cada carácter. Representación gráfica de los resultados (elaboración de gráficas estadísticas). Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de una distribución estadística. ESTADÍSTICA INFERENCIAL La estadística descriptiva trabaja con todos los individuos de la población. La estadística inferencial, sin embargo, trabaja con muestras, subconjuntos formados por algunos individuos de la población. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la población. Cómo se selecciona la muestra, cómo se realiza la inferencia, y qué grado de confianza se puede tener en ella son aspectos fundamentales de la estadística inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadística, probabilidad y matemáticas. Colegio von Humboldt METODOS ESTADÍSTICOS Gustavo von Quednow 4to “A” Clave: 21 Fecha:15/02/01 OBJETIVOS
Aprender los métodos estadísticos más efectivos.
Poner en práctica lo estudiado.
Utilizar los métodos estadísticos como se debe, sin errores. INTRODUCCIÓN En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de “interpretación” de esa información. El método estadístico guía al estadista para lograr sus metas fijadas sobre un tema estadístico. CONCLUSIONES El método estadístico se utiliza para poder realizar operaciones estadísticas y además da una explicación de los procedimientos que se tienen que llevar a cabo. El método estadístico es una buena herramienta para los estadistas. BIBLIOGRAFÍA -99. Multimedia, CD-ROM.
DISTRIBUCION DE FRECUENCIAS La distribución de frecuencia ofrece un resumen más compacto de los datos que el diagrama de tallo y hoja. Así una distribución de frecuencias es un resumen tabular de un conjunto de datos que muestra la frecuencia (o la cantidad) de artículos encada una de las clases que no se traslapan. El objetivo de elaborar una distribución de frecuencia es proporcionar una perspectiva de los datos, perspectiva que no se puede obtener rápidamente con sólo examinarlos. Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categoríasy d e t e r m i n a e l n ú m e r o d e i n d i v i d u o s q u e p e r t e n e c e n a c a d a c l a s e , l l a m a d o frecuencia de clase. Una disposición tabular de los datos por clases junto con las correspondiente s frecuencias de clase, se llama Distribución de frecuencias (O tabla de frecuencia) Un instrumento muy útil para resumir grandes conjuntos de datos es la distribución de frecuencia. Esta consiste en una representación de las categorías numéricas de la variable junto con el número de entidades que se clasifican en cada categoría. EJEMPLO 1.3 La tabla 1.3 es una distribución de frecuencia de estatura (en pulgadas) de 100estudiantes varones en cierta universidad.
Altura
Frecuencia (o número de estudiantes)
60-62 63-65 66-68 69-71 72-74
5 18 42 27 8
Total
100
Tabla 1.3. Distribuciones de frecuencias de estatura (en pulgadas) de 100 estudiantes
INTERVALO DE CLASE Es el símbolo que define una clase como 60-62 LIMITES DE CLASE •Límite inferior en el caso del intervalo de clase anterior es el valor 60 •Límite superior en el caso del intervalo de clase anterior es el valor 62 FRONTERA DE CLASE El intervalo de clase 60-62 incluye todas las medidas desde 59.5 a 62.5 (ya que una estatura registrada como 60 pulgadas realmente está entre 59.5 y 60.5) por lo quela frontera inferior es 59.5 y la frontera superior es 62.5. TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE Es la diferencia entre las fronteras de clase superior e inferior; entonces sería 62.5-59.5=3
Por lo tanto la anchura del intervalo es 3 MARCA DE CLASE Es el punto medio del intervalo de clase y se obtiene p r o m e d i a n d o l o s l í m i t e s inferiores y superiores de clase, es decir 60+61/2=61, así el punto medio de clase es 61. RANGO Del conjunto de datos que se tengan es la diferencia entre el valor mayor y el menor REGLAS GENERALES PARA FORMAR DISTRIBUCIONES 1) determinar el mayor y el menor de todos los datos, encontrando así el rango 2) dividir el rango en un número adecuado de intervalos de clase del mismo tamaño 3) determinar el número de observaciones que caen dentro del cada intervalo de clase, esto es, hallar las frecuencias de clases. Rango/ # de clase =Amplitud de clase EJEMPLO 1.4 La tabla 1.4 son datos de una muestra de 25 acciones comunes de banco. El rédito por dividendo para una acción es el porcentaje del precio de la misma representado por su dividendo.
3.1 5.3 4.7 3.8 5.1
4.2 3.5 3.7 4.4 3.7
2.3 3.1 3.0 3.2 2.3
3.3 2.6 2.6 3.2 4.3
2.8 3.3 4.0 3.8 3.9
Tabla 1.4. Acciones comunes de banco, 25 réditos. Para construir la distribución de frecuencia primero se localiza en valor menor de l a m u e s t r a e s 2 . 3 y e l m a y o r 5 . 3 y s e e n c u e n t r a e l r a n g o , p a r a c o n s t r u i r l o s intervalos de confianza. Si por ejemplo se desea hacer la distribución de frecuencia con 7 inter valos de clase sería hacer lo siguiente: Rango=5.3-2.3=3, Por lo tanto: 4.073= (0.4 es la amplitud de clase) La tabla 1.5 muestra la distribución de frecuencia de acciones comunes de banco con 7 intervalos de confianza
Intervalo de clase
Frecuencia
2.3 ---- 2.7 2.8 ---- 3.2 3.3 ---- 3.7 3.8 ---- 4.2 4.3 ---- 4.7 4.8 ---- 5.2 5.3 ---- 5.7
4 6 5 5 3 1 1
Total
25
Tabla 1.5. Distribuciones de frecuencia de acciones comunes de banco Con 5 intervalos de confianza quedaría como sigue: Rango=5.3-2.3=3, Por lo tanto: 6.053= (0.6 es la amplitud de clase) La tabla 1.6 muestra la distribución de frecue ncia de acciones comunes de banco con 5 intervalos de confianza Intervalo de clase
Frecuencia
2.3 ---- 2.9 3.0 ---- 3.6 3.7 ---- 4.3 4.4 ---- 5.0 5.1 ---- 5.7
5 8 8 2 2
Total
25
Tabla 1.6. Distribuciones de frecuencia de acciones comunes de banco HISTOGRAMA El histograma, es un tipo especial de gráfico de barras, se emplea para representar una distribución de frecuencia o de frecuencia relativa P a r a construir el gráfico se representa en un plano cartesiano donde el eje y Representa la frecuencia y el eje x los intervalos de clase, se levanta una barra con centro en la marca de clase y altura dependiendo de la frecuencia. Así la figura 1.1m u e s t r a u n h i s t o g r a m a u s a n d o l o s d a t o s d e l a t a b l a 1 . 3 ( l a e s t a t u r a d e l o s 1 0 0 alumnos).
Figura 1.1Gráfica de barras (histograma) estatura de 100 estudiantes. Al observar el histograma se puede apreciar fácilmente como se d i s t r i b u ye l a estatura de los estudiantes sobre el intervalo. POLIGONO DE FRECUENCIA Los datos de una distribución de frecuencia se pueden describir por medio de otra representación gráfica que recibe el nombre de polígono de frecuencia. Se puede construir un polígono de frecuencia dibujando primero e l h i s t o g r a m a y l u e g o conectando por medio de líneas rectas el punto medio de la parte superior de cada barra del histograma. La figura 1.3 muestra un polígono de frecuencia para el ejemplo 1.3.
Figura 1.3. Polígono de frecuencia de la figura 1.1 Distribución acumulada u ojiva Una gráfica de una distribución acumulada se llama Ojiva. Los valores de los datos están en el eje horizontal y las frecuencias acumuladas, se m u e s t r a e n e l e j e vertical; es decir tomando como ejemplo la tabla 1.8, los limites inferiores de cada clase marcan el eje horizontal y el eje vertical es la frecuencia acumulada como lo muestra la figura 1.4.
Figura 1.4 . Ojiva de los datos de la tabla 1.8
2.- TABULACION Y GRAFICACIÓN ESTADÍSTICA Métodos estadísticos: Definiciones y tipos. Tabulación, distribución de frecuencia: Polígono de frecuencia. Histograma. recuencia acumulada u ojiva.
DETERMINAR LOS MÉTODOS ESTADÍSTICOS MAS USUALES PARA LA ORGANIZACIÓN Y TABULACIÓN DE DATOS. DISTINGUIR LAS ESPECIFICACIONES TÉCNICAS DE UNA TABULACIÓN Y GRAFICACIÓN ESTADÍSTICA ÓPTIMA. SELECCIONAR EL MÉTODO ESTADÍSTICO MAS IDÓNEOS PARA EL TRATAMIENTO DE LOS DATOS. ORDENAR LA DISTRIBUCIÓN DE FRECUENCIA Y LAS TABLAS DE ACUERDO CON EL TIPO DE DATOS Y AL PROPÓSITO DEL ESTUDIO