MasMatemáticas
Apuntes de Estadísticas

 

Búsqueda personalizada

 

Medidas de Tendencia Central

 

 

¿Que es un promedio?

arriba

Otra forma de describir datos numéricos, las medidas de tendencia central, comúnmente conocidas como promedios. Estos promedios son la media aritmética, la mediana, y la moda.

A menudo necesitamos un solo número para representar una serie de datos. Este único número puede ser considerado como típico de todos los datos.

La palabra promedio es usada frecuentemente en nuestro lenguaje diario, normalmente nos referimos a la media aritmética, pero podría referirse a cualquiera de los otros promedios. Un término mas preciso que promedio es una medida de tendencia central. Hay tres diferentes medidas de tendencia central: la media aritmética, la mediana, y la moda.

 

La Media Aritmética

arriba

La medida de tendencia central mas ampliamente usada es la media aritmética, usualmente abreviada como media.

La media aritmética de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n.

Propiedades de la media aritmética

1. Puede ser calculada en distribuciones con escala relativa e intervalar.

2. Todos los valores son incluidos en el cómputo de la media.

3. Una serie de datos solo tiene una media.

4. Es una medida muy útil para comparar dos o más poblaciones.

5. Es la única medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.

Desventajas de la media aritmética

1. Si alguno de los valores es extremadamente grande o extremadamente pequeño, la media no es el promedio apropiado para representar la serie de datos.

2. No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.

La media para datos agrupados

Frecuentemente los datos estás agrupados y presentados en forma de distribución de frecuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales. Por consiguiente si queremos calcular la media u otro estadístico es necesario estimarlo en base a la distribución de frecuencias.

La media aritmética de una muestra de datos organizados en una distribución de frecuencias se calcula de la siguiente manera:

X = Σfx
n

Donde:

X simboliza la media de la muestra
x es la marca de clase
f es la frecuencia de clase
Σfx es la suma de los productos de f por X
n es la suma de las frecuencias de clase

Ejemplo:

Calcular la media aritmética de la siguiente distribución de frecuencia del número de meses de duración de una muestra de 40 baterías para coche. Como vemos es la distribución de frecuencia que elaboramos en la sección anterior.

duración de las baterías (meses) Número de baterías
15 - 19 2
20 - 24 1
25 - 29 4
30 - 34 15
35 - 39 10
40 - 44 5
45 - 49 3

Damos como un hecho que ya sabemos elaborar una distribución de frecuencias, si se quiere ver como se elaboró vaya a la sección de ese tema en este mismo sitio.

Primeramente, de la distribución de frecuencias que ya tenemos, utilizaremos la marca de clase y la frecuencia de clase, para después calcular el producto fX y proceder finalmente a calcular la sumatoria SfX y aplicar la fórmula.

LI LS X F FX
15 19 17 2 34
20 24 22 1 22
25 29 27 4 108
30 34 32 15 480
35 39 37 10 370
40 44 42 5 210
45 49 47 3 141
      n =40 ΣfX = 1365

X = Σfx
n
= 1365
40
= 34.12

La media para datos no agrupados

Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores dividida entre el número total de valores. Para encontrar la media de una muestra se usa la siguiente fórmula:

X = Σx
n

Donde:

X simboliza la media de la muestra
x son los valores de la muestra
Σx es la suma de todos los valores de la muestra
n es el número de elementos de la muestra

Ejemplo:

El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la media aritmética de estas observaciones?

X = Σx
n
= 85.4 + 85.3 + 84.9 + 85.4 + 84.0
5
= 85.0

La media de la muestra y la media de la población

Las medidas características de una muestra son llamadas estadísticos y las medidas características de una población se denominan parámetros. La media de la población se calculan de la misma manera que la media de la muestra, que calculamos arriba, pero tiene diferente notación:

μ = Σx
N

Donde:

μ simboliza la media de la población
x son los valores de la población
Σx es la suma de todos los valores de la población
N es el número de elementos de la población

 

 

La mediana

Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana.

La mediana es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos.

No hay una fórmula para calcular la mediana, pero si lo hay para la posición de la mediana cuando los datos están ordenados por su magnitud.

La posición de la mediana es:   n + 1
2

Cuando n es non, el resultado es entero y da la posición de la mediana. Cuando n es par, es resultado es el punto medio entre dos enteros, y la mediana es el promedio de los dos.

Ejemplo 1:

El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la mediana de las observaciones muestreadas?

La posición de la mediana es:   n + 1
2
= 5 + 1
2
= 3   ( tercera posición ):
85.4   →  
 X
 
  = 85.3
85.4
85.3
84.9
84.0

Ejemplo 2:

Una muestra de los honorarios de paramédicos cargados por la clínica Baltimore reveló estas cantidades: $35, $29, $30, $25, $32, $35. ¿Cuál es la mediana?

La posición de la mediana es:   n + 1
2
= 6 + 1
2
= 3.5   ( entre la tercera y la cuarta posición ):
25   →  
 X
29
30
32
35
35

En este caso la mediana se calcula obteniendo la media de la tercera y la cuarta posición


 X
 
  =  
 
30 + 32
2
 
  = 31

Propiedades de la mediana

1. Hay solo una mediana en una serie de datos.

2. No es afectada por los valores extremos ( altos o bajos )

3. Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se encuentra en el intervalo abierto.

4. Puede ser calculada en distribuciones con escala relativa, intervalar, y ordinal.

La mediana para datos agrupados

Cuando los datos se encuentran agrupados en una distribución de frecuencia no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos:

1. Calcular el valor n / 2

2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o mayor que n / 2.

3. Aplicando la siguiente fórmula con los valores del intervalo mediano:

 X
 
  =  LSR +  
 
(n/2 - fa) tic
f

Donde:


 X
 
es la mediana
LSR es el límite superior real del intervalo de clase de la mediana
fa es la frecuencia acumulada del intervalo de clase de la mediana
n es el número de elementos de la muestra
fa es la frecuencia de clase del intervalo de la mediana
tic es el tamaño del intervalo de clase

Ejemplo:

Calcular mediana de la siguiente distribución de frecuencia del número de meses de duración de una muestra de 40 baterías para coche.

duración de las baterías (meses) Número de baterías
15 - 19 2
20 - 24 1
25 - 29 4
30 - 34 15
35 - 39 10
40 - 44 5
45 - 49 3

Para calcular la mediana de una distribución de frecuencias necesitamos que tenga las columnas de límite superior real (LSR), frecuencia acumulada (FA), frecuencia (F).

1. El valor de ( n / 2 ) = 40 / 2 = 20

2. El intervalo mediano es:

LI LS LSR X F FA
15 19 19.5 17 2 2
20 24 24.5 22 1 3
25 29 29.5 27 4 7
30 34 34.5 32 15 22  g  intervalo mediano
35 39 39.5 37 10 32
40 44 44.5 42 5 37
45 49 49.5 47 3 40
N = 40

3. Aplicar la fórmula con los datos del intervalo mediano:


 X
 
  =  LSR +  
 
(n/2 - fa) tic
f
 
  =  34.5 +  
 
(20 - 22) ( 5 )
15
 
  =  33.83

 

 

 

La moda

La moda es la medida de tendencia central especialmente útil para describir mediciones de tipo ordinal y nominal.

La moda. Es el valor de la observación que aparece más frecuentemente.

Propiedades de la moda

1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y relativa).

2. La moda tiene la ventaja de no ser afectada por valores extremos.

3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

Desventajas de la moda

En muchas series de datos no hay moda porque ningún valor aparece más de una vez.

En algunas series de datos hay más de una moda, en este caso uno podría preguntarse ¿cual es el valor representativo de la serie de datos?

Ejemplo

El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la moda de las observaciones muestreadas?


X
 
  =  85.4 

La moda para datos agrupados

Para datos agrupados en una distribución de frecuencia, la moda puede ser estimada por la marca de clase del intervalo que contenga la frecuencia de clase más grande. Si hay dos intervalos contiguos con frecuencia máxima la moda será la media aritmética de las dos marcas de clase. Si hay dos o mas intervalos no contiguos con frecuencia de clase máxima habrá dos o mas modas que serás las marcas de clase de dichos intervalos.

Ejemplo: Calcular las modas de las siguientes distribuciones de frecuencia:

X F X F hay dos modas: X F no hay moda
5 4 5 4 5 4
10 3 10 8

X
 
  =  10 
10 4
15 15

X
 
  =  15 
15 6 15 4
20 9 20 7 20 4
25 10 25 8

X
 
  =  (25+30) / 2 = 27.5 
25 4
30 7 30 8 30 4

 

Comparación entre medidas
de tendencia central

Si no hay ningún argumento de peso en contra, se preferirá siempre la media. Hay dos razones para apoyar esta norma general. La primera es que en ella se basan otros estadísticos y la segunda es que es mejor estimador de su parámetro que la mediana y la moda.

Hay al menos 3 situaciones en las que se preferirá la mediana a la media:

1. Cuando la variable esté medida en escala ordinal

2. Cuando haya valores extremos que distorsionen la interpretación de la media

3. Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de límite superior, el intervalo inferior carece de límite inferior o ambos.

La media es extremadamente sensible a las puntuaciones y un cambio en sólo una de ellas supone un cambio en la media aritmética, mientras que la mediana sólo se vería alterada por cambios en los valores centrales.

La mediana será la segunda candidata para representar la tendencia central y se preferirá la mediana a la moda, a menos de que:

1. Se trate de una variable medida en escala nominal

2. Haya intervalos abiertos y la mediana pertenezca a uno de ellos.

 

Problemas

Para cada uno de los siguientes problemas: (a) determine la media moda y mediana sin agrupar los datos; (b) elabore la distribución de frecuencia y calcule la media, moda y mediana para datos agrupados.


1. Los resultados siguientes representan las calificaciones del examen final de un curso de estadística elemental.

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

2. El gerente de una firma especializada en renta de condominios para vacacionistas, quiere saber como están distribuidas los montos de las rentas mensuales de los departamentos de la firma. Seleccionó una muestra de departamentos cuyas muestras son mostradas abajo.

Rentas mensuales de los condominios
1170 1207 1581 1277 1305 1472 1077 1319 1537 1849
1332 1418 1949 1403 1744 1532 1219 896 1500 1671
1471 1399 1041 1379 821 1558 1118 1533 1510 1760
1826 1309 1426 1288 1394 1545 1032 1289 695 803
1440 1421 1329 1407 718 1457 1449 1455 2051 1677
1119 1020 1400 1442 1593 1962 1263 1788 1501 1668
1352 1340 1459 1823 1451 1138 1592 982 1981 1091

3. Los siguientes datos representan la duración de la vida en meses de 30 bombas de combustible similares.

24 36 4 40 16 5 18 6 30 60
3 72 66 78 3 28 67 72 15 3
18 48 71 22 57 9 54 4 12 72

4. Los siguientes datos representan la duración de la vida, en segundos, de 50 moscas sometidas a un nuevo atomizador en un experimento de laboratorio controlado.

17 20 10 9 23 13 12 19 18 24
12 14 6 9 13 6 7 10 13 7
16 18 8 13 3 32 9 7 10 11
13 7 18 7 10 4 27 19 16 8
7 10 5 14 15 10 9 6 7 15

5. Se aplicó una encuesta donde se les pide indicar el número de amigos o parientes que visitan cuando menos una vez al mes. Los resultados son los siguientes:

3 5 2 3 3 4 1 8 4
2 4 2 5 3 3 3 0 3
5 6 4 3 2 2 6 3 5
4 14 3 5 6 3 4 2 4
9 4 1 4 2 4 3 5 0
4 3 5 7 3 5 6 2 2

6. Una compañía de cambio de aceite tiene varias sucursales en la zona metropolitana. El número de cambios de aceite en la sucursal de la calle Roble en los pasados 20 días son:

66 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85

7. El gerente un negocio de comida rápida esta interesado en el número de veces que un cliente compra en su tienda durante un periodo de dos semanas. Las respuestas de los 51 clientes fueron:

5 3 3 1 4 4 5 6 4 2 6 6 6 7 1 1 14
1 2 4 4 4 5 6 3 5 3 4 5 6 8 4 7 6
5 9 11 3 12 4 7 6 5 15 1 1 10 8 9 2 12

8. El presidente de una agencia de viajes, quiere información sobre las edades de la gente que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero el año pasado reveló estas edades:

77 18 63 84 38 54 50 59 54 56
36 26 50 34 44 41 58 58 53 51
62 43 52 53 63 62 62 65 61 52
60 45 66 83 71 63 58 61 71 60

9. Una cadena de tiendas de artículos deportivos al servicio de esquiadores principiantes, planea hacer un estudio de cuanto gasta un esquiador principiante en su primera compra de equipo. Una muestra de recibos de sus cajas registradoras reveló esas compras iniciales.

140 82 265 168 90 114 172 230 142 86 125
235 212 171 149 156 162 118 139 149 132 105
162 126 216 195 127 161 135 172 220 229 129
87 128 126 175 127 149 126 121 118 172 126

10.- Se conduce un estudio de los efectos de fumar sobre los patrones de sueño. La medición que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen estos datos:

69 56 22 28 41 28
47 53 48 30 34 13
52 34 60 25 21 37
43 23 13 31 29 38
26 36 30

11. Un banco seleccionó una muestra de 40 cuentas de cheques de estudiantes. Abajo aparecen sus saldos de fin de mes.

404 74 234 149 279 215 123 55 43 321
87 234 68 489 57 185 141 758 72 863
703 125 350 440 37 252 27 521 302 127
968 712 503 498 327 608 358 425 303 203

12.-Una compañía de luz seleccionó una muestra de 20 clientes residenciales. Los siguientes datos son las cuentas que se les facturó el mes pasado:

54 48 58 50 25 47 75 46 60 70
67 68 39 35 56 66 33 62 65 67

13.- Una muestra de suscriptores de una compañía telefónica reveló los siguientes números de llamadas recibidas en la última semana.

52 43 30 38 30 42 12 46 39 37
34 46 32 18 41 5

 

   

 



Free web hostingWeb hosting