EN ESTA PÁGINA SE
HAN SELECCIONADO EJERCICIOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA
SI NECESITAS
TEORÍA VISITA ESTADÍSTICA
DESCRIPTIVA
Estadística Unidimensional
Conceptos básicos.
Individuo, población, muestra.
Ejemplo 1. Para estudiar la
evolución del cáncer de mama en la población femenina de un país, se puede
considerar que individuo es cada una de las mujeres residentes en el mismo, población es el conjunto de
todas ellas y una muestra se obtiene al observar
el 1% del censo.
Con mucha frecuencia se
consideran como población y muestra, no
los conjuntos de individuos, sino las medidas
de la característica asociadas a esos individuos.
Ejemplo 2. En un banco de sangre se
experimenta un nuevo sistema para aumentar el período de conservación de la
misma. En este caso cada bolsa de sangre es un individuo; la población es el
conjunto de todas las bolsas del banco y una muestra se obtiene tomando un
cierto número de bolsas para su análisis.
Obsérvese que el concepto de individuo no va
asociado necesariamente con el de persona, sino que puede ser algo de
naturaleza más abstracta.
Clasificación de los datos. Cualitativos
y cuantitativos.
Ejemplo 3. Se observan las causas de muerte de 16 individuos de una cierta
población, agrupándolas en las cuatro siguientes: enfermedades cardiovasculares
(EC), cáncer (C), accidentes (A) y otras causas (O), habiéndose obtenido los
siguientes datos:
EC, EC, A, C, O, A, EC, A, O, C, EC, C, O, C y EC.
Como los resultados no son medibles numéricamente, los datos son
cualitativos.
Ejemplo 4. Las notas obtenidas en Matemáticas en una clase de 2º BACH han
sido: 2, 7, 4, 6, 5, 0, 3, 9, 8, 4, 3,
6, 5 y 8.5.
Se trata de datos cuantitativos.
*A su vez los datos
cuantitativos se denominan continuos
si los resultados pueden tomar cualquier valor real dentro de un cierto
intervalo, o discretos, si sólo
pueden tomar ciertos valores particulares.
Ejemplo 5. Del estudio de la
estatura de un cierto núcleo de población se han obtenido los siguientes datos:
1.62, 1.78, 1.75, 1.58, 1.83, 1.68
y 1.81metros.
Son datos continuos, pues los individuos de una población pueden tener
como estatura cualquier número real en un cierto intervalo.
Ejemplo 6. Del alumbramiento de un conjunto de ratas se ha observado el número
de crías, obteniéndose los siguientes valores numéricos:
5, 3, 1, 5, 3, 6, 4, 2, 5, 6, 3, 6, 5, 2, 6, 7 y 3.
Por no ser posibles números no naturales, es evidente que se trata de
datos cuantitativos discretos.
Es decir los datos se
clasifican:
Los datos pueden
provenir del estudio de un sólo carácter o propiedad (caso unidimensional) o de varios simultáneamente (caso multidimensional).
Variables estadísticas. Frecuencias
absolutas y relativas.
Definición 1. Se llama variable estadística a
la aplicación que a cada modalidad le hace corresponder ese número, es decir su
medida.
Ejemplo 7. En el ejemplo 6 la variable estadística toma los valores: 1, 2, 3, 4,
5, 6 y 7.
La variable estadística será discreta
cuando sólo pueda tomar un nº finito de valores y continua cuando pueda tomar todos los valores de un cierto
intervalo.
Ejemplo 8. La variable estadística del ejemplo 5 es continua y discreta la del
ejemplo 6.
Definición 2. Se llama frecuencia absoluta
al número de individuos que toman un determinado valor de una variable
estadística (o una modalidad de un atributo).
Para variables estadísticas (es decir, datos cuantitativos) puede
definir:
Definición 3. Se llama frecuencia absoluta acumulada
de un valor a la suma de las frecuencias absolutas de todos los valores menores
o iguales que él.
Ejemplo 9. En el ejemplo 6 la frecuencia absoluta del 5 (tener 5 crías) es 4. La
frecuencia absoluta acumulada del 2 es 3.
Definición 4. Se llama frecuencia relativa a
la razón entre la frecuencia absoluta y el número total de datos o tamaño de la
población.
Definición 5. Se llama frecuencia relativa acumulada
de un valor de una variable estadística a la suma de las frecuencias relativas de
todos los valores menores o iguales que él.
Ejemplo 10. La frecuencia relativa del 5 es
4/17 y la relativa acumulada del 2 es 3/17.
Representación de datos:
Tablas.
Ejemplo 11.
Las notas de los 20 alumnos de una clase son:
4, 3,
3, 5, 6, 7, 9, 0, 5, 4, 9, 10, 2, 7, 2, 2, 5, 6, 5, 0
Vamos a calcular una tabla de frecuencias:
Variable |
Frecuencias |
absolutas |
Frecuencias
relativas |
|
estadística
xi |
puntuales ni |
Acumuladas Ni |
puntuales fi |
acumuladas Fi |
0 2 3 4 5 7 9 |
2 3 2 2 5 3 3 |
2 5 7 9 14 17 20 |
1/10 3/20 1/10 1/10 1/4 3/20 3/20 |
1/10 5/20=1/4 7/20 9/20 14/20=7/10 17/20 20/20=1 |
Ejercicio 1. En un Instituto hay matriculados 2200 alumnos que se distribuyen
por edades en la forma siguiente: 215 de 14 años, 437 de 15, 421 de 16, 396 de
17, 512 de 18, 124 de 19 y 95 de 20. Formar la tabla de distribución y de
frecuencias, que incluya frecuencias acumuladas.
Ejemplo 12. Se ha pasado un test de 79 preguntas a 600 personas. El número de
respuestas correctas se refleja en la siguiente tabla:
intervalos |
mi |
f. absoluta puntual |
f. absoluta
acumulada |
f. relativa puntual |
f. relativa acumulada |
[0, 10) [10, 20) [20. 30) [30, 40) [40, 50) [50, 60) [60, 70) [70, 80) |
5 15 25 35 45 55 65 75 |
40 60 75 90 105 85 80 65 |
40 100 175 265 370 455 535 600 |
1/15 1/10 1/8 3/20 7/40 17/120 2/15 13/120 |
1/15 1/6 7/24 53/120 37/60 91/120 107/120 1 |
|
|
600 |
|
1 |
|
Ejemplo 13. En una Caja de Reclutamiento se toma
una muestra de tamaño 30 de los pesos de los mozos correspondientes a un cierto
reemplazo, obteniéndose los siguientes datos medidos en kg:
71.9, 63.9, 62.3, 72.5, 78.0, 70.7, 71.4, 60.5, 60.9, 68.2,
88.5, 76.1, 82.1, 63.7, 79.8, 67.5, 50.1, 69.5, 66.1, 47.3, 72.1, 59.8, 93.7,
80.7, 61.2, 64.3, 53.7, 74.7, 96.3, 73.2.
Construir una tabla de frecuencias agrupando
los datos en clases de la misma amplitud.
Solución
Si bien no es estrictamente necesario, en
general, es conveniente ordenar los datos de menor a mayor. A continuación se
presenta la misma muestra ordenada:
47.3, 50.1, 53.7, 59.8, 60.5, 60.9, 61.2,
62.3, 63.7, 63.9, 64.3, 66.1, 67.5, 68.2, 69.5, 70.7, 71.4, 71.9, 72.1, 72.5,
73.2, 74.7, 76.1, 78.0, 79.8, 80.7, 82.1, 88.5, 93.7, 96.3.
Como los valores extremos son 47.3 y
96.3 y el número de clases aconsejado para estos datos es 6 (aplicando la fórmula de
Sturges), tomaremos 6 intervalos de
amplitud 10, la tabla queda estructurada de la siguiente manera:
clases |
Marcas de clase |
frecuencias absolutas de clase ½acumuladas |
Frecuencias relativas de clase ½acumuladas |
||
45 -55 55 -65 65 -75 75 -85 85 -95 95 -105 |
50 60 70 80 90 100 |
3 8 11 5 2 1 |
3 11 22 27 29 30 |
0.1 0.266 0.366 0.166 0.066 0.033 |
0.1 0.366 0.733 0.900 0.966 1 |
30 0.997»1
Intervalos
no solapados.
Si los datos
recogidos están ya agrupados en intervalos no solapados, como por ejemplo:
Intervalo |
ni |
120-139 140-149 150-159 160-169 |
32 37 23 19 |
Es conveniente tomar
unos intervalos que contengan a éstos, pero sin modificar las frecuencias. Esto
es:
Intervalo |
ni |
[119,5-139,5) [139,5-149,5) [149,5-159,5) [159,5-169,5) |
32 37 23 19 |
Estos nuevos valores se
llaman límites reales de la clase.
Ejercicio 2. El número de personas que viven en cada uno de los portales de una gran
barriada es:: 63, 58, 70, 47, 120, 76, 80, 59, 80, 70, 63, 77, 104, 97, 78, 90,
112, 88, 67, 58, 87, 94, 100, 74, 55, 80, 75, 49, 98, 67, 84, 73, 95, 121, 58,
71, 66, 87, 76, 56, 77, 82, 93, 102, 56, 46, 78, 67, 65, 95, 69, 90, 58, 76,
54, 76, 98, 49, 87, 69, 80, 64, 65, 56, 69, 68, 99, 106.
Construye
una tabla de frecuencias[1].
Series
cronológicas
Se
Llaman series cronológicas a unas tablas estadísticas que recogen observaciones
hechas a lo largo del tiempo, normalmente a intervalos iguales. Es por tanto
una serie estadística en que la variable independiente es el tiempo.
Ejemplo 14. El número de médicos
colegiados en España en el período de 1984 - 1992:
1984 |
1985 |
1986 |
1987 |
1988 |
1989 |
1990 |
1991 |
1992 |
99730 |
107503 |
119890 |
123543 |
129897 |
138967 |
147978 |
152943 |
156748 |
Ejercicio 3. La producción editorial española de libros de sociología y Estadística,
en los años que se indica es:
Años |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
1997 |
nº |
345 |
487 |
589 |
376 |
479 |
652 |
741 |
Hacer una tabla de frecuencias
absolutas y relativas puntuales. Expresar la relativa en porcentajes.
Representación de datos: Gráficos.
Variables cualitativas. Los más usados son los
diagramas de rectángulos (o de barras) y los de sectores.
Ejercicio 4. El censo, en miles de cabezas,
del ganado en el territorio español, en
1994 fue:
Ganado |
Número de cabezas |
Bovino Ovino Caprino Porcino Caballar Mular Asnar |
5300 18047 2601 12308 264 153 164 |
Dibujar
un diagrama de sectores y otro de rectángulos.
Variables cuantitativas. Distinguiremos entre
variable discreta
o continua.
Tratamiento
individual
Para
el tratamiento individual los medios de representación más utilizados son el gráfico
(o diagrama) de barras, el polígono de frecuencias y los gráficos acumulativos.
Diagrama
de barras:
Ejemplo 15. Vamos a hacer un diagrama de barras de frecuencias
absolutas para el ejemplo 6.
En ocasiones se superponen dos o más diagramas para
comparar datos:
Ejemplo 16: Producción y venta de automóviles en España:
Polígono
de frecuencias: Se usa sobre todo para frecuencias acumuladas
(figura 1). También para series
cronológicas.
Ejercicio 5.
La esperanza de vida al nacimiento ha evolucionado desde 1900, como se refleja
en la tabla siguiente:
Años |
1900 |
1910 |
1920 |
1930 |
1940 |
1950 |
1960 |
1970 |
1980 |
Varones |
33,9 |
40,9 |
40,3 |
48,3 |
47,1 |
59,8 |
67,4 |
69,6 |
72,6 |
Mujeres |
35,7 |
42,6 |
42,1 |
51,6 |
53,2 |
64,3 |
72,2 |
75,1 |
78,6 |
Dibujar los
polígonos de frecuencias superpuestos para poder compararlos.
Gráficos
acumulativos:
Ejemplo
16. Gráfico de barras acumulativo
Tratamiento por clases
Cuando las variables son continuas, o discretas
agrupadas, los gráficos que más se utilizan son: el histograma de
frecuencias y los polígonos de frecuencias (absolutas o relativas)
Histogramas de
frecuencias. Sobre el eje de abscisas se marcan los
extremos de las sucesivas clases y con base en cada clase se dibuja un
rectángulo de altura proporcional a la frecuencia (absoluta o relativa)
observada en dicha clase[2].
Figura 2
Ejercicio 6. En la siguiente tabla se presenta la distribución por edades del número
de muertes registradas en España (datos hasta el 30-9-94) a causa del SIDA.
Edad en años |
<3 |
3-9 |
10-12 |
13-14 |
15-19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-49 |
50-59 |
60-69 |
Nº de muertes |
411 |
171 |
35 |
31 |
247 |
2888 |
8576 |
7640 |
3292 |
2552 |
909 |
544 |
a) Construye la tabla de frecuencias relativas agrupando los datos en las
siguientes categorías de edad: 0-9, 10-19, 20-29, 30-39, 40-49, 50-59 y 60-69
años.
b) Representa gráficamente la información obtenida en el apartado a)
mediante un histograma.
Polígono de frecuencias. Se asocia a cada clase un
punto del plano cartesiano, de abscisa el valor de la marca de clase y de
ordenada la frecuencia observada en dicha clase. Uniendo los puntos resulta una
línea quebrada que se denomina polígono de frecuencias (figura 3)
3
4 5 6
7 Figura 3 30 20 10
Polígono de frecuencias acumuladas.
Partiendo del valor cero en el extremo
izquierdo de la primera clase, el polígono acumulado va tomando en los
sucesivos extremos derechos de las clases un valor igual a la frecuencia acumulada.
Uniendo los puntos así obtenidos resulta el polígono acumulativo de frecuencias
(figura 4).
Figura 4
Ejercicio 7. Los jugadores de un determinado
equipo de baloncesto se clasifican, por altura, según la tabla siguiente:
Altura |
1,70-175 |
1,75-1,80 |
1,80-185 |
185-190 |
1,90-1,95 |
1,95-2,00 |
Nº de jugadores |
1 |
3 |
4 |
8 |
5 |
2 |
Dibujar el polígono de frecuencias absolutas
acumulativo.
Parámetros estadísticos.
¨
Medidas de centralización:
media, moda y mediana
¨
Medidas de dispersión: rango o recorrido, desviación media, varianza,
desviación típica, coeficientes de Pearson.
¨ Medidas de posición: cuartiles, deciles, centiles o percentiles.
Señalan la situación de algunos valores importantes de la distribución.
¨
Medidas de asimetría, para señalar si la distribución está sesgada hacia uno u
otro lado.
¨
Medidas de apuntamiento o curtosis que indican si la distribución es más o
menos puntiaguda.
Cálculo de
los parámetros estadísticos
Para el cálculo práctico de muchos parámetros estadísticos se utilizan
tablas que facilitan dichos cálculos. Utilizaremos dos tipos de tablas que llamamos
Tabla I y Tabla II:
TABLA 1
|
|
|
|
|
|
|
..... |
TABLA 2
|
|
|
|
|
|
|
..... |
MEDIA ARITMÉTICA
Es el valor
Si se trabaja con datos agrupados para la fórmula
an-terior, [1], se toma xi igual a las marcas de clase.
MODA[3] Mo
Es el valor de la variable de mayor frecuencia.
La
distribución puede tener varias modas
Para el
caso continuo se habla del intervalo modal
(el de mayor frecuencia ni).
Cálculo
de la moda8
Para calcular la moda, para datos agrupados, se puede usar la fórmula
· ni c ni+1 ni-1
Mediana Me
Li Mo
Es el valor que ocupa el lugar central
Cálculo
de la mediana
Si la distribución tiene un nº impar de datos siempre existe una
única mediana y es precisamente el valor central en la relación ordenada de
menor a mayor. Si el nº de datos es par
se toma como mediana la media de
los valores centrales
Para hallar la mediana, cuando los datos estén
agrupados, se puede usar el polígono de frecuencias acumuladas (Figura 1)y
buscar la abscisa que corresponde a y = N/2 (por interpolación lineal).
Figura 2 N/2
Li Me
La
fórmula anterior [3], nos da dicho valor. En ella:
Ni-1 es la
frecuencia absoluta acumulada hasta llegar a la clase mediana, ni la
frecuencia absoluta de la clase mediana, Li el límite inferior de la
clase mediana y c la amplitud de
dicha clase.
Cuantiles
Se llama cuantil de orden a de una distribución al valor de la variable que deja por
debajo de él al a % de los elementos de la población.
Los que más se usan son los cuartiles y los centiles o
percentiles.
La mediana
coincide con el cuartil segundo Q2.
Los cuartiles y centiles se calculan de forma análoga
a la me diana (usando el polígono de frecuencias acumulativo, y por
interpolación lineal, que nos da la fórmula)
RANGO
También llamado recorrido,
es la diferencia entre el mayor y el menor de los datos.
Cálculo del rango.
Para el caso continuo,
se toma la diferencia máxima posible entre los límites de intervalos
DESVIACIÓN
MEDIA
Es la media de las desvia-ciones respecto de la media.
Cálculo de la desviación media9
Como la
suma de las desviaciones respecto de la media da cero lo que se toma son las
diferencias en valor absoluto.
La
fómula es:
VARIANZA
Se define como
la media de las desviaciones cuadráticas respecto de la media.
DESVIACIÓN
TÍPICA
Se define como la ráiz cua-drada de la varianza:
Propiedades
1. Si se
suma una constante a todos los valores de la variable la desviación típica no
varía.
2. Si se multiplican todos
los valores de la variable por el mismo número, la desviación típica queda
multiplicada por el mismo número
3. Se verifica que
fórmula que simplifica su cálculo.
COEFICIENTE DE VARIACIÓN DE PEARSON
Es la razón entre la desviación típica y la media.
No debe usarse para valores muy próximos a cero de la media.
Se utiliza para eliminar la influencia de las unidades
en el valor de la dispersión y mide la dispersión
relativa de la muestra..
Por definición se
calcula mediante la fórmula:
TIPIFICACIÓN
Para comparar dos series datos estadísticos se normaliza (o tipifica) la variable
Si X es una
variable estadística la variable normalizada es:
Se dice que se ha tipificado
la variable.
Coeficientes de
asimetría y curtosis
Sirven para medir la “simetría” y el “apuntamiento” de
las series estadídticas
Si el coeficiente de asimetría es:>0 la curva es sesgada a
la derecha, y sí es<0, sesgada a la iizquierda
Cálculo de los coeficientes de asimetría y
apuntamiento.
El coeficiente directo de asimetría se define así:
El de apuntamiento :
Observación. Cuando se trabaja con datos
agrupados se toma xi igual a
la marca de clase.
Ejemplo 17. Construir la tabla 1
con los datos del ejemplo 11
xi |
ni |
|
|
|
|
|
0 2 3 4 5 7 9 |
2 3 2 2 5 3 3 |
0 6 6 8 25 21 27 |
4,65 2,65 1,65 0,65 0,35 2,35 4,35 |
9,30 7,95 3,30 1,30 1,75 7,05 13,05 |
21,62 7,02 2,72 0,42 0,12 5,52 18,92 |
43,24 21,06 5,44 0,84 0,60 16,56 56,76 |
20 93 la media es 93/20=4,65
Ejemplo 18. Construir la tabla 2 con
los datos del ejemplo 13.
clases |
Marcas de clase xi |
frecuencia ni |
|
|
|
|
45 -55 55 -65 65 -75 75 -85 85 -95 95 -105 |
50 60 70 80 90 100 |
3 8 11 5 2 1 |
150 480 770 400 180 100 |
2500 3600 4900 6400 8100 10000 |
7500 28800 53900 32000 16200 10000 |
|
Ejemplo
19. a) Hallar la media y
la varianza de la variable cuyos valores y frecuencias absolutas vienen dadas
en la tabla adjunta
Valores de la variable |
3 |
5 |
4 |
2 |
0 |
8 |
7 |
frecuencias |
1 |
3 |
4 |
1 |
3 |
1 |
2 |
b) Representar gráficamente los datos en un diagrama de
barras.
Solución a) Usamos la tabla II
|
|
|
|
|
0 2 3 4 5 7 8 |
3 1 1 4 3 2 1 |
0 2 3 16 15 14 8 |
0 4 9 16 25 49 64 |
0 4 9 64 75 98 64 |
|
15 |
58 |
|
314 |
Se tiene : (Ver fórmulas)
Ejercicio 8. Los pacientes que acuden a una consulta
médica se distribuyen, según la edad, en una tabla:
X(edad) |
[0, 10) |
[10, 20) |
[20,30) |
[30, 40) |
[40, 50) |
[50,60) |
N (frecuencia) |
7 |
10 |
30 |
18 |
12 |
3 |
Se pide:
a) El histograma de frecuencias.
b) La media, desviación típica, mediana y
moda.
c) Porcentaje de pacientes menores de 40 años
que acuden a la consulta.
Ejemplo 20. a) Completar los datos que faltan en la
siguiente tabla estadística, donde f, F y fr representan,
respectivamente, la frecuencia absoluta, acumulada y relativa:
x |
f |
F |
fr |
1 |
4 |
|
0,08 |
2 |
4 |
|
|
3 |
|
16 |
0,16 |
4 |
7 |
|
0,14 |
5 |
5 |
28 |
|
6 |
|
38 |
|
7 |
7 |
45 |
|
8 |
|
|
|
b) Calcula la media,
mediana y moda de esta distribución
Solución
a) La frecuencia
relativa de 1 es 0,08 =
x |
f |
F |
fr |
1 |
4 |
4 |
0,08 |
2 |
4 |
8 |
0,08 |
3 |
8 |
16 |
0,16 |
4 |
7 |
23 |
0,14 |
5 |
5 |
28 |
0,10 |
6 |
10 |
38 |
0,20 |
7 |
7 |
45 |
0,14 |
8 |
5 |
50 |
0,10 |
b)
la media x = 4,76; la mediana es
5 y la moda es 6.
Ejemplo 21. Se considera una
distribución de datos agrupados en intervalos cuyo polígono de frecuencias
acumuladas es el de la figura
20 14 9 3
20
40 60 80 100
Calcula:
a) Tabla de
distribución de frecuencias acumuladas.
b) la media.
Solución
a)
xi |
ni |
Ni |
20 40 60 80 100 |
3 6 5 0 6 |
3 9 14 14 20 |
b)
Ejercicio 9. En la fabricación de un
cierto tipo de clavos, aparecen un cierto nº de ellos defectuosos. Se han
estudiado 200 lotes de 500 clavos cada uno obteniendo:
Clavos defectuosos |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
nº de lotes |
5 |
15 |
38 |
42 |
49 |
32 |
17 |
2 |
a)Calcular la mediana y
la desviación típica.
b) Dibuja un diagrama
de barras
Ejemplo 22. Observados los alquileres de un conjunto de despachos se ha obtenido:
Alquileres en miles de pesetas |
ni |
[0,15) |
17 |
[15,30) |
130 |
[30,45) |
180 |
[45,60) |
30 |
[60,75) |
10 |
[75,90) |
5 |
Calcula la moda y la mediana.
Solución:
Como
los datos son agrupados tenemos: para la moda la fórmula:
m0 =
Para la mediana usamos el polígono acumulativo de frecuencias
xi |
ni |
Ni |
[0,15) |
17 |
17 |
[15,30) |
130 |
147 |
[30,45) |
180 |
327 |
[45,60) |
30 |
357 |
[60,75) |
10 |
367 |
[75,90) |
5 |
372 |
Por interpolación lineal se llega a: 186-147=
Ejemplo
23. De dos muestras la primera con media 30 y desviación
típica 4 y la segunda de media 50 y desviación típica 5, ¿cuál es la que
aparece más dispersa?
Solución
Calculamos
el coeficiente de variación de Pearson[4], Cp
=
4/30
= 0,13 y 5/50 = 0,1, luego es más dispersa la primera.
*En la ordenación que se
hizo para la mediana se llaman cuartiles primero, segundo y tercero a los que
superan exactamente al 25%, 50% y 75% de
los valores.
El segundo cuartil es la mediana. Para su obtención se usan
los diagramas de cajas
Ejemplo 24. Representa
mediante un diagrama de cajas las siguientes calificaciones de 20 alumnos.
0, 2, 3, ,3, 3, 4, 4, 4, 5, 5, 5,, 5, 5, 5, 7, 7, 7, 8, 8 9
Como es múltiplo de 4,
20:4 = 5, Q1. Me y Q3. , serán los valores que hay entre el 5º y 6º , 10º y
11º, 15º y 16º, es decir:
Q1= 3,5, Me =5 y Q3 =7
Ejercicio 10.
Los pesos de un grupo
de alumnos de 2º Bach son:
63, 58, 70, 57, 56, 76, 80, 59, 80, 70, 63, 77, 84, 77, 78, 90, 72, 88,
67, 58, 87, 94, 80, 74, 55, 80, 75,
59, 81, 67, 84, 73, 65, 71, 58, 71, 66, 87, 76, 56, 77, 82, 73, 67, 56,
46, 78, 67, 65, 65, 69, 80, 58, 76, 54, 76,
78, 49, 87, 69, 80, 64, 65, 56, 69, 68, 69, 64.
Representa la distribución mediante un diagrama de caja.
*Ejemplo 25. En el estudio de un cierto
fenómeno se obtiene la siguiente tabla:
xi |
7 |
10 |
12 |
16 |
19 |
20 |
21 |
ni |
6 |
7 |
16 |
17 |
22 |
19 |
17 |
Calcula los cuartiles Q1
y Q3
correspondiente..Haz un diagrama de caja.
Solución
xi |
ni |
Ni |
7 10 12 16 19 20 21 |
6 7 16 17 22 19 17 |
6 13 29 46 68 87 104 |
Se tiene:
Ejemplo 26. En la fabricación de un cierto tipo de clavos, aparecen un cierto nº
de ellos defectuosos. Se han estudiado 200 lotes de 500 clavos cada uno
obteniendo:
Clavos defectuosos |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
nº de lotes |
5 |
15 |
38 |
42 |
49 |
32 |
17 |
2 |
Calcular la mediana y el percentil 20.
Solución:
Se construye la tabla estadística con las columnas de las frecuencias
absolutas acumuladas, siendo ésta
:
Nº de piezas |
Nº de lotes (fa) |
uar. Absoluta acumulada. |
2 3 4 5 6 7 8 |
5 15 38 42 49 32 17 2 |
5 20 58 100 149 181 198 200 |
200
Como
es par la distribución la mediana es la media
de los valores centrales
Los valores centrales son 4 y 5,
por tanto la mediana es 4,5.
El percentil 20
Está comprendido entre las frecuencias 20 y 58 luego P20 = 3
Si quieres
más ejercicios o más teoría visita ESTADÍSTICA
DESCRIPTIVA
[1] Aunque la variable es discreta conviene agruparlos en clases
ya que hay un número muy grande de
datos.
[2] Cuando se trabaja con clases
de amplitudes diferentes es más adecuado el histograma de frecuencias
relativas por unidad de amplitud: En abscisas se marcan los
extremos de las sucesivas clases y con base en cada una de ellas se dibuja un
rectángulo de área proporcional a la frecuencia relativa.
[3] Veremos en los ejercicios resueltos cómo se asigna un valor.
[4] Mide
la dispersión relativa,