U1Statistics

Transcripción

U1Statistics
Statistics
Statistics is the science that deals with collecting and sorting data related to
various phenomena for further analysis and interpretation.
La estadística es la ciencia que se ocupa de recoger y ordenar datos referidos a diversos fenómenos para su posterior análisis e interpretación.
Population:The set consisting of all elements of the statistical study.
La Población: es el conjunto formado por todos los elementos del estudio estadístico.
Sample: is the part of the population we studied and are to deduct population
characteristics.
Muestra: es la parte de la población que estudiamos y que son para deducir características de la población.
Individual: is each of the elements that make up the population or sample. The
number of individuals in a sample is called the sample size.
Individuo: es cada uno de los elementos que forman la población o la muestra. Al número de individuos que componen una muestra se llama tamaño de la muestra.
Variable statistic: is any quality that we study in individuals of the sample or the
population.
Variable estadística: es cualquier cualidad que estudiamos en los individuos de la muestra o la población.
EXAMPLE:
• Los alumnos de 2ºESO matriculados en España son un total de 136 559.
Para realizar un estudio estadístico sobre su peso, altura y edad, se
seleccionan 300 alumnos de diferentes centros escolares.
• Población:
• Muestra:
136 559 alumnos matriculados
300 alumnos seleccionados.
• Individuo:
Cada alumno matriculado en 2ºESO
• Tamaño de la muestra:
• Variable estadística:
300 alumnos
El peso, la altura y la edad.
Exercises:
• 1) In a study on the age at which you start to go to the movies we chose 50
children of our community. Determine the population, the sample size,
individuals and the statistical variable.
• 2)Discuss how would you perform a study on the musical tastes of students
of ESO. Specifies the population, the sample and some values that can take
the statistical variable.
• 3)Decide in which case it is more convenient to study the population than
sample.
a)The length of the screws which manufactures a machine continuously for
one day.
b)The height of foreign tourists visiting Spain in one year.
c)The length of a bulb until it melts or molten.
d)The salary of the employees of a company.
Which variable is studied in each case?
Types of variables:
Tipos de variables
• Qualitative:
The variable values are not numbers but qualities (gender, hair color,...).
Cualitativas:
Los valores de la variable no son números sino cualidades (Género, color de pelo,...)
• Quantitative:
The variable values are numbers (number of pages of a book, height,...).
Cuantitativas:
Los valores de la variable son números (nº de págs de un libro, altura,...).
• Quantitative variables can be:
Discrete: In each section, the variable can only take a certain number of
values.
Las variables cuantitativas pueden ser:
Discretas: cada tramo, la variable sólo puede tomar un número determinado de valores(un libro puede tener 50 o 51 págs. pero no 50,5 págs.
• Continuous:In each section, the variable can take infinite values.
Contínua: En cada tramo, la variable puede tomar infinitos valores (la altura entre 1,70 y 1,80m, puede ser 1,71m; 1,767m,...)
Example:
• Rank these statistical variables and set examples of the values they can take.
a)Breed of dog.
Qualitative (cocker, greyhound, peke,...)
b)Birthweight.
Quantitative continuous (2Kg; 2,3 Kg; 2,353 Kg,...)
c)Place in a row.
Quantitative discrete (1,2,5,...)
Exercises:
• 1)Rank these statistical variables:
a) Make of a phone.
b)Eyes color.
c)Favourite sport.
d)Height.
e)Age.
f)Name.
• 2)Write 3 qualitative variables, 3 quantitative variables and another 3 discrete
quantitative variables.
• 3)To classify abandoned dogs, the doghouse employees fill a page with the
following information:
Breed, age, elevation, weight, gender, hair color, level of training, level of
danger.
Rank the variables
Count Data
Recuento de datos
• In a statistical study, after collecting the data are sorted in ascending order
and record the number of occurrences of each.
En un estudio estadístico, después de recoger los datos, se ordenan en orden creciente y se anota el número de veces que aparece cada uno.
•Example:
Make counting how old they are the 30 guys who go to camp.
Age of the guys
14
15 14 17 17 16 15 16 15 14 16
15
16 17 14 15 14 16 14 16 17 15
16
16 16 14 17 16 15 16 15 16 16
17
//// /
//// //
//// //// //
////
•Exercise:
Realiza un recuento de estas edades:
13 12 17 11 19 15 13 14 15 16 17 18 14 17 14 15 17 13
16 18 19 17 15 15 16
6
7
12
5
Absolute frequency and relative frequency
• The absolute frequency of a statistic is the number of times it is repeated. It is
represented by f
i
La Frecuencia absoluta de un dato estadístico es el número de veces que se repite. Se representa por fi.
• The relative frequency is the quotient between the absolute frequency and
total number of data. Is represented by hi.
La Frecuencia relativa es el cociente entre la frecuencia absoluta y el número total de datos. Se representa por hi.
• The data and frequencies can be organized into a frequency table, placing
the data in the first column and the frequencies in the following.
Los datos y las frecuencias se pueden organizar en una tabla de frecuencias, colocando los datos en la primera columna y las frecuencias en las siguientes.
• The sum of the absolute frequencies of a set of statistical data is the total
number of data. f1 + f2 + f3 +.....+ fn =N
La suma de las frecuencias absolutas de un conjunto de datos estadísticos es el número total de datos.
• The sum of the relative frequencies of a set of statistical data is equal to unity.
h + h +.....+ h =1
1
2
n
La suma de las frecuencias relativas de un conjunto de datos estadísticos es igual a la unidad.
Ejemplo:
• Unos amigos van a realizar un estudio estadístico en una cancha de
baloncesto. Quieren conocer las edades de los espectadores que van a ver
un partido de alumnos de 2º de ESO. Los datos obtenidos en la encuesta
son:
Edad de los espectadores:
16 14 17 15 16 14 14 16 16 14 17 14 16 14 15 16 15 16 17 16 15
15 15 15 16 17 16 17 16 16
Calcula las frecuencias obtenidas a partir del recuento.
Frecuencia
Frecuencia relativa
x
i
absoluta f
h
14
//// /
6
14
6
6/30=0,2
i
15
//// //
7
16 //// //// // 12
17
////
5
15
16
17
7
12
5
30
i
7/30=0,23
12/30=0,4
5/30=0,17
1
Exercises:
• 1)In a classroom of 20 pupils, the number of hours dedicated to do a maths
work is:
4 6 7 3 6 8 5 9 8 7
5 4 7 8 4 6 5 8 10 7
Form a table with count data and calculate the frequencies of the values
taken its variable.
2) Note the color of the eyes of your classmates and perform a frequency
table.
Cumulative frequency
Frecuencia acumulada
• The absolute cumulative frequency of a data xi is the sum of the absolute
frequencies of the values that are smaller or equal to it. It is represented by Fi.
La Frecuencia absoluta acumulada de un dato x es la suma de las frecuencias absolutas de los valores que son menores o iguales que él. Se representa por Fi.
Fi = f1 + f +.....+ f
2
i
• The cumulative relative frequency of a given data x is the sum of the relative
frequencies of valuesless than or equal to it. Is represented by H . Equivalent
to the quotient between the cumulative absolute frequency data and the
number of them.
i
i
La Frecuencia relativa acumulada de un dato x es la suma de las frecuencias relativas de los valores menores o iguales que él. Se representa por H . Equivale al cociente entre
la frecuencia absoluta acumulada del dato y el número total de ellos.
Hi = h1 + h +.....+ h = f1/N + f2/N + f3/N +......+ fi/N
2
•
i
Ejemplo:
• Completa la tabla de frecuencias con las frecuencias acumuladas.
x
0 1 2 3 4
f
6 16 15 10 3
i
i
Recuerda que n es el número
que hay de datos diferentes y
N es el número total de datos.
Calculamos las frecuencias acumuladas por ser la variable cuantitativa.
xi fi Fi
hi
0 6 6 0,12
1 16 22 0,32
2 15 37 0,3
3 10 47 0,2
4 3 50 0,06
Hi
0,12
0,44
0,74
0,94
1
La última frecuencia absoluta acumulada coincide con el número total de datos
La última frecuencia relativa acumulada es siempre 1.
Ejercicios:
• 1)Organiza estos datos en una tabla de frecuencias:
164 168 170 170 168
170 174 170 168 172
• 2) Haz una tabla de frecuencias con las edades de los socios de un club
deportivo:
19 21 24 24 24 25 24 21 26 19
20 22 29 23 28 27 22 23 24 19
¿Qué porcentaje tiene menos de 20 años?
• 3)Copia y completa la siguiente tabla de frecuencias. Construye también una
tabla de frecuencias acumuladas:
Dato
1
2
3
4
5
f
3
i
h
0,15
0,2
i
0,3
5
Statistical graphics
Gráficos estadísticos
• Another way of organizing data is the graphical representation. Allow
statistical graphics immediately realize the most important characteristics of a
statistical study.
Otra forma de organizar los datos es la representación gráfica. Los gráficos estadísticos permiten darnos cuenta de inmediato de las características más relevantes de
un estudio estadístico.
• 1)Bar Graph:It is used when we want to represent frequency values take few
values. On the horizontal axis each represent the statistical values of the
variable. On the vertical axis the frequencies.
The frequency corresponding to each data is represented by a bar, taking into
account that the heights of the bars are proportionales to corresponding
frequencies.
Diagrama de barras:Se utiliza cuando queremos representar frecuencias de valores que tomen pocos valores. En el eje horizontal representamos cada uno de los valores de la variable estadística. En el eje vertical, las frecuencias.
La frecuencia que corresponde a cada dato se representa por una barra, teniendo en cuenta que las alturas de las barras son proporcionales a las correspondientes frecuencias.
Ejemplo:
• La tabla muestra los valores recogidos al preguntar a 40 alumnos sobre el
tipo de novela favorita. Representa la información obtenida mediante un
diagrama de barras.
f
Novela Favorita
i
Novela favorita
Frecuencia fi
Aventuras
12
Histórica
8
C.Ficción
14
Romántica
6
14
12
10
8
6
4
2
0
Aventuras
Ciencia Ficción
Ejercicios:
• 1)El color de pelo de 30 personas es:
M=Moreno; R=Rubio; P=Pelirrojo.
M R P M M M M R R P P M M M M
M M P R R R P M M M M R M M M
Organiza los datos en un diagrama de barras.
• 2)En éste gráfico se representa el número de veces que utilizan la guagua en
una semana un grupo de personas.
i
f
8
a) ¿Qué tipo de variable
estamos estudiando?
6
b)Construye la tabla correspondiente.
4
2
0
1
2
3
4
Nº de personas
5
2)Frequency polygon:
Polígono de Frecuencias:
• When the statistical variable is quantitative, the upper ends of the bars may
be joined by lines, obtaining a polygonal line which is called frequency
polygon.
Cuando la variable estadística es cuantitativa, los extremos superiores de las barras se pueden unir mediante líneas, obteniendo una línea poligonal que se llama
polígono de frecuencias.
f
i
Ejemplo:
EDAD
FRECUENCIA fi
14
6
15
7
16
12
17
5
12
10,9
9,8
8,7
7,6
6,5
5,4
4,3
3,2
2,1
1
Polígono de Frecuencias
14
15
Edad
16
17
3)Pictograph:
Pictograma
• Pictograph: Sometimes, instead of bars are usually represented drawings
representing the variable being studied and whose size is proportional to the
frequency. These graphs are called pictographs.
Pictograma: A veces, en lugar de barras se suelen representar dibujos representativos de la variable que se va a estudiar y cuyo tamaño es
proporcional a la frecuencia. Estos gráficos se llaman pictogramas.
4)Pie Chart:
Diagrama de sectores.
• Pie chart: The pie chart can be used for any type of variable. The data are
represented in a circle, divided into sectors. Each sector represents a variable
value. The amplitude of a sector, the angle is proportional to the frequency of
data it represents. Circle sector angle=(fi/N)*360º =hi*360º.
Diagrama de Sectores: El diagrama de sectores se puede utilizar para cualquier tipo de variable. Los datos se representan en un círculo, dividido
en sectores. Cada sector representa un valor de la variable. La amplitud de un sector, su ángulo, es proporcional a la frecuencia del dato que
representa.
Ángulo del sector circular= (fi/N)*360º =hi*360º.
• Ejemplo: Completa la tabla y realiza un diagrama de sectores con los datos que contiene:
Novela
Favorita
Aventuras
Histórica
Ciencia Ficción
Romántica
Frecuencia fi
12
8
14
6
• Completamos la tabla con hi, el porcentaje y la amplitud de cada sector
Novela favorita
fi
hi
%
Ángulo(º)
Aventuras
12
0,3
30%
0,3*360º=108º
Histórica
8
0,2
20%
0,2*360º=72º
Ciencia Ficción
14
0,35
35%
0,35*360º=126º
Romántica
6
0,15
15%
0,15*360º=54º
Aventuras
Ciencia Ficción
Histórica
Romántica
º
º
º
º
Exercises:
• 1)Make a pie chart with this data:
Type of waste
Paper
Container
Organic
Glass
Amount
100
125
200
175
• 2)Draw a bar graph and a pie chart with the following data:
Favourite sport
Soccer
Basketball
Paddle
Number of people
120
80
50
• Measures of centralization:
•
Medidas de centralización:
• Measures of centralization: Once organized the data in a statistical study, we
will calculate a series of values that will help us interpret.
Medidas de centralización: Una vez organizados los datos de un estudio estadístico, vamos a calcular una serie de valores que nos ayudarán a interpretarlos.
1)Arithmetic mean: The arithmetic mean of a data set is the quotient obtained
by dividing the sum of the data by the total number of them. This action can
only be calculated in quantitative variables is unique and may not match any
of the data.
Media Aritmética: La media aritmética de un conjunto de datos es el cociente que resulta de dividir la suma de los datos entre el número total de ellos. Esta medida sólo se puede
calcular en variables cuantitativas, es única y puede no coincidir ninguno de los datos.
We use two methods to calculate the arithmetic mean:
a) Divide the sum of all data between the total number of data.
b) If the data are in a table with their absolute frequencies, each data is
multiplied by its frequency, all products are added and divided by the total
number of them.
Podemos usar dos métodos para calcular la media aritmética:
a) Se divide la suma de todos los datos entre el número total de datos.
b) Si los datos vienen en una tabla con sus frecuencias absolutas, se multiplica cada dato por su frecuencia, se suman todos los productos y se divide entre el número total de ello.
Ejemplos:
• Un grupo de 6 amigos recibe estas cantidades de asignación semanal para
sus gastos: 12,14,18,13,17 y 16€ respectivamente. Calcula la media.
12 + 14 + 18 + 13 + 17 + 16
X=
= 15
6
Con este dato podemos deducir que la paga normal para un adolescente
perteneciente a ese grupo de amigos es de 15€.
• Calcula la media aritmética de las alturas obtenidas después de medir a 25
alumnos
Exercises:
• 1)The term mark is the arithmetic mean of the 5 tests done during the term: 4, 5, 8, 7, 7
Wich is the term mark?
Sol A: 6,2
SOL B: 5,8
• 2)The following table shows the number of computers that have employees of
a company. Complete the table, perform the graph and calculate the
arithmetic mean.
x
f
0
2
1
25
2
65
3
8
i
i
2)Median
Mediana
• The median of a data set, Me, is the central value of them, there are as many
bigger data as smaller data than it.
La mediana de un conjunto de datos, Me, es el valor central de ellos, es decir, hay tantos datos mayores que él como menores. Ésta medida sólo
se puede calcular en variables cuantitativas, es única y puede no coincidir con ninguno de los datos.
Para calcular la mediana ordenamos los datos de menor a mayor. Si el número de datos es impar, la mediana es el dato que ocupa el lugar
central. Si el número de datos es par, la mediana es la media aritmética de los dos datos centrales.
• Ejemplos:
Calcula la mediana de los siguientes conjuntos de datos:
Ordenamos los datos y comprobamos si es par o impar.
a) 3,6,7,2,0,3,4.
0,2,3,3,4,6,7
N=7. El num. de datos es impar.
0,2,3,3,4,6,7------>Me=3 porque tiene tantos datos
mayores como menores que él.
0,2,2,3,4,5,6,7--->N=8
• b) 3,6,7,2,0,2,4,5
Me=es la media de 3 y 4 que son los datos centrales
Me=
3+4
2
Exercises:
• 1)The ages of a group of 8 friends are 16, 15,17,15,17,14,15, and 16,
respectively. Calculate the mean and median age.
• 2)Daily temperatures in degrees Celsius obtained in a city for a month are:
18 19 22 16 21 20 19 18 17 22
21 23 25 19 20 19 22 21 20 24
23 21 19 14 23 19 18 19 20 21
Compare the mean and median temperature of the month.
Mode:
Moda:
• Mode of a distribution
The value or values that happen most often in a distribution (the most
common value in a set of data).
Moda de una distribución.El valor o los valores que se producen con más frecuencia en una distribución (el valor más común de un conjunto de
Example:
The distribution of time in minutes taken by ten people to finish a test is:
30, 31, 32, 32, 35, 36, 36, 36, 37, 40.
The value 36 happens most often in this distribution, so the mode is 36:
Mo=36.
datos).
If the aggregate statistics are two or more values with maximum frequency, we
say that the series is bimodal or multimodal. In a bar graph, the corresponding
data is the bar higher and in the pie chart is concerned with the broader
sector.
Si el conjunto de datos estadísticos aparecen dos o más valores con frecuencia máxima, decimos que la serie es bimodal o multimodal.
En un diagrama de barras, es el dato correspondiente a la barra de mayor altura y en el diagrama de sectores es el correspondiente con
el sector de mayor amplitud.
Exercises:
• 1)Halla la moda de los datos que se representan en esta tabla de frecuencias:
Xi 1 2 3 4 5 6 7 8 9 10
fi 2 1 5 4 2 1 2 2 1 1
• 2)Se ha lanzado 18 veces un dado de parchís, obteniéndose estos
resultados:
1 4 5 5 6 2 3 5 2
3 4 4 5 6 3 1 5 4
Representa graficamente los datos y calcula la moda.

Documentos relacionados