U1Statistics
Transcripción
U1Statistics
Statistics Statistics is the science that deals with collecting and sorting data related to various phenomena for further analysis and interpretation. La estadística es la ciencia que se ocupa de recoger y ordenar datos referidos a diversos fenómenos para su posterior análisis e interpretación. Population:The set consisting of all elements of the statistical study. La Población: es el conjunto formado por todos los elementos del estudio estadístico. Sample: is the part of the population we studied and are to deduct population characteristics. Muestra: es la parte de la población que estudiamos y que son para deducir características de la población. Individual: is each of the elements that make up the population or sample. The number of individuals in a sample is called the sample size. Individuo: es cada uno de los elementos que forman la población o la muestra. Al número de individuos que componen una muestra se llama tamaño de la muestra. Variable statistic: is any quality that we study in individuals of the sample or the population. Variable estadística: es cualquier cualidad que estudiamos en los individuos de la muestra o la población. EXAMPLE: • Los alumnos de 2ºESO matriculados en España son un total de 136 559. Para realizar un estudio estadístico sobre su peso, altura y edad, se seleccionan 300 alumnos de diferentes centros escolares. • Población: • Muestra: 136 559 alumnos matriculados 300 alumnos seleccionados. • Individuo: Cada alumno matriculado en 2ºESO • Tamaño de la muestra: • Variable estadística: 300 alumnos El peso, la altura y la edad. Exercises: • 1) In a study on the age at which you start to go to the movies we chose 50 children of our community. Determine the population, the sample size, individuals and the statistical variable. • 2)Discuss how would you perform a study on the musical tastes of students of ESO. Specifies the population, the sample and some values that can take the statistical variable. • 3)Decide in which case it is more convenient to study the population than sample. a)The length of the screws which manufactures a machine continuously for one day. b)The height of foreign tourists visiting Spain in one year. c)The length of a bulb until it melts or molten. d)The salary of the employees of a company. Which variable is studied in each case? Types of variables: Tipos de variables • Qualitative: The variable values are not numbers but qualities (gender, hair color,...). Cualitativas: Los valores de la variable no son números sino cualidades (Género, color de pelo,...) • Quantitative: The variable values are numbers (number of pages of a book, height,...). Cuantitativas: Los valores de la variable son números (nº de págs de un libro, altura,...). • Quantitative variables can be: Discrete: In each section, the variable can only take a certain number of values. Las variables cuantitativas pueden ser: Discretas: cada tramo, la variable sólo puede tomar un número determinado de valores(un libro puede tener 50 o 51 págs. pero no 50,5 págs. • Continuous:In each section, the variable can take infinite values. Contínua: En cada tramo, la variable puede tomar infinitos valores (la altura entre 1,70 y 1,80m, puede ser 1,71m; 1,767m,...) Example: • Rank these statistical variables and set examples of the values they can take. a)Breed of dog. Qualitative (cocker, greyhound, peke,...) b)Birthweight. Quantitative continuous (2Kg; 2,3 Kg; 2,353 Kg,...) c)Place in a row. Quantitative discrete (1,2,5,...) Exercises: • 1)Rank these statistical variables: a) Make of a phone. b)Eyes color. c)Favourite sport. d)Height. e)Age. f)Name. • 2)Write 3 qualitative variables, 3 quantitative variables and another 3 discrete quantitative variables. • 3)To classify abandoned dogs, the doghouse employees fill a page with the following information: Breed, age, elevation, weight, gender, hair color, level of training, level of danger. Rank the variables Count Data Recuento de datos • In a statistical study, after collecting the data are sorted in ascending order and record the number of occurrences of each. En un estudio estadístico, después de recoger los datos, se ordenan en orden creciente y se anota el número de veces que aparece cada uno. •Example: Make counting how old they are the 30 guys who go to camp. Age of the guys 14 15 14 17 17 16 15 16 15 14 16 15 16 17 14 15 14 16 14 16 17 15 16 16 16 14 17 16 15 16 15 16 16 17 //// / //// // //// //// // //// •Exercise: Realiza un recuento de estas edades: 13 12 17 11 19 15 13 14 15 16 17 18 14 17 14 15 17 13 16 18 19 17 15 15 16 6 7 12 5 Absolute frequency and relative frequency • The absolute frequency of a statistic is the number of times it is repeated. It is represented by f i La Frecuencia absoluta de un dato estadístico es el número de veces que se repite. Se representa por fi. • The relative frequency is the quotient between the absolute frequency and total number of data. Is represented by hi. La Frecuencia relativa es el cociente entre la frecuencia absoluta y el número total de datos. Se representa por hi. • The data and frequencies can be organized into a frequency table, placing the data in the first column and the frequencies in the following. Los datos y las frecuencias se pueden organizar en una tabla de frecuencias, colocando los datos en la primera columna y las frecuencias en las siguientes. • The sum of the absolute frequencies of a set of statistical data is the total number of data. f1 + f2 + f3 +.....+ fn =N La suma de las frecuencias absolutas de un conjunto de datos estadísticos es el número total de datos. • The sum of the relative frequencies of a set of statistical data is equal to unity. h + h +.....+ h =1 1 2 n La suma de las frecuencias relativas de un conjunto de datos estadísticos es igual a la unidad. Ejemplo: • Unos amigos van a realizar un estudio estadístico en una cancha de baloncesto. Quieren conocer las edades de los espectadores que van a ver un partido de alumnos de 2º de ESO. Los datos obtenidos en la encuesta son: Edad de los espectadores: 16 14 17 15 16 14 14 16 16 14 17 14 16 14 15 16 15 16 17 16 15 15 15 15 16 17 16 17 16 16 Calcula las frecuencias obtenidas a partir del recuento. Frecuencia Frecuencia relativa x i absoluta f h 14 //// / 6 14 6 6/30=0,2 i 15 //// // 7 16 //// //// // 12 17 //// 5 15 16 17 7 12 5 30 i 7/30=0,23 12/30=0,4 5/30=0,17 1 Exercises: • 1)In a classroom of 20 pupils, the number of hours dedicated to do a maths work is: 4 6 7 3 6 8 5 9 8 7 5 4 7 8 4 6 5 8 10 7 Form a table with count data and calculate the frequencies of the values taken its variable. 2) Note the color of the eyes of your classmates and perform a frequency table. Cumulative frequency Frecuencia acumulada • The absolute cumulative frequency of a data xi is the sum of the absolute frequencies of the values that are smaller or equal to it. It is represented by Fi. La Frecuencia absoluta acumulada de un dato x es la suma de las frecuencias absolutas de los valores que son menores o iguales que él. Se representa por Fi. Fi = f1 + f +.....+ f 2 i • The cumulative relative frequency of a given data x is the sum of the relative frequencies of valuesless than or equal to it. Is represented by H . Equivalent to the quotient between the cumulative absolute frequency data and the number of them. i i La Frecuencia relativa acumulada de un dato x es la suma de las frecuencias relativas de los valores menores o iguales que él. Se representa por H . Equivale al cociente entre la frecuencia absoluta acumulada del dato y el número total de ellos. Hi = h1 + h +.....+ h = f1/N + f2/N + f3/N +......+ fi/N 2 • i Ejemplo: • Completa la tabla de frecuencias con las frecuencias acumuladas. x 0 1 2 3 4 f 6 16 15 10 3 i i Recuerda que n es el número que hay de datos diferentes y N es el número total de datos. Calculamos las frecuencias acumuladas por ser la variable cuantitativa. xi fi Fi hi 0 6 6 0,12 1 16 22 0,32 2 15 37 0,3 3 10 47 0,2 4 3 50 0,06 Hi 0,12 0,44 0,74 0,94 1 La última frecuencia absoluta acumulada coincide con el número total de datos La última frecuencia relativa acumulada es siempre 1. Ejercicios: • 1)Organiza estos datos en una tabla de frecuencias: 164 168 170 170 168 170 174 170 168 172 • 2) Haz una tabla de frecuencias con las edades de los socios de un club deportivo: 19 21 24 24 24 25 24 21 26 19 20 22 29 23 28 27 22 23 24 19 ¿Qué porcentaje tiene menos de 20 años? • 3)Copia y completa la siguiente tabla de frecuencias. Construye también una tabla de frecuencias acumuladas: Dato 1 2 3 4 5 f 3 i h 0,15 0,2 i 0,3 5 Statistical graphics Gráficos estadísticos • Another way of organizing data is the graphical representation. Allow statistical graphics immediately realize the most important characteristics of a statistical study. Otra forma de organizar los datos es la representación gráfica. Los gráficos estadísticos permiten darnos cuenta de inmediato de las características más relevantes de un estudio estadístico. • 1)Bar Graph:It is used when we want to represent frequency values take few values. On the horizontal axis each represent the statistical values of the variable. On the vertical axis the frequencies. The frequency corresponding to each data is represented by a bar, taking into account that the heights of the bars are proportionales to corresponding frequencies. Diagrama de barras:Se utiliza cuando queremos representar frecuencias de valores que tomen pocos valores. En el eje horizontal representamos cada uno de los valores de la variable estadística. En el eje vertical, las frecuencias. La frecuencia que corresponde a cada dato se representa por una barra, teniendo en cuenta que las alturas de las barras son proporcionales a las correspondientes frecuencias. Ejemplo: • La tabla muestra los valores recogidos al preguntar a 40 alumnos sobre el tipo de novela favorita. Representa la información obtenida mediante un diagrama de barras. f Novela Favorita i Novela favorita Frecuencia fi Aventuras 12 Histórica 8 C.Ficción 14 Romántica 6 14 12 10 8 6 4 2 0 Aventuras Ciencia Ficción Ejercicios: • 1)El color de pelo de 30 personas es: M=Moreno; R=Rubio; P=Pelirrojo. M R P M M M M R R P P M M M M M M P R R R P M M M M R M M M Organiza los datos en un diagrama de barras. • 2)En éste gráfico se representa el número de veces que utilizan la guagua en una semana un grupo de personas. i f 8 a) ¿Qué tipo de variable estamos estudiando? 6 b)Construye la tabla correspondiente. 4 2 0 1 2 3 4 Nº de personas 5 2)Frequency polygon: Polígono de Frecuencias: • When the statistical variable is quantitative, the upper ends of the bars may be joined by lines, obtaining a polygonal line which is called frequency polygon. Cuando la variable estadística es cuantitativa, los extremos superiores de las barras se pueden unir mediante líneas, obteniendo una línea poligonal que se llama polígono de frecuencias. f i Ejemplo: EDAD FRECUENCIA fi 14 6 15 7 16 12 17 5 12 10,9 9,8 8,7 7,6 6,5 5,4 4,3 3,2 2,1 1 Polígono de Frecuencias 14 15 Edad 16 17 3)Pictograph: Pictograma • Pictograph: Sometimes, instead of bars are usually represented drawings representing the variable being studied and whose size is proportional to the frequency. These graphs are called pictographs. Pictograma: A veces, en lugar de barras se suelen representar dibujos representativos de la variable que se va a estudiar y cuyo tamaño es proporcional a la frecuencia. Estos gráficos se llaman pictogramas. 4)Pie Chart: Diagrama de sectores. • Pie chart: The pie chart can be used for any type of variable. The data are represented in a circle, divided into sectors. Each sector represents a variable value. The amplitude of a sector, the angle is proportional to the frequency of data it represents. Circle sector angle=(fi/N)*360º =hi*360º. Diagrama de Sectores: El diagrama de sectores se puede utilizar para cualquier tipo de variable. Los datos se representan en un círculo, dividido en sectores. Cada sector representa un valor de la variable. La amplitud de un sector, su ángulo, es proporcional a la frecuencia del dato que representa. Ángulo del sector circular= (fi/N)*360º =hi*360º. • Ejemplo: Completa la tabla y realiza un diagrama de sectores con los datos que contiene: Novela Favorita Aventuras Histórica Ciencia Ficción Romántica Frecuencia fi 12 8 14 6 • Completamos la tabla con hi, el porcentaje y la amplitud de cada sector Novela favorita fi hi % Ángulo(º) Aventuras 12 0,3 30% 0,3*360º=108º Histórica 8 0,2 20% 0,2*360º=72º Ciencia Ficción 14 0,35 35% 0,35*360º=126º Romántica 6 0,15 15% 0,15*360º=54º Aventuras Ciencia Ficción Histórica Romántica º º º º Exercises: • 1)Make a pie chart with this data: Type of waste Paper Container Organic Glass Amount 100 125 200 175 • 2)Draw a bar graph and a pie chart with the following data: Favourite sport Soccer Basketball Paddle Number of people 120 80 50 • Measures of centralization: • Medidas de centralización: • Measures of centralization: Once organized the data in a statistical study, we will calculate a series of values that will help us interpret. Medidas de centralización: Una vez organizados los datos de un estudio estadístico, vamos a calcular una serie de valores que nos ayudarán a interpretarlos. 1)Arithmetic mean: The arithmetic mean of a data set is the quotient obtained by dividing the sum of the data by the total number of them. This action can only be calculated in quantitative variables is unique and may not match any of the data. Media Aritmética: La media aritmética de un conjunto de datos es el cociente que resulta de dividir la suma de los datos entre el número total de ellos. Esta medida sólo se puede calcular en variables cuantitativas, es única y puede no coincidir ninguno de los datos. We use two methods to calculate the arithmetic mean: a) Divide the sum of all data between the total number of data. b) If the data are in a table with their absolute frequencies, each data is multiplied by its frequency, all products are added and divided by the total number of them. Podemos usar dos métodos para calcular la media aritmética: a) Se divide la suma de todos los datos entre el número total de datos. b) Si los datos vienen en una tabla con sus frecuencias absolutas, se multiplica cada dato por su frecuencia, se suman todos los productos y se divide entre el número total de ello. Ejemplos: • Un grupo de 6 amigos recibe estas cantidades de asignación semanal para sus gastos: 12,14,18,13,17 y 16€ respectivamente. Calcula la media. 12 + 14 + 18 + 13 + 17 + 16 X= = 15 6 Con este dato podemos deducir que la paga normal para un adolescente perteneciente a ese grupo de amigos es de 15€. • Calcula la media aritmética de las alturas obtenidas después de medir a 25 alumnos Exercises: • 1)The term mark is the arithmetic mean of the 5 tests done during the term: 4, 5, 8, 7, 7 Wich is the term mark? Sol A: 6,2 SOL B: 5,8 • 2)The following table shows the number of computers that have employees of a company. Complete the table, perform the graph and calculate the arithmetic mean. x f 0 2 1 25 2 65 3 8 i i 2)Median Mediana • The median of a data set, Me, is the central value of them, there are as many bigger data as smaller data than it. La mediana de un conjunto de datos, Me, es el valor central de ellos, es decir, hay tantos datos mayores que él como menores. Ésta medida sólo se puede calcular en variables cuantitativas, es única y puede no coincidir con ninguno de los datos. Para calcular la mediana ordenamos los datos de menor a mayor. Si el número de datos es impar, la mediana es el dato que ocupa el lugar central. Si el número de datos es par, la mediana es la media aritmética de los dos datos centrales. • Ejemplos: Calcula la mediana de los siguientes conjuntos de datos: Ordenamos los datos y comprobamos si es par o impar. a) 3,6,7,2,0,3,4. 0,2,3,3,4,6,7 N=7. El num. de datos es impar. 0,2,3,3,4,6,7------>Me=3 porque tiene tantos datos mayores como menores que él. 0,2,2,3,4,5,6,7--->N=8 • b) 3,6,7,2,0,2,4,5 Me=es la media de 3 y 4 que son los datos centrales Me= 3+4 2 Exercises: • 1)The ages of a group of 8 friends are 16, 15,17,15,17,14,15, and 16, respectively. Calculate the mean and median age. • 2)Daily temperatures in degrees Celsius obtained in a city for a month are: 18 19 22 16 21 20 19 18 17 22 21 23 25 19 20 19 22 21 20 24 23 21 19 14 23 19 18 19 20 21 Compare the mean and median temperature of the month. Mode: Moda: • Mode of a distribution The value or values that happen most often in a distribution (the most common value in a set of data). Moda de una distribución.El valor o los valores que se producen con más frecuencia en una distribución (el valor más común de un conjunto de Example: The distribution of time in minutes taken by ten people to finish a test is: 30, 31, 32, 32, 35, 36, 36, 36, 37, 40. The value 36 happens most often in this distribution, so the mode is 36: Mo=36. datos). If the aggregate statistics are two or more values with maximum frequency, we say that the series is bimodal or multimodal. In a bar graph, the corresponding data is the bar higher and in the pie chart is concerned with the broader sector. Si el conjunto de datos estadísticos aparecen dos o más valores con frecuencia máxima, decimos que la serie es bimodal o multimodal. En un diagrama de barras, es el dato correspondiente a la barra de mayor altura y en el diagrama de sectores es el correspondiente con el sector de mayor amplitud. Exercises: • 1)Halla la moda de los datos que se representan en esta tabla de frecuencias: Xi 1 2 3 4 5 6 7 8 9 10 fi 2 1 5 4 2 1 2 2 1 1 • 2)Se ha lanzado 18 veces un dado de parchís, obteniéndose estos resultados: 1 4 5 5 6 2 3 5 2 3 4 4 5 6 3 1 5 4 Representa graficamente los datos y calcula la moda.