Elementos de estadística para ingeniería: Un curso básico
()
Información de este libro electrónico
Relacionado con Elementos de estadística para ingeniería
Títulos en esta serie (50)
Justicia y paz en la novela de crímenes Calificación: 0 de 5 estrellas0 calificacionesRepública, violencia y género en la novela de crímenes Calificación: 0 de 5 estrellas0 calificacionesBreve historia de la narrativa colombiana: Siglos XVI-XX Calificación: 5 de 5 estrellas5/5La novela de crímenes en América Latina: un espacio de anomia social Calificación: 5 de 5 estrellas5/5Memoria de crímenes: Literatura, medios audiovisuales y testimonios Calificación: 0 de 5 estrellas0 calificacionesEl cielo y otros infiernos Calificación: 0 de 5 estrellas0 calificacionesLa anomia en la novela de crímenes en Colombia Calificación: 0 de 5 estrellas0 calificacionesCapitalismo, crisis y anarquismo en la novela de crímenes del siglo XXI en España Calificación: 0 de 5 estrellas0 calificacionesLas hojas breves: Acerca de Fernando Pessoa Calificación: 0 de 5 estrellas0 calificacionesIngeniería de Costos: Un enfoque basado en la gestión de operaciones de manufactura y logística Calificación: 0 de 5 estrellas0 calificacionesCuando nada concuerda Calificación: 0 de 5 estrellas0 calificacionesAsedios a la palabra: (Para un arte poético) Calificación: 0 de 5 estrellas0 calificacionesMemorias de una cinefilia: (Andrés Caicedo, Carlos Mayolo, Luis Ospina) Calificación: 1 de 5 estrellas1/5Python a su alcance Calificación: 4 de 5 estrellas4/5Modelo de integración de servicios para el sistema de salud en Colombia Calificación: 0 de 5 estrellas0 calificacionesCargadores de baterías de mediana y baja capacidad para vehículos eléctricos: Consideraciones preliminares de diseño Calificación: 0 de 5 estrellas0 calificacionesMicrorredes eléctricas Calificación: 0 de 5 estrellas0 calificacionesElementos de estadística para ingeniería: Un curso básico Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ciencia de datos en R: Un enfoque práctico Calificación: 0 de 5 estrellas0 calificacionesEstática aplicada en ingeniería civil: Introducción al análisis de cerchas, marcos y vigas Calificación: 0 de 5 estrellas0 calificacionesIntroducción Al Psoc5Lp: Teoría y aplicaciones práctica Calificación: 0 de 5 estrellas0 calificacionesEstructuras de datos en java Calificación: 0 de 5 estrellas0 calificacionesEl Nuevo Reto: Los Datos Abiertos En Colombia Calificación: 0 de 5 estrellas0 calificacionesHerramientas de modelación de ingeniería de rránsito Calificación: 0 de 5 estrellas0 calificacionesGuía para el análisis y solución de problemas de resistencia de materiales Calificación: 0 de 5 estrellas0 calificacionesGeometría euclidiana Calificación: 0 de 5 estrellas0 calificacionesIncidencia de la lógica del cambio en la viabilidad organizacional: Conceptos de transmisión y distribución. Modelación de líneas y redes Calificación: 0 de 5 estrellas0 calificacionesAplicaciones Web con HTML, JavaScript y Php Calificación: 0 de 5 estrellas0 calificacionesMetodologías ágiles para el desarrollo de software Calificación: 0 de 5 estrellas0 calificacionesManual de civil 3D aplicado a proyectos viales Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Ejercicios de Inferencia Estadística Calificación: 0 de 5 estrellas0 calificacionesEstadística multivariada: inferencia y métodos Calificación: 0 de 5 estrellas0 calificacionesEstadística descriptiva para datos categóricos Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la Estadística Calificación: 0 de 5 estrellas0 calificacionesCalidad docente: Factor estratégico en el rendimiento académico de los alumnos de Matemáticas y Estadística. Caso CUCEA Calificación: 0 de 5 estrellas0 calificacionesMétodos de regresión no paramétrica Calificación: 0 de 5 estrellas0 calificacionesEstadística para veterinarios y zootecnistas Calificación: 5 de 5 estrellas5/5Análisis de datos Calificación: 0 de 5 estrellas0 calificacionesEstadística aplicada a la ingeniería y los negocios Calificación: 4 de 5 estrellas4/5Introducción a la estadística matemática Calificación: 5 de 5 estrellas5/5Métodos Bioestadísticos Calificación: 5 de 5 estrellas5/5Introducción a la estadística con aplicaciones en Ciencias Sociales Calificación: 4 de 5 estrellas4/5Introducción a la teoría de la probabilidad Calificación: 4 de 5 estrellas4/5Introducción al análisis estadístico multivariado aplicado: Experiencia y casos en el Caribe colombiano Calificación: 5 de 5 estrellas5/5Cómo entender estadística fácilmente Calificación: 4 de 5 estrellas4/5Probabilidad y estadística: un enfoque teórico-práctico Calificación: 4 de 5 estrellas4/5Estadística descriptiva y probabilidad para los Negocios con aplicaciones en excel y jamovi Calificación: 0 de 5 estrellas0 calificacionesEstadística básica para los negocios Calificación: 0 de 5 estrellas0 calificacionesPrincipios de estadística aplicada Calificación: 0 de 5 estrellas0 calificacionesEconometría aplicada usando stata 13 Calificación: 4 de 5 estrellas4/5Estadística Descriptiva y Probabilidad Calificación: 5 de 5 estrellas5/5Manual Para La Construcción De Tablas De Contingencia: Modelo, Investigación Y Análisis Calificación: 0 de 5 estrellas0 calificacionesIntroducción a los análisis estadísticos en R Calificación: 0 de 5 estrellas0 calificacionesProcesos estocásticos con aplicaciones Calificación: 5 de 5 estrellas5/5Estadística Descriptiva Calificación: 0 de 5 estrellas0 calificacionesEconometría fundamental Calificación: 0 de 5 estrellas0 calificacionesFundamentos matemáticos para ciencias químicas e ingeniería Calificación: 0 de 5 estrellas0 calificacionesSistema numérico residual: Fundamentos lógico-matemáticos Calificación: 0 de 5 estrellas0 calificacionesMétodos numéricos Calificación: 5 de 5 estrellas5/5Transparencia y ética de una pyme sustentable Calificación: 0 de 5 estrellas0 calificaciones
Matemática para usted
Introducción a las matemáticas Calificación: 3 de 5 estrellas3/5¿Soy yo normal?: Filias y parafilias sexuales Calificación: 5 de 5 estrellas5/5Probabilidad y estadística: un enfoque teórico-práctico Calificación: 4 de 5 estrellas4/5Matemática fundamental para matemáticos Calificación: 5 de 5 estrellas5/5Manual de preparación PSU Matemática Calificación: 4 de 5 estrellas4/5Estadística inferencial aplicada Calificación: 5 de 5 estrellas5/5Geometría sagrada: Desvelando el significado espiritual de varias formas y símbolos Calificación: 0 de 5 estrellas0 calificacionesRazonamiento Lógico Matemático para la toma de decisiones Calificación: 4 de 5 estrellas4/5Dignos de ser humanos: Una nueva perspectiva histórica de la humanidad Calificación: 4 de 5 estrellas4/5Matemáticas básicas 2ed. Calificación: 4 de 5 estrellas4/5Cálculo integral: Técnicas de integración Calificación: 4 de 5 estrellas4/5Estadística básica: Introducción a la estadística con R Calificación: 5 de 5 estrellas5/5Fundamentos de matemática: Introducción al nivel universitario Calificación: 3 de 5 estrellas3/5Aplicaciones de las funciones algebraicas Calificación: 5 de 5 estrellas5/5Álgebra clásica Calificación: 0 de 5 estrellas0 calificacionesEl gran teatro del mundo Calificación: 5 de 5 estrellas5/5Introducción a la geometría Calificación: 5 de 5 estrellas5/5Pitágoras y su teorema Calificación: 4 de 5 estrellas4/5Estadística descriptiva, regresión y probabilidad con aplicaciones Calificación: 5 de 5 estrellas5/5Teoría de juegos: Una introducción matemática a la toma de decisiones Calificación: 4 de 5 estrellas4/5No leer Calificación: 4 de 5 estrellas4/5Qué es (y qué no es) la estadística: Usos y abusos de una disciplina clave en la vida de los países y las personas Calificación: 5 de 5 estrellas5/5Laboratorio lector: Para entender la lectura Calificación: 5 de 5 estrellas5/5Matemáticas básicas 4ed Calificación: 5 de 5 estrellas5/5Inteligencia matemática Calificación: 4 de 5 estrellas4/5La belleza de las matemáticas Calificación: 4 de 5 estrellas4/5Estadística Descriptiva y Probabilidad Calificación: 5 de 5 estrellas5/5La Física - Aventura del pensamiento Calificación: 5 de 5 estrellas5/5CeroCeroCero: Cómo la cocaína gobierna el mundo Calificación: 4 de 5 estrellas4/5
Comentarios para Elementos de estadística para ingeniería
0 clasificaciones0 comentarios
Vista previa del libro
Elementos de estadística para ingeniería - Rigoberto Quintero Camacho
Capítulo 1
Estadística descriptiva
Analizar las características de una población es posible mediante el estudio del análisis de sus variables de interés. Estas pueden ser cualitativas, si lo que estamos analizando son algunas de sus cualidades, o cuantitativas, si se están midiendo ciertas características. Las variables cualitativas pueden ser discretas si los valores que toma la variable son de un conjunto contable, o continuas, si los valores que toma la variable son de un subintervalo de números reales.
Así, por ejemplo, si analizamos la población de vehículos de Bogotá a estos les podemos estudiar algunas variables cualitativas, como su color, el modelo, el país dónde está la casa matriz, si son nacionales o importados, la clase o la marca, y algunas variables cuantitativas, como el cilindraje o el número de pasajeros. Como variable discreta también podemos analizar el kilometraje recorrido, en tanto que como variable continua podemos ocuparnos del rendimiento del combustible en kilómetros por galón de gasolina.
Dado que se ha recogido la información de las variables de interés en el estudio de una población, es pertinente contar con herramientas estadísticas para su análisis. La estadística descriptiva es la encargada de encontrar métodos que permitan describir los datos de una manera visual, mediante gráficas y tablas, como también encontrar algunas medidas numéricas que ayuden a descubrir ciertas características de los datos, de esta manera y mediante la inferencia estadística, se podrá establecer el comportamiento probabilístico de aquellas variables. Por ejemplo, en el caso del estudio automotor en Bogotá, es importante el análisis de la distribución de probabilidades del rendimiento por galón de los vehículos. Tal estudio, unido al análisis del recorrido promedio diario, puede llevarnos a descubrir un posible desabastecimiento de combustible en la ciudad.
Finalmente, los métodos estadísticos para la presentación de la información dependen de las variables, si son cualitativas o cuantitativas, discretas o continuas.
1.1. El sistema eléctrico de potencia
La elaboración de tablas de frecuencia es una técnica para inferir el comportamiento de la información de una variable.
1.1.1. Variables cualitativas
Si la variable es cualitativa se elabora una tabla con tres columnas. En la primera, se ubican las distintas categorías o cualidades de la variable, en la segunda la frecuencia absoluta (número de veces que aparece la información en esa categoría); en la tercera, la proporción de la información que está en esa categoría.
Ejemplo 1.1. La tabla 1.1 muestra la información organizada de 1500 vehículos según su país de origen.
Tabla 1.1. Porcentaje de vehículos en la ciudad según el país de origen
La anterior información también la podemos presentar mediante un diagrama de barras (que se aconseja en el caso de variables como esta). Lo fundamental es lograr de manera clara la visualización de cuál es la preferencia del vehículo de los ciudadanos de acuerdo con el país donde está la casa matriz en la que se produce. Así, por ejemplo, la figura 1.1 muestra que la mayor preferencia de los ciudadanos es por los vehículos japoneses, con lo que se puede inferir que el 27% de los vehículos que transitan en la ciudad son hechos en este país¹, o lo que es lo mismo: si se elige un vehículo al azar en la ciudad, la probabilidad de que sea japonés es de 0,27.
Figura 1.1. Distribución del porcentaje de vehículos de acuerdo con el país de origen
La información también la podemos presentar mediante un gráfico circular (figura 1.2) dividiendo el círculo de acuerdo con la proporción que le
Figura 1.2. Porcentaje de vehículos por país de origen
1.1.2. Variables cuantitativas discretas
Si la variable es cuantitativa discreta se elabora una tabla con cuatro columnas: en la primera se ubica el valor que toma la variable, en la segunda la frecuencia absoluta con que la variable toma este valor, en la tercera la frecuencia relativa con que la variable toma dicho valor, y en la cuarta la frecuencia acumulada.
Ejemplo 1.2. La tabla 1.2 muestra el número de defectos por pieza en un lote de doscientas piezas elegidas al azar.
Tabla 1.2. Porcentaje de vehículos por país de origen
La anterior información la presentamos en un gráfico de barras o puntos. En el eje horizontal se incluye el valor que toma la variable y en el eje vertical la frecuencia con la que se presenta este valor (figura 1.3).
Figura 1.3. Distribución del número de defectos por pieza
La información también la podemos presentar mediante un gráfico de puntos (figura 1.4).
Figura 1.4. Distribución del número de defectos por pieza
En las gráficas y tablas anteriores podemos leer, por ejemplo, que si elegimos una pieza al azar de la producción, la probabilidad de que dos sea el número de defectos de la pieza es aproximadamente 0,24, o lo que es lo mismo, podemos inferir que el porcentaje de piezas con dos defectos es de 24%.
Otra información importante en el análisis de este tipo de variables es el porcentaje acumulado, por cuanto representa la aproximación de la distribución de la variable. Así, por ejemplo, en la última columna de la tabla 1.2 se lee que la probabilidad aproximada de que una pieza tenga a lo sumo tres defectos es de 0,61. Podemos inferir que el porcentaje de la producción de piezas con tres defectos o menos es del 61%, asimismo observamos, por ejemplo, que la probabilidad aproximada de que una pieza tenga entre dos y cinco defectos inclusive es de 0,78, o lo que es lo mismo, P(2 ≤ X ≤ 5) ≈ 78,0, donde X es la variable que mide el número de defectos por pieza. Además, se observa que
En general, esa es una propiedad importante de la función de distribución acumulativa de una variable aleatoria discreta². Como la frecuencia relativa acumulada es la aproximación de dicha función, entonces la gráfica de la frecuencia relativa acumulada será la gráfica de una función escalonada. En la figura 1.5 se presenta la gráfica de la frecuencia acumulada del número de defectos por pieza.
Figura 1.5. Distribución del número de defectos por pieza
1.1.3. Variables cuantitativas continuas
Si la variable es continua, es pertinente establecer algunas definiciones para que los investigadores cuenten con unos criterios claves en la elaboración de dichas tablas y gráficas.
Definición 1.1. Se define la clase como el intervalo (yi-1 yi], donde yi-1 se denomina el límite inferior de la clase i y yi el límite superior de la clase. Además, la marca de clase se define como:
Es de anotar que el intervalo es semiabierto, lo cual indica que yi-1 es un valor que no pertenece a la clase i.
Definición 1.2. Supongamos que se quiere organizar x1, x2, x3,,,,,,,, xn datos de una variable X. Se define el rango de los - n datos como:
Es decir, para encontrar el rango de los datos ordenamos los datos de la variable de menor a mayor; este rango es la diferencia entre el mayor y el menor. El rango de la variable lo dividimos en k clases, o lo que es lo mismo, dividimos el rango en k subintervalos.
Definición 1.3. Se define la longitud de la clase i como:
Se recomienda que todas las clases tengan la misma longitud. En tal caso, si el rango lo hemos dividido en k clases, entonces la longitud de cada clase estará dada por:
Definición 1.4. Si x1, x2, x3,,,,,,,, xn son n datos organizados en k clases, la frecuencia absoluta de la clase i se define como ni, que es el número de datos que están en la clase i; se define la frecuencia absoluta acumulada como:
Es claro que:
Definición 1.5. Si x1, x2, x3,,,,,,,,xn son n datos organizados en k clases, la frecuencia relativa de la clase i se define como:
Y la frecuencia relativa acumulada se define como:
Es claro que:
Ejemplo 1.3. La tabla 1.3 muestra la información del porcentaje de aluminio en 190 muestras de roca.
Tabla 1.3. Porcentaje de aluminio en 190 muestras de roca
La anterior información la podemos organizar en una tabla, a la que denominamos tabla de frecuencias. Esta tabla la elaboramos siguiendo los siguientes pasos:
Paso 1: ordenamos la información de menor a mayor y calculamos el rango. En el ejemplo tenemos:
R(X) = 7,45 – 1,78 = 5,67
Es decir, el rango de las observaciones es 5,67.
Paso 2: determinamos el número de clases k y calculamos la longitud de cada una. Tal número de clases se determina a criterio del investigador, pero debe estar de acuerdo con la cantidad de datos que tengamos, de tal forma que no sean ni muchas ni pocas. Una fórmula empírica que se acostumbra a usar está dada por:
Es decir, el número de clases lo podemos calcular como la parte entera de la raíz cuadrada del número de datos, que es recomendable que no sea mayor a diez. En el caso del ejemplo se proponen diez clases, con lo cual la longitud de cada una está dada por:
Este valor lo podemos aproximar a 0,6.
Paso 3: determinamos cada clase de la siguiente forma: como el mínimo es 1,78, entonces el límite superior de la primera clase es: 1,78 + 0,6 = 2,38, el cual podemos, por facilidad de cálculo, aproximarlo a 2,4; es decir, la primera clase es: (− ∞,2,4]. El límite superior de la segunda clase se halla sumando la longitud, esto es: 2,4 + 0,6 = 3,0, es decir, la segunda clase es: (2,4, 3,0]. De igual forma, se encuentran las siguientes clases, las cuales se observan en la primera columna de la tabla de frecuencias.
Paso 4: se calculan las marcas de clase, que son el punto medio de cada intervalo, el cual también se puede calcular a partir de la primera clase, restándole al límite superior de esta la mitad de la longitud. Esta es la marca de clase de la primera, las demás se calculan sumando la longitud, esto es: la primera marca de clase es 2,1, la segunda 2,7, la tercera 3,3, la cuarta 3,9, la quinta 4,5 y así sucesivamente; esta se ve en la segunda columna de la tabla de frecuencias.
Paso 5: se calculan las marcas, las frecuencias absolutas de cada clase, es decir, en la información ordenada se cuentan los datos que están en la clase. Así, por ejemplo, para encontrar n1 se calcula el número de datos que son menores o iguales a 2,4, que son cinco. Para encontrar n2 se establece el número de datos que son mayores que 2,4 y menores o iguales a 3,0, que en este caso son nueve, y así sucesivamente con las otras frecuencias.
Paso 6: se calculan las frecuencias absolutas acumuladas, las frecuencias relativas y las relativas acumuladas de acuerdo con las definiciones anteriores. La tabla 1.4 establece.
Tabla 1.4. Distribución de frecuencia del porcentaje de aluminio
La gráfica de la distribución se presenta mediante un histograma de frecuencias, donde el área de cada rectángulo representa la probabilidad de que la variable se encuentre en el intervalo de clase (figura 1.6).
Figura 1.6. Histograma de frecuencias del porcentaje de aluminio en las muestras
Una gráfica importante es el polígono de frecuencias, por cuanto indica la forma de la distribución y se grafica con las marcas de clase y segmentos de recta, como se observa en la figura 1.7.
Figura 1.7. Polígono de frecuencias del porcentaje de aluminio en las muestras
Otro gráfico relevante es el de la frecuencia acumulada, ya que nos muestra la forma de la función de probabilidad acumulativa de la variable. A esta gráfica se acostumbra a llamársele la ojiva de la distribución (figura 1.8).
Figura 1.8. Frecuencia acumulativa del porcentaje de aluminio
1.2. Medidas de tendencia central
Como se dijo antes, una de las funciones de la estadística descriptiva es encontrar medidas numéricas a partir de los datos de una variable que nos permitan determinar algunas características de la población. Cualesquiera de esas medidas, a las que se denomina de tendencia central, las definimos a continuación.
Definición 1.6. Sean x1, x2, x3,..., xn n datos de una variable X, se define la media aritmética de los n datos como:
Y si los -n datos están agrupados en k clases, entonces la media aritmética de los- n datos se puede aproximar mediante la siguiente fórmula:
Donde ci es la marca de clase de la clase.
Ejemplo 1.4. Encontrar la media aritmética de los datos y calcular la aproximación mediante los datos agrupados.
Como podemos observar, los valores son básicamente iguales.
Definición 1.7. Sean x1, x2, x3,,,,,,,,xn n datos de una variable X, se ordenan los n datos de mayor a menor y si el número de datos es impar se define la mediana como el dato central; si es par entonces la mediana se define como la semisuma de los dos centrales y se denota como md.
Si los datos están agrupados en k clases entonces la mediana se puede aproximar mediante la siguiente fórmula:
Donde yj−1 es el límite inferior de la clase en la cual se encuentra la mediana, n el número de datos, Nj−1 la frecuencia absoluta acumulada de la clase anterior a la clase mediana, nj la frecuencia absoluta de la clase mediana y L la longitud de la clase mediana.
Ejemplo 1.5. Calcular la mediana de los datos del porcentaje de aluminio y su aproximación mediante los datos agrupados.
Los dos datos centrales son el 95 y el 96. Si se ordena la información, la mediana es la semisuma de estos dos datos, esto es:
Para calcular la mediana a partir de los datos agrupados, primero se ubica la clase mediana, es decir, establecemos en la columna de la frecuencia acumulada la frecuencia más próxima al 0,5 (al 50 % de la información) por encima. En este caso se ve que dicha frecuencia es 0,579, es decir, la clase mediana es (4,2, 4,8]; por lo tanto:
nj = 38,