Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Elementos de estadística para ingeniería: Un curso básico
Elementos de estadística para ingeniería: Un curso básico
Elementos de estadística para ingeniería: Un curso básico
Libro electrónico468 páginas2 horas

Elementos de estadística para ingeniería: Un curso básico

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

En la actualidad, se requieren ciertas habilidades para manejar los grandes volúmenes de datos provenientes de diversas fuentes, como los negocios, la economía o la ingeniería. Para esta tarea se precisan profesionales capaces de traducir los datos en información viable para realizar interpretaciones y análisis necesarios en la toma de decisiones empresariales. Nuevas disciplinas han surgido a raíz de esta disponibilidad de datos: Big Data, Data Analytic, Data Science, Data Mining. Son los estadísticos, matemáticos e ingenieros, trabajando en equipo interdisciplinario, quienes deben abordar estos retos, con el apoyo de computadores y software especializado.
IdiomaEspañol
Fecha de lanzamiento15 nov 2019
ISBN9789587873504
Elementos de estadística para ingeniería: Un curso básico

Relacionado con Elementos de estadística para ingeniería

Títulos en esta serie (50)

Ver más

Libros electrónicos relacionados

Matemática para usted

Ver más

Artículos relacionados

Comentarios para Elementos de estadística para ingeniería

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Elementos de estadística para ingeniería - Rigoberto Quintero Camacho

    Capítulo 1

    Estadística descriptiva

    Analizar las características de una población es posible mediante el estudio del análisis de sus variables de interés. Estas pueden ser cualitativas, si lo que estamos analizando son algunas de sus cualidades, o cuantitativas, si se están midiendo ciertas características. Las variables cualitativas pueden ser discretas si los valores que toma la variable son de un conjunto contable, o continuas, si los valores que toma la variable son de un subintervalo de números reales.

    Así, por ejemplo, si analizamos la población de vehículos de Bogotá a estos les podemos estudiar algunas variables cualitativas, como su color, el modelo, el país dónde está la casa matriz, si son nacionales o importados, la clase o la marca, y algunas variables cuantitativas, como el cilindraje o el número de pasajeros. Como variable discreta también podemos analizar el kilometraje recorrido, en tanto que como variable continua podemos ocuparnos del rendimiento del combustible en kilómetros por galón de gasolina.

    Dado que se ha recogido la información de las variables de interés en el estudio de una población, es pertinente contar con herramientas estadísticas para su análisis. La estadística descriptiva es la encargada de encontrar métodos que permitan describir los datos de una manera visual, mediante gráficas y tablas, como también encontrar algunas medidas numéricas que ayuden a descubrir ciertas características de los datos, de esta manera y mediante la inferencia estadística, se podrá establecer el comportamiento probabilístico de aquellas variables. Por ejemplo, en el caso del estudio automotor en Bogotá, es importante el análisis de la distribución de probabilidades del rendimiento por galón de los vehículos. Tal estudio, unido al análisis del recorrido promedio diario, puede llevarnos a descubrir un posible desabastecimiento de combustible en la ciudad.

    Finalmente, los métodos estadísticos para la presentación de la información dependen de las variables, si son cualitativas o cuantitativas, discretas o continuas.

    1.1. El sistema eléctrico de potencia

    La elaboración de tablas de frecuencia es una técnica para inferir el comportamiento de la información de una variable.

    1.1.1. Variables cualitativas

    Si la variable es cualitativa se elabora una tabla con tres columnas. En la primera, se ubican las distintas categorías o cualidades de la variable, en la segunda la frecuencia absoluta (número de veces que aparece la información en esa categoría); en la tercera, la proporción de la información que está en esa categoría.

    Ejemplo 1.1. La tabla 1.1 muestra la información organizada de 1500 vehículos según su país de origen.

    Tabla 1.1. Porcentaje de vehículos en la ciudad según el país de origen

    La anterior información también la podemos presentar mediante un diagrama de barras (que se aconseja en el caso de variables como esta). Lo fundamental es lograr de manera clara la visualización de cuál es la preferencia del vehículo de los ciudadanos de acuerdo con el país donde está la casa matriz en la que se produce. Así, por ejemplo, la figura 1.1 muestra que la mayor preferencia de los ciudadanos es por los vehículos japoneses, con lo que se puede inferir que el 27% de los vehículos que transitan en la ciudad son hechos en este país¹, o lo que es lo mismo: si se elige un vehículo al azar en la ciudad, la probabilidad de que sea japonés es de 0,27.

    Figura 1.1. Distribución del porcentaje de vehículos de acuerdo con el país de origen

    La información también la podemos presentar mediante un gráfico circular (figura 1.2) dividiendo el círculo de acuerdo con la proporción que le

    Figura 1.2. Porcentaje de vehículos por país de origen

    1.1.2. Variables cuantitativas discretas

    Si la variable es cuantitativa discreta se elabora una tabla con cuatro columnas: en la primera se ubica el valor que toma la variable, en la segunda la frecuencia absoluta con que la variable toma este valor, en la tercera la frecuencia relativa con que la variable toma dicho valor, y en la cuarta la frecuencia acumulada.

    Ejemplo 1.2. La tabla 1.2 muestra el número de defectos por pieza en un lote de doscientas piezas elegidas al azar.

    Tabla 1.2. Porcentaje de vehículos por país de origen

    La anterior información la presentamos en un gráfico de barras o puntos. En el eje horizontal se incluye el valor que toma la variable y en el eje vertical la frecuencia con la que se presenta este valor (figura 1.3).

    Figura 1.3. Distribución del número de defectos por pieza

    La información también la podemos presentar mediante un gráfico de puntos (figura 1.4).

    Figura 1.4. Distribución del número de defectos por pieza

    En las gráficas y tablas anteriores podemos leer, por ejemplo, que si elegimos una pieza al azar de la producción, la probabilidad de que dos sea el número de defectos de la pieza es aproximadamente 0,24, o lo que es lo mismo, podemos inferir que el porcentaje de piezas con dos defectos es de 24%.

    Otra información importante en el análisis de este tipo de variables es el porcentaje acumulado, por cuanto representa la aproximación de la distribución de la variable. Así, por ejemplo, en la última columna de la tabla 1.2 se lee que la probabilidad aproximada de que una pieza tenga a lo sumo tres defectos es de 0,61. Podemos inferir que el porcentaje de la producción de piezas con tres defectos o menos es del 61%, asimismo observamos, por ejemplo, que la probabilidad aproximada de que una pieza tenga entre dos y cinco defectos inclusive es de 0,78, o lo que es lo mismo, P(2 ≤ X ≤ 5) ≈ 78,0, donde X es la variable que mide el número de defectos por pieza. Además, se observa que

    En general, esa es una propiedad importante de la función de distribución acumulativa de una variable aleatoria discreta². Como la frecuencia relativa acumulada es la aproximación de dicha función, entonces la gráfica de la frecuencia relativa acumulada será la gráfica de una función escalonada. En la figura 1.5 se presenta la gráfica de la frecuencia acumulada del número de defectos por pieza.

    Figura 1.5. Distribución del número de defectos por pieza

    1.1.3. Variables cuantitativas continuas

    Si la variable es continua, es pertinente establecer algunas definiciones para que los investigadores cuenten con unos criterios claves en la elaboración de dichas tablas y gráficas.

    Definición 1.1. Se define la clase como el intervalo (yi-1 yi], donde yi-1 se denomina el límite inferior de la clase i y yi el límite superior de la clase. Además, la marca de clase se define como:

    Es de anotar que el intervalo es semiabierto, lo cual indica que yi-1 es un valor que no pertenece a la clase i.

    Definición 1.2. Supongamos que se quiere organizar x1, x2, x3,,,,,,,, xn datos de una variable X. Se define el rango de los - n datos como:

    Es decir, para encontrar el rango de los datos ordenamos los datos de la variable de menor a mayor; este rango es la diferencia entre el mayor y el menor. El rango de la variable lo dividimos en k clases, o lo que es lo mismo, dividimos el rango en k subintervalos.

    Definición 1.3. Se define la longitud de la clase i como:

    Se recomienda que todas las clases tengan la misma longitud. En tal caso, si el rango lo hemos dividido en k clases, entonces la longitud de cada clase estará dada por:

    Definición 1.4. Si x1, x2, x3,,,,,,,, xn son n datos organizados en k clases, la frecuencia absoluta de la clase i se define como ni, que es el número de datos que están en la clase i; se define la frecuencia absoluta acumulada como:

    Es claro que:

    Definición 1.5. Si x1, x2, x3,,,,,,,,xn son n datos organizados en k clases, la frecuencia relativa de la clase i se define como:

    Y la frecuencia relativa acumulada se define como:

    Es claro que:

    Ejemplo 1.3. La tabla 1.3 muestra la información del porcentaje de aluminio en 190 muestras de roca.

    Tabla 1.3. Porcentaje de aluminio en 190 muestras de roca

    La anterior información la podemos organizar en una tabla, a la que denominamos tabla de frecuencias. Esta tabla la elaboramos siguiendo los siguientes pasos:

    Paso 1: ordenamos la información de menor a mayor y calculamos el rango. En el ejemplo tenemos:

    R(X) = 7,45 – 1,78 = 5,67

    Es decir, el rango de las observaciones es 5,67.

    Paso 2: determinamos el número de clases k y calculamos la longitud de cada una. Tal número de clases se determina a criterio del investigador, pero debe estar de acuerdo con la cantidad de datos que tengamos, de tal forma que no sean ni muchas ni pocas. Una fórmula empírica que se acostumbra a usar está dada por:

    Es decir, el número de clases lo podemos calcular como la parte entera de la raíz cuadrada del número de datos, que es recomendable que no sea mayor a diez. En el caso del ejemplo se proponen diez clases, con lo cual la longitud de cada una está dada por:

    Este valor lo podemos aproximar a 0,6.

    Paso 3: determinamos cada clase de la siguiente forma: como el mínimo es 1,78, entonces el límite superior de la primera clase es: 1,78 + 0,6 = 2,38, el cual podemos, por facilidad de cálculo, aproximarlo a 2,4; es decir, la primera clase es: (− ∞,2,4]. El límite superior de la segunda clase se halla sumando la longitud, esto es: 2,4 + 0,6 = 3,0, es decir, la segunda clase es: (2,4, 3,0]. De igual forma, se encuentran las siguientes clases, las cuales se observan en la primera columna de la tabla de frecuencias.

    Paso 4: se calculan las marcas de clase, que son el punto medio de cada intervalo, el cual también se puede calcular a partir de la primera clase, restándole al límite superior de esta la mitad de la longitud. Esta es la marca de clase de la primera, las demás se calculan sumando la longitud, esto es: la primera marca de clase es 2,1, la segunda 2,7, la tercera 3,3, la cuarta 3,9, la quinta 4,5 y así sucesivamente; esta se ve en la segunda columna de la tabla de frecuencias.

    Paso 5: se calculan las marcas, las frecuencias absolutas de cada clase, es decir, en la información ordenada se cuentan los datos que están en la clase. Así, por ejemplo, para encontrar n1 se calcula el número de datos que son menores o iguales a 2,4, que son cinco. Para encontrar n2 se establece el número de datos que son mayores que 2,4 y menores o iguales a 3,0, que en este caso son nueve, y así sucesivamente con las otras frecuencias.

    Paso 6: se calculan las frecuencias absolutas acumuladas, las frecuencias relativas y las relativas acumuladas de acuerdo con las definiciones anteriores. La tabla 1.4 establece.

    Tabla 1.4. Distribución de frecuencia del porcentaje de aluminio

    La gráfica de la distribución se presenta mediante un histograma de frecuencias, donde el área de cada rectángulo representa la probabilidad de que la variable se encuentre en el intervalo de clase (figura 1.6).

    Figura 1.6. Histograma de frecuencias del porcentaje de aluminio en las muestras

    Una gráfica importante es el polígono de frecuencias, por cuanto indica la forma de la distribución y se grafica con las marcas de clase y segmentos de recta, como se observa en la figura 1.7.

    Figura 1.7. Polígono de frecuencias del porcentaje de aluminio en las muestras

    Otro gráfico relevante es el de la frecuencia acumulada, ya que nos muestra la forma de la función de probabilidad acumulativa de la variable. A esta gráfica se acostumbra a llamársele la ojiva de la distribución (figura 1.8).

    Figura 1.8. Frecuencia acumulativa del porcentaje de aluminio

    1.2. Medidas de tendencia central

    Como se dijo antes, una de las funciones de la estadística descriptiva es encontrar medidas numéricas a partir de los datos de una variable que nos permitan determinar algunas características de la población. Cualesquiera de esas medidas, a las que se denomina de tendencia central, las definimos a continuación.

    Definición 1.6. Sean x1, x2, x3,..., xn n datos de una variable X, se define la media aritmética de los n datos como:

    Y si los -n datos están agrupados en k clases, entonces la media aritmética de los- n datos se puede aproximar mediante la siguiente fórmula:

    Donde ci es la marca de clase de la clase.

    Ejemplo 1.4. Encontrar la media aritmética de los datos y calcular la aproximación mediante los datos agrupados.

    Como podemos observar, los valores son básicamente iguales.

    Definición 1.7. Sean x1, x2, x3,,,,,,,,xn n datos de una variable X, se ordenan los n datos de mayor a menor y si el número de datos es impar se define la mediana como el dato central; si es par entonces la mediana se define como la semisuma de los dos centrales y se denota como md.

    Si los datos están agrupados en k clases entonces la mediana se puede aproximar mediante la siguiente fórmula:

    Donde yj−1 es el límite inferior de la clase en la cual se encuentra la mediana, n el número de datos, Nj−1 la frecuencia absoluta acumulada de la clase anterior a la clase mediana, nj la frecuencia absoluta de la clase mediana y L la longitud de la clase mediana.

    Ejemplo 1.5. Calcular la mediana de los datos del porcentaje de aluminio y su aproximación mediante los datos agrupados.

    Los dos datos centrales son el 95 y el 96. Si se ordena la información, la mediana es la semisuma de estos dos datos, esto es:

    Para calcular la mediana a partir de los datos agrupados, primero se ubica la clase mediana, es decir, establecemos en la columna de la frecuencia acumulada la frecuencia más próxima al 0,5 (al 50 % de la información) por encima. En este caso se ve que dicha frecuencia es 0,579, es decir, la clase mediana es (4,2, 4,8]; por lo tanto:

    nj = 38,

    ¿Disfrutas la vista previa?
    Página 1 de 1