Introducción al análisis estadístico multivariado aplicado: Experiencia y casos en el Caribe colombiano
5/5
()
Información de este libro electrónico
Relacionado con Introducción al análisis estadístico multivariado aplicado
Libros electrónicos relacionados
Introducción a la Estadística Bayesiana Calificación: 5 de 5 estrellas5/5Introducción a la estadística matemática Calificación: 5 de 5 estrellas5/5Estadística multivariada: inferencia y métodos Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la estadística con aplicaciones en Ciencias Sociales Calificación: 4 de 5 estrellas4/5Análisis estadístico de datos multivariados Calificación: 5 de 5 estrellas5/5Estadística inferencial aplicada Calificación: 5 de 5 estrellas5/5Análisis de datos con el programa estadístico R: Una introducción aplicada Calificación: 4 de 5 estrellas4/5Estadística aplicada a la ingeniería y los negocios Calificación: 4 de 5 estrellas4/5Manual de estadística no paramétrica aplicada a los negocios Calificación: 0 de 5 estrellas0 calificacionesAnálisis estadístico de datos categóricos Calificación: 0 de 5 estrellas0 calificacionesCómo entender estadística fácilmente Calificación: 4 de 5 estrellas4/5Procesos estocásticos con aplicaciones Calificación: 5 de 5 estrellas5/5Econometría aplicada usando stata 13 Calificación: 4 de 5 estrellas4/5Principios de estadística aplicada Calificación: 0 de 5 estrellas0 calificacionesDiseño de Experimentos [Métodos y Aplicaciones] Calificación: 0 de 5 estrellas0 calificacionesEstadística básica para los negocios Calificación: 0 de 5 estrellas0 calificacionesEconometría: modelos econométricos y series temporales. Tomo 2: Con los paquetes micro-TSP y TSP Calificación: 0 de 5 estrellas0 calificacionesBioestadística Calificación: 2 de 5 estrellas2/5Econometría I: manual de Eviews: Estimulación de un modelo de exportación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a los análisis estadísticos en R Calificación: 0 de 5 estrellas0 calificacionesMétodos numéricos Calificación: 5 de 5 estrellas5/5Introducción al análisis de supervivencia avanzada Calificación: 0 de 5 estrellas0 calificacionesEconometría aplicada: Usando Eviews 10.0 Calificación: 5 de 5 estrellas5/5Métodos Bioestadísticos Calificación: 5 de 5 estrellas5/5Econometría fundamental Calificación: 0 de 5 estrellas0 calificacionesEjercicios de econometría: Material de estudio Calificación: 4 de 5 estrellas4/5Matlab: una introducción con ejemplos prácticos Calificación: 0 de 5 estrellas0 calificacionesPrincipios de Econometría Calificación: 5 de 5 estrellas5/5Introducción a la matemática discreta Calificación: 5 de 5 estrellas5/5Cálculo avanzado. Introducción Calificación: 0 de 5 estrellas0 calificaciones
Matemática para usted
Introducción a las matemáticas Calificación: 3 de 5 estrellas3/5¿Soy yo normal?: Filias y parafilias sexuales Calificación: 5 de 5 estrellas5/5Probabilidad y estadística: un enfoque teórico-práctico Calificación: 4 de 5 estrellas4/5Matemática fundamental para matemáticos Calificación: 5 de 5 estrellas5/5Manual de preparación PSU Matemática Calificación: 4 de 5 estrellas4/5Estadística inferencial aplicada Calificación: 5 de 5 estrellas5/5Geometría sagrada: Desvelando el significado espiritual de varias formas y símbolos Calificación: 0 de 5 estrellas0 calificacionesRazonamiento Lógico Matemático para la toma de decisiones Calificación: 4 de 5 estrellas4/5Dignos de ser humanos: Una nueva perspectiva histórica de la humanidad Calificación: 4 de 5 estrellas4/5Matemáticas básicas 2ed. Calificación: 4 de 5 estrellas4/5Cálculo integral: Técnicas de integración Calificación: 4 de 5 estrellas4/5Estadística básica: Introducción a la estadística con R Calificación: 5 de 5 estrellas5/5Fundamentos de matemática: Introducción al nivel universitario Calificación: 3 de 5 estrellas3/5Aplicaciones de las funciones algebraicas Calificación: 5 de 5 estrellas5/5Álgebra clásica Calificación: 0 de 5 estrellas0 calificacionesEl gran teatro del mundo Calificación: 5 de 5 estrellas5/5Introducción a la geometría Calificación: 5 de 5 estrellas5/5Pitágoras y su teorema Calificación: 4 de 5 estrellas4/5Estadística descriptiva, regresión y probabilidad con aplicaciones Calificación: 5 de 5 estrellas5/5Teoría de juegos: Una introducción matemática a la toma de decisiones Calificación: 4 de 5 estrellas4/5No leer Calificación: 4 de 5 estrellas4/5Qué es (y qué no es) la estadística: Usos y abusos de una disciplina clave en la vida de los países y las personas Calificación: 5 de 5 estrellas5/5Laboratorio lector: Para entender la lectura Calificación: 5 de 5 estrellas5/5Matemáticas básicas 4ed Calificación: 5 de 5 estrellas5/5Inteligencia matemática Calificación: 4 de 5 estrellas4/5La belleza de las matemáticas Calificación: 4 de 5 estrellas4/5Estadística Descriptiva y Probabilidad Calificación: 5 de 5 estrellas5/5La Física - Aventura del pensamiento Calificación: 5 de 5 estrellas5/5CeroCeroCero: Cómo la cocaína gobierna el mundo Calificación: 4 de 5 estrellas4/5
Categorías relacionadas
Comentarios para Introducción al análisis estadístico multivariado aplicado
2 clasificaciones0 comentarios
Vista previa del libro
Introducción al análisis estadístico multivariado aplicado - Martín Díaz Rodríguez
productivo.
CAPÍTULO 1
Conceptos preliminares
1.1 Introducción
El proceso de investigación en general supone un conjunto de etapas que comienzan con la indagación preliminar y la revisión del conocimiento existente sobre algún fenómeno objeto de la investigación (fase previa), para después concretar los objetivos y formular hipótesis de partida, delimitando el alcance y las características generales de la investigación.
Cuando se recurre a datos primarios, se diseña todo el proceso de trabajo de campo (entrevistas, características, muestras, etc.), para seguidamente pasar a la acción. Tras realizar toda esta planificación, ejecutarla y depurarla, lo siguiente es el análisis de los datos obtenidos.
Dada la gran variedad de opciones de análisis de datos, es necesario recurrir a algún criterio de clasificación que permita un mejor manejo de las diferentes posibilidades. Un criterio de clasificación muy utilizado es el que se centra en el número de variables.
Para establecer qué métodos multivariados se deben usar se suele recurrir a tres criterios:
1. La distinción o no entre las variables utilizadas en el análisis
Entre las técnicas de no distinción entre variables (técnicas de interdependencia) tenemos, entre otras, el análisis factorial y el análisis de cluster.
Entre las técnicas de distinción entre variables (se distingue entre variables explicativas (independientes) y variables explicadas (dependiente)) podemos mencionar, entre otras, el análisis de regresión y el análisis discriminante.
2. La escala de medidas de las variables
Algunas veces se requiere que las variables estén definidas en escala métrica, otras veces sean categóricas y otras de ambos tipo, tales como en el análisis de regresión, análisis de correspondencia y análisis de varianza, respectivamente.
3. Número de las variables que se analizan simultáneamente
En el caso de las técnicas de interdependencia, el número de variables estará determinado por los planteamientos teóricos de la investigación, mientras que en las técnicas de dependencia, el número de variables dependiente determinará el análisis estadístico que se deberá utilizar.
1.2 Técnicas de interdependencia
Son técnicas con un interés eminentemente descriptivo que permiten un mejor conocimiento de la realidad medida por estas variables. En este texto solo estudiaremos las siguientes:
1. Análisis de componentes principales
Análisis mediante el cual a partir de las variables originales métricas se busca generar nuevas variables no correlacionadas que recojan toda la variabilidad de las variables originales.
2. Análisis factorial
Análisis mediante el cual se busca generar a partir de las variables métricas del problema un número menor de variables (casos) métricas no correlacionadas (generalmente) que expresen la misma información o, por lo menos, en un alto porcentaje la información que expresan las variables originales.
3. Análisis de correspondencia
Como el anterior, trata de descubrir y describir dimensiones fundamentales de un fenómeno pero con la particularidad de trabajar con variables categóricas.
4. Análisis de cluster
Comprende diferentes técnicas en las que, dado un conjunto de variables, se obtienen subconjuntos ya sea de casos o de variables, intentando que cada subconjunto sea lo más homogéneo posible internamente y lo más diferente posible de los demás.
1.3 Técnicas de dependencia
Son técnicas de distinción de variables; en tal distinción se admite que una o unas variables independientes condicionen los valores de otra u otras variables dependientes. De las técnicas de dependencia estudiaremos, entre otras, las siguientes:
1. Análisis de varianza
La característica del modelo es: una variable o más variables métricas dependientes y una o más variables no métricas independentes.
2. Análisis de regresión
La característica del modelo es : una variable dependiente (explicada) métrica y una o más variables independientes (explicativas) también métrica. Mencionaremos solo el caso en el que la variable dependiente se expresa como una combinación lineal de las variables independientes.
3. Análisis discriminante
La característica del modelo es: una variable dependiente (explicada) no métrica y una o más variables independientes (explicativas) métrica.
La variable dependiente se expresa como una combinación lineal de las variables independientes. Esta técnica requiere del supuesto de normalidad multivariada del conjunto de variables independientes en cada uno de los grupos definidos por la variable dependiente.
4. Análisis de regresión logística
La característica del modelo es : una variable dependiente (explicada) no métrica y una o más variables independientes (explicativas) métrica.
Esta técnica no requiere del supuesto de normalidad multivariada del conjunto de variables indepenientes.
1.4 Conceptos básicos del álgebra lineal
Antes de entrar de lleno en materia es necesario tener claro algunos conceptos del álgebra lineal básicos para el buen desarrollo de este texto, tales como el concepto de vector en ℝn, norma de un vector, producto escalar, proyección de un vector, ángulo entre dos vectores, vectores ortogonales, dependencia lineal entre vectores, matriz, matriz triangular, matriz simétrica, matriz ortogonal, sistemas de ecuaciones lineales, determinantes, vectores y valores propios de una matriz. Estos conceptos pueden ser leídos en el texto de introducción al álgebra lineal para las ciencias económicas de M. Díaz, V. Obeso y M. Navarro (2009). En este texto solo presentaremos los temas relacionados con vectores y valores propios de una matriz.
1.5 Vectores en ℝ n
Desde un punto de vista geométrico, un vector se puede definir por:
Definición 1.5.1. Un vector es un segmento de recta dirigido, con un punto inicial llamado origen y un punto final llamado extremo del vector.
Desde el punto de vista algebraico, un vector lo podemos definir así:
Definición 1.5.2. Vectores en ℝ²
Un vector en ℝ² es un par ordenado (a, b)′ de números reales, donde ℝ² es el conjunto de todos los vectores ubicados en el espacio bidimensional. En forma análoga definimos vectores en ℝ³ como ternas (a1, a2, a3)′ de números reales; y en términos generales, vectores en ℝn, como n-uplas (a1, a2, ..., an)′ de números reales.
Definición 1.5.3. Norma de un vector
Sea = (a1, a2, ..., an) un vector en ℝn, definimos la norma o magnitud de un vector , denotado así:
es:
es siempre no negativa y representa la distancia que hay entre el origen y el extremo del vector.
Un vector se dice que es unitario si su norma es igual a 1.
es un vector unitario.
1.5.1 Traslación de un vector con punto inicial en el origen
Definiremos ahora vectores equivalentes.
Definición 1.5.4. Dos vectores , en ℝn son equivalentes si las diferencias de las coordenadas del punto final y del inicial de cada vector coinciden.
Ejemplo 1.5.1. El vector , con punto inicial en (5,1) y su punto final en (7,2), y el vector , que tiene su punto inicial en (7,3) y su punto final en (9,4), son equivalentes, ya que la diferencia (7,2)-(5,1)=(2,1) y la diferencia (9,4)-(7,3)=(2,1). Como podemos ver, las diferencias de las coordenadas del punto final y del inicial de cada vector coinciden.
En la gráfica se muestran los dos vectores del ejemplo anterior:
Figura 1.5.1. Vectores equivalentes
Ejemplo 1.5.2. El vector , con punto inicial en (2,3,8) y su punto final en (4,1,6), y el vector , que tiene su punto inicial en (5,6,5) y su punto final en (7,4,3), son equivalentes, ya que la diferencia (4,1,6)-(2,3,8)=(2,-2,-2) y la diferencia (7,4,3)-(5,6,5)=(2,-2,-2). Como podemos ver, las diferencias de las coordenadas del punto final y del inicial de cada vector coinciden.
Teorema 1.5.1. Dados dos puntos del espacio n-dimensional, punto inicial A=(a1, a2, ..., an)′ y punto final B=(b1, b2, ..., bn)′, entonces el vector que tiene su origen en el punto A y su extremo en el punto B, denotado es equivalente al vector anclado (con punto inicial en el origen del sistema de coordenadas rectangulares): (b1 − a1, b2 − a2, ..., bn − an)′.
Note que de acuerdo con lo anterior, todo vector no anclado en el origen del sistema de coordenadas rectangulares tiene un equivalente cuyo origen o punto inicial es el origen del sistema de coordenadas rectangulares.
Definición 1.5.5. Sean = (u1, u2, ..., un) y = (v1, v2, ..., vn) dos vectores en el espacio n-dimensional, se dice que los vectores son iguales, y lo denotamos si y solo si las componentes correspondientes de los dos vectores son iguales, es decir, u1 = v1, u2 = v2, u3 = v3,..., un = vn.
Ejemplo 1.5.3. Dados los vectores = (5, 3, 6, −= (10/2, 3, 36/6, −4) y = (8, 0, 7, 3), note que los vectores son iguales, mientras que el vector no es igual ni a
Ejemplo 1.5.4. Dados los vectores = (5, a, 6, b) y = (c, 3, d, −4), si , ¿ cuáles son los valores de a, b, c, d ?
De acuerdo con la definición, a = 3, b = −4, c = 5 y d = 6.
1.5.2 Operaciones entre vectores
Definición 1.5.6. Sean = (u1, u2, ..., un) y = (v1, v2, ..., vn) dos vectores en el espacio n-dimensional, definimos el vector suma de los vectores , denotado como el vector que tiene como componentes la suma de las componentes correspondientes de los vectores en notación:
= (u1 + v1, u2 + v2, ..., un + vn).
Ejemplo 1.5.5. Dados los vectores
= (−= (6, 4, 3, −12) y = (8, 15, −9, 21), entonces = (1, 10, 6, 2) y = (3, 21, −6, 35).
Definición 1.5.7. Multiplicación de un escalar por un vector
Se a = (u1, u2, ..., un) un vector en el espacio n-dimensional, y sea k un número real (escalar), definimos el producto del escalar k por el vector denotado como el vector que tiene como componentes k veces las componentes correspondientes de es decir , = (ku1, ku2, ..., kun).
Ejemplo 1.5.6. Dados los vectores
= (5, 6, 3, −4) y = (16, 14, 13, −12),
entonces = (15, 18, 9, −= (64, −56, −52, 48).
Definiremos la sustracción de vectores así:
Definición 1.5.8. Sean vectores en ℝn, definimos ).
Ejemplo 1.5.7. Dados los vectores
= (7, 1, 26, 63, 34) y
= (7, 36, 44, 63, 22) , entonces
= (14, 35, 18, 0, 12).
Definición 1.5.9. Sea = (u1, u2, ..., un) y = (v1, v2, ..., vn) dos vectores en el espacio n-dimensional, definimos el producto escalar de por denotado así:
= u1.v1 + u2.v2 + ... + unvn
Ejemplo 1.5.8. Dados los vectores
= = y = (4, 5, 9, 1), entonces → = 3(4)+4(5)+3(9)+4(1) = 15. ¿cuál es el resultado de
El siguiente teorema es usado para hallar el ángulo entre dos vectores. La demostración se escribe para dos dimensiones sin perder la generalidad de las afirmaciones.
Teorema 1.5.2. Dados los vectores
= (u1, u2, ..., un= (v1, v2, ..., vn), entonces
= cos(α), siendo α el ángulo entre ellos.
Demostración 1. Se demostrará el teorema para el caso en dos dimensiones. Sin perder generalidad, tomemos el triángulo que se muestra a continuación, cuyos lados son los dos vectores y α, el ángulo entre ellos.
Figura 1.5.2. Ángulo entre dos vectores
Aplicando el teorema del coseno en el triángulo anterior obtenemos:
cos(θ); despejando cos(θ) obtenemos:
Ejemplo 1.5.9. Halle el ángulo entre la diagonal de un cubo y una de sus caras.
Demostración 1. En la figura se presentan los datos necesarios para la solución del problema. Como = (l, l, l) y = (l, l, 0), entonces cos(θ) = con
Figura 1.5.3. Ángulo entre la diagonal de un cubo y una de sus caras
lo cual encontramos que
cos(θ) =
=
= entonces el ángulo θ = 35.3◦.
Ejemplo 1.5.10. Halle el ángulo entre los vectores = (2, 6, 1) y = (5, 2, 9).
Demostración 2. Como cos(θencontramos que
entonces el ángulo θ = 62.5◦.
Si el ángulo entre dos vectores es de 90 grados, se dice que los vectores son ortogonales.
Teorema 1.5.3. Sean dos vectores en ℝn, entonces |
para todo la igualdad se cumple cuando para algún λ∈ℝ.
1.5.3 Ejercicios
1. Sean
= (1, 3, 5)
= (−1, 12, 35)
= (15, 33, 52)
= (−11, −23, 35)
= (51, 33, −65)
= (31, 83, 52)
halle:
2. Si el punto inicial de un vector
es (1, 3, 2)′ y el punto final es (4, 6, −3)′, halle el vector:
1.5.4 Combinación e independencia lineal
Definición 1.5.10. Combinación lineal
Sean
vectores de ℝn, se dice que el vector es una combinación lineal de los vectores si y solo si existen escalares c1, c2, ..., ck ∈ ℝ tal que
Definición 1.5.11. Independencia lineal
Sean vectores de ℝn, se dice que ellos son linealmente independientes si la combinación
implica que c1 = c2 = ··· = cn = 0.
Si los k vectores no son linealmente independientes, se dice que son linealmente dependientes.
El siguiente ejemplo ilustra el concepto de combinación lineal.
Ejemplo 1.5.11. Demostrar que el vector = (24, 1) es combinación lineal de los vectores = (3, 4) y = (6, −3).
Demostración 3. Por definición, debemos encontrar escalares c1 y c2 tales que la expresión
sea verdadera, es decir, hallar c1 y c2 en la siguiente ecuación vectorial:
esto genera el siguiente sistema de ecuaciones lineales:
3c1 + 6c2 = 24
4c1 − 3c2 = −1,
en el cual podemos aplicar el método de Gauss-Jordan y obtenemos la siguiente solución:
c1 = 2 y c2 = 3; note que 2(3, 4)′ + 3(6, −3)′ = (6, 8)′ + (18, −9)′ = (24, −1)′.
Ejemplo 1.5.12. Demostrar que el vector = (−14, 32, 33) es combinación lineal de los vectores = (2, 4, 5) y = (−6, 3, 2).
Demostración 4. Por definición, debemos encontrar escalares c1 y c2 tales que la expresión
sea verdadera, es decir, hallar c1 y c2 en la siguiente ecuación vectorial:
(−14, 32, 33)′ = c1(2, 4, 5)′ + c2(−6, 3, 2)′; esto genera el siguiente sistema de ecuaciones:
2c1 − 6c2 = −14
4c1 +3c2 = 32
5c1 +2c2 = 33,
en el cual podemos aplicar el método de Gauss-Jordan y obtenemos la siguiente solución:
c1 = 5 y c2 = 4; note que 5(2, 4, 5)′ +4(−6, 3, 2)′ = (10, 20, 25)′ +(−24, 12, 8)′ = (−14, 32, 33)′.
Ejemplo 1.5.13. Dados los vectores y = (3, 4, 1), mostraremos que son linealmente independientes.
Tomemos la combinación lineal de esos vectores y la igualamos al vector cero, o sea,
Entonces, obtenemos el siguiente sistema de ecuaciones lineales:
2c1 +3c2 = 0
3c1 +4c2 = 0
5c1 + c2 = 0
Aplicando Gauss-Jordan obtenemos que c1 = c2 = 0, lo cual implica que los vectores son linealmente independientes.
Ejemplo 1.5.14. Ahora mostraremos que los vectores = (2, 3, 5) y = (6, 9, 15) son linealmente dependientes.
Como en el ejemplo anterior, obtenemos un sistema de ecuaciones lineales homogéneo:
2c1 +6c2 = 0
3c1 +9c2 = 0
5c1 +15c2 = 0
en el cual, aplicando el método de Gauss Jordan, se obtiene:
Como hay más incógnitas que ecuaciones, el sistema tiene infinitas soluciones, entre ellas la trivial. Esto conlleva a la afirmación Los dos vectores son linealmente dependientes
.
Nótese que uno de los vectores es un múltiplo escalar del otro: 3(2, 3, 5)′ = (6, 9, 15)′.
Si cualquier vector de ℝn , se dice que este conjunto de vectores generan a ℝn.
1.5.5 Autovalores y autovectores
Se presentará la definición solo para matrices simétricas.
Definición 1.5.12. Sea A una matriz cuadrada de orden n y λℝ, se dice que λ es un valor propio (autovalor) de la matriz A si existe un vector en ℝn tal que
es entonces llamado el vector propio o autovector de A correspondiente al autovalor λ.
De la definición anterior es fácil ver que λ es un valor propio de la matriz A si det(A − λIn) = 0.
Nota 1. Note que si es un autovector de la matriz A, entonces también lo es.
Definición 1.5.13. Una proyección ortogonal, P, es simplemente una transformación lineal, para la cual
para todo
Definición 1.5.14. Sea A una matriz simétrica de orden n y un vector de ℝn, se dice que A es una matriz definida positiva si para todo .
Ejemplo 1.5.15. Si