UF2215 - Herramientas de los sistemas gestores de bases de datos. Pasarelas y medios de conexión
()
Información de este libro electrónico
Para ello, se analizarán los sistemas de gestión de BD, los sistemas de análisis de la información y las herramientas CASE. También se estudiarán los entornos
4GL, el desarrollo de aplicaciones, y se profundizará en las tecnologías de conectividad a BD.
Tema 1. Sistemas de gestión de BD.
1.1 Funcionalidades y objetivos.
1.2 Arquitectura funcional.
1.3 El componente de procesamiento de peticiones
1.4 El componente de gestión de los datos
1.5 Gestión del rendimiento
1.6 Herramientas
Tema 2. Sistemas de análisis de la información.
2.1 Minería de datos.
2.2 OLAP.
2.3 Dashboard/scorecard.
2.4 Herramientas
Tema 3. Herramientas CASE.
3.1 Concepto.
3.2 Historia y evolución.
3.3 Clasificación
3.4 Componentes y funcionalidades de una herramienta CASE.
Tema 4. Entornos 4GL.
4.1 Tipología.
4.2 Componentes y funcionalidades.
4.3 Generadores de informes.
4.4 Generadores de formularios.
4.5 Generadores de gráficos
4.6 Generadores de aplicaciones.
4.7 Nuevas tendencias.
Tema 5. Desarrollo de aplicaciones
5.1 Órdenes embebidas.
5.2 Uso de bibliotecas de funciones.
5.3 Diseño de nuevos lenguajes.
Tema 6. Tecnologías de conectividad a BD.
6.1 OLEDB.
6.2 ODBC.
6.3 JDBC.
6.4 SQLJ.
6.5 SQL/CLI.
Relacionado con UF2215 - Herramientas de los sistemas gestores de bases de datos. Pasarelas y medios de conexión
Libros electrónicos relacionados
UF2176 - Definición y manipulación de datos Calificación: 0 de 5 estrellas0 calificacionesUF2175 - Diseño de bases de datos relacionales Calificación: 0 de 5 estrellas0 calificacionesUF1889 - Desarrollo de componente software en sistemas ERP-CRM Calificación: 0 de 5 estrellas0 calificacionesUF0348 - Utilización de las bases de datos relacionales en el sistema de gestión y almacenamiento de datos Calificación: 0 de 5 estrellas0 calificacionesUF1882 - Instalación de sistemas operativos y gestores de datos en sistemas ERP-CRM Calificación: 0 de 5 estrellas0 calificacionesUF1473 - Salvaguarda y seguridad de los datos Calificación: 0 de 5 estrellas0 calificacionesUF2218 - Desarrollo de un CMS Calificación: 0 de 5 estrellas0 calificacionesUF1890 - Desarrollo de componente software y consultas dentro del sistema de almacén de datos Calificación: 0 de 5 estrellas0 calificacionesUF1888 - Operaciones de mantenimiento y consulta de datos Calificación: 0 de 5 estrellas0 calificacionesUF1471 - Bases de datos relacionales y modelado de datos Calificación: 0 de 5 estrellas0 calificacionesUF1884 - Almacenamiento de datos en sistemas ERP-CRM Calificación: 0 de 5 estrellas0 calificacionesUF1887 - Operaciones de seguridad en sistemas ERP-CRM y almacén de datos Calificación: 0 de 5 estrellas0 calificacionesUF1306 - Pruebas de funcionalidades y optimización de páginas web Calificación: 0 de 5 estrellas0 calificacionesUF2405 - Modelo de programación web y bases de datos Calificación: 0 de 5 estrellas0 calificacionesUF1472 - Lenguajes de definición y modificación de datos SQL Calificación: 0 de 5 estrellas0 calificacionesCurso de Introducción a la Administración de Bases de Datos Calificación: 3 de 5 estrellas3/5UF1272 - Administración y auditoría de los servicios web Calificación: 0 de 5 estrellas0 calificacionesUF1468 - Almacenamiento de la información e introducción a SGBD Calificación: 0 de 5 estrellas0 calificacionesUF1469 - SGBD e instalación Calificación: 0 de 5 estrellas0 calificacionesUF1275 - Selección, instalación, configuración y administración de los servidores de transferencia de archivos Calificación: 0 de 5 estrellas0 calificacionesUF2213 - Modelos de datos y visión conceptual de una base de datos Calificación: 0 de 5 estrellas0 calificacionesSgbd e instalación. IFCT0310 Calificación: 0 de 5 estrellas0 calificacionesUF1467 - Aplicaciones microinformáticas e internet para consulta y generación de documentación Calificación: 0 de 5 estrellas0 calificacionesUF1883 - Instalación de sistemas ERP-CRM Calificación: 0 de 5 estrellas0 calificacionesUF1643 - Gestión y control de los sistemas de Información Calificación: 0 de 5 estrellas0 calificacionesUF1885 - Administración del sistema operativo en sistemas ERP-CRM Calificación: 0 de 5 estrellas0 calificacionesUF2177 - Desarrollo de programas en el entorno de la base de datos Calificación: 0 de 5 estrellas0 calificacionesImplantación de aplicaciones web en entornos internet, intranet y extranet. IFCD0210 Calificación: 0 de 5 estrellas0 calificacionesComputadores para bases de datos. IFCT0310 Calificación: 0 de 5 estrellas0 calificacionesUF2404 - Principios de la programación orientada a objetos Calificación: 0 de 5 estrellas0 calificaciones
Negocios para usted
Colección De Hábitos. 97 Pequeños Cambios De Vida Que Toman 5 Minutos O Menos. Calificación: 4 de 5 estrellas4/5El año de 12 semanas: Logra en 12 semanas lo que otros hacen en 12 meses Calificación: 5 de 5 estrellas5/5Padre Rico, Padre Pobre de Robert Kiyosaki (Análisis de la obra): La riqueza al alcance de todos Calificación: 4 de 5 estrellas4/5Frases que Venden: Descubre cómo promocionar tus productos, atraer clientes y cerrar las ventas Calificación: 4 de 5 estrellas4/5Ideas que pegan (2ª Edición): Por qué algunas ideas sobreviven y otras mueren Calificación: 5 de 5 estrellas5/5Planeación estratégica. Fundamentos y casos Calificación: 4 de 5 estrellas4/5Secretos judíos del dinero Calificación: 4 de 5 estrellas4/5Rica mente: El juego interior de la riqueza Calificación: 5 de 5 estrellas5/523 Hábitos Anti-Procrastinación Cómo Dejar De Ser Perezoso Y Tener Resultados En Tu Vida. Calificación: 4 de 5 estrellas4/5Administración-Fundamentos: Cómo iniciarse en el estudió de la administración Calificación: 5 de 5 estrellas5/5Libertad financiera: Los cinco pasos para que el dinero deje de ser un problema Calificación: 5 de 5 estrellas5/5Resumen de El poder del hábito de Charles Duhigg Calificación: 5 de 5 estrellas5/5Las 21 leyes irrefutables del liderazgo, cuaderno de ejercicios: Revisado y actualizado Calificación: 4 de 5 estrellas4/5El secreto de los grandes empresarios Calificación: 4 de 5 estrellas4/5Enfócate en resultados: Alto rendimiento para la vida y el trabajo Calificación: 4 de 5 estrellas4/5Cómo tratar con gente difícil Calificación: 4 de 5 estrellas4/5Cómo Invertir En El Mercado De Valores Para Principiantes Calificación: 4 de 5 estrellas4/5Detalles que enamoran: Cómo derretir a los clientes para que no quieran comprarle a nadie más Calificación: 5 de 5 estrellas5/5MBA: Guía visual. Todo lo que aprendí en dos años en la escuela de negocios Calificación: 5 de 5 estrellas5/5Sistema de Indicadores de Gestión Calificación: 4 de 5 estrellas4/5Libertad, libertad, libertad: Para romper las cadenas que no nos dejan crecer Calificación: 3 de 5 estrellas3/5PLAN DE NEGOCIOS Calificación: 4 de 5 estrellas4/5Secretos para cerrar la venta Calificación: 5 de 5 estrellas5/5Aprende a pensar como un gurú: Las 10 fuerzas del pensamiento crítico Calificación: 4 de 5 estrellas4/5
Comentarios para UF2215 - Herramientas de los sistemas gestores de bases de datos. Pasarelas y medios de conexión
0 clasificaciones0 comentarios
Vista previa del libro
UF2215 - Herramientas de los sistemas gestores de bases de datos. Pasarelas y medios de conexión - José Luis Ávila Jiménez
1.1. Funcionalidades y objetivo
1.2. Arquitectura funcional
1.3. El componente de procesamiento de peticiones
1.3.1. Seguridad
1.3.2. Concurrencia
1.3.3. Transaccionalidad
1.3.4. Procesamiento de consultas
1.3.4.1. Optimización semántica
1.3.4.2. Optimización sintáctica
1.3.4.3. Optimización física
1.4. El componente de gestión de los datos
1.4.1. Restauración
1.4.2. Reconstrucción
1.5. Gestión del rendimiento
1.5.1. Plan de consultas
1.5.2. Monitores
1.5.3. Benchmarks
1.6. Herramientas
1.6.1. Administración
1.6.2. Importación/exportación masiva de datos
1.6.3. Acceso y consulta de datos
1.1.Funcionalidades y objetivo
Sabías que...
El concepto de bases de datos surgió en los años 60. Anteriormente solamente se utilizaban ficheros planos para el almacenamiento de la información procesada por un sistema informático.
Los ficheros planos son ficheros generalmente no relacionados entre si, y por tanto para reflejar la interrelación entre la información se ha de utilizar enlaces lógicos o físicos. Pero este sistema conlleva numerosas desventajas; entre ellas podemos citar la dificultad para mantener la integridad de los datos y la gran cantidad de redundancia (datos repetidos) necesaria.
Además los ficheros dependen fuertemente de la aplicación con la que eran tratados, es decir, cada aplicación utiliza sus propios ficheros y esto hace complicado compartir información entre ellas.
Por todos estos motivos, en una etapa temprana del desarrollo de la informática, comenzaron a desarrollarse los sistemas de bases de datos, incorporando, conforme la tecnología ha ido avanzando, las características que en la actualidad poseen.
Una base de datos debe cumplir una serie de características. Para que un sistema pueda ser considerado una base de datos ha de poseer una serie de características para ser considerado como tal:
Independencia de los datos con respecto a los procedimientos: como ya se ha mencionado, uno de los factores que influyó en la génesis de las bases de datos fue la necesidad de mantener una independencia entre los datos y los programas que los utilizan.
Generalmente en las organizaciones los programas de aplicación suelen cambiar cada poco tiempo, sin embargo los datos, y sobre todo la estructura subyacente a esos datos suele permanecer con pocas variaciones durante bastante tiempo. Por ello en épocas tempranas de la informática se vio la necesidad de independizar los datos con respecto a los procedimientos que los manejan.
La independencia de los datos con respecto a los procedimientos también supone que la visión conceptual de dichos datos no ha de ser necesariamente la misma que la visión física, es decir, los datos relativos a un mismo problema han de ser representados conceptualmente de la misma forma independientemente del dispositivo físico que se utilice.
Importante
Es por ello que la independencia de los datos con respecto a los procedimientos que la manejan ha de ser satisfecha a dos niveles de abstracción: independencia lógica de los datos por la que la modificación de la representación lógica del dominio del problema no debe de afectar a los programas de aplicación que maneja los datos e independencia física por la que la distribución en las unidades de almacenamiento y la estructura física de la información debe de ser independiente de los cambios en la estructura lógica de la información.
Otra característica importante de las bases de datos es la versatilidad para la representación de la información: si bien la estructura de la información es única, diferentes procedimientos pueden hacer un uso distinto de ella.
Por esta razón la organización de la información en las bases de datos debe permitir que diferentes procedimientos puedan construir diferentes registros a partir de la información existente en la base de datos. Estos registros lógicos estarán formados por ítems de datos pertenecientes al dominio del problema que se quiere representar y son derivados de los ítems de datos existentes en dicho dominio. Por supuesto para garantizar la independencia física antes mencionada, estos registros han de ser independientes de los registros físicos que utilice la base de datos para almacenar la información.
Definición
Se denomina redundancia a la existencia de varias copias de un mismo ítem de datos, las cuales en un momento determinado pueden tener distintos valores.
Además de por el espacio desaprovechado la redundancia es nefasta debido a las posibilidades de inconsistencia en la información almacenada; de hecho uno de los principales motivos por los que surgió la tecnología de las bases de datos fue para evitar la alta redundancia que implica un sistema de archivos planos.
Sin embargo las bases de datos no elimina, ni sería deseable que eliminaran, cualquier redundancia existente en la información perteneciente al dominio de un problema determinado. Esto es debido a que es necesario representar todas las relaciones existentes entre las entidades que pertenecen a dicho dominio.
Importante
Si han de existir diversas copias de un mismo ítem de datos es necesario establecer procedimientos que garanticen la consistencia de la Información cuando dichas copias vayan a ser utilizadas por diversos procedimientos, posiblemente al mismo tiempo.
Por otro lado también es necesario establecer procedimientos para permitir que un mismo ítem de datos pueda ser accedido por varios procedimientos al mismo tiempo.
Definición
El concepto de integridad hace referencia a la veracidad de los datos almacenados con respecto a la información que realmente caracteriza el dominio del problema en un momento dado.
Ya que los datos van a ser accedidos por diversos procedimientos de diversa índole, en necesario garantizar que dichos datos no sean destruidos ni modificados de forma anómala. Esto también incluye el hecho de que el sistema que maneje la información ha de garantizar la consistencia de esta frente a todo tipo de errores tanto hardware como software que se puedan producir.
Simplicidad: una base de datos debe de estar basada en una representación lógica simple pero potente que permita tanto la representación de la información y sus relaciones de cualquier problema que se pueda plantear como la fácil verificación del problema que representa, así como las modificaciones necesarias de los requerimientos del mismo de manera que la inclusión de nuevos ítems de datos o nuevas relaciones entre ellos no cause una complejidad excesiva.
Importante
Seguridad y privacidad: la seguridad de una base de datos hace referencia a la capacidad de ésta para proteger los datos contra pérdidas accidentales, causadas por fallos en la infraestructura informática (tanto hardware como software). La privacidad se refiere a la reserva de la información a personas no autorizadas.
Definición
La denominada arquitectura de referencia
hace referencia a los diferentes niveles de visión de los datos que pueden aparecer en una base de datos.
Una base de datos, dependiendo del tipo de usuario que acceda a los datos debe presentarle una visión de éstos que sea capaz de manejar, interpretar y reconocer. Además la organización física de los datos debe ser lo más independiente posible de los procedimientos que manejen dicha información, así como de los posibles cambios que puedan ir apareciendo en el dominio del problema.
Es por esta razón que en una base de datos deben de poder distinguirse tres tipos de visiones de los datos:
–Visión externa: es la visión de los datos que tiene los usuarios de la base de datos. Habrá tantas visiones externas como tipos de usuarios diferentes utilicen una base de datos.
–Visión conceptual: es una representación del dominio del problema tal y como este se presenta en el mundo real. Es una representación abstracta e independiente de cómo va a ser tratada dicha información. La visión conceptual no debe de experimentar cambios a menos que cambie la naturaleza del problema a representar por la base de datos.
–Visión física: es una representación de cómo la información va ser guardada en los dispositivos de almacenamiento.
Importante
Estas tres formas de descripción son en realidad tres niveles de abstracción diferentes a los que se describe el mismo problema. La descripción a tres niveles garantiza la independencia de los datos de tal manera que se cumplan las siguientes características:
Pueda ser cambiada la organización física de los datos sin necesidad de que sea cambiada la descripción conceptual, ni los programas de usuario que utilizan las visiones externas.
Pueda ser cambiada la representación conceptual sin necesidad de modificar la organización física de los datos ni las visiones externas (siempre que no se eliminen descripciones de datos que utilicen).
Pueda ser cambiadas las visiones externas conforme aparezcan nuevos requisitos para los programas de usuario.
Importante
El nivel conceptual describe el sistema tal y como es, de manera independiente a como esté va ser tratado por los procedimientos automatizados, y por esto es necesario añadir otro nivel de abstracción, que llamaremos nivel lógico o canónico, que será derivado del conceptual, aplicándole una serie de reglas y restricciones que tendrán en cuenta cómo la información representada puede ser tratada por los procedimientos que van a manejar y definir la información.
Una vez introducidos todos los conceptos anteriores, tanto las características deseables de una base de datos como los niveles de descripción de los datos, podemos dar una definición formal de base de datos de la siguiente manera:
Definición
Se denomina base de datos a una colección de archivos que almacena tanto una representación abstracta del dominio de un problema como los datos correspondientes a la información acerca del mismo. Tanto la representación como los datos estarán sujetos a una serie de restricciones, las cuales también forman parte del dominio del problema y que se almacenarán también en dichos ficheros.
Icono utilizado para representar las bases de datos a modo de bloques
Importante
Es importante diferenciar entre lo que es una base de datos y los que es un Sistema Gestor de Bases de datos (SGBD), dos términos que suelen confundirse a menudo cuando se utilizan estas tecnologías.
Anteriormente se ha definido lo que es una base de datos, definiéndola y describiendo una serie de características que debe de cumplir y restricciones que deben de darse para que una base de datos pueda ser considerada como tal.
Definición
Para que la información pueda ser almacenada de la forma descrita anteriormente, es necesario disponer de una serie de procedimientos, es decir, un sistema software, que sea capaz de llevar a cabo esta labor. A este sistema se le denomina Sistema Gestor de Bases de datos.
Un sistema gestor de bases de datos debe de permitir llevar a cabo las siguientes funciones:
–Definición de los datos: ha de permitir definir tanto la estructura como el contenido de los datos a almacenar a los distintos niveles de abstracción (físico, lógico y externo).
Manipulación de los datos de la base de datos: realización de consultas sobre los datos almacenados, con criterios arbitrarios y tanto consultas previstas como no previstas por el desarrollador; además de las operaciones de inserción, borrado y modificación de dichos datos.
Mantenimiento de la integridad de la base de datos: evitando cualquier tipo de pérdida accidental de los datos en sí, las relaciones existentes entre ellos, así como control de las restricciones que se impongan que deben de satisfacerse se cumplan en cualquier operación de inserción, borrado y modificación.
Control de la privacidad y seguridad de los datos: evitando cualquier pérdida accidental de éstos por cualquier causa de fallo proveniente del entorno, del hardware o del software. Además debe de controlar que solamente los usuarios autorizados puedan acceder a aquellos datos que les esté permitido manipular.
En definitiva, el SGBD debe de poner los medios necesarios para el establecimiento de las características anteriormente mencionadas que deben de exigirse a una base de datos.
Hay muchos tipos de sistemas de bases de datos. Se diferencian fundamentalmente entre sí en el modelo de datos lógico que utilizan. Se pueden distinguir la siguiente tipología de sistemas gestores de bases de datos:
–SGBD Relacionales: la información se almacena a nivel lógico en forma de tablas, denominadas relaciones, almacenándose la estructura de la información utilizando diferentes tipos de definiciones de tablas.
–SGBD Jerárquicos: la información es almacenada siguiendo una estructura arborescente. Los nodos de los árboles representan registros de información y la jerarquía se utiliza para guardar las relaciones entre los distintos tipos de datos.
–SGBD en red: similares a los jerárquicos, con la diferencia de que no necesariamente ha de utilizase una estructura en forma de árbol para representar las relaciones entre los datos.
–SGBD Orientados a Objeto: la información se almacena en forma de objetos que pertenecen a varias clases distintas. Las clases se organizan de forma jerárquica, utilizando la herencia y encapsulan tanto datos como los procedimientos que permiten el acceso a los mismos
Además de la clasificación anterior en base al modelo lógico utilizado, podemos distinguir entre SGBD Centralizados, en los cuales la información se almacena en una sola máquina, y SGBD Distribuidos, en los cuales la base de datos no reside en un solo ordenador, sino en varios host pertenecientes a una red y no necesariamente con la misma ubicación geográfica.
Los SGBD distribuidos presentan una problemática añadida a las bases de datos centralizadas, ya que han de cuidar como separan los ítems de información a lo largo de la red manteniendo la integridad, seguridad y privacidad de los datos.
Además se pueden distinguir los SGBD según el tipo de licencia de software que utilizan. Con el advenimiento de Internet, el software libre se ha consolidado como alternativa, técnicamente viable y económicamente sostenible al software comercial, contrariamente a lo que a menudo se piensa, convirtiéndose el software libre como otra alternativa para ofrecer los mismos servicios a un coste cada vez más reducido.
Estas alternativas se encuentran tanto para herramientas de ofimática como Open office o Microsoft Office. También disponemos de herramientas mucho más avanzadas a un nivel de propósito general como MySQL, SQL Server·y ·si hablamos de software con más potencia y funcionalidad vale la pena señalar a Postgresql u Oracle, entre otros.
No conviene decantarse por uno en concreto, debemos usar en primer lugar lo que mejor nos funciona dadas nuestras restricciones particulares. Así, si solamente quiero una aplicación de agenda puede ser perfectamente válido un Access o incluso un documento Openoffice puede ser válido, incluso en algunas ocasiones un fichero plano o un simple fichero de texto.
Si por el contrario, la base de datos a desarrollar requiere cierta cantidad de accesos de usuarios diversos, control de integridad y otras funcionalidades, se deberían plantear opciones como MySQL.
Finalmente, si hablamos de una gran corporación que requiere herramientas avanzadas para grandes bases de datos en este caso se usan sistemas más potentes como Oracle o Postgresql.
En cuanto a si debe ser libre o no la decisión dependerá de si disponemos de personal cualificado en cuyo caso un sistema libre es más barato y potente. En caso contrario el sistema de pago es la elección más adecuada.
No obstante todas las tecnologías disponen de servicios de soporte de gran calidad.
Por otro lado, los sistemas libres cada vez proveen una mejor y más eficiente documentación tanto a nivel oficial como a través de múltiples foros y blogs, lo que hace que cada vez lo use más gente y mejore continuamente. Sin embargo siempre existe el riesgo de que sea comercializado y deje de estar disponible de forma abierta.
En definitiva a la hora de tomar la decisión de utilizar un SGBD u otro deben sopesarse muchos factores como:
–Documentación.
–Seguridad, control de acceso a los recursos.
–Volúmenes de información que soportará y número de usuarios esperable.
–Complejidad en la migración de los datos.
–Soporte ofrecido.
–Etc.
1.2.Arquitectura funcional
Para llevar a cabo las funciones que tiene encomendadas, los SGBD suelen estar compuestos de varios programas e implementan varios lenguajes para la utilización de los datos. A la división en partes o módulos de un SGBD se le denomina Arquitectura Operacional.
Definición
El lenguaje de definición de datos o DDL (Data Definition Languaje) es un lenguaje artificial basado en un determinado modelo de datos que permite la representación de éstos a nivel lógico.
En algunos SGBD el propio DDL permite definir cómo será estructurado el almacenamiento de los datos a nivel físico, aunque en otros la descripción a nivel físico se realiza utilizando otro lenguaje, el Lenguaje de Definición de Almacenamiento de datos, llamado DSDL (Data Storage Definition Language).
Importante
SQL es un lenguaje tanto de definición de datos como de manipulación de datos almacenados en SGBD relacionales. Utiliza como base los fundamentos matemáticos del álgebra relacional a la que se le ha añadido una semántica que lo hace más cercano al lenguaje natural.
La sintaxis de las operaciones para la definición de los datos la vamos a recordar a continuación:
Creación de tablas: para la creación de tablas utiliza las palabras clave CREATE TABLE seguidas de la descripción de la tabla.
Ejemplo
En este ejemplo se ha creado una relación denominada alumno, con tres atributos, denominados DNI, nombre y apellidos y definiendo el tipo de datos de cada atributo. Se ha indicado que la clave primaria es el atributo DNI y se ha definido una clave foránea sobre el atributo curso que hace referencia a otra relación llamada curso.
La palabra clave CONSTRAINT sirven para dar nombre a una restricción y en su caso poder manipularla.
Modificación de tablas: para la modificación de las tablas se utiliza ALTER TABLE.
Ejemplo
En el siguiente ejemplo le añadimos a la relación anteriormente creada un atributo edad:
Creación de vistas: las vistas consisten en las visiones externas de los datos que utilizan los programas de usuario externos. Es conveniente definirlas aparte de las relaciones para evitar mezclar las visiones externas con el modelo lógico.
Para crear una vista en SQL se utiliza la sintaxis CREATE VIEW seguida por la consulta que devolverá el resultado que se mostrará en esta vista.
Ejemplo
En el siguiente ejemplo creamos una vista solamente con los nombres, apellidos y edad de los alumnos, denominadas nombreedades:
Definición
Lenguaje de manipulación de datos, también denominado DML (Data Manipulation Languaje) Es un lenguaje de programación mediante el cual ser realizan dos tareas bien diferenciadas, la definición del nivel externo y las operaciones de manipulación de la información.
Definición del nivel externo de representación: en esta tarea, mediante el DML se definen una serie de vistas o visiones parciales de los datos que utilizarán los usuarios de la base de datos
La manipulación de los datos consiste en realización de operaciones de inserción, borrado, modificación y consulta de la información almacenada en la base de datos.
Las operaciones básicas que debe permitir realizar el DML de un SGBD son las siguientes:
–Inserción de información: añadir nueva información a la ya almacenada en la base de datos, siempre respetando las restricciones que se hayan definido mediante el DDL así como las necesarias relaciones entre la información existente la nueva y con sí misma.
–Borrado de información: eliminación de información ya existente en la base de datos, siguiendo un determinado criterio y manteniendo las restricciones existentes.
–Modificación de información almacenada en la base de datos.
–Consulta de información: acceso a la información almacenada en la base de datos siguiendo unos determinados criterios. Un SGBD que almacene una base de datos bien diseñada debe de permitir realizar consultas tanto previstas como no previstas sobre ésta.
–Creación de subesquemas: la creación del nivel externo o vistas para lo usuarios y programas suele incluirse en casi todos los modelos como operaciones del DML.
El DML de un SGBD depende fuertemente del tipo de modelo lógico de datos que se utilice, así todos los SGBD que utilizan un modelo jerárquico tiene lenguajes para la manipulación de datos similares y los SGBD relacionales que implementan el álgebra relacional, suelen utilizar SQL, más o menos ampliado por el fabricante concreto.
Los SGBD jerárquicos y en red se caracterizan porque su modelo lógico está basado en registros y relaciones entre ellos. En el modelo jerárquico dichas relaciones han de tener una estructura arborescente, restricción que no es necesario mantener en los SGBD en red.
Para la manipulación de la información suelen utilizar un lenguaje (DML) a un nivel de abstracción más bajo que el usado en los sistemas relacionales, trabajando el DML con punteros y registros.
Normalmente el SGBD jerárquico o en red mantiene en memoria una serie de plantillas de todos los tipos de registros utilizados y una serie de punteros (a esta zona de memoria se le denomina área de trabajo). Las operaciones suelen tener dos componentes bien diferenciados:
La primera fase de la operación de acceso tiene como objeto situar los punteros correctamente apuntando al registro que se desea manipular, ya sea para consultar, añadir, borrar o modificar.
La segunda fase del acceso consiste en efectuar la operación que se desee, utilizando para ello como área de almacenamiento intermedio entre el programa de usuario y la base de datos las plantillas de registros anteriormente mencionadas.
Importante
El hecho de utilizar operaciones a tan bajo nivel aumenta en gran medida la velocidad de acceso (un SGBD en red o jerárquico en ocasiones puede ser hasta 20 veces más rápido que otro relacional semejante) pero dificulta sobremanera y en muchas ocasiones impide la ejecución de consultas no previstas además de condicionar excesivamente el modelo lógico de los datos a su ubicación física. Es por ello que en la actualidad predomina el uso de los SGBD relacionales.
Sabías que…
El modelo relacional fue propuesto por E.F. Codd, investigador de IBM y propone una representación de la información en forma tabular, en base a tablas bidimensionales.
Logotipo de IBM (marca registrada)
Una tabla o relación en el modelo relacional es una matriz rectangular, identificada por un nombre único en todo el modelo, en la cual, cada elemento de la tabla representa un ítem de datos particular.
Los SGBD relacionales utilizan este modelo, y para el acceso a la información pueden utilizar dos paradigmas diferentes, propuestos a la misma vez que el modelo, el cálculo relacional y el álgebra relacional.
Cálculo relacional: Los lenguajes basados en el cálculo relacional son lenguajes no procedimentales, al describirse en general como será la consulta generada.
Dentro del cálculo relacional hay dos subtipos:
–Cálculo relacional orientado a tuplas: en el las consultas tiene la siguiente sintaxis: {t|p(t)} siendo t una relación y p(t) un predicado sobre esa relación. La semántica de la consulta se interpreta como devuelve todas las tuplas de t que cumplan p(t)
. El lenguaje más utilizado que implementa el cálculo relacional orientado a tuplas es Quel.
–Cálculo relacional orientado a dominios: las consultas son de la siguiente manera: {
Álgebra relacional: la mayoría de SGBD relacionales utiliza el álgebra relacional como paradigma para la manipulación de datos. Este álgebra propone una serie de operadores que aplicados a una o dos relaciones devuelven otra relación con unas características diferentes a las anteriores. Los operadores algebraicos básicos son: Unión, diferencia, selección, proyección y producto cartesiano. Además de éstos hay otra serie de operadores avanzados que pueden ser descritos en base a los operadores básicos.
SQL es un lenguaje tanto de definición como de manipulación de datos de los SGBD relacionales, basado en el álgebra relacional al cual se le ha añadido una semántica que lo hace más próximo al lenguaje natural.
SQL utiliza una serie de operadores (los operadores algebraicos básicos) que operan sobre relaciones o tablas de un esquema relacional. Se considera un lenguaje procedimental, quizás no en el sentido clásico sino en el sentido que hay que describir la secuencia de operaciones algebraicas relacionales para obtener una relación (la consulta a obtener) a partir de las relaciones que forman parte del esquema lógico almacenado.
Las operaciones básicas se realizan de la siguiente manera:
Creación de vistas: la creación de vistas consiste en la operación por la que se crean los subesquemas o visiones parciales de los datos que utilizarán los programas de usuario que accederán a la base de datos. Para su creación se utiliza la orden CREATE VIEW. Su sintaxis es la siguiente:
Siendo la sentencia SELECT una consulta que devolverá el subesquema que utilizará el programa de usuario correspondiente.
La creación de índices no puede considerarse propiamente una operación del DML ya que realmente lo que genera es un índice a nivel físico que mejore el rendimiento de los accesos ejecutados por un campo determinado, aunque suele incluirse en el mismo en la mayoría de la documentación técnica.
Para su creación se utiliza la orden CREATE INDEX cuya sintaxis es la siguiente:
Definición
Diccionario de datos: es un conjunto de archivos que almacena información acerca de los datos que pueden ser almacenados en la base de datos; por tanto se trata de una base de datos sobre la base de datos o una metabase de datos.
En el diccionario de datos se encuentra:
–El esquema lógico de la base de datos.
–El esquema físico de la base de datos.
–Los subesquemas o visiones externas de la base de datos.
Es decir, se encuentra la representación de la información a los tres niveles de abstracción necesarios para su funcionamiento.
Además de esta información en el diccionario de datos se encuentra también información sobre restricciones de privacidad o acceso a datos; reglas, normas o restricciones sobre seguridad de los datos; información que permite garantizar la integridad de los datos.
Importante
También en el diccionario de datos se encuentran un conjunto de reglas, llamadas de ligadura o de enganche que permiten conectar entre sí las tres representaciones de los datos cuando sea necesario. La ligadura es de dos tipos, ligadura lógica y ligadura física, según se trate del proceso de vinculación entre las representaciones externas y la representación lógica (ligadura lógica) o de proceso de enganche entre la representación lógica y la física (ligadura física).
Definición
El gestor de la base de datos, también llamado monitor, es el software encargado de realizar el correcto, seguro, íntegro y eficiente acceso a la base da datos. Proporciona un interfaz entre la base de datos y todos los programas de aplicación que acceden a ella.
Toda operación que se quiera realizar contra
la base de datos ha de ser validada previamente por el gestor de la misma; por tanto el gestor se encargará de:
–Garantizar la seguridad de los datos, realizando procedimientos que permitan su recuperación en caso de parada o fallo de la misma.
–Garantizar la integridad de los datos: gestionando que los datos almacenados satisfagan las restricciones definidas.
–Garantizar la privacidad de los datos: permitiendo su acceso solamente a los usuarios a los que les está permitido.
–Permitir el acceso concurrente a la base de datos.
–Interaccionar con el sistema operativo, en particular con el gestor de archivos para el correcto almacenamiento de la información.
Además los sistemas gestores de bases de datos, suelen incluir distintas herramientas para llevar a cabo varias operaciones entre las que se pueden citar las siguientes:
–Seguridad: de modo que los usuarios no autorizados no puedan acceder a la base de datos.
–Integridad: que mantiene la integridad y la consistencia de los datos.
–El control de concurrencia: que permite el acceso compartido a la base de datos.
–El control de recuperación: que restablece la base de datos después de que se produzca un fallo del hardware o del software.
–Gestión del diccionario de datos (o catálogo): accesible por el usuario que contiene la descripción de los datos de la base de datos.
–Programación de aplicaciones.
–Importación/exportación de datos (migraciones).
–Distribución de datos.
–Replicación (arquitectura maestro-esclavo).
–Sincronización (de equipos replicados).
–Optimizador de consultas: para determinar la estrategia óptima para la ejecución de las consultas.
–Gestión de transacciones.
–Este módulo realiza el procesamiento de las transacciones.
–Planificador (scheduler): para programar y automatizar la realización de ciertas operaciones y procesos.
–Copias de seguridad: para garantizar que la base de datos se puede devolver a un estado consistente en caso de que se produzca algún fallo.
Todos los SGBD no presentan la misma funcionalidad, depende de cada producto. En general, los grandes SGBD multiusuario ofrecen todas las funciones que se acaban de citar y muchas más.
Los sistemas modernos son conjuntos de programas extremadamente complejos y sofisticados, con millones de líneas de código y con una documentación muy extensa.
Al ser el SGBD un sistema software, su estudio no estaría completo sin una descripción del fundamental componente humano. Podemos distinguir cuatro tipos de usuarios de la base de datos:
Definición
Administrador de la base de datos. También denominado DBA (Database Administrador). El administrador de la base de datos es aquella persona o grupo de personas con la máxima responsabilidad en el mantenimiento del SGBD.
En concreto el administrador de la base de datos se encarga de:
–Definir el esquema lógico de la base de datos.
–Definir el esquema físico de la base de datos.
–Definir los subesquemas o visiones externas.
–Todas las tareas relacionadas con el mantenimiento de los esquemas.
–Especificar los procedimientos para mantener la seguridad de los datos, su integridad y privacidad.
Definición
Usuarios finales: usuarios no especializados que manejan la base de datos a través de los programas de aplicación desarrollados