Bases de datos Distribuidas: Actividad # 7

Arquitectura de bases de datos distribuidas

El procesamiento de la bases de datos distribuida, es el procesamiento por el medio del cual la ejecucion de las transaciones, la recuperación y actualización de los datos se llevan a cabo entre dos o mas computadoras independientes.
En esta arquitectura el sistema administrador de bases de datos distribuidas, estan formados por los administradores de transaciones y los administradores de bases de datos de todas las computadoras.

Son la que almacenan datos que pertenecen lógicamente a un sólo sistema, pero se encuentra físicamente esparcido en varios “sitios” de la red. Un sistema de base de datos distribuidos se compone de un conjunto de sitios, conectados entre sí mediante algún tipo de red de comunicaciones, en el cual:

• Cada sitio es un sistema de base de datos en sí mismo.

• Los sitios trabajan en conjunto si es necesario con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red tal como si todos los datos estuvieran almacenados en el sitio propio del usuario.
La mayoria de los sistemas de manejo de bases de datos disponibles actualmente están bassdas en la arquitectura ANSI-SPARC la cualdivide a un sistema en tres niveles: Interno, Conceptual, Externo.

Donde se Utilizan

Cualquier organización que tiene una estructura descentralizada. El enfoque distribuido de las bases de datos se adapta más naturalmente a la estructura de las organizaciones. Además, la necesidad de desarrollar una aplicación global (que incluya a toda la organización), se resuelve fácilmente con bases de datos distribuidas. Si una organización crece por medio de la creación de unidades o departamentos nuevos, entonces, el enfoque de bases de datos distribuidas permite un crecimiento suave.

Los datos se pueden colocar físicamente en el lugar donde se accede más frecuentemente, haciendo que los usuarios tengan control local de los datos con los que interactúan. Los casos más típicos son organismos gubernamentales y/o de servicio público.

La industria de la manufactura, particularmente, aquella con plantas múltiples. Por ejemplo, la industria automotriz.

Aplicaciones de control y comando militar.
Líneas de transporte aéreo.
Cadenas hoteleras.
Servicios bancarios y financieros.
Implementaciones comerciales

Ventajas y Desventajas

Ventajas

La primera ventaja es la modularidad, los sistemas distribuidos pueden variar su tamaño de un modo más sencillo. Se pueden agregar computadoras adicionales a la red conforme aumentan el número de usuarios y su carga de procesamiento. Después, si la carga de trabajo se reduce, el tamaño de la red también puede reducirse.

A menudo es más fácil y más económico agregar una nueva computadora más pequeña que actualizar una computadora única y centralizada que sea más poderosa.

La sencillez, los sistemas distribuidos se pueden adecuar de una manera más sencilla a las estructuras de la organización de los usuarios.

La autonomía local de los datos. Los datos se pueden colocar físicamente en el lugar donde se accede a ellos más frecuentemente, haciendo que los usuarios tengan control local de los datos con los que actúan (un departamento puede controlar los datos que le pertenecen) permitiendo a los usuarios aplicar políticas locales respecto del tipo de accesos a sus datos.

La disponibilidad. Si se produce un fallo en una localidad de un sistema distribuido, es posible que las demás localidades puedan seguir trabajando. En particular, si los datos se repiten en varias localidades, una transacción que requiere un dato específico puede encontrarlo en más de una localidad. Así, el fallo de una localidad no implica necesariamente la desactivación del sistema. La disponibilidad es fundamental para los sistemas de bases de datos que se utilizan en aplicaciones de tiempo real.

Puede dar como resultado un mejor rendimiento que el que se obtiene por un procesamiento centralizado. Los datos generalmente se ubican cerca del sitio con mayor demanda, también los sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores. Varias computadoras operando en forma simultánea pueden entregar más volumen de procesamiento que una sola computadora.

Los datos duplicados aumentan su confiabilidad. Cuando falla una computadora, se pueden obtener los datos extraídos de otras computadoras. Los usuarios no dependen de la disponibilidad de una sola fuente para sus datos.

El acceso a los datos es más rápido debido a que los datos se localizan más cercanos al lugar donde se utilizan.

El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo.

Nuevos nodos se pueden agregar fácil y rápidamente.

La probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe una autonomía e independencia entre los nodos.

Control local de los datos con que se interactúa.

Mayor tolerancia a los fallos

Desventajas

La primera desventaja es el rendimiento, puede ser peor para el procesamiento distribuido que para el procesamiento centralizado. Depende de la naturaleza de la carga de trabajo, la red, el DDBMS y las estrategias utilizadas de concurrencia y de falla, así como las ventajas del acceso local a los datos y de los procesadores múltiples, ya que éstos pueden ser abrumados por las tareas de coordinación y de control requeridas. Tal situación es probable cuando la carga de trabajo necesita un gran número de actualizaciones concurrentes sobre datos duplicados, y que deben estar muy distribuidos.

La confiabilidad. El procesamiento de base de datos distribuida puede resultar menos confiable que el procesamiento centralizado y un sistema distribuido puede estar menos disponible que uno centralizado. Esto dependerá de los parámetros mencionados en el apartado anterior.

Una desventaja es su mayor complejidad, a menudo se traduce en altos gastos de construcción y mantenimiento. Ya que existen más componentes de hardware, hay más cantidad de cosas por aprender y más interfaces susceptibles de fallar. Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas diferentes que pueden presentar dificultades únicas.

El coste. El control de concurrencia y recuperación de fallos puede convertirse en algo complicado y difícil de implementar, puede empujar a una mayor carga sobre programadores y personal de operaciones y quizá se requiera de personal más experimentado y más costoso.

El procesamiento de bases de datos distribuido es difícil de controlar. Una computadora centralizada reside en un entorno controlado, con personal de operaciones que supervisa muy de cerca, y las actividades de procesamiento pueden ser vigiladas, aunque a veces con dificultad. En un sistema distribuido, las computadoras de proceso, residen muchas veces en las áreas de trabajo de los usuarios. En ocasiones el acceso físico no está controlado, y los procedimientos operativos son demasiado suaves y efectuados por personas que tienen escasa apreciación o comprensión sobre su importancia. En sistemas centralizados, en caso de un desastre o catástrofe, la recuperación puede ser más difícil de sincronizar.

En sexto lugar tenemos la seguridad. Dado que los datos residen en muchos nodos diferentes y se pueden consultar por nodos diversos de la red, la probabilidad de violaciones de seguridad es creciente si no se toman las precauciones debidas.

La siguiente es la integridad (consistencia, validez y exactitud de la información). Se vuelve difícil mantener la integridad, aplicar las reglas de integridad a través de la red puede ser muy caro en términos de transmisión de datos.

Finalmente se puede mencionar la carencia de estándares. Aún no existen herramientas o metodologías que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.

Es más complicado el control y la manipulación de los datos

Es compleja el aseguramiento de la integridad de la información en presencia de fallas no predecibles tanto de componentes de hardware como de software. La integridad se refiere a la consistencia, validez y exactitud de la información.

El control de concurrencia y los mecanismos de recuperación son mucho más complejos que en un sistema centralizado dado que los datos pueden estar replicados.

Referencias:
http://es.scribd.com/doc/82807834/1-4-Arquitectura-de-Base-de-Datos-Distribuidas-Copia#scribd
http://es.slideshare.net/Deyzzi/unidad1-bases-de-datos-distribuidas
http://repositorio.utn.edu.ec/bitstream/123456789/522/6/04%20ISC%20151%20CAPITULO%20IV.pdf

Bases de datos Distribuidas

lunes, 9 de febrero de 2015

Actividad # 7

Arquitectura de bases de datos distribuidas

Donde se Utilizan

Ventajas y Desventajas

No hay comentarios.:

Publicar un comentario