saltar al contenido

Conceptos y configuración de bases de datos distribuidas

Wikipedia define "datos distribuidos" como "colecciones de datos (por ejemplo, en una base de datos) distribuidas en múltiples ubicaciones físicas". Hay muchas razones por las que un diseñador de sistemas consideraría una solución de base de datos distribuida. Los siguientes escenarios destacan varias configuraciones distribuidas y los beneficios de configurar una arquitectura de base de datos distribuida.

Copias de seguridad

Lo más simple replicación o reflejo El escenario se puede utilizar para realizar copias de seguridad de datos valiosos. A medida que los cambios se almacenan en la copia maestra de la base de datos, esos mismos cambios se envían a la base de datos esclava. Para entornos de alta disponibilidad (HA), Administrador de base de datos Raima (RDM) cooperará con un administrador de HA externo para realizar la función de conmutación por error o conmutación por recuperación.

Sistemas de gestión de bases de datos distribuidos maestro-esclavo

Figura 1 - Copia de seguridad de datos

Una de las consideraciones en cualquier sistema de administración de bases de datos distribuidas es la latencia en la consistencia de los datos entre el maestro y el esclavo. Esta consideración es importante para evaluar la compensación entre el rendimiento y la cantidad de datos que el diseñador de la aplicación está dispuesto a perder en caso de una falla catastrófica en la base de datos maestra.

Muchas bases de datos distribuidas proporcionan modos de duplicación síncronos y asíncronos con el esclavo. En modo síncrono, el esclavo es parte de la transacción de actualización. En modo asíncrono, las actualizaciones llegan al esclavo de forma retardada. En el último modo, si el maestro falla antes de que se envíen las actualizaciones, el esclavo seguirá teniendo los valores antiguos. Esta ventana de inconsistencia de datos entre el maestro y el esclavo depende de la periodicidad y velocidad de las transferencias de actualización entre el maestro y el esclavo.

Particionamiento de bases de datos

La ubicación de datos cerca del sitio de mayor demanda aumenta automáticamente el rendimiento. El siguiente diagrama muestra la partición de la base de datos según la autonomía del sitio. Los datos "propiedad" del sitio se actualizan y comparten mediante la replicación en el segundo sitio. La función de “unión” de RDM permite que esas instancias (sitios) de bases de datos independientes se consulten como una base de datos sin necesidad de depender de conexiones remotas al otro sitio. Esto es posible porque RDM permite acceso de solo lectura a la instancia de la base de datos esclava.

Particionamiento de bases de datos en diferentes ciudades

Figura 2 - Particionamiento de la base de datos

La latencia en la consistencia de los datos también es aplicable en este escenario, ya que ambos sitios accederán a una base de datos esclava para sus lecturas locales de los datos del otro sitio. Se garantiza que la base de datos local será eventualmente consistente y la ventana de inconsistencia de datos está sujeta a la rapidez con la que llegan las actualizaciones del maestro.

Agregación de datos

Los datos capturados en dispositivos inteligentes son cada vez más frecuentes en el mercado. Un ejemplo serían los sensores en vehículos o embarcaciones que pueden experimentar conectividad intermitente. Dispositivos integrados son capaces de enviar los datos que registra a bases de datos móviles o servidores mediante replicación o duplicación de datos. La comunicación entre dispositivos es posible a través de la agregación de datos e incluso puede conducir a procesos eficientes, como el mantenimiento automatizado, donde se le puede notificar sobre una falla en el proceso. La captura de datos directamente en el dispositivo aumenta el rendimiento de la captura, ya que elimina la latencia de las comunicaciones remotas a un depósito de almacenamiento central. Los registros de replicación se pueden enviar a la base de datos de agregación cuando se establece la conectividad.

Configuración y control de bases de datos distribuidas

Figura 3 - Agregación de datos

Configuración y control de bases de datos distribuidas

Figura 4 - Configuración / Control

Configuración / Control

Además de agregar los datos capturados de estos dispositivos inteligentes, los sistemas de control necesitan un método seguro y eficiente para enviar información de configuración o datos de control a estos dispositivos. El desarrollador del sistema debe tener la seguridad de que todo el paquete de transferencia de datos llega al dispositivo o no llega. Mediante la replicación, los datos se pueden distribuir a varios dispositivos desde una fuente centralizada.

Las ventajas de una base de datos distribuida

Una base de datos distribuida le brinda la posibilidad de realizar copias de seguridad de la información, aumentar el rendimiento y sincronizar los datos. Si bien esto puede ser muy poderoso, un diseño de datos distribuidos puede volverse muy complejo muy rápidamente. Los productos Raima son adecuados para manejar escenarios de datos distribuidos como los anteriores y más. Contáctenos y podemos ayudarlo con sus requisitos de diseño específicos.