¿Gestión de bases de datos de próxima generación?

julio 14

Bill habla sobre los factores impulsores del cambio en la industria de bases de datos integradas y lo relaciona con SQL, computación en la nube, rendimiento como factor impulsor y más.

De acuerdo a Agrawal y col. (2009, junio) La comunidad de bases de datos se encuentra en un punto de inflexión en su historia, debido tanto a una explosión de datos y escenarios de uso como a cambios importantes en el hardware y las plataformas informáticas.

Factores impulsores del cambio en la industria de bases de datos integradas

En una reunión de investigadores, arquitectos, usuarios y expertos de bases de datos se discutieron varios factores que impulsan los cambios en la industria de las bases de datos. Algunos de esos factores son: entusiasmo por los "macrodatos"; análisis de datos como centro de beneficios; ubicuidad de datos estructurados y no estructurados; demandas expandidas de los desarrolladores; y cambios arquitectónicos en la informática. La pregunta con la que lucho es cómo estos cambios importantes en la comunidad de bases de datos afectan a la industria de la computación integrada. Es un absoluto que hay y habrá un afecto.

Impacto del análisis de datos

Hemos visto el impacto del entusiasmo por el factor de "análisis de datos" en algunos de nuestros clientes. Como Agrawal, et al. (2009, junio) afirma: "Se están contratando analistas estadísticamente sofisticados en un número creciente de industrias, con un interés cada vez mayor en ejecutar sus fórmulas sobre los datos sin procesar". En otras palabras, estos analistas no solo están interesados en las cuotas de la línea de producción, sino que también pueden estar interesados en acceder a los datos generados por la miríada de dispositivos automatizados a lo largo de la línea de producción. Los datos sin procesar pueden ser la clave para una mayor eficiencia y ganancias para la empresa y el acceso a ellos se está convirtiendo en una necesidad.

Demandas ampliadas de los desarrolladores

Para mí, uno de los factores más complejos de generalizar son las “demandas ampliadas de los desarrolladores”. Si bien ha habido un aumento significativo en la adopción de DBMS relacionales en la comunidad de desarrolladores de aplicaciones, los requisitos expandidos de las industrias que necesitan administración de datos están creando nuevas expectativas de programabilidad y usabilidad. SQL, aunque es excepcionalmente bueno para muchos tipos de consultas de bases de datos, puede resultar demasiado engorroso en algunas aplicaciones. Un nuevo modelo de programación con componentes de sistema simplificados para gestión de datos y la manipulación puede aceptarse más fácilmente que SQL en algunos de estos tipos de aplicaciones. En otras palabras, los desarrolladores de aplicaciones buscan la lo más rápido manera posible de desarrollar sus aplicaciones con calidad. En algunos casos, SQL se establece como un requisito porque se considera un estándar y alguien del equipo lo sabe. El requisito real es que quieren capturar y almacenar información rápidamente y cualquier API que proporcione esa capacidad con la menor cantidad de líneas de código, mejor.

Rendimiento y factores impulsores | Industria de bases de datos integradas

Los factores que impulsan el cambio en la industria de las bases de datos integradas se remontan al rendimiento. Los conjuntos de datos más grandes significan que el motor debe escalar para manejar las búsquedas de manera eficiente. El tiempo de comercialización es otro indicador de rendimiento que viene dictado por la facilidad de uso y la interoperabilidad con otras herramientas de desarrollo de aplicaciones. En el espacio de los sistemas integrados, en la base de datos de la memoria El rendimiento o la capacidad de proporcionar tiempos de respuesta deterministas, especialmente a la luz de los analistas que necesitan acceso a los datos del dispositivo, es una prioridad.

Cuando se trata de un mayor rendimiento, Jouppi (2009, junio) informa: "La larga marcha de los aumentos del rendimiento de un solo subproceso se ha detenido en seco". En lugar de procesadores más rápidos, ahora vemos más núcleos de procesador por dado. Los cambios de diseño recientes en la línea de productos Raima se centran en las características de comportamiento de estos procesadores para proporcionar un verdadero procesamiento paralelo. Cuanto más trabajo se pueda realizar en paralelo sin interacción o sincronización con otros subprocesos o procesos, aumentará significativamente el rendimiento del motor de base de datos integrado.

Internet es otra área donde el aumento del ancho de banda está limitado por las leyes de la física. El advenimiento de la "computación en la nube" será sensato para muchos tipos de aplicaciones. Smith (2009, julio) afirma: “A medida que [la computación en la nube] crece en popularidad, los ingenieros deben ser conscientes de algunas limitaciones fundamentales que enfrentan al desarrollar este tipo de aplicaciones, en particular, la velocidad finita de la luz”. Para muchas otras aplicaciones, la falta de tiempos de respuesta deterministas evitará que se adopte la funcionalidad de la aplicación. Sin embargo, una mezcla de aplicaciones de bases de datos integradas ejecutar en el borde de la "nube" sería un escenario probable para preservar los tiempos de respuesta deterministas con la capacidad de interoperar con la "nube" para algunas de estas aplicaciones.

Desde mi perspectiva, el mercado parece estar a punto de fragmentarse aún más. Algunos de los datos para el próximo período son:

  • SQL crecerá como requisito, pero no en todos los segmentos
  • La usabilidad y el tiempo de comercialización serán muy altos en los requisitos de los desarrolladores, pero no necesariamente SQL
  • La necesidad de interoperabilidad con el acceso y el movimiento de datos hacia los centros de análisis (podría estar basado en la "nube")
  • El rendimiento será un requisito absoluto
  • Los requisitos típicos de la base de datos ACID pueden no ser un requisito estricto para todos los casos de uso de aplicaciones.

Según mis lecturas de los últimos días, el RDM integrado El proyecto parece estar preparado para aprovechar el seguimiento de la fragmentación adicional de la industria de bases de datos integradas.

Referencias:

AGRAWAL, R., AILAMAKI, A., BERNSTEIN, P., BREWER, E., CAREY, M., CHAUDHURI, S., et al. (2009, junio). Informe Claremont sobre investigación de bases de datos. Comunicaciones de la ACM, 52 (6), 56-65. Obtenido el 14 de julio de 2009 de la base de datos Business Source Alumni Edition.

Jouppi, N. (junio de 2009). Perspectiva técnica: soporte de software y hardware para la reproducción determinista de programas paralelos. Comunicaciones de la ACM, 52 (6), 92-92. Obtenido el 14 de julio de 2009 de la base de datos de Academic Search Alumni Edition.

SMITH, J. (julio de 2009). Lucha contra la física: una dura batalla. Comunicaciones de la ACM, 52 (7), 60-65. Obtenido el 14 de julio de 2009 de la base de datos Business Source Complete.

Get notified about new RDM updates

Be the first to know about new Raima Database Manager updates when they go live, use cases, industry trends and more.