INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los...

12
INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE TRANSACCIONES DE ALTO RENDIMIENTO

Transcript of INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los...

Page 1: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

INTERSYSTEMS DATA PLATFORM PARALA GESTIÓN Y ANÁLISIS DE TRANSACCIONES DE ALTO RENDIMIENTO

Page 2: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform for High Performance Page 1

Page 3: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

Procesamiento ya probado de análisis transaccional concurrente, de misión crítica y a escala para el comercio electrónico

Resumen ejecutivoEn la actualidad, las mejores empresas de servicios financieros deben ser capaces de procesar simultá-neamente cargas de trabajo analíticas y transaccio-nales a gran escala y gestionar millones de mensajes por segundo, a la vez que prestan soporte a miles de consultas analíticas procedentes de cientos de aplicaciones sin que se produzca ningún incidente. Las consecuencias de la reducción de transacciones, o lo que es peor, de fallos en el sistema, pueden ser graves y ocasionar pérdidas económicas y dañar la reputación de las empresas.

Las bases de datos operacionales tradicionales sue-len ser demasiado lentas para adaptarse a la gran velocidad necesaria para procesar y acceder a los datos. Estas bases de datos introducen y actualizan los registros en milésimas de segundo, en lugar de en el tiempo de respuesta necesario de microsegun-dos, y no están optimizadas para soportar simultá-neamente cargas de trabajo analíticas y transaccio-nales de forma plena.

Actualmente, las bases de datos in memory están muy extendidas en el sector de los servicios financieros, sobre todo debido a su capacidad para soportar operaciones de alto rendimiento en inserción de datos y de cargas de trabajo de

procesamiento analítico. No obstante, las bases de datos in memory, por sí solas, han demostrado no ser ni mucho menos ideales, especialmente en lo relativo a la gestión de cargas de trabajo mixtas a medida que aumentan los volúmenes de transacciones.

Este whitepaper describe los requisitos de las plata-formas de bases de datos analíticas y de gestión de transacciones que deben operar a escala masiva sin que se den problemas de rendimiento o fiabilidad, incluso durante periodos de inestabilidad en los mercados. Describe las fortalezas y las debilidades de las diferentes tecnologías que se han utilizado hasta la fecha y presenta una tecnología demos-trada, InterSystems Data Platform. Esta plataforma está optimizada para un procesamiento pleno de múltiples cargas de trabajo, con un rendimiento igual o superior al de las tecnologías in memory, con la persistencia y fiabilidad de una base de datos operativa tradicional.

En el caso de una de las entidades bancarias in-ternacionales más importantes del mundo, Inter-Systems Data Platform aumentó su productividad hasta en un 500% y su rendimiento en un 1.000% comparado con su sistema anterior basado en SGBD in memory y ha operado sin ningún incidente desde su implementación en 2007.

InterSystems Data Platform para transacciones de alto rendimiento Pag 2

Page 4: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 3

IntroducciónEl aumento de los volúmenes de comercio y los periodos de alta volatilidad en los mercados están creando desafíos tecnológicos significativos para las empresas de servicios financieros. Esto es especial-mente cierto para las empresas de sell-side, que pueden experimentar volúmenes de transacción extremadamente altos, ya que dividen grandísimos volúmenes de órdenes entrantes en órdenes de ejecución más secundarias. Al mismo tiempo, deben dar soporte a un gran número de consultas analí-ticas simultáneas para proporcionar datos sobre el estado de las órdenes, la gestión de riesgos, la supervisión y otra información para clientes tanto internos como externos. Esta necesidad de proce-samiento de múltiples tipos de cargas de trabajo a escala masiva junto con los más altos niveles de ren-dimiento y fiabilidad han sido difíciles de satisfacer tradicionalmente.

Agravando el problema, los volúmenes de transac-ciones no solo crecen gradualmente y según las previsiones, sino que, algunos acontecimientos mundiales inesperados que afectan a los mercados pueden provocar que estos volúmenes se disparen de manera radical. Esto se refleja en algunos ejem-plos recientes, como la crisis financiera de 2008, el Flash Crash de 2010 y la devaluación de la moneda china en 2015.

Un componente crítico de la infraestructura tecno-lógica de las empresas sell-side es su plataforma de procesamiento analítico y de gestión de transaccio-nes. La plataforma debe ser extremadamente fiable y con un alto nivel de disponibilidad, capaz de so-

portar tanto el crecimiento que supone un volumen normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados.

Un fallo o una simple ralentización en la plataforma de procesamiento analítico y gestión de transacciones puede tener graves consecuencias para la empresa. Por ejemplo, puede llevar muchas horas restaurar el estado de las órdenes y reanudar las operaciones normales después de un fallo, tiempo durante el cual se ve afectada la capacidad de la empresa de procesar operaciones adicionales y de proporcionar los estados de las órdenes y otra información crítica, a la vez que aumentan las pérdidas financieras.

Incluso un ligero retraso o interrupción puede provocar graves pérdidas financieras y afectar negativamente a la reputación de la empresa. Una importante entidad bancaria notificó recientemente de pérdidas del orden de 100.000 dólares por cada minuto de inactividad del sistema.

Plataforma de alto rendimiento para el procesamiento analítico y gestión de tran-sacciones

Una plataforma de alto rendimiento para el procesamiento analítico y la gestión de transacciones debe registrar todas las órde-nes procedentes tanto de clientes como de fuentes internas, garantizar que se enruten y ejecuten de forma adecuada, mantener la integridad del estado de las órdenes (por ejemplo, cuando una orden está cumpli-mentada solo en parte), registrar y distribuir correctamente todas las ejecuciones de las operaciones y preservar todos los datos mientras que, de forma simultánea, procesa las cargas de trabajo analíticas relativas a los datos comerciales.

Figura 1: arquitectura del procesamiento de las transacciones

Transaction Management & Analytics

ClientGateways

Trading Platform

ExchangeGateways

Hundreds of Applications...

Order Management SurveillanceRisk

Management

Page 5: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 4

Para tratar satisfactoriamente el crecimiento y la volatilidad sin problemas de rendimiento o dispo-nibilidad, la plataforma debe equilibrar de forma plena y escalable las cargas de trabajo transaccio-nales con las demandas de análisis simultáneas de aplicaciones posteriores. Las empresas de servicio financieros, especialmente las empresas sell-side, deben ser capaces de procesar millones de mensajes por segundo, a la vez que prestan soporte a miles de consultas de análisis procedentes de cientos de sistemas que deben informar sobre el estado de las órdenes y ejecutar otras peticiones. Las bases de datos operacionales tradicionales son demasiado lentas para adaptarse a la gran veloci-dad necesaria para el procesamiento y acceso a los datos. Estas bases de datos introducen y actualizan los registros en milésimas de segundo, en lugar de en el tiempo de respuesta necesario de microse-gundos, y no están optimizadas para soportar plena y simultaneamente cargas de trabajo analíticas y transaccionales. Actualmente, las bases de datos in memory están muy extendidas en el sector de los servicios financie-ros, sobre todo debido a su capacidad de soportar operaciones de alto rendimiento en inserción de datos y de procesamiento de cargas de trabajo ana-

líticas. No obstante, las bases de datos in memory, por sí solas, han demostrado no ser una plataforma ni mucho menos ideal para la gestión de las transac-ciones y procesamiento analítico por una serie de razones:

Capacidad limitada para procesar simultanea-mente cargas de trabajo analíticas y transaccio-nales a escala. Las bases de datos in memory no están diseñadas para soportar el procesamiento de cargas múltiples de trabajo a gran escala. Y, como resultado, a medida que aumentan los volú-menes, llega un momento en que tanto el proceso de transacciones como las consultas analíticas se ralentizarán o detendrán.

Limitaciones de escala. Dado que en una base de datos in memory los datos se almacenan en la memoria principal, el tamaño de los datos de trabajo está limitado por la cantidad de memoria disponible. Esto crea un riesgo importante cuando se intensifican los volúmenes de transacciones y pone en peligro la capacidad de procesar órdenes nuevas una vez que se llena la memoria RAM dis-ponible. También limita la cantidad de datos que pueden consultarse y analizarse en tiempo real.

Altos costes. Los servidores tienen un límite de memoria, así que para escalar las bases de datos in memory por encima de estos límites es necesario adquirir y generar nodos para soportar las opera-ciones normales y contar con espacio libre ante un caso inesperado de volatilidad, lo que aumenta los costes.

Tiempo de inactividad del sistema. Los datos están almacenados en la memoria por lo que, si el servidor de datos falla, los datos almacenados en la memoria de ese servidor se pierden. Algunos sistemas de bases de datos in memory ofrecen continuidad a través de bases de datos en espejo (mirroring), replicación y otras alternativas que pueden afectar al rendimiento de entrada y a los costes, a la vez que añaden complejidad al mante-nimiento. Para aquellas bases de datos en las que los datos están almacenados en archivos y regis-tros de transacciones, el esfuerzo de recuperación implica el restablecimiento de la base de datos utilizando registros, archivos de puntos de control y otros datos de backup. Se trata de un esfuerzo al que hay que dedicarle un tiempo durante el cual se pone en peligro la capacidad de la entidad bancaria para procesar las órdenes, lo que implica pérdidas de ingresos y otros inconvenientes para el negocio.

Page 6: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 5

InterSystems Data Platform es una plataforma de bases de datos de procesamiento híbrido (HTAP) que ofrece el rendimiento de una base de datos in memory, con la continuidad y fiabilidad de una base de datos operativa tradicional. A diferencia de otras bases de datos, está optimizada para adaptarse tanto a cargas de trabajo con mucho volumen de transacciones como a un gran volumen de consul-tas de análisis sobre los datos de las operaciones simultáneamente, sin que se produzcan incidentes o baje su rendimiento, incluso durante periodos de extrema volatilidad en los mercados.

En el núcleo de InterSystems Data Platform se encuentra InterSystems Caché®. Caché es el úni-co SGBD multimodelo integral del mercado que procesa múltiples tipos de cargas de trabajo con un rendimiento analítico y transaccional increíblemen-te rápido sin sacrificar la escalabilidad, la fiabilidad o la seguridad de datos tipo relacional, objetos, key-value, documento y jerárquico ven un nivel de almacenamiento persistente común.

Caché ofrece un conjunto de características úni-cas que lo hacen especialmente atractivo para las aplicaciones de procesamiento analítico y para la gestión de transacciones de alto rendimiento y de misión crítica, entre las que se incluyen:

Un alto rendimiento para cargas de trabajo transaccionales con persistencia embebida

Un alto rendimiento para cargas de trabajo analíticas

Un alto rendimiento constante y a escala para cargas de trabajo analíticas y transaccionales simultáneas

Menor coste total de propiedad

En el caso de una de las entidades bancarias

más importantes del mundo, InterSystems Data

Platform ha multiplicado su productividad de 3 a 5 veces y su rendimiento por 10. Sus

costes operativos se han reducido en un 75%

comparado con su sistema anterior, basado

en SGBD in memory, y ha operado sin ningún

incidente desde su implementación en 2007.

InterSystems Data Platform para alto rendimiento en análisis y gestión de transacciones

Page 7: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 6

resultar lenta. Estos índices también pueden llegar a ocupar mucho espacio de almacenamiento, por lo que raramente se utilizan con bases de datos, espe-cialmente si deben analizar datos transaccionales en tiempo real. Los índices bitmap transaccionales de Caché apro-vechan las estructuras de datos multidimensionales para eliminar estos dos problemas. De esta forma, la actualización de estos bitmap suele ser más rápida que la de los índices tradicionales y utilizan técnicas de compresión sofisticadas para reducir el espacio de almacenamiento. El resultado es un bitmap ultra rápido que puede utilizarse para buscar en millo-nes de registros y permite consultas analíticas para incorporar datos “reales” con alto rendimiento a escala. Por último, Caché permite llevar a cabo consultas analíticas complejas en millones de registros, inclui-dos joins que pueden acceder a los datos distribui-dos en distintos nodos oshards, con un rendimiento altísimo y sin realizar copias múltiples de los datos. Esta característica permite que las empresas acce-dan a más datos de órdenes con sus consultas ana-líticas. Algunas empresas incluso están importando su histórico de registros desde Hadoop a Caché para analizarlos con los datos de transacciones actua-les. Esto supone que las empresas pueden incluir muchos más datos en sus análisis para soportar apli-caciones posteriores y consultas analíticas ad hoc para conseguir nuevas y más precisas informaciones sobre los datos, con un rendimiento prácticamente en tiempo real.

Alto rendimiento para cargas de trabajo analíticasCaché proporciona una gran variedad de capacida-des analíticas, incluido un soporte integral SQL que permite a las empresas financieras utilizar sus apli-caciones ya existentes y basadas en SQL haciendo pocos o ningún cambio. Dado que Caché almacena los datos en eficientes estructuras multidimensio-nales, las aplicaciones SQL consiguen un mejor rendimiento con Caché que con las bases de datos relacionales tradicionales. Además del soporte SQL, al ser Caché una base de datos multi-modelo, proporciona también soporte nativo para otros pa-radigmas de datos, incluidos objetos, documentos, datoskey-value y datos no estructurados. El alto rendimiento de Caché con las cargas de trabajo analíticas también se debe, en parte, a su enfoque único de indexación en tiempo real, indexación con bitmap transaccional, que aumen-ta significativamente el rendimiento en consultas complejas sobre datos transaccionales en tiempo real. La mayoría de las bases de datos utilizan índices tradicionales que mantienen una lista de identificadores para los valores en filas u objetos. En contraste, los índices bitmap contienen un mapa de bits asignado por cada posible valor de la columna o propiedad. La ventaja de los índices bitmap está en que las consultas complejas pueden procesarse rea-lizando operaciones booleanas sin tener que buscar en toda la base de datos, lo que reduce los tiempos de respuesta a consultas que realizan búsquedas en grandes volúmenes de datos, multiplicando por 100 o más su efectividad. Sin embargo, con la indexación bitmap tradicional la actualización del índice puede

Un alto rendimiento para cargas de tra-bajo transaccionales con persistencia embebidaCaché es una base de datos de altísimo rendimien-to que proporciona un rendimiento transaccional igual o mayor que el de las bases de datos in memory, junto con persistencia embebida y a escala. Caché es un almacén permanente de datos y siempre está actualizado. Los datos no se pierden al apagar un dispositivo, eliminando así la necesi-dad de recuperación o restablecimiento de cual-quier base de datos.

El alto rendimiento de entrada de Caché procede, en parte, de su motor de datos multidimensio-nal que permite un almacenamiento compacto y eficiente en una estructura enriquecida de datos. Utilizando un modelo de datos multidimensional eficaz con pocas técnicas de almacenamiento en lu-gar de un laberinto inmanejable de tablas bidimen-sionales, el acceso a los datos y las actualizaciones se realizan más rápidamente empleando menos recursos y menos capacidad de disco. Además de las API de acceso TCP/IP tradicionales, Caché ofrece API in memory y en proceso, aumentando aún más el rendimiento de entrada.

El rendimiento de entrada resultante es normal-mente entre 3 y 10 veces más rápido que el de las bases de datos in memory. Un cliente de InterSystems está procesando cientos de millones de transacciones diariamente, utilizan-do procesadores Intel Xeon de 56 núcleos y dos co-nectores, con una velocidad de inserción media de 455.000 objetos por segundo en cada procesador1.

1 En este ejemplo, la base de datos está insertando nuevos objetos de datos de 2 kB de tamaño promedio.

Page 8: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 7

Application Servers (processing queries)

Data Servers (processing inserts and updates)

CachéInstance

Enterprise Cache Protocol(data cloud)

CachéInstance

CachéInstance

CachéInstance

CachéInstance

CachéInstance

CachéInstance

CachéInstance

CachéInstance

CachéInstance

Figura 2: la mayoría de las bases de datos pueden configurarse para inserciones y actualizaciones o para el procesamiento de consultas. El Enterprise Cache Protocol de Caché es una tecnología única que optimiza el procesamiento de ambos tipos de

cargas de trabajo en un solo entorno.

Un alto rendimiento constante y a escala para cargas de trabajo analíticas y transaccionales simultáneasCaché es una plataforma única a la hora de propor-cionar los niveles más altos de rendimiento tanto para cargas de trabajo analíticas como transaccio-nales de forma simultánea, a gran escala, sin poner en peligro el rendimiento en cualquier tipo de carga de trabajo. Dado que los crecientes volúmenes de órdenes aumentan tanto las cargas de trabajo analí-ticas como las transaccionales en el sistema, resulta vital que se pueda escalar para gestionar dichas cargas de trabajo sin que aparezcan problemas de rendimiento o fiabilidad, incluso durante periodos de inestabilidad en los mercados. Caché cuenta con varias características para soportar estas demandas.

Enterprise Cache Protocol. Para conseguir este altísimo rendimiento y escalabilidad con múltiples cargas de trabajo, InterSystems ha desarrollado una tecnología única: Enterprise Cache Protocol (ECP).Una de las ventajas clave de ECP es que se pueden

escalar los recursos de manera independiente se-gún el tipo de carga de trabajo (por ejemplo, proce-samiento de transacciones o consultas analíticas) y la carga. ECP coordina de manera óptima el flujo de datos a través de un entorno de multiservidor desde la entrada hasta su utilización. Permite un acceso SQL completo a todos los datos en el entorno sin replicar o transmitir los datos.

ECP permite que los servidores de un sistema distribuido funcionen como servidores de aplicacio-nes y como servidores de datos, y que accedan de forma dinámica a bases de datos remotas como si se tratara de bases de datos locales. La propiedad de los datos solo necesita ser mantenida por un pe-queño porcentaje de los servidores del sistema. Si aumentan los requisitos analíticos pueden añadirse de forma instantánea más servidores de aplicacio-nes. Si la productividad del disco se convierte en un obstáculo pueden añadirse más servidores de datos y se producirán particiones en la base de datos.

Cada nodo en los sistemas distribuidos puede ope-rar en los datos que residen en su propio sistema de disco o en los datos transferidos por ECP desde otro servidor de datos Caché. Cuando un cliente hace una petición de datos, el servidor de aplicaciones intentará dar respuesta a la petición desde su me-moria caché local. Si los datos en cuestión resultan no ser locales, se pedirán al servidor de datos remo-to y, a continuación, los datos se almacenarán en la memoria caché del servidor de aplicaciones local, donde estarán a disposición de todas las aplicacio-nes que se ejecuten en dicho servidor. ECP gestiona automáticamente la consistencia y la coherencia de la memoria caché en toda la red.El uso de ECP es transparente y no necesita de

cambios en las aplicaciones ni de técnicas especia-lizadas. Las aplicaciones simplemente tratan a toda la base de datos como si fuera local.

Page 9: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 8

Sofisticadas técnicas de gestión de memoria. Caché utiliza sofisticadas técnicas de gestión de me-moria para garantizar su alto rendimiento y disponi-bilidad. La mayoría de las bases de datos in memory dependen del sistema operativo para la gestión de la memoria y, por eso, pueden agotar los recursos de memoria durante periodos de grandes cargas de tra-bajo. Caché solicita una parte constante de memoria del sistema operativo al comienzo y después, de manera inteligente, gestiona y optimiza la memoria, independientemente del SO. Es posible (y esperable) que durante periodos de grandes cargas de trabajo la memoria asignada se consuma por completo. Cuando esto sucede, Caché se deshace de manera dinámica de los datos menos usados recientemente, libera memoria y continúa operando de forma efi-ciente. Si alguno de los datos solicitados no estuvie-ra disponible en la memoria, Caché simplemente lo recupera del disco.

Optimización de la memoria caché. Al contrario que la mayoría de las otras bases de datos, que mantienen una memoria caché separada para cada proceso que se lleva a cabo en una máquina, Caché mantiene una única memoria caché por cada máquina y permite que los procesos que se están realizando en su propio espacio de direcciones de memoria accedan a los datos. Dado que múltiples clientes puede compartir una sola memoria caché, únicamente es necesario mantener una copia de los datos por cada dispositivo, lo que reduce los requisi-tos de almacenamiento, reduce la red I/O y permite una mayor escalabilidad. Por ejemplo, en un sistema con Caché de 250 máquinas, con ocho núcleos cada una, solo son necesarias 250 memorias caché para comunicarse entre sí y mantener la coherencia de caché. Por el contrario, los sistemas que necesitan de una memoria caché para cada núcleo necesitarán coordinarse entre 2.000 cachés.

Figura 3: comparación de Caché de InterSystems con bases de datos in memory.

Menor coste total de propiedadCaché proporciona una única arquitectura sólida para trabajar con múltiples tipos de datos y proce-sar cargas de trabajo analíticas y transaccionales, eliminando la necesidad de aprender o integrar diferentes tecnologías y enfoques. Asimismo, ofrece un desarrollo de aplicaciones y un entorno de mantenimiento muy intuitivos, acelerando las implementaciones, simplificando el mantenimiento de las aplicaciones y permitiendo a las empresas conseguir más con menos recursos, a la vez que reducen sus costes de mantenimiento y desarrollo.

El uso eficiente que hace Caché de los recursos del sistema reduce la cantidad de infraestructura necesaria, especialmente si lo comparamos con las bases de datos in memory, reduciendo significativa-mente los costes de infraestructuras. Una empresa de servicios financieros está experimentando una reducción del 75% de sus costes operativos a la vez que ha aumentado su productividad, rendimiento y fiabilidad en comparación con su SGBD v anterior.

Optimized for concurrent

transactional and analytic workloads

Ability to handle increasing workloads

not limited by RAM

Low cost to scale

Automatic built-in persistence

InterSystems In Memory DBMS

Las ventajas de rendimiento y escalabilidad de Ca-ché son enormes y permiten a las empresas procesar de forma eficiente las cargas de trabajo analíticas y transaccionales simultáneas, sin poner en peligro ninguno de los dos tipos, con una única plataforma y los niveles más altos de rendimiento y fiabilidad, incluso en los momentos de repunte de los volúme-nes de transacciones.

Page 10: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 9

Clients

ClientGateways

Trading Platform

Exchanges &Liquidity Pools

ExchangeGateways

Hundreds of Applications...

Order Management SurveillanceRisk

Management

Caché

Transaction Management & Analytics

Caché

Exchange

Caché

Caché

Caché

Caché

Figura 4: InterSystems Caché en un entorno de procesamiento de transacciones distribuido

Bases de datos para procesamiento analítico y transaccional híbrido (HTAP)

Tradicionalmente, las cargas de trabajo de procesamiento de transac-ciones en línea (OLTP) y el procesamiento analítico en línea (OLAP) se han venido gestionando de manera independiente por bases de datos separadas. No obstante, las dificultades asociadas al funcionamiento de bases de datos separadas y los tiempos de espera provocados al copiar los datos desde el entorno OLPT al entorno OLAP para su análisis ha llevado al desarrollo de un nuevo tipo de base de datos. En el año 2014, Gartner acuñó el término procesamiento analítico y transaccional híbrido2 , o HTAP, para este nuevo tipo de base de datos, que puede procesar tanto cargas de trabajo de OLTP como de OLAP en un solo entorno, sin tener que copiar los datos transaccionales para su análisis.

Las bases de datos HTAP se están utilizando en diversos sectores por su capacidad de descubrir nueva información, crear nuevas oportunidades de ingresos y mejorar la concienciación situacional así como la agilidad empresarial general de las empresas.

Sin embargo, no todas las bases de datos HTAP son iguales. Mientras que la tecnología in memory es un componente fundamental, las bases de datos HTAP que dependen únicamente o en gran medida de arqui-tecturas in memory experimentan algunos de los desafíos asociados a las bases de datos in memory, incluida la incapacidad de adaptarse tanto a cargas de trabajo analíticas como transaccionales simultánea-mente a gran escala, los costes excesivos de la escalabilidad así como límites de escalabilidad estrictos que dependen de la cantidad de memoria disponible.

Estas limitaciones pueden afectar a la capacidad de la empresa para gestionar de forma fiable las transacciones durante periodos con picos de trabajo sin que surjan problemas de rendimiento o disponibilidad, incluida la capacidad de las empresas de servicios financieros para procesar de manera fiable todas las órdenes durante periodos de volati-lidad en los mercados.

2 Hybrid Transaction/Analytical Processing Will Foster Opportunities for Dramatic Business Innovation, January 2014, Massimo Pezzini, Donald Feinberg, Nigel Rayner, Roxane Edjlali, Gartner.

Page 11: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems Data Platform para transacciones de alto rendimiento Pag 10

Ejemplos de clientes

Procesamiento analítico y gestión de transacciones de alto rendimiento Una de las principales entidades bancarias a nivel internacional en el ámbito de las inversiones sell-side, con 50.000 empleados y más de un billón de dólares en activos bajo gestión tenía exigencias contradictorias en relación a su plataforma de pro-cesamiento analítico y gestión de las transacciones: gestionar de manera fiable los crecientes volúmenes de órdenes comerciales a la vez que se reducían los costes de las infraestructuras.

El sistema distribuido por todo el mundo tenía que atender a miles de millones de órdenes diariamen-te, con suficiente espacio libre para gestionar picos inesperados durante periodos de volatilidad en los mercados, mientras que, de forma simultánea, daba servicio a la consultas analíticas procedentes de 250 aplicaciones de toda la organización.

La entidad bancaria ya había utilizado anterior-mente un sistema de gestión transaccional SGBD in memory, pero había tenido graves problemas de rendimiento y disponibilidad durante periodos de picos de trabajo. El banco migró la aplicación a la plataforma de bases de datos de InterSystems y consiguió multiplicar su productividad entre 3 y 5 veces, su rendimiento lo ha multiplicado por 10 y sus costes operativos se han reducido en un 75%. Además, la entidad puede incluir ahora más datos de órdenes en las consultas analíticas, comparado con el sistema in memory anterior.

Con la implementación del producto deInterSystems no hay posibilidad de fallos. Cada

componente funcional es linealmente escalable y su gestión ha sido impecable durante todos los días de cotización, incluido durante la crisis financiera de 2008 y el “Flash Crash” de 2010, sin que se produjera ningún problema de rendimiento o fiabilidad.

Procesamiento analítico de Big Data en entornos transaccionales en tiempo real e históricos Otra entidad bancaria en el ámbito de las inversio-nes sell-side, con más de 35.000 empleados y más de 800.000 millones de dólares en activos bajo gestión necesitaba analizar sus datos transaccionales y responder a las consultas de los usuarios finales en milésimas de segundo. La entidad había impor-tado un histórico de datos de 70 años a un lago de datos en Hadoop pero no pudo satisfacer todos sus requisitos utilizando únicamente las capacidades de análisis de Hadoop:

Aunque la infraestructura de almacenamiento de datos Apache Hive podía soportar consultas SQL simples, no podía llevar a cabo las consultas SQL necesarias para establecer una correlación de da-tos (por ejemplo, a través de joins) para identificar información y relaciones nuevas.

Muchas de las consultas superaban el estricto compromiso de rendimiento, contraído por el banco, en cuanto a un nivel de servicio de 200 milésimas de segundo.

La organización estaba experimentando tiempos de espera inaceptables en la incorporación de los datos transaccionales en tiempo real a los análi-sis.

Lo que hizo la entidad bancaria fue implementar InterSystems Data Platform para complementar su lago de datos en Hadoop. Como resultado de esta medida, en la actualidad puede llevar a cabo consul-tas SQL complejas de forma más rápida, incluidos joins internos, externos, transversales y entre redes. Las consultas SQL tradicionales se ejecutan ahora una media de cinco veces más rápido y todas las consultas se ejecutan en menos de 200 milésimas de segundo. Asimismo, se pueden incluir más datos al procesamiento analítico, incluidos los entornos transaccionales en tiempo real, para proporcionar información nueva y más precisa.

Conclusión

InterSystems Data Platform es idónea para las apli-caciones de procesamiento analítico y gestión de transacciones de alto rendimiento que deben sopor-tar tanto el procesamiento de transacciones como las consultas analíticas simultáneamente, a escala masiva, con los niveles más altos de fiabilidad y un bajo coste total de propiedad.

Durante más de 35 años InterSystems ha sido el motor de las aplicaciones más importantes del mundo. En los servicios financieros, la sanidad, las administraciones públicas y en todos los ámbitos en los que están en juego vidas y sustentos, millones de personas de todo el mundo dependen de la poten-cia, la escalabilidad, la integración y el rendimiento de la tecnología de InterSystems.

Para más información: financial.intersystems.com

Page 12: INTERSYSTEMS DATA PLATFORM PARA LA GESTIÓN Y ANÁLISIS DE … · normal de transacciones, como los repuntes que pueden surgir en periodos de gran volatilidad de los mercados. Un

InterSystems.es

© Copyright 2017 InterSystems Corporation. Todos los derechos reservados. 1-17

Desde las entidades que se dedican a los mercados y pagos de capital hasta las compañías de seguros y aquellas de ener-gías inteligentes, las empresas con más éxito a nivel internacional confían en no-sotros para que les ayudemos a solucionar sus mayores retos empresariales.

Nuestra tecnología permite a los clientes gestionar el riesgo de múltiples productos y en diferentes regiones, adaptarse a las cambiantes exigencias legales y transfor-mar montañas de datos complejos en me-jores decisiones empresariales.