Menú
Está libre
registro
hogar  /  SOBRE/ Sistemas Olap. Categorías de sistemas de información

Sistemas Olap. Categorías de sistemas de información

conductible

Recientemente, se ha escrito mucho sobre OLAP. Podemos decir que ha habido cierto auge en torno a estas tecnologías. Es cierto que para nosotros este boom fue algo tardío, pero esto está relacionado, por supuesto, con la situación general del país.

Los sistemas de información de toda la empresa, por regla general, contienen aplicaciones diseñadas para el análisis multivariado complejo de datos, su dinámica, tendencias, etc. Este análisis está destinado en última instancia a facilitar la toma de decisiones. A menudo, estos sistemas se denominan sistemas de apoyo a la toma de decisiones.

Los sistemas de apoyo a la toma de decisiones suelen tener medios para proporcionar al usuario datos agregados para varias muestras del conjunto inicial en una forma conveniente para la percepción y el análisis. Por lo general, estas funciones agregadas forman un conjunto de datos multidimensional (y, por lo tanto, no relacional) (a menudo llamado hipercubo o metacubo), cuyos ejes contienen parámetros y las celdas, los datos agregados que dependen de ellos, y dichos datos pueden también se almacenarán en tablas relacionales, pero en este caso, estamos hablando de la organización lógica de los datos, y no de la implementación física de su almacenamiento). A lo largo de cada eje, los datos se pueden organizar en una jerarquía que representa diferentes niveles de detalle. Gracias a este modelo de datos, los usuarios pueden formular consultas complejas, generar informes y recuperar subconjuntos de datos.

La tecnología para el análisis de datos multivariados complejos se denomina OLAP (procesamiento analítico en línea).

OLAP es un componente clave de la organización del almacenamiento de datos.

El concepto OLAP fue descrito por primera vez en 1993 por Edgar Codd, un reconocido investigador de bases de datos y autor del modelo de datos relacionales.E.F. Codd, S.B. Codd y C.T. Salley, Proporcionar OLAP (procesamiento analítico en línea) a los analistas de usuarios: un mandato de TI. Informe técnico, 1993).

En 1995, en base a los requisitos establecidos por Codd, se formuló la prueba denominada Análisis Rápido de Información Multidimensional Compartida (FASMI), que incluye los siguientes requisitos para aplicaciones de análisis multivariante:

· proporcionar al usuario los resultados del análisis en un tiempo razonable (generalmente no más de 5 s), incluso a costa de un análisis menos detallado;

· la capacidad de realizar cualquier análisis lógico y estadístico típico de esta aplicación y guardarlo en un formato accesible para el usuario final;

· acceso de múltiples usuarios a los datos con el apoyo de los mecanismos de bloqueo apropiados y los medios de acceso autorizados;

· representación conceptual multidimensional de datos, incluido el soporte total para jerarquías y jerarquías múltiples (este es un requisito clave de OLAP);

· la capacidad de acceder a cualquier información necesaria, independientemente de su volumen y ubicación de almacenamiento.

Cabe señalar que la funcionalidad OLAP se puede implementar de varias formas, desde las herramientas de análisis de datos más simples en aplicaciones de oficina hasta sistemas analíticos distribuidos basados ​​en productos de servidor. Los usuarios pueden ver fácilmente los datos en una estructura multidimensional aplicada a sus propias necesidades.

2. ¿Qué es OLAP?

OLAP es una abreviatura de Procesamiento analítico en línea, que no es el nombre de un producto específico, sino de toda una tecnología. En ruso, es más conveniente llamar al procesamiento analítico en línea OLAP. Aunque algunas publicaciones se refieren al procesamiento analítico como en línea e interactivo, el adjetivo “en línea” refleja con la mayor precisión posible el significado de la tecnología OLAP.

El desarrollo de liderazgo de soluciones de gestión cae en la categoría de áreas más difíciles de automatizar. Sin embargo, hoy existe la oportunidad de ayudar a un gerente en el desarrollo de decisiones y, lo más importante, de acelerar significativamente el proceso de desarrollo de decisiones, su selección y adopción. Puede usar OLAP para esto.

Echemos un vistazo a cómo suele funcionar el proceso de desarrollo de soluciones.

Históricamente, las soluciones para la automatización de actividades operativas son las más desarrolladas. Estamos hablando de sistemas de procesamiento de datos transaccionales (OLTP), más simplemente llamados sistemas operativos. Estos sistemas proporcionan el registro de algunos hechos, su breve almacenamiento y el almacenamiento en archivos. La base de estos sistemas la proporcionan los sistemas de gestión de bases de datos relacionales (RDBMS). El enfoque tradicional consiste en intentar utilizar sistemas operativos ya creados para respaldar la toma de decisiones. Por lo general, intentan construir un sistema desarrollado de consultas al sistema operativo y utilizan los informes obtenidos después de la interpretación directamente para respaldar las decisiones. Los informes se pueden crear de forma personalizada, es decir el gerente solicita un informe, y de forma regular, cuando los informes se construyen al llegar a algún evento o momento. Por ejemplo, un proceso de soporte de decisiones tradicional podría verse así: un gerente acude a un especialista en TI y comparte su pregunta con él. El especialista CIO luego crea una solicitud al sistema operativo, recibe un informe electrónico, lo interpreta y luego lo comunica al personal de administración. Por supuesto, tal esquema proporciona en cierta medida apoyo a la toma de decisiones, pero tiene una eficiencia extremadamente baja y una gran cantidad de desventajas. Se utilizan pocos datos para respaldar decisiones de misión crítica. Hay otros problemas también. Este proceso es muy lento, ya que el proceso mismo de redactar solicitudes e interpretar un informe electrónico es largo. Lleva muchos días, en un momento en el que el líder puede necesitar tomar una decisión ahora mismo, de inmediato. Si tenemos en cuenta que el gerente, luego de recibir el informe, puede estar interesado en otra pregunta (digamos, aclarar o requerir consideración de los datos en un contexto diferente), entonces este ciclo lento debe repetirse, y dado que el proceso de análisis los datos de los sistemas operativos se producirán de forma iterativa, se invierte aún más tiempo. Otro problema es el problema de las diferentes áreas de actividad del especialista en tecnologías de la información y el líder, quienes pueden pensar en diferentes categorías y, como resultado, no entenderse entre sí. Entonces se requerirán iteraciones de refinamiento adicionales, y esto nuevamente es tiempo, lo cual no siempre es suficiente. Otro tema importante es la complejidad de los informes para comprender. El gerente no tiene tiempo para elegir las cifras de interés del informe, especialmente porque puede haber demasiadas (recuerde los enormes informes de varias páginas en los que se utilizan varias páginas y el resto, por si acaso). También observamos que el trabajo de interpretación recae con mayor frecuencia en los especialistas de los departamentos de información. Es decir, un especialista competente se distrae con el trabajo rutinario e ineficaz de dibujar diagramas, etc., que, naturalmente, no puede tener un efecto favorable en sus calificaciones. Además, no es ningún secreto que hay simpatizantes en la cadena de interpretación que están interesados ​​en distorsionar deliberadamente la información entrante.

Las deficiencias antes mencionadas hacen pensar tanto en la eficiencia general del sistema operativo como en los costos asociados a su existencia, ya que resulta que los costos de crear un sistema operativo no se compensan adecuadamente con la eficiencia de su trabajo.

En realidad, estos problemas no son consecuencia de la mala calidad del sistema operativo ni de su mala construcción. La raíz de los problemas radica en la diferencia fundamental entre las actividades operativas que son automatizadas por el sistema operativo y las actividades de desarrollo y toma de decisiones. Esta diferencia radica en el hecho de que los datos de los sistemas operativos son simplemente registros de algunos eventos que han tenido lugar, hechos, pero de ninguna manera información en el sentido general de la palabra. La información es lo que reduce la incertidumbre en cualquier área. Y sería muy bueno que la información redujera la incertidumbre en el campo de la preparación de decisiones. El célebre E.F. Codd, el pionero de las tecnologías de administración de bases de datos relacionales en la década de 1970: "Si bien los sistemas de administración de bases de datos relacionales están disponibles para los usuarios, nunca se ha considerado que brinden funciones poderosas para sintetizar, analizar y consolidar (funciones llamadas análisis de datos multivariados)". . Se trata precisamente de la síntesis de información, de cómo convertir los datos de los sistemas operativos en información e incluso en valoraciones cualitativas. OLAP te permite hacer esta transformación.

OLAP se basa en la idea de un modelo de datos multidimensional. El pensamiento humano es multidimensional por definición. Cuando una persona hace preguntas, impone restricciones, por lo que formula preguntas en muchas dimensiones, por lo que el proceso de análisis en un modelo multidimensional es muy cercano a la realidad del pensamiento humano. Según las dimensiones del modelo multidimensional, se posponen los factores que influyen en las actividades de la empresa (por ejemplo: tiempo, productos, departamentos de la empresa, geografía, etc.). Así, se obtiene un hipercubo (claro, el nombre no es muy bueno, ya que un cubo suele entenderse como una figura de aristas iguales, que, en este caso, dista mucho de ser el caso), que luego se rellena con indicadores de la actividad de la empresa (precios, ventas, plan, beneficios, pérdidas, etc., etc.). Este llenado se puede realizar tanto con datos reales de sistemas operativos, como predecir en base a datos históricos. Las dimensiones del hipercubo pueden ser complejas, jerárquicas y se pueden establecer relaciones entre ellas. En el proceso de análisis, el usuario puede cambiar el punto de vista de los datos (la llamada operación de cambiar la vista lógica), visualizando así los datos en diferentes secciones y resolviendo problemas específicos. Se pueden realizar varias operaciones en cubos, incluida la previsión y la planificación condicional (análisis hipotético). Además, las operaciones se realizan a la vez en los cubos, es decir un producto, por ejemplo, dará como resultado un producto hipercubo, cada celda del cual es el producto de las celdas de los correspondientes hipercubos multiplicadores. Naturalmente, es posible realizar operaciones en hipercubos con diferentes números de dimensiones.

3. Historial de creación de tecnología OLAP

La idea de procesar datos en matrices multidimensionales no es nueva. En realidad, se remonta a 1962, cuando Ken Iverson publicó su libro A Programming Language (APL). La primera implementación práctica de APL tuvo lugar a finales de los sesenta por IBM. APL es un lenguaje muy elegante, definido matemáticamente con variables multidimensionales y operaciones procesables. Estaba destinado a ser la poderosa herramienta de transformación multidimensional original en comparación con otros lenguajes de programación prácticos.

Sin embargo, la idea no recibió un uso generalizado durante mucho tiempo, ya que aún no había llegado el momento de las interfaces gráficas, los dispositivos de impresión de alta calidad y la visualización de caracteres griegos requería pantallas, teclados y dispositivos de impresión especiales. Más tarde, a veces se usaron palabras en inglés para reemplazar a los operadores griegos, pero los defensores de la pureza de APL frustraron los intentos de popularizar su idioma favorito. APL también consumió recursos de la máquina. Su uso era caro en aquellos días. Los programas eran muy lentos de ejecutar y, además, el propio coste de ejecutarlos. Tomó mucha memoria, en ese momento solo volúmenes impactantes (alrededor de 6 MB).

Sin embargo, la frustración de estos errores iniciales no acabó con la idea. Se utilizó en muchas aplicaciones comerciales en los años 70 y 80. Muchas de estas aplicaciones tienen características de los sistemas de procesamiento analítico modernos. Por ejemplo, IBM desarrolló un sistema operativo para APL llamado VSPC, que algunas personas consideraron el entorno ideal para uso personal hasta que las hojas de cálculo se volvieron omnipresentes.

Pero APL era demasiado difícil de usar, especialmente porque cada vez había inconsistencias entre el lenguaje en sí y el hardware en el que se intentaba implementarlo.

En la década de 1980, APL estuvo disponible en máquinas personales, pero no encontró uso en el mercado. La alternativa era programar aplicaciones multidimensionales utilizando matrices en otros lenguajes. Esta fue una tarea muy difícil incluso para los programadores profesionales, lo que obligó a esperar la próxima generación de productos de software multidimensionales.

En 1972, varios productos de software multidimensionales aplicados anteriormente utilizados con fines educativos encontraron uso comercial: Express. Permanece en una forma completamente reescrita incluso ahora, pero los conceptos originales de los años 70 ya no son relevantes. Express es una de las tecnologías OLAP más populares de los años 90 en la actualidad, y Oracle (r) la impulsará y agregará nuevas funciones.

En la década de 1980 surgieron productos más multidimensionales. A principios de la década, un producto llamado Stratagem, más tarde llamado Acumate (hoy propiedad de Kenan Technologies), que todavía se promocionó hasta principios de los 90, pero hoy, a diferencia de Express, prácticamente no se usa.

Comshare System W fue un producto multidimensional de un estilo diferente. Introducido en 1981, fue el primero en ofrecer más desarrollo de aplicaciones financieras y para el usuario final. Introdujo muchos conceptos que no estaban bien adaptados, como reglas completamente no procedimentales, visualización y edición en pantalla completa de datos multidimensionales, recálculo automático e integración por lotes con datos relacionales. Sin embargo, el Comshare System W era lo suficientemente pesado para el hardware de la época en comparación con otros productos y se usaba menos en el futuro, se vendía menos y no hizo mejoras en el producto. Aunque todavía está disponible en UNIX en la actualidad, no es cliente-servidor, lo que no aumenta su oferta en el mercado analítico. A finales de los 80, Comshare lanzó un producto para DOS y más tarde para Windows. Estos productos se llamaron Commander Prism y utilizaron los mismos conceptos que System W.

Otro producto creativo de finales de los 80 se llamó Metáfora. Estaba dirigido a profesionales del marketing. También propuso muchos conceptos nuevos que apenas comienzan a ser ampliamente utilizados en la actualidad: computación cliente-servidor, el uso de un modelo multidimensional sobre datos relacionales, desarrollo de aplicaciones orientadas a objetos. Sin embargo, el hardware de máquina personal estándar de la época no podía funcionar con Metaphor y los proveedores se vieron obligados a desarrollar sus propios estándares para redes y máquinas personales. Poco a poco, Metaphor comenzó a funcionar con éxito en computadoras personales en serie, pero el producto se fabricó exclusivamente para OS / 2 y tenía su propia interfaz gráfica de usuario.

Luego, Metaphor firmó una alianza de marketing con IBM, que posteriormente fue adquirida. A mediados de 1994, IBM decidió integrar la tecnología Metaphor (rebautizada como DIS) con sus tecnologías futuras y de ese modo poner fin a la financiación de un negocio independiente, pero los clientes expresaron su descontento y exigieron un soporte continuo para el producto. El soporte continuó para los clientes restantes e IBM relanzó el producto con un nuevo nombre DIS, que, sin embargo, no lo hizo popular. Pero los conceptos creativos e innovadores de Metaphor no se han olvidado y son visibles en muchos productos en la actualidad.

A mediados de los 80, nació el término EIS (Sistema de Información Ejecutiva). El primer producto que demostró claramente esta dirección fue el Pilot's Command Center. Era un producto que permitía la computación colaborativa, lo que hoy llamamos computación cliente-servidor. Debido a que el poder de las computadoras personales en la década de 1980 era limitado, el producto estaba muy “centrado en el servidor”, pero el principio sigue siendo muy popular en la actualidad. Pilot no vendió el Command Center por mucho tiempo, pero ofreció muchos conceptos que se pueden aprender en los productos OLAP de hoy, incluyendo temporización automática, computación cliente / servidor multidimensional y control simplificado del proceso de análisis (mouse, pantallas sensibles, etc.). Algunos de estos conceptos se volvieron a aplicar más tarde en Pilot Analysis Server.

A finales de la década de 1980, las hojas de cálculo eran la herramienta dominante en el mercado para proporcionar análisis a los usuarios finales. Compete presentó la primera hoja de cálculo multidimensional. Se comercializó como un producto muy caro para los especialistas, pero los proveedores no brindaron una oportunidad de captura de mercado para este producto, y Computer Associates adquirió los derechos junto con otros productos, incluidos Supercalc y 20/20. El principal efecto de la adquisición de CA Compete fue una fuerte disminución de su precio y la eliminación de la protección de copia, lo que naturalmente contribuyó a su distribución. Sin embargo, no tuvo éxito. Competir está en el corazón de Supercalc 5, pero no se promueve su aspecto multidimensional. El viejo Compete todavía se usa a veces debido al hecho de que se invirtió una gran cantidad de dinero al mismo tiempo.

Lotus fue el siguiente en intentar ingresar al mercado de hojas de cálculo multidimensionales con Improv, que se ejecuta en una máquina NeXT. Esto aseguró, como mínimo, que las ventas de 1-2-3 no descendieran, pero cuando finalmente se lanzó para Windows, Excel ya tenía una gran cuota de mercado, lo que impidió que Lotus hiciera cambios en la distribución del mercado. Lotus, al igual que CA con Compete, trasladó Improv al extremo inferior del mercado, pero esto no era un requisito previo para un avance exitoso en el mercado, y los nuevos desarrollos en esta área no continuaron. Resultó que los usuarios de computadoras personales preferían las hojas de cálculo 1-2-3 y no estaban interesados ​​en las nuevas capacidades multidimensionales si no eran totalmente compatibles con sus hojas de cálculo antiguas. Asimismo, los conceptos de pequeñas hojas de cálculo de escritorio que se ofrecen como aplicaciones personales no han demostrado ser realmente útiles y se han arraigado en el mundo empresarial real. Microsoft (r) ha tomado este camino, agregando tablas dinámicas (en la edición rusa se llama "tablas dinámicas") a Excel. Si bien pocos usuarios de Excel se han beneficiado de esta función, probablemente sea el único hecho de que las capacidades de análisis multidimensionales se utilizan ampliamente en el mundo, simplemente porque hay tantos usuarios de Excel en el mundo.

4. OLAP, ROLAP, MOLAP ...

Es bien sabido que cuando Codd publicó sus reglas para construir DBMS relacionales en 1985, causaron una fuerte reacción y posteriormente tuvieron un fuerte impacto en la industria de DBMS en general. Sin embargo, pocas personas saben que en 1993 Codd publicó un trabajo titulado "OLAP para usuarios analíticos: lo que debería ser". En él, esbozó los conceptos básicos del procesamiento analítico en línea e identificó 12 reglas que deben cumplir los productos que permiten el procesamiento analítico en línea.

Estas son las reglas (el texto original se mantiene siempre que sea posible):

1. Representación conceptual multidimensional. El usuario analista ve el mundo empresarial como de naturaleza multidimensional. En consecuencia, el modelo OLAP debe ser multidimensional en su esencia. Un diagrama conceptual multidimensional o una vista personalizada facilita el modelado y el análisis, así como el cálculo.

2. Transparencia. Independientemente de si el producto OLAP es parte de los fondos del usuario o no, este hecho debe ser transparente para el usuario. Si OLAP es proporcionado por computación cliente-servidor, entonces este hecho también debería, si es posible, ser invisible para el usuario. OLAP debe presentarse en el contexto de una arquitectura verdaderamente abierta, que permita al usuario, esté donde esté, comunicarse con el servidor mediante una herramienta analítica. Además, se debe lograr transparencia cuando la herramienta analítica interactúa con entornos de bases de datos homogéneos y heterogéneos.

3. Disponibilidad. Un usuario analista OLAP debería poder realizar análisis basados ​​en un esquema conceptual común que contenga datos de toda la empresa en una base de datos relacional, así como datos de bases de datos heredadas, métodos de acceso compartido y un modelo analítico común. Esto significa que OLAP debe proporcionar su propia lógica para el acceso en un entorno de base de datos heterogéneo y realizar las transformaciones adecuadas para presentar los datos al usuario. Además, debe pensar de antemano dónde y cómo, y qué tipos de organización de datos físicos se utilizarán realmente. Un sistema OLAP solo debe acceder a los datos que realmente se necesitan y no aplicar el principio general del embudo de cocina, que implica una entrada innecesaria.

4. Productividad constante al desarrollar informes. Si aumenta el número de dimensiones o el tamaño de la base de datos, el usuario analista no debería sentir ninguna degradación significativa en el rendimiento. El rendimiento constante es fundamental para ayudar al usuario final con facilidad de uso y limitar la complejidad de OLAP. Si el analista de usuarios experimenta diferencias significativas en el desempeño de acuerdo con el número de dimensiones, entonces buscará compensar estas diferencias con una estrategia de diseño, lo que hará que los datos se presenten de otra manera que no sea la forma en que los datos realmente necesitan ser presentados. presentado. Tomarse el tiempo de recorrer el sistema para compensar su insuficiencia no es para lo que están diseñados los productos de análisis.

5. Arquitectura cliente-servidor. La mayoría de los datos que deben procesarse en línea de forma analítica en la actualidad están contenidos en mainframes y se accede a ellos a través de una PC. Esto significa, por tanto, que los productos OLAP deben poder funcionar en un entorno cliente-servidor. Desde este punto de vista, es necesario que el componente de servidor de la herramienta analítica sea sustancialmente “inteligente” para que diferentes clientes puedan conectarse al servidor con un mínimo de problemas y programación de integración. Un servidor "inteligente" debe poder realizar el mapeo y la consolidación entre esquemas de base de datos lógicos y físicos inapropiados. Esto proporcionará transparencia y construirá un esquema conceptual, lógico y físico general.

6. Multidimensionalidad general. Cada dimensión debe aplicarse sin tener en cuenta su estructura y capacidades operativas. Se pueden proporcionar capacidades operativas adicionales a dimensiones seleccionadas, y dado que las dimensiones son simétricas, se puede proporcionar una única función a cualquier dimensión. Las estructuras de datos, fórmulas y formatos de informes básicos no deben estar sesgados hacia ninguna dimensión.

7. Gestión dinámica de matrices dispersas. El diseño físico de una herramienta OLAP debe adaptarse completamente al modelo analítico específico para una gestión óptima de matrices dispersas. Para cualquier matriz dispersa dada, hay un solo esquema físico óptimo. Este esquema proporciona la máxima eficiencia de memoria y operabilidad de la matriz, a menos que, por supuesto, el conjunto de datos completo no quepa en la memoria. La física subyacente de una herramienta OLAP debe configurarse para cualquier subconjunto de dimensiones, en cualquier orden, para operaciones prácticas con grandes modelos analíticos. Los accesos físicos también deben cambiar dinámicamente y contener varios tipos de mecanismos, tales como: cálculo directo, árboles B y derivados, hash, la capacidad de combinar estos mecanismos si es necesario. La escasez (medida como porcentaje de celdas vacías para todas las posibles) es una de las características de la propagación de datos. La incapacidad para controlar la escasez puede hacer que la eficiencia de las operaciones sea inalcanzable. Si la herramienta OLAP no puede controlar y regular la distribución de los valores de los datos analizados, un modelo que pretende ser práctico, basado en muchos caminos y dimensiones de consolidación, en realidad, puede resultar innecesario y desesperado.

8. Soporte multiusuario. A menudo, varios usuarios analíticos necesitan trabajar juntos con el mismo modelo analítico o crear diferentes modelos a partir de los mismos datos. Por lo tanto, la herramienta OLAP debe proporcionar capacidades de intercambio (consulta y complemento), integridad y seguridad.

9. Cruces ilimitados. Los distintos niveles de acumulación y rutas de consolidación, debido a su naturaleza jerárquica, representan relaciones dependientes en un modelo o aplicación OLAP. Por lo tanto, la herramienta en sí debe implicar los cálculos adecuados y no requerir que el usuario analista redefina esos cálculos y operaciones. Los cálculos que no se siguen de estas relaciones heredadas requieren que se definan diferentes fórmulas de acuerdo con algún lenguaje aplicable. Dicho lenguaje puede permitir el cálculo y manipulación de datos de cualquier dimensión y no restringir la relación entre celdas de datos, sin prestar atención al número de atributos de datos comunes de celdas específicas.

10. Manipulación de datos intuitiva. La reorientación de las rutas de consolidación, el detallado, la ampliación y otras manipulaciones reguladas por las rutas de consolidación deben aplicarse a través de un impacto separado en las celdas del modelo analítico, y no deben requerir el uso de un sistema de menú u otras acciones múltiples con la interfaz de usuario. La perspectiva del usuario analista sobre las dimensiones definidas en el modelo analítico debe contener toda la información necesaria para realizar las acciones anteriores.

11. Opciones de informes flexibles. Analizar y presentar datos es sencillo cuando las filas, columnas y celdas de datos que se compararán visualmente entre sí estarán próximas entre sí o de acuerdo con alguna función lógica que tenga lugar en la empresa. Las herramientas de generación de informes deben representar datos sintetizados o información resultante del modelo de datos en cualquier orientación posible. Esto significa que las filas, columnas o páginas deben mostrar de 0 a N dimensiones al mismo tiempo, donde N es el número de dimensiones en todo el modelo analítico. Además, cada dimensión de contenido que se muestra en un solo registro, columna o página también debe poder mostrar cualquier subconjunto de los elementos (valores) contenidos en la dimensión, en cualquier orden.

12. Dimensión y número ilimitados de niveles de agregación. La investigación sobre el posible número de mediciones requeridas requeridas en un modelo analítico ha demostrado que se pueden usar hasta 19 mediciones simultáneamente. De ahí la fuerte recomendación de que la herramienta analítica pueda proporcionar al menos 15 dimensiones simultáneamente y preferiblemente 20. Además, cada una de las dimensiones genéricas no debe estar limitada por el número de niveles de agregación definidos por el usuario y rutas de consolidación definidas por el usuario analista.

De hecho, los desarrolladores de productos OLAP siguen estas reglas, o al menos se esfuerzan por seguirlas. Estas reglas pueden considerarse la base teórica del procesamiento analítico operacional, es difícil discutir con ellas. Posteriormente, muchas consecuencias se derivaron de las 12 reglas, que, sin embargo, no citaremos, para no complicar innecesariamente la historia.

Echemos un vistazo más de cerca a cómo los productos OLAP se diferencian en su implementación física.

Como se señaló anteriormente, OLAP se basa en la idea de procesar datos en estructuras multidimensionales. Cuando decimos OLAP, queremos decir que la estructura de datos de un producto analítico es lógicamente multidimensional. Cómo se implementa exactamente esto es otro asunto. Hay dos tipos principales de procesamiento analítico, que incluyen ciertos productos.

MOLAP ... El propio OLAP multidimensional. El producto se basa en una estructura de datos no relacional que proporciona almacenamiento, procesamiento y presentación de datos multidimensionales. En consecuencia, las bases de datos se denominan multidimensionales. Los productos que pertenecen a esta clase suelen tener un servidor de base de datos multidimensional. Los datos en el proceso de análisis se seleccionan exclusivamente de una estructura multidimensional. Esta estructura es muy eficiente.

ROLAP ... OLAP relacional. Como su nombre lo indica, la estructura multidimensional en tales herramientas se implementa mediante tablas relacionales. Y los datos en el proceso de análisis, respectivamente, se seleccionan de la base de datos relacional por la herramienta analítica.

Las desventajas y ventajas de cada enfoque son, en general, obvias. OLAP multidimensional proporciona un mejor rendimiento, pero las estructuras no se pueden utilizar para procesar grandes cantidades de datos, ya que las grandes dimensiones requerirán grandes recursos de hardware y, al mismo tiempo, la escasez de hipercubos puede ser muy alta y, por lo tanto, el uso de capacidades de hardware. no será justificado. Por el contrario, OLAP relacional proporciona procesamiento en grandes arreglos de datos almacenados, ya que es posible brindar un almacenamiento más económico, pero, al mismo tiempo, pierde significativamente en la velocidad del trabajo multidimensional. Dicho razonamiento llevó a la identificación de una nueva clase de herramientas analíticas: HOLAP. Este es el procesamiento analítico en línea híbrido. Las herramientas de esta clase le permiten combinar ambos enfoques: relacional y multidimensional. El acceso se puede realizar tanto a datos de bases de datos multidimensionales como a datos relacionales.

Existe otro tipo bastante exótico de procesamiento analítico en línea: DOLAP. Esto es OLAP de escritorio. Estamos hablando de tal procesamiento analítico, donde los hipercubos son pequeños, su dimensión es pequeña, las necesidades son modestas y para tal procesamiento analítico una máquina personal en el escritorio es suficiente.

El procesamiento analítico operativo le permite simplificar y acelerar significativamente el proceso de preparación y toma de decisiones por parte del personal gerencial. El procesamiento analítico en línea sirve para convertir los datos en información. Es fundamentalmente diferente del proceso tradicional de apoyo a las decisiones, que a menudo se basa en la consideración de informes estructurados. Por analogía, la diferencia entre los informes estructurados y OLAP es la misma que entre circular por la ciudad en tranvía y en coche. Cuando vas en tranvía, se mueve por los raíles, lo que no te permite ver bien los edificios lejanos, y más aún acercarte a ellos. Por el contrario, conducir un automóvil privado le brinda total libertad de movimiento (por supuesto, se deben respetar las reglas de tránsito). Puede conducir hasta cualquier edificio y llegar a lugares donde los tranvías no circulan.

Los informes estructurados son los rieles que frenan la libertad de preparar decisiones. OLAP es un vehículo para el tráfico eficiente en las autopistas de la información.

Introducción

En nuestro tiempo, casi ninguna organización puede prescindir de los sistemas de gestión de bases de datos, especialmente entre aquellas que tradicionalmente se centran en la interacción con los clientes. Bancos, compañías de seguros, aerolíneas y otras compañías de transporte, cadenas de supermercados, empresas de telecomunicaciones y marketing, organizaciones de servicios y otros, todos recopilan y almacenan gigabytes de datos sobre clientes, productos y servicios en sus bases de datos. El valor de tal información está fuera de toda duda. Estas bases de datos se denominan operativas o transaccionales porque se caracterizan por una gran cantidad de pequeñas transacciones u operaciones de lectura y escritura. Los sistemas informáticos que registran transacciones y realmente acceden a las bases de datos de transacciones se denominan comúnmente sistemas de procesamiento de transacciones en línea (OLTP) o sistemas de contabilidad.

Los sistemas contables están afinados y optimizados para realizar el máximo número de transacciones en cortos periodos de tiempo. Normalmente, las operaciones individuales son muy pequeñas y no están relacionadas entre sí. Sin embargo, cada registro de datos que caracteriza la interacción con el cliente (una llamada al soporte, una transacción en efectivo, un pedido por catálogo, una visita al sitio web de la empresa, etc.) se puede utilizar para obtener información cualitativamente nueva, es decir, para crear informes y analizar las actividades de la empresa. ...

El conjunto de funciones analíticas en los sistemas contables suele ser muy limitado. Los esquemas utilizados en las aplicaciones OLTP dificultan la creación de informes incluso simples, ya que los datos se distribuyen con mayor frecuencia en muchas tablas y se deben realizar combinaciones complejas para agregarlos. Como regla general, los intentos de crear informes complejos son computacionalmente intensivos y dan como resultado pérdidas de rendimiento.

Además, los sistemas de contabilidad almacenan datos en constante cambio. A medida que se recopilan las transacciones, los totales cambian muy rápidamente, por lo que dos análisis realizados a intervalos de varios minutos pueden producir resultados diferentes. La mayoría de las veces, el análisis se realizará al final del período del informe; de ​​lo contrario, la imagen puede distorsionarse. Además, los datos necesarios para el análisis se pueden almacenar en varios sistemas.

Algunos análisis requieren cambios estructurales que son inaceptables en el entorno operativo actual. Por ejemplo, debe averiguar qué sucede si la empresa tiene nuevos productos. Esta investigación no puede llevarse a cabo sobre una base viva. En consecuencia, el análisis eficaz rara vez se realiza directamente en el sistema contable.

Los sistemas de apoyo a la toma de decisiones suelen tener medios para proporcionar al usuario datos agregados para varias muestras del conjunto inicial en una forma conveniente para la percepción y el análisis. Por lo general, estas funciones agregadas forman un conjunto de datos multidimensional (y, por lo tanto, no relacional) (a menudo llamado hipercubo o metacubo), cuyos ejes contienen parámetros y las celdas, los datos agregados que dependen de ellos, y dichos datos pueden también se almacenará en tablas relacionales. A lo largo de cada eje, los datos se pueden organizar en una jerarquía que representa diferentes niveles de detalle. Gracias a este modelo de datos, los usuarios pueden formular consultas complejas, generar informes y recuperar subconjuntos de datos.

Esto es precisamente lo que provocó el interés por los sistemas de soporte a la toma de decisiones, que se han convertido en el principal campo de aplicación de OLAP (Procesamiento Analítico en Línea, procesamiento analítico en línea, análisis de datos en línea), que convierte el “mineral” de OLTP sistemas en un "producto" terminado que los gerentes y analistas pueden usar directamente. Este método permite a los analistas, gerentes y ejecutivos "llegar al fondo" de los datos acumulados a través de un acceso rápido y consistente a una amplia gama de vistas de información.

El objetivo del trabajo del curso es revisar la tecnología OLAP.

procesamiento de datos analíticos multidimensionales

Parte principal

1 Entendiendo OLAP

El concepto OLAP se basa en el principio de presentación de datos multidimensionales. En 1993, Edgar Codd acuñó el término OLAP. Habiendo considerado las deficiencias del modelo relacional, en primer lugar señaló la imposibilidad "de combinar, visualizar y analizar datos desde el punto de vista de múltiples dimensiones, es decir, de la forma más comprensible para los analistas corporativos", y definió el Requisitos generales para los sistemas OLAP que amplían la funcionalidad de los DBMS relacionales e incluyen el análisis multidimensional como una de sus características.

En una gran cantidad de publicaciones, la abreviatura OLAP denota no solo una vista multidimensional de los datos, sino también el almacenamiento de los datos en sí en una base de datos multidimensional. En general, esto no es cierto, ya que el propio Codd señala que "las bases de datos relacionales fueron, son y serán la tecnología más adecuada para almacenar datos corporativos. No existe la necesidad de una nueva tecnología de base de datos, sino de herramientas de análisis que complementen la Funciones de DBMS existentes flexibles para anticipar y automatizar los diferentes tipos de minería inherentes a OLAP ". Esta confusión conduce a oposiciones como "OLAP o ROLAP", lo cual no es del todo correcto, ya que ROLAP (OLAP relacional) a nivel conceptual soporta toda la funcionalidad definida por el término OLAP. Parece más preferible utilizar el término especial MOLAP para OLAP basado en DBMS multidimensional. Según Codd, una vista conceptual multidimensional es una perspectiva múltiple que consta de varias dimensiones independientes a lo largo de las cuales se pueden analizar conjuntos específicos de datos. El análisis simultáneo en múltiples dimensiones se define como análisis multivariado. Cada dimensión incluye direcciones de consolidación de datos, que consisten en una serie de niveles sucesivos de agregación, donde cada nivel superior corresponde a un mayor grado de agregación de datos para la dimensión correspondiente. Entonces, medición.

El ejecutante puede ser determinado por la dirección de consolidación, que consiste en los niveles de generalización "empresa - departamento - departamento - empleado". La dimensión Tiempo puede incluso incluir dos direcciones de consolidación: año - trimestre - mes - día y semana - día, porque el conteo del tiempo por mes y por semana es incompatible. En este caso, es posible seleccionar arbitrariamente el nivel deseado de detalle de información para cada una de las mediciones. La operación de perforación corresponde al movimiento de las etapas superiores de consolidación a las inferiores; por el contrario, una operación de enrollamiento significa pasar de niveles inferiores a niveles superiores.

Codd definió 12 reglas que un producto de software de clase OLAP debe cumplir.

1.2 Requisitos para las herramientas de procesamiento analítico en línea

Vista conceptual multidimensional. La representación conceptual de un modelo de datos en un producto OLAP debe ser de naturaleza multidimensional, es decir, debe permitir a los analistas realizar operaciones intuitivas de cortar y cortar, rotar y pivotar de direcciones de consolidación. Transparencia El usuario no debe saber qué medios específicos se utilizan para almacenar y procesar datos, cómo se organizan los datos y de dónde provienen.

Accesibilidad. El analista debe poder realizar análisis dentro del marco de un marco conceptual común, pero al mismo tiempo los datos pueden permanecer bajo el control del legado restante del DBMS, mientras están vinculados al modelo analítico general. Es decir, el kit de herramientas OLAP debe superponer su esquema lógico a conjuntos de datos físicos, realizando todas las transformaciones necesarias para proporcionar una visión única, coherente y holística del usuario sobre la información.

Rendimiento de informes consistente A medida que aumenta el número de dimensiones y tamaños de la base de datos, los analistas no deberían experimentar ninguna degradación del rendimiento. El rendimiento sostenido es esencial para mantener la facilidad de uso y la ausencia de la complejidad necesaria para llevar OLAP al usuario final.

Arquitectura cliente-servidor (Arquitectura Cliente-Servidor). La mayoría de los datos que requieren un procesamiento analítico operativo se almacenan en sistemas mainframe y se recuperan de computadoras personales. Por lo tanto, uno de los requisitos es la capacidad de los productos OLAP para funcionar en un entorno cliente-servidor. La idea principal aquí es que el componente de servidor de la herramienta OLAP debe ser lo suficientemente inteligente y tener la capacidad de construir un diagrama conceptual general basado en la generalización y consolidación de varios esquemas de bases de datos corporativos lógicos y físicos para proporcionar un efecto transparente.

Dimensionalidad genérica Todas las medidas de datos deben ser iguales. Se pueden proporcionar características adicionales a las dimensiones individuales, pero como todas son simétricas, esta funcionalidad adicional se puede proporcionar a cualquier dimensión. La estructura de datos, las fórmulas y los formatos de informe subyacentes no deben depender de ninguna dimensión.

Manejo dinámico de matriz dispersa. La herramienta OLAP debería poder manejar matrices dispersas de manera óptima. La velocidad de acceso debe mantenerse independientemente de la ubicación de las celdas de datos y ser constante para modelos con un número diferente de dimensiones y escasez de datos diferente.

Soporte para modo multiusuario (Soporte multiusuario). A menudo, varios analistas necesitan trabajar con el mismo modelo analítico al mismo tiempo o crear diferentes modelos basados ​​en los mismos datos corporativos. La herramienta OLAP debe proporcionarles acceso simultáneo, integridad y protección de datos.

Operaciones multidimensionales sin restricciones. Calcular y manipular datos en cualquier número de dimensiones no debería prohibir ni restringir ninguna relación entre celdas de datos. Las transformaciones que requieren una definición arbitraria deben especificarse en un lenguaje de fórmulas funcionalmente completo.

Manipulación de datos intuitiva. La reorientación de las direcciones de consolidación, el detalle de los datos en columnas y filas, la agregación y otras manipulaciones inherentes a la estructura de la jerarquía de direcciones de consolidación deben realizarse en la interfaz de usuario más conveniente, natural y cómoda.

Mecanismo de informes flexible (informes flexibles). Se deben admitir diferentes formas de visualización de datos, es decir, los informes deben presentarse en cualquier orientación posible.

Dimensiones ilimitadas y niveles de agregación. Es muy recomendable asumir al menos quince, y preferiblemente veinte, dimensiones en el modelo analítico en cada herramienta OLAP seria.

2 Componentes de los sistemas OLAP

2.1 Servidor. Cliente. Internet

OLAP le permite realizar análisis rápidos y eficientes en grandes cantidades de datos. Los datos se almacenan en una forma multidimensional que refleja más fielmente el estado natural de los datos comerciales reales. Además, OLAP ofrece a los usuarios la capacidad de recuperar datos resumidos de forma más rápida y sencilla. Con su ayuda, pueden profundizar en el contenido de estos datos si es necesario para obtener información más detallada.

Un sistema OLAP consta de muchos componentes. En el nivel más alto de presentación, el sistema incluye una fuente de datos, un servidor OLAP y un cliente. Una fuente de datos es una fuente de la que se toman datos para su análisis. Los datos de la fuente se transfieren o copian al servidor OLAP, donde se organizan y preparan para una generación posterior más rápida de respuestas a las consultas. El cliente es la interfaz de usuario del servidor OLAP. Esta sección del artículo describe las funciones de cada componente y la importancia de todo el sistema en su conjunto. Fuentes. La fuente en los sistemas OLAP es el servidor que proporciona los datos para el análisis. Según el alcance del producto OLAP, la fuente puede ser un almacén de datos, una base de datos heredada que contiene datos generales, un conjunto de tablas que combinan datos financieros o cualquier combinación de los anteriores. La capacidad de un producto OLAP para trabajar con datos de diferentes fuentes es muy importante. Requerir un solo formato, o una sola base de datos, para almacenar todos los datos originales, no es apropiado para los administradores de bases de datos. Además, este enfoque reduce la flexibilidad y la potencia del producto OLAP. Tanto los administradores como los usuarios creen que los productos OLAP que extraen datos no solo de fuentes diferentes sino también de múltiples fuentes son más flexibles y útiles que aquellos con requisitos más estrictos.

Servidor. El servidor OLAP es la parte aplicada del sistema OLAP. Este componente hace todo el trabajo (según el modelo del sistema) y almacena en sí mismo toda la información a la que se proporciona acceso activo. La arquitectura del servidor se rige por varios conceptos. En particular, la principal característica funcional de un producto OLAP es el uso de una base de datos multidimensional (MMDB, MDDB) o relacional (RDB, RDB) para el almacenamiento de datos. Datos agregados / preagregados

La implementación rápida de consultas es imperativa para OLAP. Este es uno de los principios básicos de OLAP: la capacidad de manipular datos de forma intuitiva requiere una rápida recuperación de la información. En general, cuanto más cálculo se necesita para obtener un fragmento de información, más lenta es la respuesta. Por tanto, con el fin de ahorrar un poco de tiempo para la implementación de las consultas, las piezas de información a las que se suele acceder con mayor frecuencia, pero que al mismo tiempo requieren computación, se someten a agregación preliminar. Es decir, se cuentan y luego se almacenan en la base de datos como datos nuevos. Un ejemplo de un tipo de datos que se puede calcular de antemano son los datos de resumen, por ejemplo, cifras de ventas por mes, trimestre o año, para los cuales los datos reales ingresados ​​son cifras diarias.

Los diferentes proveedores tienen diferentes métodos de selección para los parámetros que requieren una agregación previa y una serie de valores calculados previamente. El enfoque de agregación afecta tanto a la base de datos como al tiempo de ejecución de la consulta. Si se calculan más valores, aumenta la probabilidad de que el usuario solicite un valor ya calculado, y por tanto el tiempo de respuesta será menor, ya que no es necesario pedir el valor inicial para el cálculo. Sin embargo, si calcular todos los valores posibles no es la mejor solución, en este caso, el tamaño de la base de datos aumentará significativamente, lo que la hará inmanejable y el tiempo de agregación será demasiado largo. Además, cuando se agregan valores numéricos a la base de datos, o si cambian, esta información debe reflejarse en los valores precalculados en función de los nuevos datos. Por tanto, la actualización de la base de datos también puede llevar mucho tiempo en el caso de una gran cantidad de valores precalculados. Dado que la base de datos suele estar fuera de línea durante la agregación, es deseable que el tiempo de agregación no sea demasiado largo.

Cliente. El cliente es el que se utiliza para representar y manipular los datos de la base de datos. El cliente puede ser bastante simple, en forma de tabla, que incluye capacidades OLAP como, por ejemplo, rotación de datos (pivotar) y profundización de datos (exploración), y puede ser un visor de informes especializado pero igual de simple o ser tan potente como una aplicación personalizada diseñada para la manipulación de datos complejos. Internet es una nueva forma de cliente. Además, lleva el sello de las nuevas tecnologías; muchas soluciones de Internet difieren significativamente en sus capacidades en general y en la calidad de las soluciones OLAP en particular. Esta sección analiza las diversas propiedades funcionales de cada tipo de cliente.

Si bien el servidor es la columna vertebral de una solución OLAP, el cliente es igualmente importante. El servidor puede proporcionar una base sólida para facilitar la manipulación de datos, pero si el cliente es complejo o no muy funcional, el usuario no podrá aprovechar al máximo un servidor potente. El cliente es tan importante que muchos proveedores centran sus esfuerzos únicamente en el desarrollo del cliente. Todo lo que se incluye en estas aplicaciones es una mirada estándar a la interfaz, funciones y estructura predefinidas, así como soluciones rápidas para situaciones más o menos estándar. Por ejemplo, los paquetes financieros son populares. Las aplicaciones financieras predefinidas permitirán a los profesionales utilizar instrumentos financieros familiares sin tener que diseñar una estructura de base de datos o formularios e informes comunes. Herramienta de consulta / generador de informes. Una herramienta de consulta o un generador de informes ofrece un fácil acceso a los datos OLAP. Tienen una interfaz gráfica fácil de usar y permiten a los usuarios crear informes arrastrando y soltando objetos en el informe. Mientras que el generador de informes tradicional brinda al usuario la capacidad de producir rápidamente informes formateados, los generadores de informes compatibles con OLAP generan informes actualizados. El producto final es un informe que tiene la capacidad de profundizar en el nivel de datos, rotar (pivotar) informes, admitir jerarquías y más. Complementos (adiciones) de hojas de cálculo.

Hoy en día, en muchas líneas de negocio, se realizan diversas formas de análisis de datos corporativos mediante hojas de cálculo. En cierto modo, es un visor de informes y datos ideal. El analista puede crear macros que manipulen los datos en una dirección elegida, y la plantilla puede diseñarse para que cuando se ingresen los datos, las fórmulas calculen los valores correctos, eliminando la necesidad de volver a ingresar cálculos simples.

Sin embargo, todo esto da como resultado un informe "plano", lo que significa que una vez creado, es difícil verlo desde diferentes ángulos. Por ejemplo, un gráfico muestra información durante un período de tiempo, digamos, un mes. Y si uno quiere ver las cifras del día (a diferencia de los datos del mes), será necesario crear un gráfico completamente nuevo. Hay que definir nuevos conjuntos de datos, agregar nuevas etiquetas al gráfico y realizar muchos otros cambios simples pero tediosos. Además, hay una serie de áreas en las que se pueden cometer errores, lo que en general reduce la fiabilidad. Cuando se agrega OLAP a una tabla, es posible crear un solo gráfico y luego someterlo a varias manipulaciones para proporcionar al usuario la información necesaria, sin sobrecargarse con la creación de todas las vistas posibles. Internet como cliente. Internet es un nuevo miembro de la familia de clientes OLAP. La generación de informes OLAP a través de Internet tiene muchas ventajas. El más significativo es la ausencia de la necesidad de un software especializado para acceder a la información. Esto le ahorra a la empresa mucho tiempo y dinero.

Cada producto de Internet es específico. Algunos facilitan la creación de páginas web, pero son menos flexibles. Otros le permiten crear vistas de sus datos y luego guardarlos como archivos HTML estáticos. Todo esto permite visualizar datos a través de Internet, pero nada más. Es imposible manipular activamente los datos con su ayuda.

Existe otro tipo de producto, interactivo y dinámico, que transforma dichos productos en herramientas con todas las funciones. Los usuarios pueden profundizar en datos, pivotar, limitar dimensiones y más. Antes de elegir una herramienta de implementación de Internet, es importante comprender qué funcionalidad se requiere de una solución web y luego determinar qué producto implementará mejor esa funcionalidad.

Aplicaciones. Las aplicaciones son un tipo de cliente que usa bases de datos OLAP. Son idénticas a las herramientas de consulta y los generadores de informes descritos anteriormente, pero también agregan más funcionalidad al producto. La aplicación es generalmente más poderosa que la herramienta de consulta.

Desarrollo. Normalmente, los proveedores de OLAP proporcionan un entorno de desarrollo para que los usuarios creen sus propias aplicaciones personalizadas. El entorno de desarrollo en su conjunto es una interfaz gráfica que admite el desarrollo de aplicaciones orientadas a objetos. Además, la mayoría de los proveedores proporcionan una API que se puede utilizar para integrar bases de datos OLAP con otras aplicaciones.

2.2 clientes OLAP

Los clientes OLAP con una máquina OLAP incorporada se instalan en las PC de los usuarios. No requieren un servidor para computar y no tienen administración. Estos clientes permiten al usuario sintonizar sus bases de datos existentes; como regla, esto crea un diccionario que oculta la estructura física de los datos detrás de su descripción temática, comprensible para un especialista. El cliente OLAP luego ejecuta consultas arbitrarias y muestra los resultados en una tabla OLAP. En esta tabla, a su vez, el usuario puede manipular los datos y recibir cientos de informes diferentes en pantalla o en papel. Los clientes OLAP diseñados para trabajar con RDBMS le permiten analizar datos ya disponibles en una corporación, por ejemplo, almacenados en una base de datos OLTP. Sin embargo, su segundo propósito puede ser crear de forma rápida y económica almacenes de datos o mercados de datos; en este caso, los programadores de la organización solo necesitan crear colecciones de tablas estrella en bases de datos relacionales y procedimientos de carga de datos. La parte del trabajo que lleva más tiempo (escribir interfaces con numerosas opciones para consultas e informes personalizados) se implementa en el cliente OLAP en tan solo unas horas. El usuario final, por otro lado, tarda unos 30 minutos en dominar dicho programa. Los propios desarrolladores de bases de datos proporcionan los clientes OLAP, tanto multidimensionales como relacionales. Estos son SAS Corporate Reporter, que es casi un producto de referencia en términos de conveniencia y belleza, Oracle Discoverer, un conjunto de programas MS Pivot Services y Pivot Table, etc. Muchos programas diseñados para trabajar con MS OLAP Services se entregan como parte del Campaña OLAP realizada por Microsoft Corporation. Por lo general, son versiones mejoradas de la tabla dinámica y están diseñadas para su uso en MS Office o un navegador web. Se trata de productos de Matryx, Knosys, etc., que han ganado una inmensa popularidad en Occidente debido a su sencillez, bajo coste y eficiencia.

3 Clasificación de productos OLAP

3.1 OLAP multidimensional

Actualmente, hay una gran cantidad de productos en el mercado que brindan funcionalidad OLAP en un grado u otro. Al proporcionar una vista conceptual multidimensional desde la interfaz de usuario hasta la base de datos de origen, todos los productos OLAP se dividen en tres clases, similares a la base de datos de origen.

1. Los primeros sistemas de procesamiento analítico en línea (por ejemplo, Essbase de Arbor Software, Oracle Express Server de Oracle) pertenecían a la clase MOLAP, es decir, solo podían trabajar con sus propias bases de datos multidimensionales. Se basan en tecnologías patentadas de DBMS multidimensionales y son las más caras. Estos sistemas proporcionan un ciclo completo de procesamiento OLAP. Incluyen, además del componente de servidor, su propia interfaz de cliente integrada o utilizan programas de hoja de cálculo externos para comunicarse con el usuario. Para mantener dichos sistemas, se requiere un personal especial de empleados para instalar, mantener el sistema y formar representaciones de datos para los usuarios finales.

2. Los sistemas de procesamiento analítico online de datos relacionales (ROLAP) permiten representar datos almacenados en una base de datos relacional en forma multidimensional, proporcionando la transformación de información en un modelo multidimensional a través de una capa intermedia de metadatos. Esta clase incluye DSS Suite de MicroStrategy, MetaCube de Informix, DecisionSuite de Information Advantage y otros. El paquete de software InfoVisor, desarrollado en Rusia, en la Universidad Estatal de Ingeniería Eléctrica de Ivanovo, también es un sistema de esta clase. Los sistemas ROLAP son adecuados para trabajar con grandes instalaciones de almacenamiento. Al igual que los sistemas MOLAP, requieren un mantenimiento de TI significativo y son multiusuario.

3. Finalmente, los sistemas híbridos (Hybrid OLAP, HOLAP) están diseñados para combinar las ventajas y minimizar las desventajas inherentes a las clases anteriores. Esta clase incluye Media / MR de Speedware. Según los desarrolladores, combina la flexibilidad analítica y la capacidad de respuesta de MOLAP con el acceso constante a datos reales inherentes a ROLAP.

Además de estas herramientas, hay otra clase: herramientas de consulta e informes de escritorio, complementadas con funciones OLAP o integradas con herramientas externas que realizan dichas funciones. Estos sistemas bien desarrollados recuperan datos de fuentes originales, los transforman y los colocan en una base de datos multidimensional dinámica que se ejecuta en la estación del cliente del usuario final. Los principales representantes de esta clase son BusinessObjects de la empresa del mismo nombre, BrioQuery de Brio Technology y PowerPlay de Cognos. En el apéndice se proporciona una descripción general de algunos productos OLAP.

En los DBMS especializados basados ​​en la representación de datos multidimensionales, los datos no se organizan en forma de tablas relacionales, sino en forma de matrices multidimensionales ordenadas:

1) hipercubos (todas las celdas almacenadas en la base de datos deben tener la misma dimensión, es decir, estar en la base de medidas más completa) o

2) policubos (cada variable se almacena con su propio conjunto de medidas, y todas las dificultades de procesamiento asociadas se trasladan a los mecanismos internos del sistema).

El uso de bases de datos multidimensionales en sistemas de procesamiento analítico en línea tiene las siguientes ventajas.

1. En el caso de utilizar un DBMS multidimensional, la búsqueda y recuperación de datos es mucho más rápida que con una vista conceptual multidimensional de una base de datos relacional, ya que una base de datos multidimensional está desnormalizada, contiene indicadores preagregados y proporciona un acceso optimizado a las celdas solicitadas.

2. Los DBMS multidimensionales hacen frente fácilmente a las tareas de incluir varias funciones integradas en el modelo de información, mientras que las limitaciones objetivamente existentes del lenguaje SQL hacen que la ejecución de estas tareas sobre la base de DBMS relacionales sea bastante difícil ya veces imposible.

Por otro lado, existen limitaciones importantes.

1. Los DBMS multidimensionales no permiten trabajar con grandes bases de datos. Además, debido a la desnormalización y la agregación preliminar, la cantidad de datos en una base de datos multidimensional, por regla general, corresponde (según Codd) a 2.5-100 veces menos que el volumen de los datos detallados originales.

2. Los DBMS multidimensionales, en comparación con los relacionales, utilizan la memoria externa de manera muy ineficaz. En la inmensa mayoría de los casos, el hipercubo de información es muy escaso y, dado que los datos se almacenan en forma ordenada, los valores indefinidos se pueden eliminar solo eligiendo el orden de clasificación óptimo que permita organizar los datos en los grupos contiguos más grandes. Pero incluso en este caso, el problema solo se resuelve parcialmente. Además, es probable que el orden de clasificación óptimo para almacenar datos dispersos sea diferente del orden que se usa con más frecuencia en las consultas. Por lo tanto, en sistemas reales, debe encontrar un compromiso entre el rendimiento y la redundancia del espacio en disco ocupado por la base de datos.

Por lo tanto, el uso de DBMS multidimensionales se justifica solo bajo las siguientes condiciones.

1. El volumen de datos iniciales para el análisis no es demasiado grande (no más de varios gigabytes), es decir, el nivel de agregación de datos es bastante alto.

2. El conjunto de dimensiones de la información es estable (ya que cualquier cambio en su estructura casi siempre requiere una reestructuración completa del hipercubo).

3. El tiempo de respuesta del sistema a solicitudes ad hoc es el parámetro más crítico.

4. Se requiere un uso extensivo de funciones integradas complejas para realizar cálculos multidimensionales en celdas de un hipercubo, incluida la capacidad de escribir funciones personalizadas.

El uso directo de bases de datos relacionales en sistemas de procesamiento analítico en línea tiene las siguientes ventajas.

1. En la mayoría de los casos, los almacenes de datos corporativos se implementan mediante DBMS relacionales, y las herramientas ROLAP permiten analizar directamente sobre ellos. Al mismo tiempo, el tamaño de almacenamiento no es un parámetro tan crítico como en el caso de MOLAP.

2. En el caso de una dimensión variable del problema, cuando hay que realizar cambios en la estructura de medición con bastante frecuencia, los sistemas ROLAP con una representación dinámica de la dimensión son la solución óptima, ya que en ellos tales modificaciones no requieren de una reorganización de la base de datos.

3. Los DBMS relacionales proporcionan un nivel significativamente más alto de protección de datos y buenas oportunidades para diferenciar los derechos de acceso.

La principal desventaja de ROLAP en comparación con DBMS multidimensionales es un rendimiento más bajo. Los sistemas relacionales requieren un esquema de base de datos cuidadoso y un ajuste de índices para lograr un rendimiento comparable al de MOLAP, lo que significa un gran esfuerzo por parte de los administradores de bases de datos. Solo mediante el uso de esquemas en estrella, el rendimiento de los sistemas relacionales bien ajustados puede acercarse al rendimiento de los sistemas basados ​​en bases de datos multidimensionales.

La descripción del esquema en estrella y las recomendaciones para su uso están completamente dedicadas al trabajo. Su idea es que existen tablas para cada dimensión, y todos los hechos se colocan en una tabla, indexados por una clave múltiple compuesta por claves de dimensiones individuales (Apéndice A). Cada rayo del esquema de estrella define, en la terminología de Codd, la dirección de consolidación de datos a lo largo de la dimensión correspondiente.

Para problemas complejos con dimensiones multinivel, tiene sentido mirar las extensiones del esquema de estrella: el esquema de constelación de hecho y el esquema de copo de nieve. En estos casos, se crean tablas de hechos independientes para posibles combinaciones de niveles de resumen de diferentes dimensiones (Apéndice B). Esto permite un mejor rendimiento, pero a menudo conduce a la redundancia de datos y a complicaciones significativas en la estructura de la base de datos, que contiene una gran cantidad de tablas de hechos.

El aumento del número de tablas de hechos en la base de datos puede deberse no solo a la multiplicidad de niveles de diferentes dimensiones, sino también al hecho de que, en general, los hechos tienen diferentes conjuntos de dimensiones. Al abstraerse de mediciones individuales, el usuario debe obtener una proyección del hipercubo más completo, y de ninguna manera siempre los valores de los indicadores en él deben ser el resultado de una suma elemental. Por lo tanto, con una gran cantidad de dimensiones independientes, es necesario mantener muchas tablas de hechos correspondientes a cada posible combinación de dimensiones seleccionadas en la consulta, lo que también conduce a un uso innecesario de la memoria externa, un aumento en el tiempo de carga de datos en la consulta. base de datos de esquema en estrella de fuentes externas y complejidades de administración.

Extensiones del lenguaje SQL (operadores GROUP BY CUBE "," GROUP BY ROLLUP "y" GROUP BY GROUPING SETS ") resuelven parcialmente este problema; además, se propone un mecanismo para encontrar un compromiso entre redundancia y rendimiento, recomendando la creación de tablas de hechos. no para todas las combinaciones posibles de dimensiones, sino solo para aquellas cuyos valores de celda no se pueden obtener utilizando la agregación posterior de tablas de hechos más completas (Apéndice B).

En cualquier caso, si el modelo multidimensional se implementa como una base de datos relacional, debe crear tablas de hechos largas y "estrechas" y tablas de dimensiones relativamente pequeñas y "anchas". Las tablas de hechos contienen los valores numéricos de las celdas del hipercubo, y el resto de las tablas definen la base multidimensional de las dimensiones que las contiene. Parte de la información se puede obtener mediante la agregación dinámica de datos distribuidos sobre estructuras normalizadas no estelares, aunque debe recordarse que las consultas que involucran agregación con una estructura de base de datos altamente normalizada pueden ser bastante lentas.

Centrarse en la presentación de información multidimensional utilizando modelos relacionales en forma de estrella le permite deshacerse del problema de optimizar el almacenamiento de matrices dispersas, que es agudo para DBMS multidimensionales (donde el problema de escasez se resuelve mediante una elección especial de esquema) . Aunque se utiliza un registro completo para almacenar cada celda, que, además de los valores en sí, incluye claves secundarias: referencias a tablas de dimensiones, los valores inexistentes simplemente no se incluyen en la tabla de hechos.

Conclusión

Habiendo considerado los temas de operación y aplicación de la tecnología OLAP, las empresas tienen preguntas, cuyas respuestas permitirán elegir el producto que mejor se adapte a las necesidades del usuario.

Estas son las siguientes preguntas:

¿De dónde provienen los datos? - Los datos a analizar se pueden ubicar en diferentes lugares. Es posible que la base de datos OLAP los reciba de un data warehouse corporativo o de un sistema OLTP. Si el producto OLAP ya tiene la capacidad de acceder a una fuente de datos, se reducen los procesos de categorización y limpieza de datos.

¿Qué tipo de manipulaciones realiza el usuario con los datos? -
Una vez que el usuario ha accedido a la base de datos y ha comenzado a realizar el análisis, es importante que pueda manipular los datos de forma adecuada. Dependiendo de las necesidades del usuario, es posible que necesite un potente generador de informes o la capacidad de crear y alojar páginas web dinámicas. Sin embargo, puede ser preferible que el usuario tenga a su disposición un medio para crear fácil y rápidamente sus propias aplicaciones.

¿Cuál es la cantidad total de datos? - Este es el factor más importante a la hora de definir una base de datos OLAP. Los productos OLAP relacionales pueden manejar grandes cantidades de datos mejor que los multidimensionales. Si el volumen de datos no requiere el uso de una base de datos relacional, el producto multidimensional se puede utilizar con el mismo éxito.

¿Quién es el usuario? - Al definir un cliente de sistema OLAP, el nivel de habilidad del usuario es importante. Algunos usuarios encontrarán más conveniente integrar OLAP con una hoja de cálculo, mientras que otros preferirán una aplicación especializada. Dependiendo de las calificaciones del usuario, también se decide la cuestión de realizar la formación. Es posible que una gran empresa desee pagar por la formación de los usuarios, pero una empresa más pequeña no. El cliente debe ser tal que los usuarios se sientan seguros y puedan utilizarlo de forma eficaz.

Hoy en día, la mayoría de las empresas del mundo han pasado a utilizar OLAP como tecnología subyacente para proporcionar información a los responsables de la toma de decisiones. Por lo tanto, la pregunta fundamental que debe plantearse no es si las hojas de cálculo deben seguir utilizándose como la plataforma principal para la presentación de informes, la elaboración de presupuestos y la previsión. Las empresas deben preguntarse si están preparadas para perder una ventaja competitiva al utilizar información inexacta, irrelevante e incompleta antes de madurar y considerar tecnologías alternativas.

Asimismo, en conclusión, cabe señalar que las capacidades analíticas de las tecnologías OLAP aumentan la utilidad de los datos almacenados en el almacén de información corporativa, permitiendo a la empresa interactuar de manera más efectiva con sus clientes.

Glosario

Concepto Definición
1 Herramientas de BI Herramientas y tecnologías utilizadas para acceder a la información. Incluye tecnologías OLAP, minería de datos y análisis complejo; herramientas de usuario final y herramientas de creación de consultas ad-hoc, paneles de control de negocios y generadores de informes corporativos.
2 Procesamiento analítico en línea, OLAP Una tecnología para el procesamiento analítico de información en tiempo real, que incluye la preparación y publicación dinámica de informes y documentos.
3 Parte y pica Término utilizado para describir la sofisticada funcionalidad de análisis de datos proporcionada por las herramientas OLAP. Obtención de datos de un cubo multidimensional con valores especificados y posición relativa especificada de dimensiones.
4 Pivote de datos El proceso de rotar una tabla de datos, es decir, convertir columnas en filas y viceversa.
5 Miembro calculado Un elemento de dimensión cuyo valor está determinado por los valores de otros elementos (por ejemplo, aplicaciones matemáticas o lógicas). El elemento calculado puede ser parte del servidor OLAP o ser descrito por el usuario durante una sesión interactiva. Un artículo calculado es cualquier artículo que no se ingresa, sino que se calcula.
6 Modelos de negocios globales Un tipo de almacén de datos que brinda acceso a la información que se distribuye en diferentes sistemas de la empresa y está bajo el control de diferentes divisiones o departamentos con diferentes bases de datos y modelos de datos. Este tipo de almacén de datos es difícil de construir debido a la necesidad de combinar los esfuerzos de los usuarios de diferentes departamentos para desarrollar un modelo de datos común para el almacén.
7 Procesamiento de datos Técnicas que utilizan herramientas de software diseñadas para un usuario que, por regla general, no puede decir de antemano qué es exactamente lo que está buscando, sino que solo puede indicar ciertos patrones y direcciones de búsqueda.
8 Servidor de cliente Enfoque tecnológico, que consiste en dividir el proceso en funciones separadas. El servidor realiza varias funciones: gestión de comunicaciones, mantenimiento de la base de datos, etc. El cliente realiza funciones de usuario individuales: proporciona interfaces adecuadas, realiza navegación entre pantallas, proporciona funciones de ayuda, etc.
9 Base de datos multidimensional, MDBS y MDBMS Una poderosa base de datos que permite a los usuarios analizar grandes cantidades de datos. Una base de datos con una organización de almacenamiento especial: cubos, que proporciona un trabajo de alta velocidad con datos almacenados como una colección de hechos, dimensiones y agregados precalculados.
10 Profundizar Un método de minería de datos detallado que se utiliza para analizar el nivel de datos agregados. Los niveles de "profundización" dependen de la granularidad de los datos en [almacenamiento.
11 Almacén central

1. Una base de datos que contiene datos recopilados de los sistemas operativos de una organización. Tiene una estructura conveniente para el análisis de datos. Diseñado para apoyar la toma de decisiones y crear un espacio de información único para la corporación.

2. Una forma de automatización, que abarque todos los sistemas de información controlados desde un solo lugar.

1 Golitsina O.L., Maksimov N.V., Popov I.I. Bases de datos: Tutorial. - M.: FORO: INFRA-M, 2003 .-- 352 p.

2 Fecha K. Introducción a los sistemas de bases de datos. - M.: Nauka, 2005 - 246 p.

3 Elmanova N.V., Fedorov A.A. Introducción a las tecnologías OLAP de Microsoft. - M .: Dialog-MEPhI, 2004.- 312 p.

4 Karpova T.S. Bases de datos: modelos, desarrollo, implementación. - SPb.: Peter, 2006 .-- 304 p.

5 Korovkin S. D., Levenets I. A., Ratmanova I. D., Starykh V. A., Shchavelev L. V. Solución del problema del análisis operativo complejo de información en almacenes de datos // DBMS. - 2005. - No. 5-6. - 47-51 p.

6 Krechetov N., Ivanov P. Productos para la minería de datos ComputerWeek-Moscow. - 2003. - No. 14-15. - 32-39 p.

7 Przhiyalkovsky V.V. Análisis complejo de grandes datos: nuevas perspectivas de informatización // DBMS. - 2006. - No. 4. - 71-83 p.

8 Sakharov A.A. El concepto de construcción e implementación de sistemas de información enfocados en el análisis de datos // DBMS. - 2004. - No. 4. - 55-70 p.

9 Ullman J. Conceptos básicos de los sistemas de bases de datos. - M.: Finanzas y estadísticas, 2003. - 312 p.

10 Hubbard J. Diseño de bases de datos asistido por computadora. - M.: Mir, 2007.- 294 p.


Korovkin S. D., Levenets I. A., Ratmanova I. D., Starykh V. A., Shchavelev L. V. Solución del problema del análisis operativo complejo de información en almacenes de datos // DBMS. - 2005. - No. 5-6. - 47-51 p.

Ullman J. Conceptos básicos de los sistemas de bases de datos. - M.: Finanzas y estadísticas, 2003. - 312 p.

Barsegyan A.A., Kupriyanov M.S. Tecnologías de análisis de datos: DataMining, VisualMining, TextMining, Olap. - SPb.: BHV-Petersburg, 2007 .-- 532 p.

Elmanova N.V., Fedorov A.A. Introducción a las tecnologías OLAP de Microsoft. - M .: Dialog-MEPhI, 2004.- 312 p.

Fecha K. Introducción a los sistemas de bases de datos. - M.: Nauka, 2005 - 246 p.

Golitsina O.L., Maksimov N.V., Popov I.I. Bases de datos: Tutorial. - M.: FORO: INFRA-M, 2003.- 352s.

Sakharov A.A. El concepto de construcción e implementación de sistemas de información enfocados en el análisis de datos // DBMS. - 2004. - No. 4. - 55-70 p.

Przhiyalkovskiy V.V. Análisis complejo de grandes datos: nuevas perspectivas de informatización // DBMS. - 2006. - No. 4. - 71-83 p.

El objetivo del trabajo del curso es estudiar la tecnología OLAP, el concepto de su implementación y estructura.

En el mundo moderno, las redes informáticas y los sistemas informáticos permiten analizar y procesar grandes cantidades de datos.

Una gran cantidad de información complica enormemente la búsqueda de soluciones, pero permite obtener cálculos y análisis mucho más precisos. Para resolver este problema, existe toda una clase de sistemas de información que realizan análisis. Dichos sistemas se denominan sistemas de soporte de decisiones (DSS) (DSS, Decision Support System).

Para realizar el análisis, el DSS debe acumular información, disponiendo de los medios para su entrada y almacenamiento. En total, hay tres tareas principales resueltas en el DSS:

· Entrada de datos;

· almacenamiento de datos;

· análisis de los datos.

La entrada de datos en el DSS se realiza automáticamente desde sensores que caracterizan el estado del medio ambiente o proceso, o por un operador humano.

Si los datos se ingresan automáticamente desde los sensores, los datos se acumulan mediante la señal de preparación que aparece cuando aparece la información o mediante sondeo cíclico. Si la entrada es realizada por una persona, entonces debe proporcionar a los usuarios medios convenientes para ingresar datos, verificar la exactitud de la entrada y realizar los cálculos necesarios.

Al ingresar datos simultáneamente por varios operadores, es necesario resolver los problemas de modificación y acceso paralelo de los mismos datos.

DSS proporciona a los analistas datos en forma de informes, tablas, gráficos para su estudio y análisis, razón por la cual estos sistemas brindan funciones de apoyo a la toma de decisiones.

En los subsistemas de entrada de datos denominados OLTP (procesamiento de transacciones en línea), se implementa el procesamiento de datos operativos. Para su implementación se utilizan sistemas de gestión de bases de datos (DBMS) convencionales.

El subsistema de análisis se puede construir sobre la base de:

· Subsistemas de análisis de recuperación de información basados ​​en DBMS relacionales y consultas estáticas utilizando el lenguaje SQL;

· Subsistemas de análisis operacional. Para implementar dichos subsistemas, se utiliza la tecnología de procesamiento de datos analíticos en línea OLAP, que utiliza el concepto de presentación de datos multidimensionales;

· Subsistemas de análisis intelectual. Este subsistema implementa métodos y algoritmos de DataMining.

Desde el punto de vista del usuario, los sistemas OLAP proporcionan un medio de visualización flexible de la información en varios cortes, obtención automática de datos agregados, realizando operaciones analíticas de convolución, detalle, comparación en el tiempo. Gracias a todo esto, los sistemas OLAP son una solución con grandes ventajas en el campo de la preparación de datos para todo tipo de reportes comerciales, involucrando la presentación de datos en diferentes secciones y diferentes niveles de jerarquía, tales como reportes de ventas, diversas formas de presupuestos, y otros. Los sistemas OLAP tienen grandes ventajas de tal presentación en otras formas de análisis de datos, incluida la previsión.

1.2 Definición OLAP-sistemas

La tecnología para el análisis de datos multivariados complejos se llama OLAP. OLAP es un componente clave de una organización de HD.

La funcionalidad OLAP se puede implementar de varias formas, tanto las más simples, como el análisis de datos en aplicaciones de oficina, como las más complejas: sistemas analíticos distribuidos basados ​​en productos de servidor.

OLAP (On-LineAnalyticalProcessing) es una tecnología para el procesamiento de datos analíticos en línea que utiliza herramientas y métodos para recopilar, almacenar y analizar datos multidimensionales y para respaldar los procesos de toma de decisiones.

El propósito principal de los sistemas OLAP es apoyar actividades analíticas, solicitudes arbitrarias de usuarios analíticos. El propósito del análisis OLAP es probar hipótesis emergentes.

Objeto del informe

Este informe se centrará en una de las categorías de tecnologías inteligentes que son una herramienta analítica conveniente: las tecnologías OLAP.

El propósito del informe: revelar y resaltar 2 temas: 1) el concepto de OLAP y su valor aplicado en la gestión financiera; 2) Implementación de la funcionalidad OLAP en soluciones de software: diferencias, oportunidades, ventajas, desventajas.

Quiero señalar de inmediato que OLAP es una herramienta universal que se puede utilizar en cualquier área aplicada, no solo en finanzas (como se puede entender por el título del informe), que requiere el análisis de datos por varios métodos.

Gestión financiera

La gestión financiera es un área donde el análisis es más importante que cualquier otro. Cualquier decisión financiera y de gestión surge como resultado de ciertos procedimientos analíticos. Hoy en día, la gestión financiera está adquiriendo un papel importante para el buen funcionamiento de una empresa. A pesar de que la gestión financiera es un proceso auxiliar en la empresa, requiere una atención especial, ya que las decisiones financieras y de gestión erróneas pueden generar grandes pérdidas.

La gestión financiera tiene como objetivo dotar a la empresa de recursos financieros en los volúmenes requeridos, en el momento adecuado y en el lugar adecuado para obtener el máximo efecto de su uso a través de una distribución óptima.

Quizás sea difícil determinar el nivel de "máxima eficiencia en el uso de recursos", pero en cualquier caso,

El director financiero siempre debe saber:

  • cuantos recursos financieros hay?
  • ¿De dónde vendrán los fondos y en qué cantidades?
  • ¿Dónde invertir de manera más eficiente y por qué?
  • y ¿en qué momentos es necesario hacer todo esto?
  • ¿Cuánto se necesita para asegurar el funcionamiento normal de la empresa?

Para obtener respuestas razonables a estas preguntas, es necesario tener, analizar y saber analizar una cantidad suficientemente grande de indicadores de desempeño. Además, FI cubre una gran cantidad de áreas: análisis de flujos de caja (flujo de caja), análisis de activos y pasivos, análisis de rentabilidad, análisis de márgenes, análisis de rentabilidad, análisis de surtido.

Conocimiento

Por tanto, el factor clave en la eficacia del proceso de gestión financiera es la disponibilidad de conocimientos:

  • Conocimientos personales en el área temática (se podría decir teóricos y metodológicos), incluida la experiencia, la intuición de un financiero / CFO
  • Conocimiento general (corporativo) o información sistematizada sobre los hechos de las transacciones financieras en la empresa (es decir, información sobre el estado pasado, presente y futuro de la empresa, presentada en varios indicadores y mediciones)

Si el primero se encuentra en el área de acción de este financiero (o el director de recursos humanos que contrató a este empleado), entonces el segundo debe crearse a propósito en la empresa mediante los esfuerzos conjuntos de los empleados de los servicios financieros y de información.

Qué es ahora

Sin embargo, ahora una situación paradójica es típica en las empresas: hay información, hay mucha, demasiada. Pero está en un estado caótico: desestructurado, inconsistente, disperso, no siempre confiable y muchas veces erróneo, es casi imposible encontrarlo y obtenerlo. Se realiza una larga y muchas veces inútil generación de montañas de estados financieros, lo cual resulta inconveniente para el análisis financiero, difícil de entender, ya que no se crea para la gestión interna, sino para su presentación a las autoridades reguladoras externas.

Según los resultados de un estudio realizado por la empresa Reuters Entre los 1.300 gerentes internacionales, el 38% de los encuestados dice que pasa mucho tiempo tratando de encontrar la información que necesita. Resulta que un especialista altamente calificado dedica su tiempo altamente remunerado no al análisis de datos, sino a recopilar, buscar y organizar la información necesaria para este análisis. Al mismo tiempo, los gerentes experimentan una gran cantidad de datos que a menudo son irrelevantes, lo que nuevamente reduce su eficiencia. El motivo de esta situación: exceso de información y desconocimiento.

Qué hacer

La información debe transformarse en conocimiento. Para los negocios modernos, la información valiosa, su adquisición sistemática, síntesis, intercambio, uso es una especie de moneda, pero para recibirla es necesario gestionar la información, como cualquier proceso empresarial.

La clave para la gestión de la información es entregar la información correcta de la manera correcta a las partes interesadas dentro de la organización en un momento específico. El objetivo de dicha gobernanza es ayudar a las personas a trabajar mejor juntas utilizando cantidades cada vez mayores de información.

Las tecnologías de la información en este caso actúan como un medio por el cual sería posible sistematizar la información en una empresa, brindar acceso a la misma a ciertos usuarios y brindarles herramientas para convertir esta información en conocimiento.

Conceptos básicos de las tecnologías OLAP

La tecnología OLAP (del inglés On-Line Analytical Processing) es el nombre no de un producto específico, sino de toda una tecnología de análisis operativo de datos multidimensionales acumulados en el almacenamiento. Para comprender la esencia de OLAP, es necesario considerar el proceso tradicional de obtención de información para la toma de decisiones.

Sistema de apoyo a la toma de decisiones tradicional

Aquí, por supuesto, también puede haber muchas opciones: un caos de información completo, o la situación más típica cuando una empresa tiene sistemas operativos con la ayuda de los cuales los hechos de ciertas operaciones se registran y almacenan en bases de datos. Para recuperar datos de bases de datos con fines analíticos, se ha construido un sistema de consultas para determinadas muestras de datos.

Pero este método de apoyo a la toma de decisiones carece de flexibilidad y tiene muchas desventajas:

  • utiliza una cantidad insignificante de datos que pueden ser útiles para la toma de decisiones
  • a veces se crean informes complejos de varias páginas, de los cuales se utilizan 1 o 2 líneas (el resto es por si acaso) - sobrecarga de información
  • Reacción lenta del proceso a los cambios: si se requiere una nueva representación de datos, entonces el programador debe describir y codificar formalmente la solicitud y luego ejecutarla. Tiempo de espera: horas, días. Quizás se necesite una solución ahora, de inmediato. Pero luego de recibir nueva información, surgirá una nueva pregunta (aclarando)

Si los informes de consultas se presentan en un formato unidimensional, los problemas comerciales suelen ser multidimensionales y multifacéticos. Si necesita obtener una imagen clara del negocio de la empresa, entonces es necesario analizar los datos en diferentes aspectos.

Muchas empresas crean excelentes bases de datos relacionales, idealmente descomponiendo montañas de información no utilizada en los estantes, lo que por sí solo no proporciona una reacción rápida o suficientemente competente a los eventos del mercado. SÍ, las bases de datos relacionales fueron, son y serán la tecnología más adecuada para almacenar datos corporativos. Esta no es una nueva tecnología de base de datos, sino más bien un conjunto de herramientas de análisis que complementa la funcionalidad del DBMS existente y es lo suficientemente flexible para adaptarse y automatizar los diferentes tipos de minería inherentes a OLAP.

Entendiendo OLAP

¿Qué da OLAP?

  • Herramientas avanzadas para acceder al almacenamiento de datos
  • Manipulación dinámica de datos interactivos (rotación, consolidación o exploración)
  • Visualización clara de datos
  • Rápido: el análisis se realiza en tiempo real
  • Presentación de datos multidimensionales: análisis simultáneo de múltiples indicadores en múltiples dimensiones

Para obtener un efecto del uso de tecnologías OLAP, debe: 1) comprender la esencia de las tecnologías en sí y sus capacidades; 2) definir claramente qué procesos necesitan ser analizados, qué indicadores se caracterizarán y en qué dimensiones es recomendable verlos, es decir, crear un modelo de análisis.

Los conceptos básicos que utilizan las tecnologías OLAP son los siguientes:

Multidimensionalidad

Para comprender la multidimensionalidad de los datos, primero debe presentar una tabla que muestre, por ejemplo, el desempeño de los costos empresariales por elemento económico y unidad de negocio.

Estos datos se presentan en dos dimensiones:

  • artículo
  • unidad de negocio

Esta tabla no es informativa, ya que muestra las ventas durante un período de tiempo determinado. Para diferentes períodos de tiempo, los analistas deberán comparar varias tablas (para cada período de tiempo):

La figura muestra una tercera dimensión, el Tiempo, además de las dos primeras. (Artículo, unidad de negocio)

Otra forma de mostrar datos multidimensionales es representarlos en forma de cubo:

Los cubos OLAP permiten a los analistas obtener datos en diferentes porciones para obtener respuestas a las preguntas que hace la empresa:

  • ¿Cuáles son los costos críticos en qué unidades de negocio?
  • ¿Cómo cambian los costos de las unidades de negocio con el tiempo?
  • ¿Cómo cambian los artículos de costo con el tiempo?

Las respuestas a estas preguntas son necesarias para la toma de decisiones de gestión: reducir determinados elementos de coste, influir en su estructura, identificar las razones de los cambios de costes a lo largo del tiempo, desviaciones del plan y eliminarlas, optimizar su estructura.

En este ejemplo, solo se consideran 3 dimensiones. Es difícil representar más de 3 dimensiones, pero funciona de la misma manera que con 3 dimensiones.

Por lo general, las aplicaciones OLAP le permiten obtener datos en 3 o más dimensiones, por ejemplo, puede agregar una dimensión más: Plan-Real, Categoría de costo: directo, indirecto, por pedidos, por mes. Las dimensiones adicionales le permiten obtener más porciones analíticas y proporcionar respuestas a preguntas con múltiples condiciones.

Jerarquía

OLAP también permite a los analistas organizar cada dimensión en una jerarquía de grupos y subgrupos y totales que representan una medida en toda la organización, la forma más lógica de analizar una empresa.

Por ejemplo, es recomendable agrupar los costos jerárquicamente:

OLAP permite a los analistas obtener datos de una medida de resumen general (en el nivel superior) y luego profundizar en los niveles inferior y posterior, descubriendo así la razón exacta del cambio en la medida.

Al permitir que los analistas utilicen múltiples dimensiones en un cubo de datos, con la posibilidad de dimensiones jerárquicas, OLAP proporciona una imagen del negocio que no está comprimida por la estructura del almacén de datos.

Cambiar las direcciones de análisis en un cubo (rotación de datos)

Por regla general, operan con los siguientes conceptos: dimensiones especificadas en columnas, filas (puede haber varias), el resto forma rodajas, los contenidos de la tabla están formados por dimensiones (ventas, costos, efectivo)

Normalmente, OLAP le permite cambiar la orientación de las dimensiones de un cubo, presentando así los datos en diferentes vistas.

La visualización de los datos del cubo depende de:

  • orientaciones de dimensión: qué dimensiones se especifican en filas, columnas, cortes;
  • grupos de indicadores resaltados en filas, columnas, cortes.
  • El cambio de dimensiones radica en el campo de acción del usuario.

De esta forma, OLAP le permite realizar varios tipos de análisis y comprender su relación con sus resultados.

  • Análisis de desviaciones: un análisis de la implementación del plan, que se complementa con un análisis factorial de las causas de las desviaciones al detallar los indicadores.
  • Análisis de dependencia: OLAP le permite identificar varias dependencias entre diferentes cambios, por ejemplo, cuando se eliminó la cerveza del surtido durante los primeros dos meses, se encontró una caída en las ventas de cucarachas.
  • Comparación (análisis comparativo). Comparación de los resultados de los cambios en el indicador a lo largo del tiempo, para un determinado grupo de productos, en diferentes regiones, etc.
  • El análisis de la dinámica le permite identificar ciertas tendencias en el cambio de indicadores a lo largo del tiempo.

Prontitud: podemos decir que OLAP se basa en las leyes de la psicología: la capacidad de procesar solicitudes de información en "tiempo real" - al ritmo del proceso de comprensión analítica de datos por parte del usuario.

Si puede leer alrededor de 200 registros por segundo de una base de datos relacional y escribir 20, entonces un buen servidor OLAP, usando filas y columnas calculadas, puede consolidar 20,000-30,000 celdas (equivalente a un registro en una base de datos relacional) por segundo.

Visibilidad: Cabe destacar que OLAP proporciona una presentación gráfica avanzada de datos para el usuario final. El cerebro humano es capaz de percibir y analizar información presentada en forma de imágenes geométricas, en un volumen varios órdenes de magnitud mayor que la información presentada en forma alfanumérica. Ejemplo: Suponga que necesita encontrar un rostro familiar en una de las cien fotografías. Creo que este proceso le llevará menos de un minuto. Ahora imagine que en lugar de fotografías se le ofrecerán cien descripciones verbales de las mismas personas. Creo que no podrá resolver el problema propuesto en absoluto.

Sencillez: La característica principal de estas tecnologías es que están enfocadas en el uso no por un especialista en TI, ni por un estadístico experto, sino por un profesional en el campo aplicado: el gerente del departamento de crédito, el gerente del departamento de presupuesto, y finalmente el director. Están diseñados para que el analista se comunique con el problema, no con la computadora..

A pesar de las grandes capacidades de OLAP (además, la idea es relativamente antigua - los años 60), de hecho, su uso prácticamente no se encuentra en nuestras empresas. ¿Por qué?

  • no hay información o las posibilidades no están claras
  • hábito de pensar bidimensionalmente
  • barrera de precios
  • capacidad de fabricación excesiva de artículos en OLAP: términos desconocidos ahuyentan - OLAP, "excavación y corte de datos", "consultas ad hoc", "identificación de correlaciones significativas"

Nuestro enfoque y enfoque occidental de las aplicaciones OLAP

Además, también tenemos un conocimiento específico de la utilidad de OLAP incluso al comprender sus capacidades tecnológicas.

Autores nuestros y rusos de diversos materiales sobre OLAP expresan la siguiente opinión sobre la utilidad de OLAP: la mayoría percibe OLAP como una herramienta que permite expandir y colapsar datos de manera simple y conveniente, realizando manipulaciones que se le ocurren al analista durante el análisis. Cuantos más "cortes" y "cortes" de datos ve un analista, más ideas tiene, que, a su vez, requieren más y más "cortes" para ser verificados. No está bien.

La comprensión occidental de la utilidad de OLAP se basa en un modelo metodológico de análisis, que debe establecerse en el diseño de soluciones OLAP. El analista no debe jugar con el cubo OLAP y cambiar sin rumbo fijo sus dimensiones y niveles de detalle, orientación de datos, visualización gráfica de datos (¡y realmente se necesita!), Sino comprender claramente qué vistas necesita, en qué secuencia y por qué (por supuesto , elementos "descubrimientos" puede haber, pero este no es un elemento fundamental de la utilidad de OLAP).

Uso aplicado de OLAP

  • Presupuesto
  • Flujo de fondos

Uno de los campos de aplicación más fértiles de las tecnologías OLAP. No en vano, ningún sistema presupuestario moderno se considera completo sin la presencia de herramientas OLAP para el análisis presupuestario en su composición. La mayoría de los informes presupuestarios se crean fácilmente sobre la base de sistemas OLAP. Al mismo tiempo, los informes responden a un abanico muy amplio de preguntas: análisis de la estructura de gastos e ingresos, comparación de gastos para ciertos rubros en diferentes departamentos, análisis de dinámica y tendencias de gastos para ciertos rubros, análisis de costos y ganancias .

OLAP le permitirá analizar las entradas y salidas de efectivo en el contexto de transacciones comerciales, contrapartes, divisas y tiempo con el fin de optimizar sus flujos.

  • Informes financieros y de gestión (con los análisis que necesita la dirección)
  • Márketing
  • Cuadro de mando integral
  • Análisis de rentabilidad

Cuando los datos relevantes estén disponibles, puede encontrar una aplicación de tecnología OLAP diferente.

Productos OLAP

Esta sección hablará sobre OLAP como solución de software.

Requisitos generales para productos OLAP

Hay muchas formas de implementar aplicaciones OLAP, entonces ninguna tecnología en particular debería haber sido requerida, ni siquiera recomendada. En diferentes condiciones y circunstancias, un enfoque puede ser preferible al otro. La técnica de implementación incluye muchas ideas propietarias diferentes de las que los proveedores están tan orgullosos: tipos de arquitectura cliente / servidor, análisis de series de tiempo, orientación a objetos, optimización de almacenamiento, procesos paralelos, etc. Pero estas tecnologías no pueden ser parte de la definición OLAP.

Hay características que deben observarse en todos los productos OLAP (si es un producto OLAP), que son la tecnología ideal. Estas son 5 definiciones clave que caracterizan a OLAP (la llamada prueba FASMI): Análisis rápido de información multidimensional compartida.

  • Rápido(RÁPIDO): significa que el sistema debería poder proporcionar la mayoría de las respuestas a los usuarios en aproximadamente cinco segundos. Incluso si el sistema advierte que el proceso llevará mucho más tiempo, los usuarios pueden distraerse y perder sus pensamientos, y la calidad del análisis se ve afectada. Esta velocidad no es fácil de lograr con grandes cantidades de datos, especialmente si se requieren cálculos especiales sobre la marcha. Los proveedores están recurriendo a una amplia variedad de métodos para lograr este objetivo, incluidas formas especializadas de almacenamiento de datos, precálculo extenso o requisitos de hardware más estrictos. Sin embargo, actualmente no existen soluciones totalmente optimizadas. A primera vista, puede parecer sorprendente que al recibir un informe en un minuto, que no hace tanto tiempo tomaba días, el usuario se aburre muy rápidamente mientras espera, y el proyecto resulta mucho menos exitoso que en el caso de un respuesta instantánea, incluso a costa de un análisis menos detallado.
  • Compartido significa que el sistema permite cumplir con todos los requisitos de protección de datos e implementar acceso distribuido y simultáneo a los datos para diferentes niveles de usuarios. El sistema debe poder manejar múltiples cambios de datos de manera oportuna y segura. Esta es una debilidad importante en muchos productos OLAP, que tienden a asumir que todas las aplicaciones OLAP son de solo lectura y brindan protecciones simplificadas.
  • Multidimensional es un requisito clave. Si tuviera que definir OLAP en una palabra, lo elegiría. El sistema debe proporcionar una vista conceptual multidimensional de los datos, incluido el soporte completo para jerarquías y jerarquías múltiples, ya que esto determina la forma más lógica de analizar el negocio. No existe un número mínimo de dimensiones para procesar, ya que también depende de la aplicación, y la mayoría de los productos OLAP tienen dimensiones suficientes para los mercados a los que se dirigen. Nuevamente, no estamos especificando qué tecnología de base de datos subyacente debe usarse si el usuario recibe una representación conceptual verdaderamente multidimensional de la información. Esta característica está en el corazón de OLAP
  • Información. La información necesaria debe obtenerse donde se necesite, independientemente de su volumen y ubicación de almacenamiento. Sin embargo, mucho depende de la aplicación. La potencia de varios productos se mide en términos de la cantidad de entrada que pueden procesar, pero no de la cantidad de gigabytes que pueden almacenar. La potencia de los productos varía enormemente: los productos OLAP más grandes pueden manejar al menos mil veces más datos que los más pequeños. Hay muchos factores a considerar a este respecto, incluida la duplicación de datos, RAM requerida, uso de espacio en disco, rendimiento, integración de almacenamiento de datos y más.
  • Análisis significa que el sistema puede manejar cualquier análisis lógico y estadístico específico de una aplicación dada, y asegura que se guarde en una forma accesible para el usuario final. El usuario debe poder definir nuevos cálculos personalizados como parte del análisis sin necesidad de programación. Es decir, toda la funcionalidad de análisis requerida debe proporcionarse de manera intuitiva a los usuarios finales. Las herramientas de análisis podrían incluir ciertos procedimientos, como análisis de series de tiempo, asignación de costos, transferencias de divisas, búsqueda de objetivos, etc. Estas capacidades varían ampliamente entre productos, dependiendo de la orientación del objetivo.

En otras palabras, estas 5 definiciones clave son los objetivos para los que están diseñados los productos OLAP.

Aspectos de la tecnología OLAP

El sistema OLAP incluye ciertos componentes. Existen varios esquemas de su trabajo que un producto en particular puede implementar.

Componentes de los sistemas OLAP (¿en qué consiste un sistema OLAP?)

Normalmente, un sistema OLAP incluye los siguientes componentes:

  • Fuente de datos
    La fuente de la que se toman los datos para el análisis (almacén de datos, base de datos de sistemas contables operativos, un conjunto de tablas, combinaciones de los anteriores).
  • Servidor OLAP
    Los datos de la fuente se transfieren o copian al servidor OLAP, donde se organizan y preparan para una generación posterior más rápida de respuestas a las consultas.
  • Cliente OLAP
    La interfaz de usuario para el servidor OLAP, en el que opera el usuario.

Cabe señalar que no todos los componentes son necesarios. Existen sistemas de escritorio OLAP que le permiten analizar los datos almacenados directamente en la computadora del usuario y no requieren un servidor OLAP.

Sin embargo, qué elemento se requiere es la fuente de datos: la disponibilidad de datos es un tema importante. Si existen, en cualquier forma, como una tabla de Excel, en la base de datos del sistema contable, en forma de informes estructurados de sucursales, el especialista en TI puede integrarse con el sistema OLAP directamente o con una transformación intermedia. Para ello, los sistemas OLAP cuentan con herramientas especiales. Si estos datos no están disponibles, o no están lo suficientemente completos y son de calidad insuficiente, OLAP no ayudará. Es decir, OLAP es solo un complemento sobre los datos, y si no hay ninguno, se convierte en algo inútil.

La mayoría de los datos de las aplicaciones OLAP se originan en otros sistemas. Sin embargo, en algunas aplicaciones (por ejemplo, para planificación o presupuestación), los datos se pueden generar directamente en aplicaciones OLAP. Cuando los datos provienen de otras aplicaciones, generalmente es necesario que los datos se almacenen en un formulario duplicado separado para la aplicación OLAP. Por tanto, es recomendable crear almacenes de datos.

Cabe señalar que el término "OLAP" está indisolublemente vinculado con el término "almacén de datos" (Data Warehouse). Un almacén de datos es una colección de datos inmutable, limitada en el tiempo y específica de un dominio para respaldar el proceso de toma de decisiones de gestión. Los datos en el almacén provienen de sistemas operativos (sistemas OLTP), que están diseñados para automatizar los procesos comerciales; el almacén se puede reponer desde fuentes externas, por ejemplo, informes estadísticos.

A pesar de que contienen información deliberadamente redundante, que ya se encuentra en las bases de datos o archivos de los sistemas operativos, los almacenamientos de datos son necesarios porque:

  • fragmentación de datos, almacenándolos en diferentes formatos DBMS;
  • rendimiento de recuperación de datos mejorado
  • Si en una empresa todos los datos se almacenan en un servidor de base de datos central (lo cual es extremadamente raro), el analista probablemente no comprenderá sus estructuras complejas, a veces confusas.
  • Las consultas analíticas complejas a la información operativa ralentizan el trabajo actual de la empresa, bloquean las tablas durante mucho tiempo y se apoderan de los recursos del servidor.
  • la capacidad de limpiar y conciliar datos
  • es imposible o muy difícil analizar directamente los datos de los sistemas operativos;

El propósito del repositorio es proporcionar la "materia prima" para el análisis en un solo lugar y en una estructura simple y comprensible. Es decir, el concepto de Almacenes de datos no es un concepto de análisis de datos, sino más bien un concepto de preparación de datos para el análisis. Asume la implementación de una única fuente de datos integrada.

Productos OLAP: arquitecturas

Al usar productos OLAP, dos preguntas son importantes: cómo y dónde guardar y para procesar datos. Las arquitecturas OLAP se distinguen según cómo se implementen estos dos procesos. Hay 3 formas de almacenar datos para OLAP y 3 formas de procesar estos datos. Muchos fabricantes ofrecen varias opciones, algunos están tratando de demostrar que su enfoque es el más prudente. Esto es, por supuesto, absurdo. Sin embargo, muy pocos productos pueden funcionar de manera eficiente en más de un modo.

Opciones de almacenamiento de datos OLAP

La retención en este contexto significa el contenido de los datos en un estado constantemente actualizado.

  • Bases de datos relacionales: esta es la opción típica si la empresa almacena credenciales en una RDB. En la mayoría de los casos, los datos deben almacenarse en una estructura desnormalizada (el esquema en estrella es el más aceptable). Una base de datos normalizada no es aceptable debido al bajo rendimiento de las consultas al generar valores agregados para OLAP (a menudo, los totales se almacenan en tablas agregadas).
  • Archivos de base de datos en la computadora cliente (quioscos o mercados de datos): estos datos se pueden propagar o generar a pedido en las computadoras cliente.

Bases de datos multidimensionales: se supone que los datos se almacenan en una base de datos multidimensional en un servidor. Puede incluir datos recuperados y resumidos de otros sistemas y bases de datos relacionales, archivos de usuario final, etc. En la mayoría de los casos, las bases de datos multidimensionales se almacenan en disco, pero algunos productos también permiten el uso de RAM, calculando los datos más utilizados en el volar ". En una cantidad muy pequeña de productos basados ​​en bases de datos multidimensionales, son posibles múltiples ediciones de datos, muchos productos permiten ediciones únicas pero múltiples lecturas de datos, mientras que otros están limitados a solo lectura.

Estas tres ubicaciones de almacenamiento tienen diferentes capacidades de almacenamiento y están dispuestas en orden decreciente de capacidad. También tienen diferentes características de rendimiento de consultas: las bases de datos relacionales son mucho más lentas que las dos últimas.

Opciones de procesamiento de datos OLAP

Existen 3 de las mismas opciones de procesamiento de datos:

  • Usando SQL: esta opción se usa, por supuesto, cuando se almacenan datos en un RDB. Sin embargo, SQL no permite cálculos multidimensionales en una sola consulta, por lo que se requieren consultas SQL complejas para lograr nada más que la funcionalidad multidimensional normal. Sin embargo, eso no impide que los desarrolladores lo intenten. En la mayoría de los casos, realizan un número limitado de cálculos SQL pertinentes, con resultados que pueden obtenerse del procesamiento de datos multidimensionales o de la máquina cliente. También es posible utilizar RAM, que puede almacenar datos utilizando más de una solicitud: esto ha mejorado drásticamente la respuesta.
  • Procesamiento multidimensional del lado del cliente: el producto de cliente OLAP hace los cálculos por sí mismo, pero este procesamiento solo está disponible si los usuarios tienen PC relativamente potentes.

Procesamiento multidimensional del lado del servidor: este es un lugar popular para la computación multidimensional en aplicaciones cliente / servidor OLAP y se utiliza en muchos productos. El rendimiento suele ser bueno porque la mayor parte del cálculo ya se ha realizado. Sin embargo, esto requiere mucho espacio en disco.

Matriz de arquitectura OLAP

En consecuencia, al combinar opciones de almacenamiento / procesamiento, puede obtener una matriz de arquitecturas de sistemas OLAP. En consecuencia, teóricamente, puede haber 9 combinaciones de estos métodos. Sin embargo, dado que 3 de ellos carecen de sentido común, en realidad solo hay 6 opciones para almacenar y procesar datos OLAP.

Opciones de almacenamiento multidimensional
datos

Variantes
multidimensional
procesamiento de datos

Base de datos relacional

Base de datos multidimensional del lado del servidor

Computadora cliente

Magnitud de la cartesis

Procesamiento de servidor multidimensional

Crystal Holos (modo ROLAP)

Servidor OLAP IBM DB2

CA EUREKA: Estrategia

Informix MetaCube

Speedware Media / MR

Servicios de análisis de Microsoft

Oracle Express (modo ROLAP)

Servidor de análisis piloto

Applix iTM1

Holos de cristal

Decisión de Comshare

Hyperion Essbase

Oracle Express

Speedware Media / M

Servicios de análisis de Microsoft

Servidor PowerPlay Enterprise

Servidor de análisis piloto

Applix iTM1

Procesamiento multidimensional en la computadora del cliente

Descubridor de Oracle

Informix MetaCube

Perspicacia dimensional

Hyperion Enterprise

Cognos PowerPlay

Expreso personal

Perspectivas de iTM1

Dado que es el almacenamiento el que determina el procesamiento, se acostumbra agrupar por opciones de almacenamiento, es decir:

  • Productos ROLAP en los sectores 1, 2, 3
  • OLAP de escritorio - en el sector 6

Productos MOLAP - en los sectores 4 y 5

Productos HOLAP (que permiten el almacenamiento de datos tanto multidimensionales como relacionales) - en 2 y 4 (en cursiva)

Categorías de productos OLAP

Hay más de 40 proveedores OLAP, aunque no todos pueden considerarse competidores, porque sus capacidades son muy diferentes y, de hecho, trabajan en diferentes segmentos de mercado. Se pueden agrupar en 4 categorías fundamentales, que se diferencian en función de los conceptos: funcionalidad compleja - funcionalidad simple, rendimiento - espacio en disco. Es conveniente dibujar las categorías como un cuadrado porque muestra claramente la relación entre ellas. Una característica distintiva de cada una de las categorías se presenta en su lado, y las similitudes con otras: en los lados adyacentes, por lo tanto, las categorías en los lados opuestos son fundamentalmente diferentes.

Peculiaridades

Ventajas

desventajas

Representantes

OLAP aplicado

Aplicaciones completas, ricas en funcionalidad. Casi todos requieren una base de datos multidimensional, aunque algunos también funcionan con una base de datos relacional. Muchas de esta categoría de aplicaciones están especializadas, por ejemplo, ventas, fabricación, banca, elaboración de presupuestos, consolidación financiera, análisis de ventas.

La capacidad de integrarse con varias aplicaciones.

Alto nivel de funcionalidad

Alto nivel de flexibilidad y escalabilidad

Complejidad de la aplicación (necesidad de formación del usuario)

Precio alto

Soluciones Hyperion

Decisiones cristalinas

Constructores de información

El producto se basa en una estructura de datos no relacional que proporciona almacenamiento, procesamiento y presentación de datos multidimensionales. Los datos en el proceso de análisis se seleccionan exclusivamente de una estructura multidimensional. A pesar del alto nivel de apertura, los proveedores persuaden a los clientes para que compren su propio conjunto de herramientas.

Alto rendimiento (cálculos rápidos de totales y diversas transformaciones multidimensionales para cualquiera de las dimensiones). El tiempo medio de respuesta a una consulta analítica ad hoc cuando se utiliza una base de datos multidimensional suele ser de 1 a 2 órdenes de magnitud menor que en el caso de un RDB.

Alto nivel de apertura: una gran cantidad de productos con los que es posible la integración

Hacen frente fácilmente a las tareas de incluir varias funciones integradas en el modelo de información, realizar análisis especializados por parte del usuario, etc.

La necesidad de un gran espacio en disco para almacenar datos (debido a la redundancia de los datos que se almacenan). Este es un uso extremadamente ineficiente de la memoria: debido a la desnormalización y la agregación realizada previamente, la cantidad de datos en una base de datos multidimensional corresponde a 2.5-100 veces menos que el volumen de los datos detallados originales. En cualquier caso, MOLAP no permite trabajar con grandes bases de datos. El límite real es una base de 10-25 gigabytes.

Explosión potencial de la base de datos: aumento inesperado, brusco y desproporcionado de su volumen

Falta de flexibilidad cuando es necesario modificar estructuras de datos. Cualquier cambio en la estructura de dimensiones requiere casi siempre una reestructuración completa del hipercubo.

Para las bases de datos multidimensionales, actualmente no existen estándares uniformes para la interfaz, lenguajes para describir y manipular datos

Hyperion (Essbase)

DOLAP (OLAP de escritorio)

Productos OLAP del lado del cliente que son fáciles de implementar y tienen un bajo costo por puesto

Estamos hablando de tal procesamiento analítico, donde los hipercubos son pequeños, su dimensión es pequeña, las necesidades son modestas y para tal procesamiento analítico, una máquina personal en el escritorio es suficiente.

El objetivo de los fabricantes en este mercado es automatizar cientos y miles de lugares de trabajo, pero los usuarios deben hacer un análisis bastante simple. A los compradores a menudo se les pide que compren más trabajos de los necesarios.

Buena integración de bases de datos: multidimensional, relacional

La capacidad de realizar compras complejas, lo que reduce el costo de los proyectos de implementación.

Facilidad de uso de aplicaciones

Funcionalidad muy limitada (no comparable en este sentido con productos especializados)

Potencia muy limitada (pequeños volúmenes de datos, pocas mediciones)

Cognos (PowerPlay)

Objetos de negocio

Decisiones cristalinas

Este es el sector más pequeño del mercado.

Los datos detallados permanecen donde estaban originalmente: en una base de datos relacional; algunos agregados se almacenan en la misma base de datos en tablas de servicio especialmente creadas

Capaz de manejar grandes cantidades de datos (almacenamiento económico)

Proporciona un modo de funcionamiento multiusuario, incluido el modo de edición, no solo de lectura

Mayor nivel de protección de datos y buenas oportunidades para diferenciar los derechos de acceso

Es posible realizar cambios frecuentes en la estructura de medición (no requieren una reorganización física de la base de datos)

Rendimiento deficiente, significativamente inferior en velocidad de respuesta a las multidimensionales (la respuesta a consultas complejas se mide en minutos o incluso horas en lugar de segundos). Son creadores de informes más fáciles de usar que las herramientas analíticas interactivas.

Complejidad de productos. Requiere importantes costos de servicios de TI. Los sistemas relacionales requieren un esquema de base de datos cuidadoso y un ajuste de índices para lograr un rendimiento comparable al de MOLAP, lo que significa un gran esfuerzo por parte de los administradores de bases de datos.

Costoso de implementar

Las limitaciones de SQL siguen siendo una realidad, lo que impide muchas funciones integradas que se proporcionan fácilmente en sistemas basados ​​en la representación de datos multidimensionales en un RDBMS.

Ventaja de información

Informix (MetaCube)

Cabe señalar que los consumidores de productos híbridos que permiten la selección del modo ROLAP y MOLAP, como Microsoft Analysis Services, OracleExpress, Crystal Holos, IBM DB2 OLAPServer, casi siempre seleccionan el modo MOLAP.

Cada una de las categorías presentadas tiene sus propias fortalezas y debilidades; no existe una única opción óptima. La elección afecta a 3 aspectos importantes: 1) desempeño; 2) espacio en disco para almacenamiento de datos; 3) las capacidades, la funcionalidad y especialmente la escalabilidad de la solución OLAP. Al mismo tiempo, es necesario tener en cuenta los volúmenes de datos procesados, el poder de la tecnología, las necesidades de los usuarios y buscar un compromiso entre velocidad y redundancia de espacio en disco ocupado por la base de datos, simple y multifuncional.

Clasificación de los almacenes de datos de acuerdo con el tamaño de la base de datos de destino

Desventajas de OLAP

Como toda tecnología OLAP, también tiene sus inconvenientes: altos requerimientos de hardware, capacitación y conocimiento del personal administrativo y usuarios finales, altos costos para la implementación del proyecto de implementación (tanto monetarios como de tiempo, intelectuales).

Elegir un producto OLAP

Elegir el producto OLAP correcto es difícil, pero muy importante si desea que su proyecto no falle.

Como puede ver, las diferencias de producto se encuentran en muchas áreas: funcional, arquitectónica, técnica. Algunos productos tienen una personalización bastante limitada. Algunos están diseñados para áreas temáticas especializadas: marketing, ventas, finanzas. Hay productos para fines generales, que no están destinados a un uso de aplicación, que deben ser lo suficientemente flexibles. Como regla general, estos productos son más baratos que los especializados, pero hay más costos de implementación. La gama de productos OLAP es muy amplia: desde las herramientas más simples para crear tablas dinámicas y gráficos que forman parte de productos de oficina, hasta análisis de datos y búsqueda de patrones, cuyo costo es de decenas de miles de dólares.

Como ocurre con cualquier campo, no puede haber pautas definitivas para la elección de herramientas en el ámbito OLAP. Solo puede concentrarse en una serie de puntos clave y adaptar las capacidades de software ofrecidas a las necesidades de la organización. Una cosa es importante: si no piensa en cómo va a utilizar las herramientas OLAP, corre el riesgo de sufrir un fuerte dolor de cabeza.

En el proceso de selección, es necesario considerar 2 preguntas:

  • evaluar las necesidades y capacidades de la empresa
  • evaluar la oferta existente en el mercado, las tendencias de desarrollo también son importantes

Entonces todo esto se puede comparar y, de hecho, tomar una decisión.

Necesita valoración

No se puede hacer una elección racional de un producto sin comprender para qué se utilizará. Muchas empresas quieren el "mejor producto" sin una comprensión clara de cómo se debe utilizar.

Para que el proyecto se implemente con éxito, el director financiero debe, al menos, formular correctamente sus deseos y requisitos al gerente y a los especialistas del servicio de automatización. Muchos problemas surgen debido a una preparación e información insuficientes para elegir OLAP, los especialistas en TI y los usuarios finales experimentan dificultades de comunicación solo porque manipulan diferentes conceptos y términos en una conversación y presentan preferencias en conflicto. Necesita coherencia en el propósito dentro de la empresa.

Varios factores ya se han hecho evidentes después de leer la descripción general de las categorías de productos OLAP, a saber:

Aspectos técnicos

  • Fuentes de datos: almacén de datos corporativos, sistema OLTP, archivos de tablas, bases de datos relacionales. Posibilidad de vincular OLAP-toolkit con todos los DBMS utilizados en la organización. Como muestra la práctica, la integración de productos diferentes en un sistema operativo estable es uno de los temas más importantes, y su solución en algunos casos puede estar asociada con grandes problemas. Es necesario comprender lo fácil y confiable que es integrar herramientas OLAP con DBMS existentes en la organización. También es importante evaluar las posibilidades de integración no solo con fuentes de datos, sino también con otras aplicaciones en las que puede necesitar exportar datos: correo electrónico, aplicaciones de oficina.
  • La variabilidad de los datos que se tiene en cuenta
  • Plataforma de servidor: NT, Unix, AS / 400, Linux, pero no insista en que los productos con especificaciones OLAP se ejecuten en plataformas cuestionables o en vías de extinción que todavía está utilizando
  • Estándares del lado del cliente y del navegador
  • Arquitectura implementada: LAN y módem de PC, cliente / servidor de alta velocidad, intranet, extranet, Internet
  • Funciones internacionales: soporte multidivisa, operaciones multilingües, intercambio de datos, localización, licencias, actualización de Windows

Cantidades de información de entrada que están disponibles y que aparecerán en el futuro

Usuarios

  • Ámbito de aplicación: análisis de ventas / marketing, elaboración de presupuestos / planificación, análisis de indicadores de rendimiento, análisis de informes contables, análisis cualitativo, situación financiera, formación de materiales analíticos (informes)
  • El número de usuarios y su ubicación, requisitos para la separación de derechos de acceso a datos y funciones, secreto (confidencialidad) de la información.
  • Vista de usuario: alta dirección, finanzas, marketing, RR.HH., ventas, fabricación, etc.
  • Experiencia de usuario. Nivel de habilidad del usuario. Considere brindar capacitación. Es muy importante que la aplicación cliente OLAP sea tal que los usuarios se sientan seguros y puedan utilizarla de forma eficaz.

Características clave: necesidad de escritura diferida de datos, computación distribuida, conversiones de moneda complejas, necesidad de imprimir informes, interfaz de hoja de cálculo, complejidad de la lógica de la aplicación, dimensión requerida, tipos de análisis: estadístico, búsqueda de objetivos, análisis hipotético

Implementación

  • Quién implementará y operará: consultores externos, TI interno o usuarios finales
  • Presupuesto: software, hardware, servicios, transmisión de datos. Recuerde que las licencias de productos OLAP son solo una pequeña fracción del costo total del proyecto. Los costos de implementación y hardware pueden ser mayores que las tarifas de licencia, y los costos de administración, mantenimiento y soporte a largo plazo son casi con certeza significativamente más altos. Y si tomó la decisión equivocada de comprar un producto inadecuado solo porque es más barato, en última instancia, puede tener un costo total del proyecto más alto debido a mayores costos de mantenimiento, administración y / o hardware, mientras que es probable que reciba un nivel más bajo de beneficios comerciales. . Al estimar el costo total, asegúrese de hacer las siguientes preguntas: ¿Qué tan amplia es la selección de fuentes para la implementación, la capacitación y el apoyo? ¿El potencial stock general (empleados, contratistas, consultores) es propenso a crecer o reducirse? ¿Qué tanto se puede utilizar su experiencia laboral?

A pesar de que el costo de los sistemas analíticos aún hoy sigue siendo bastante alto, y las metodologías y tecnologías para la implementación de dichos sistemas aún se encuentran en la etapa de su formación, incluso hoy en día, el efecto económico proporcionado por ellos supera significativamente el efecto de los sistemas tradicionales. sistemas operativos.

El efecto de la organización correcta, la planificación estratégica y operativa del desarrollo empresarial es difícil de estimar en números por adelantado, pero es obvio que puede exceder los costos de implementación de dichos sistemas en decenas o incluso cientos de veces. Sin embargo, no hay que equivocarse. El efecto no lo proporciona el sistema en sí, sino las personas que trabajan con él. Por tanto, declaraciones del tipo: "el sistema de data warehouse y las tecnologías OLAP ayudarán al gestor a tomar las decisiones correctas" no son del todo correctas. Los sistemas analíticos modernos no son sistemas de inteligencia artificial y no pueden ayudar ni obstaculizar la toma de decisiones. Su objetivo es proporcionar al gerente toda la información necesaria para tomar una decisión de manera conveniente y oportuna. Y qué información se solicitará y qué decisión se tomará sobre la base solo de la persona específica que la utilice.

Una cosa queda por decir, estos sistemas pueden ayudar a resolver muchos problemas comerciales y pueden tener efectos positivos de gran alcance. Solo queda esperar quién es el primero en darse cuenta de las ventajas de este enfoque y estará por delante de los demás.

El procesamiento analítico en línea, o OLAP, es una tecnología de procesamiento de datos eficaz, como resultado de la cual la información resumida se muestra sobre la base de enormes conjuntos de todo tipo de datos. Es un producto poderoso que le ayuda a acceder, recuperar y visualizar información en una PC, analizándola desde diferentes perspectivas.

OLAP es una herramienta que proporciona una posición estratégica para la planificación a largo plazo y considera la información básica de los datos operativos en los próximos 5, 10 o más años. Los datos se almacenan en una base de datos con una dimensión que es su atributo. Los usuarios pueden ver el mismo conjunto de datos con diferentes atributos, según el propósito del análisis.

Historia OLAP

OLAP no es un concepto nuevo y se ha utilizado durante décadas. De hecho, los orígenes de la tecnología se remontan a 1962. Pero el término fue acuñado en 1993 por el autor de la base de datos Ted Coddom, quien también estableció 12 reglas para el producto. Como ocurre con muchas otras aplicaciones, el concepto ha pasado por varias etapas evolutivas.

La historia de la tecnología OLAP en sí se remonta a 1970, cuando se lanzaron el contenido Express y el primer servidor Olap. Fueron adquiridos por Oracle en 1995 y posteriormente se convirtieron en la columna vertebral del procesamiento analítico en línea del motor de computación multidimensional que la reconocida marca de computadoras proporcionaba en su base de datos. En 1992, Arbor Software (adquirido por Oracle en 2007) lanzó otro conocido producto de procesamiento analítico en línea, Essbase.

En 1998, Microsoft lanzó el servidor de análisis de procesamiento de datos en línea de MS Analysis Services. Esto contribuyó a la popularidad de la tecnología e impulsó el desarrollo de otros productos. Hoy en día existen varios proveedores de renombre mundial que ofrecen aplicaciones Olap, incluidos IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.

Procesamiento analítico en línea

OLAP es una herramienta que te permite tomar decisiones sobre eventos programados. El cálculo de Olap atípico puede ser más complejo que la simple agregación de datos. Consultas analíticas por minuto (AQM) se utiliza como punto de referencia estándar para comparar el rendimiento de diferentes instrumentos. Estos sistemas deben ocultar a los usuarios de la sintaxis de consultas complejas tanto como sea posible y proporcionar tiempos de respuesta consistentes para todos (sin importar cuán complejos sean).

OLAP tiene las siguientes características principales:

  1. Representaciones de datos multidimensionales.
  2. Soporte para cálculos complejos.
  3. Reconocimiento temporal.

La vista multidimensional proporciona un marco para el procesamiento analítico a través del acceso flexible a los datos corporativos. Permite a los usuarios analizar datos en cualquier dimensión y en cualquier nivel de agregación.

El soporte para cálculos complejos es la columna vertebral del software OLAP.

La inteligencia de tiempo se utiliza para evaluar el rendimiento de cualquier aplicación analítica durante un período de tiempo. Por ejemplo, este mes frente al mes pasado, este mes frente al mismo mes del año pasado.

Estructura de datos multidimensional

Una de las principales características del procesamiento analítico en línea es la estructura de datos multidimensional. Un cubo puede tener varias dimensiones. Con este modelo, todo el proceso de minería OLAP es fácil para gerentes y ejecutivos, ya que los objetos representados en las celdas son objetos comerciales del mundo real. Además, este modelo de datos permite a los usuarios manejar no solo matrices estructuradas, sino también no estructuradas y semiestructuradas. Todo esto los hace especialmente populares para el análisis de datos y las aplicaciones de BI.

Las principales características de los sistemas OLAP:

  1. Utilice métodos de análisis de datos multidimensionales.
  2. Proporciona soporte de base de datos avanzado.
  3. Cree interfaces de usuario final fáciles de usar.
  4. Soporta arquitectura cliente / servidor.

Uno de los componentes principales de los conceptos OLAP es el servidor del lado del cliente. Además de agregar y preprocesar datos de una base de datos relacional, proporciona opciones avanzadas de cálculo y registro, funcionalidad adicional, capacidades básicas de consulta avanzada y más.

Hay diferentes modelos de datos y herramientas disponibles, según la aplicación de muestra que elija el usuario, que incluyen alertas en tiempo real, secuencias de comandos hipotéticas, optimización e informes OLAP complejos.

Forma cúbica

El concepto se basa en una forma cúbica. La ubicación de los datos en él muestra cómo OLAP se adhiere al principio del análisis multidimensional, lo que da como resultado una estructura de datos diseñada para un análisis rápido y eficiente.

Un cubo OLAP también se conoce como "hipercubo". Se describe como que consta de hechos numéricos (medidas) clasificados por facetas (dimensiones). Las dimensiones se refieren a atributos que definen un problema empresarial. En pocas palabras, una dimensión es una etiqueta que describe una medida. Por ejemplo, en los informes de ventas, la medida sería el volumen de ventas y las dimensiones incluirían el período de ventas, el vendedor, el producto o servicio y la región de ventas. En el informe de las operaciones de fabricación, la medida puede ser los costos totales de producción y las unidades de producción. Las dimensiones serán la fecha u hora de producción, la etapa de producción o fase, incluso los trabajadores involucrados en el proceso de producción.

El cubo de datos OLAP es la piedra angular del sistema. Los datos del cubo se organizan mediante un esquema de estrella o de copo de nieve. En el centro hay una tabla de hechos que contiene agregados (medidas). Está vinculado a una serie de tablas de dimensiones que contienen información sobre medidas. Las dimensiones describen cómo se pueden analizar estas medidas. Si un cubo contiene más de tres dimensiones, a menudo se denomina hipercubo.

Una de las funciones principales de un cubo es su naturaleza estática, lo que significa que el cubo no se puede cambiar una vez diseñado. Por lo tanto, el proceso de ensamblar un cubo y configurar un modelo de datos es un paso crítico hacia el procesamiento de datos apropiado en una arquitectura OLAP.

Combinando datos

El uso de agregaciones es la razón principal por la que las consultas se procesan mucho más rápido en las herramientas OLAP (en comparación con OLTP). Las agregaciones son resúmenes de datos que se han calculado previamente durante el procesamiento. Todos los miembros almacenados en tablas de dimensiones OLAP definen las consultas que puede recibir el cubo.

En un cubo, las acumulaciones de información se almacenan en celdas, cuyas coordenadas están establecidas por dimensiones específicas. El número de agregados que puede contener un cubo depende de todas las combinaciones posibles de miembros de dimensión. Por lo tanto, un cubo típico de una aplicación puede contener una gran cantidad de agregados. Solo se calcularán previamente los agregados clave que se distribuyen en todo el cubo analítico de análisis en línea. Esto reducirá drásticamente el tiempo que lleva definir cualquier agregación al ejecutar una consulta en el modelo de datos.

También hay dos opciones relacionadas con la agregación que pueden mejorar el rendimiento del cubo terminado: crear una capacidad de agregación de caché y usar la agregación basada en el análisis de las consultas de los usuarios.

Principio de funcionamiento

Por lo general, el análisis de la información operativa obtenida de las transacciones se puede realizar utilizando una hoja de cálculo simple (los valores de los datos se representan en filas y columnas). Esto es bueno considerando la naturaleza bidimensional de los datos. En el caso de OLAP, existen diferencias debido al conjunto de datos multidimensionales. Debido a que a menudo se obtienen de diferentes fuentes, es posible que la hoja de cálculo no siempre los procese de manera eficiente.

El cubo resuelve este problema y también mantiene el almacén de datos OLAP funcionando de manera lógica y ordenada. Las empresas recopilan datos de varias fuentes y se presentan en una variedad de formatos, como archivos de texto, archivos multimedia, hojas de cálculo de Excel, bases de datos de Access e incluso bases de datos OLTP.

Todos los datos se recopilan en un repositorio que se llena directamente de las fuentes. Limpiará la información sin procesar de OLTP y otras fuentes de cualquier transacción errónea, incompleta e inconsistente.

Después de la limpieza y transformación, la información se almacenará en una base de datos relacional. Luego se cargará en un servidor OLAP multidimensional (o cubo Olap) para su análisis. Los usuarios finales responsables de las aplicaciones comerciales, la minería de datos y otras operaciones comerciales tendrán acceso a la información que necesitan del cubo Olap.

Beneficios del modelo de matriz

OLAP es una herramienta que ofrece un rendimiento de consulta rápido a través del almacenamiento optimizado, la indexación multidimensional y el almacenamiento en caché, que son importantes beneficios del sistema. Además, los beneficios son:

  1. Tamaño de datos más pequeño en el disco.
  2. Cálculo automatizado de agregados de mayor nivel de datos.
  3. Los modelos de matriz proporcionan una indexación natural.
  4. La extracción de datos eficiente se logra mediante la preestructuración.
  5. Compacidad para conjuntos de datos de dimensiones reducidas.

Las desventajas de OLAP incluyen el hecho de que algunas decisiones (paso de procesamiento) pueden ser bastante largas, especialmente con grandes cantidades de información. Esto generalmente se corrige realizando solo un procesamiento incremental (examinando los datos que han cambiado).

Operaciones analíticas básicas

Circunvolución(roll-up / drill-up) también se conoce como "consolidación". La convolución implica recopilar todos los datos que se pueden recuperar y calcular todos en una o más dimensiones. La mayoría de las veces, esto puede requerir la aplicación de una fórmula matemática. Como ejemplo de OLAP, considere una red minorista con puntos de venta en diferentes ciudades. Para identificar patrones y anticipar tendencias de ventas futuras, los datos sobre ellos de todos los puntos se "acumulan" en el departamento de ventas principal de la empresa para su consolidación y cálculo.

Divulgación(profundizar). Esto es lo opuesto a cuajar. El proceso comienza con un gran conjunto de datos y luego se divide en partes más pequeñas, lo que permite a los usuarios ver los detalles. En el ejemplo minorista, el analista analizará los datos de ventas y observará las marcas o productos individuales que se consideran más vendidos en cada uno de los puntos de venta en diferentes ciudades.

Sección transversal(Parte y pica). Es un proceso donde las operaciones analíticas implican dos pasos: tomar un conjunto específico de datos de un cubo OLAP (el aspecto de "corte" del análisis) y verlo desde diferentes puntos de vista o ángulos. Esto puede suceder cuando todos los datos del punto de venta se reciben y se ingresan en el hipercubo. El analista corta un conjunto de datos de ventas del Cubo OLAP. Luego se revisará al analizar las ventas de unidades individuales en cada región. Durante este tiempo, otros usuarios pueden centrarse en evaluar la rentabilidad de las ventas o evaluar la eficacia de una campaña de marketing y publicidad.

Girar(Pivote). Gira los ejes de datos para reemplazar la presentación de información.

Tipos de bases de datos

Básicamente, este es un cubo OLAP típico que implementa el procesamiento analítico de datos multidimensionales utilizando el Cubo OLAP o cualquier cubo de datos para que el proceso analítico pueda agregar dimensiones según sea necesario. Cualquier información cargada en una base de datos multidimensional se almacenará o archivará y podrá recuperarse cuando sea necesario.

Sentido

OLAP relacional (ROLAP)

ROLAP es un DBMS avanzado junto con mapeo de datos multidimensionales para realizar operaciones relacionales estándar

OLAP multidimensional (MOLAP)

MOLAP: implementa el trabajo en datos multidimensionales

Procesamiento analítico híbrido en línea (HOLAP)

En el enfoque HOLAP, los totales agregados se almacenan en una base de datos multidimensional y la información detallada se almacena en una base de datos relacional. Esto asegura tanto la eficiencia del modelo ROLAP como el rendimiento del modelo MOLAP.

Escritorio OLAP (DOLAP)

En Desktop OLAP, un usuario descarga un fragmento de datos de una base de datos localmente o en su escritorio y lo analiza. DOLAP es relativamente más económico de implementar, ya que ofrece muy poca funcionalidad en comparación con otros sistemas OLAP.

Web OLAP (WOLAP)

Web OLAP es un sistema OLAP accesible a través de un navegador web. WOLAP es una arquitectura de tres niveles. Tiene tres componentes: cliente, middleware y servidor de base de datos.

OLAP móvil

OLAP móvil ayuda a los usuarios a obtener y analizar datos OLAP utilizando sus dispositivos móviles

OLAP espacial

SOLAP se crea para facilitar la gestión de datos espaciales y no espaciales en un sistema de información geográfica (SIG)

Existen sistemas o tecnologías OLAP menos conocidos, pero estos son los principales que utilizan actualmente las grandes corporaciones, empresas e incluso gobiernos.

Herramientas OLAP

Las herramientas de procesamiento analítico en línea están muy bien representadas en Internet tanto en versiones pagas como gratuitas.

Los más populares son:

  1. Dundas BI de Dundas Data Visualization es una plataforma de visualización de datos y analista empresarial basada en navegador que incluye paneles integrados, informes OLAP y análisis de datos.
  2. Yellowfin es una plataforma de inteligencia empresarial que es una solución única e integrada diseñada para empresas de todos los sectores y tamaños. Este sistema es personalizable para empresas en los campos de contabilidad, publicidad, agricultura.
  3. ClicData es una solución de Business Intelligence (BI) diseñada para ser utilizada principalmente por pequeñas y medianas empresas. La herramienta permite a los usuarios finales crear informes y cuadros de mando. La junta está diseñada para integrar inteligencia empresarial, gestión del desempeño corporativo y es un sistema con todas las funciones que sirve a empresas medianas y corporativas.
  4. Domo es una suite de gestión empresarial basada en la nube que se integra con múltiples fuentes de datos, incluidas hojas de cálculo, bases de datos, redes sociales y cualquier solución de software local o en la nube existente.
  5. InetSoft Style Intelligence es una plataforma de software de analista empresarial que permite a los usuarios crear paneles, tecnología de análisis visual OLAP e informes mashup.
  6. Birst by Infor Company es un analista de negocios y una solución de análisis basados ​​en la web que reúne información de diferentes equipos para ayudarlo a tomar decisiones informadas. La herramienta permite a los usuarios descentralizados escalar el modelo de equipo corporativo.
  7. Halo es un sistema integral de inteligencia empresarial y gestión de la cadena de suministro que ayuda en la planificación empresarial y la previsión de inventarios para la gestión de la cadena de suministro. El sistema utiliza datos de todas las fuentes: grandes, pequeñas e intermedias.
  8. Chartio es una solución de analista empresarial basada en la nube que proporciona a los fundadores, equipos empresariales, analistas de datos y grupos de productos las herramientas para organizar su trabajo diario.
  9. Exago BI es una solución basada en web diseñada para integrarse en aplicaciones web. La implementación de Exago BI permite a empresas de todos los tamaños proporcionar a sus clientes informes ad-hoc, oportunos e interactivos.

Impacto de negocios

El usuario encontrará OLAP en la mayoría de las aplicaciones comerciales de diversas industrias. El análisis es utilizado no solo por la empresa, sino también por otras partes interesadas.

Algunas de sus aplicaciones más comunes incluyen:

  1. Análisis de datos de marketing OLAP.
  2. Informes financieros, que cubren ventas y gastos, elaboración de presupuestos y planificación financiera.
  3. Gestión de Procesos de Negocio.
  4. Análisis de ventas.
  5. Comercialización de bases de datos.

Las industrias continúan creciendo, lo que significa que los usuarios pronto verán más aplicaciones OLAP. El procesamiento personalizado multivariante proporciona un análisis más dinámico. Es por esta razón que estos sistemas y tecnologías OLAP se utilizan para evaluar escenarios hipotéticos y escenarios comerciales alternativos.