Menú
Está libre
registro
hogar  /  SOBRE/ Descifrado Olap. OLAP en la gestión financiera

Transcripción de Olap. OLAP en la gestión financiera

El objetivo del trabajo del curso es estudiar la tecnología OLAP, el concepto de su implementación y estructura.

En el mundo moderno, las redes informáticas y los sistemas informáticos permiten analizar y procesar grandes cantidades de datos.

Una gran cantidad de información complica enormemente la búsqueda de soluciones, pero permite obtener cálculos y análisis mucho más precisos. Para resolver este problema, existe toda una clase de sistemas de información que realizan análisis. Dichos sistemas se denominan sistemas de soporte de decisiones (DSS) (DSS, Decision Support System).

Para realizar el análisis, el DSS debe acumular información, disponiendo de los medios para su entrada y almacenamiento. En total, hay tres tareas principales resueltas en el DSS:

· Entrada de datos;

· almacenamiento de datos;

· análisis de los datos.

La entrada de datos en el DSS se realiza automáticamente desde sensores que caracterizan el estado del medio ambiente o proceso, o por un operador humano.

Si los datos se ingresan automáticamente desde los sensores, los datos se acumulan mediante la señal de preparación que aparece cuando aparece la información o mediante sondeo cíclico. Si la entrada la realiza una persona, entonces debe proporcionar a los usuarios medios convenientes para ingresar datos, verificar la exactitud de la entrada y realizar los cálculos necesarios.

Al ingresar datos simultáneamente por varios operadores, es necesario resolver los problemas de modificación y acceso paralelo de los mismos datos.

DSS proporciona a los analistas datos en forma de informes, tablas, gráficos para su estudio y análisis, razón por la cual estos sistemas brindan funciones de apoyo a la toma de decisiones.

En los subsistemas de entrada de datos denominados OLTP (procesamiento de transacciones en línea), se implementa el procesamiento de datos operativos. Para su implementación se utilizan sistemas de gestión de bases de datos (DBMS) convencionales.

El subsistema de análisis se puede construir sobre la base de:

· Subsistemas de análisis de recuperación de información basados ​​en DBMS relacionales y consultas estáticas utilizando el lenguaje SQL;

· Subsistemas de análisis operacional. Para implementar dichos subsistemas, se utiliza la tecnología de procesamiento de datos analíticos en línea OLAP, que utiliza el concepto de presentación de datos multidimensionales;

· Subsistemas de análisis intelectual. Este subsistema implementa métodos y algoritmos de DataMining.

Desde el punto de vista del usuario, los sistemas OLAP proporcionan un medio de visualización flexible de la información en varios cortes, obtención automática de datos agregados, realización de operaciones analíticas de convolución, detalle, comparación en el tiempo. Gracias a todo esto, los sistemas OLAP son una solución con grandes ventajas en el campo de la preparación de datos para todo tipo de reportes comerciales, involucrando la presentación de datos en diferentes secciones y diferentes niveles de jerarquía, tales como reportes de ventas, diversas formas de presupuestos, y otros. Los sistemas OLAP tienen grandes ventajas de tal presentación en otras formas de análisis de datos, incluida la previsión.

1.2 Definición OLAP-sistemas

La tecnología para el análisis de datos multivariados complejos se llama OLAP. OLAP es un componente clave de una organización de HD.

La funcionalidad OLAP se puede implementar de varias formas, tanto las más simples, como el análisis de datos en aplicaciones de oficina, como las más complejas: sistemas analíticos distribuidos basados ​​en productos de servidor.

OLAP (On-LineAnalyticalProcessing) es una tecnología para el procesamiento de datos analíticos en línea que utiliza herramientas y métodos para recopilar, almacenar y analizar datos multidimensionales y para respaldar los procesos de toma de decisiones.

El propósito principal de los sistemas OLAP es apoyar actividades analíticas, solicitudes arbitrarias de usuarios analíticos. El propósito del análisis OLAP es probar hipótesis emergentes.

almacenamiento de datos se forman sobre la base de instantáneas de bases de datos de operaciones sistema de informacion y posiblemente varias fuentes externas. Los almacenes de datos utilizan tecnologías de bases de datos, OLAP, análisis profundo de datos, visualización de datos.

Las principales características de los almacenes de datos.

  • contiene datos históricos;
  • almacena información detallada, así como datos agregados parcial y completamente;
  • los datos son en su mayoría estáticos;
  • método de procesamiento de datos ad-hoc, no estructurado y heurístico;
  • intensidad media y baja del procesamiento de transacciones;
  • forma impredecible de utilizar los datos;
  • destinado al análisis;
  • centrado en áreas temáticas;
  • apoyo a la toma de decisiones estratégicas;
  • atiende a un número relativamente pequeño de ejecutivos.

El término OLAP (Procesamiento Analítico en Línea) se utiliza para describir el modelo de presentación de datos y, en consecuencia, la tecnología para su procesamiento en almacenes de datos. OLAP utiliza una vista multidimensional de datos agregados para proporcionar acceso rápido a información estratégica para un análisis en profundidad. Las aplicaciones OLAP deben tener las siguientes propiedades básicas:

  • multidimensional presentación de datos;
  • soporte para cálculos complejos;
  • consideración correcta del factor tiempo.

Ventajas de OLAP:

  • el aumento productividad personal de producción, desarrolladores programas de aplicación... Acceso oportuno a información estratégica.
  • proporcionando a los usuarios una amplia oportunidad para realizar sus propios cambios en el esquema.
  • Las aplicaciones OLAP se basan en almacenamiento de datos y sistemas OLTP, recibiendo datos actualizados de ellos, lo que permite guardar control de integridad datos corporativos.
  • reducir la carga en los sistemas OLTP y almacenamiento de datos.

OLAP y OLTP. Características y principales diferencias

OLAP OLTP
Almacén de datos debe incluir tanto datos corporativos internos como datos externos la principal fuente de información que ingresa a la base de datos operativa son las actividades de la corporación, y para analizar los datos se requiere la participación de fuentes externas de información (por ejemplo, informes estadísticos)
El volumen de bases de datos analíticas es al menos un orden de magnitud mayor que el volumen de las operativas. para un análisis y una previsión fiables en Almacén de datos necesita tener información sobre las actividades de la corporación y el estado del mercado durante varios años Para el procesamiento operativo, se requieren datos de los últimos meses
Almacén de datos debe contener información acordada y presentada de manera uniforme que se corresponda mejor con el contenido de las bases de datos operativas. Se necesita un componente para extraer y "limpiar" información de varias fuentes. Muchas grandes corporaciones tienen simultáneamente varios SI operativos con sus propias bases de datos (por razones históricas). Las bases de datos operativas pueden contener información semánticamente equivalente presentada en diferentes formatos, con diferente indicación de la hora de su llegada, a veces incluso contradictoria.
El conjunto de consultas contra una base de datos analítica es imposible de predecir. almacenamiento de datos existen para responder a las solicitudes de analistas ad hoc. Solo puede contar con el hecho de que las solicitudes no llegarán con demasiada frecuencia e involucrarán una gran cantidad de información. El tamaño de la base de datos analítica estimula el uso de consultas con agregados (suma, mínimo, máximo, significar etc.) Los sistemas de procesamiento de datos se crean con la expectativa de resolver problemas específicos. La información de la base de datos se selecciona con frecuencia y en pequeñas porciones. Por lo general, el conjunto de consultas a la base de datos operativa ya se conoce durante el diseño.
Con una baja variabilidad de las bases de datos analíticas (solo cuando se cargan datos), el orden de las matrices resulta ser métodos de indexación más rápidos y razonables para el muestreo masivo, el almacenamiento de datos agregados previamente Los sistemas de procesamiento de datos son por su naturaleza altamente volátiles, lo que se tiene en cuenta en el DBMS utilizado (estructura de base de datos normalizada, las cadenas se almacenan de manera desordenada, árboles B para indexación, transaccional)
La información analítica de la base de datos es tan crítica para una corporación que se requiere una gran granulación de protección (derechos de acceso individual a ciertas filas y / o columnas de la tabla) Para los sistemas de procesamiento de datos, generalmente es suficiente protección de la información al nivel de la mesa

Reglas codd para sistemas OLAP

En 1993, Codd publicó un trabajo titulado OLAP para usuarios analíticos: la forma en que debería ser. En él, esbozó los conceptos básicos del procesamiento analítico en línea e identificó 12 reglas que deben cumplir los productos que permiten el procesamiento analítico en línea.

  1. Visión conceptual multidimensional. Un modelo OLAP debe ser multidimensional en su esencia. Un diagrama conceptual multidimensional o una vista personalizada facilita el modelado y el análisis, así como el cálculo.
  2. Transparencia. El usuario puede obtener todos los datos necesarios de la máquina OLAP, sin siquiera saber de dónde vienen. Ya sea que el producto OLAP sea parte de las herramientas del usuario o no, este hecho debería ser invisible para el usuario. Si OLAP lo proporciona la computación del lado del servidor del cliente, este hecho también debería, si es posible, ser invisible para el usuario. OLAP debe presentarse en el contexto de una arquitectura verdaderamente abierta, que permita al usuario, esté donde esté, comunicarse con el servidor mediante una herramienta analítica. Además de esto, la transparencia también debe lograrse cuando la herramienta analítica interactúa con entornos de bases de datos homogéneos y heterogéneos.
  3. Disponibilidad. OLAP debe proporcionar su propio diagrama de lógica para acceder en un entorno de base de datos heterogéneo y realizar las transformaciones adecuadas para proporcionar datos al usuario. Además, debe pensar de antemano dónde y cómo, y qué tipos de organización de datos físicos se utilizarán realmente. Un sistema OLAP solo debe acceder a los datos que realmente se requieren, y no aplicar el principio general del "embudo de cocina", que implica entradas innecesarias.
  4. Constante rendimiento al desarrollar informes. Rendimiento la presentación de informes no debería disminuir significativamente con el aumento en el número de dimensiones y el tamaño de la base de datos.
  5. Arquitectura cliente-servidor. Se requiere que el producto no solo sea cliente / servidor, sino también que el componente del servidor sea lo suficientemente inteligente como para que diferentes clientes puedan conectarse con un mínimo de esfuerzo y programación.
  6. Multidimensionalidad general. Todas las dimensiones deben ser iguales, cada dimensión debe ser equivalente tanto en estructura como en capacidades operativas. Es cierto que se permiten posibilidades operativas adicionales para dimensiones individuales (aparentemente, el tiempo está implícito), pero tales funciones adicionales deben proporcionarse a cualquier dimensión. No debería ser tan básico estructuras de datos, los formatos computacionales o de informes eran más específicos para cualquier dimensión.
  7. Control dinámico matrices dispersas... Los sistemas OLAP deben ajustar automáticamente su esquema físico según el tipo de modelo, los volúmenes de datos y la escasez de la base de datos.
  8. Soporte multijugador. La herramienta OLAP debe proporcionar capacidades intercambio(solicitud y adición), integridad y seguridad.
  9. Cruces ilimitados. Se debe permitir todo tipo de operaciones para cualquier medida.
  10. Manipulación de datos intuitiva. La manipulación de datos se llevó a cabo mediante acciones directas en las celdas en el modo de visualización sin utilizar menús y operaciones múltiples.
  11. Opciones de informes flexibles. Las mediciones deben incluirse en el informe de la forma que necesite el usuario.
  12. Ilimitado

Las condiciones de alta competencia y la dinámica creciente del entorno externo imponen mayores requisitos para los sistemas de gestión empresarial. El desarrollo de la teoría y la práctica de la gestión estuvo acompañado por la aparición de nuevos métodos, tecnologías y modelos destinados a mejorar la eficiencia de las actividades. Los métodos y modelos, a su vez, contribuyeron al surgimiento de sistemas analíticos. La demanda de sistemas analíticos en Rusia es alta. Estos sistemas son los más interesantes desde el punto de vista de la aplicación en el sector financiero: bancos, negocio de seguros, sociedades de inversión. Los resultados del trabajo de los sistemas analíticos son necesarios principalmente para las personas, de cuyas decisiones depende el desarrollo de la empresa: gerentes, expertos, analistas. Los sistemas analíticos permiten resolver los problemas de consolidación, reporting, optimización y previsión. Hasta ahora, no existe una clasificación final de los sistemas analíticos, así como tampoco existe un sistema general de definiciones en términos usados ​​en esta dirección. La estructura de la información de una empresa se puede representar mediante una secuencia de niveles, cada uno de los cuales se caracteriza por su propia forma de procesar y gestionar la información, y tiene su propia función en el proceso de gestión. Así, los sistemas analíticos se ubicarán jerárquicamente en diferentes niveles de esta infraestructura.

Capa de sistemas transaccionales

Nivel de almacenamiento de datos

Capa de mercado de datos

Nivel OLAP - sistemas

Capa de aplicación analítica

OLAP - sistemas - (procesamiento analítico en línea, procesamiento analítico en tiempo real) - son una tecnología para el análisis de datos multidimensionales complejos. OLAP: los sistemas son aplicables cuando existe la tarea de analizar datos multifactoriales. Son una herramienta eficaz para el análisis y la generación de informes. Los almacenes de datos, los mercados de datos y los sistemas OLAP mencionados anteriormente se clasifican como sistemas de inteligencia empresarial (BI).

Muy a menudo, los sistemas de información y análisis creados con la expectativa de un uso directo por parte de los responsables de la toma de decisiones son extremadamente fáciles de usar, pero tienen una funcionalidad muy limitada. Estos sistemas estáticos se denominan en la literatura sistemas de información ejecutiva (EIS). Contienen conjuntos de consultas predefinidos y, al ser suficientes para la revisión del día a día, son incapaces de dar respuesta a todas las preguntas sobre los datos disponibles que pueden surgir a la hora de tomar decisiones. Como regla general, el resultado del trabajo de dicho sistema son informes de varias páginas, después de un estudio cuidadoso de los cuales el analista tiene una nueva serie de preguntas. Sin embargo, cada nueva solicitud no prevista en el diseño de dicho sistema debe primero describirse formalmente, codificarse por el programador y solo luego ejecutarse. El tiempo de espera en este caso puede ser de horas y días, lo que no siempre es aceptable. Por lo tanto, la simplicidad externa de los DSS estáticos, por los que la mayoría de los clientes de sistemas analíticos de información luchan activamente, se convierte en una pérdida catastrófica de flexibilidad.



Dynamic DSS, por otro lado, se centra en procesar solicitudes de datos de analistas ad hoc. Los requisitos más detallados para tales sistemas fueron considerados por E. F. Codd en el artículo que sentó las bases para el concepto de OLAP. Los analistas trabajan con estos sistemas en una secuencia interactiva de formación de consultas y estudio de sus resultados.

Pero los DSS dinámicos pueden operar en algo más que en el ámbito del procesamiento analítico en línea (OLAP); El apoyo para la toma de decisiones de gestión basadas en datos acumulados se puede realizar en tres áreas básicas.

Esfera de datos detallada. Este es el dominio de la mayoría de los sistemas de recuperación de información. En la mayoría de los casos, los DBMS relacionales hacen un excelente trabajo con las tareas que surgen aquí. El estándar generalmente aceptado para el lenguaje de manipulación de datos relacionales es SQL. Los sistemas de recuperación de información que proporcionan una interfaz de usuario final en las tareas de búsqueda de información detallada se pueden utilizar como complementos tanto en bases de datos independientes de sistemas transaccionales como en un almacén de datos común.

Alcance de agregados. Una mirada completa a la información recopilada en el almacén de datos, su generalización y agregación, la representación de hipercubos y el análisis multidimensional son las tareas de los sistemas de procesamiento de datos analíticos en línea (OLAP). Aquí puede centrarse en DBMS multidimensionales especiales o permanecer dentro del marco de las tecnologías relacionales. En el segundo caso, los datos agregados previamente se pueden recopilar en una base de datos en forma de estrella, o la información se puede agregar sobre la marcha mientras se escanean tablas detalladas de una base de datos relacional.

La esfera de las regularidades. El procesamiento intelectual se realiza mediante métodos de minería de datos (IAD, Data Mining), cuyas principales tareas son la búsqueda de patrones funcionales y lógicos en la información acumulada, la construcción de modelos y reglas que expliquen las anomalías encontradas y / o predigan el desarrollo de algunos procesos.

Procesamiento rápido de datos analíticos

El concepto OLAP se basa en el principio de presentación de datos multidimensionales. En un artículo de 1993 de EF Codd, examinó las deficiencias del modelo relacional, en primer lugar señalando la imposibilidad "de combinar, visualizar y analizar datos en términos de múltiples dimensiones, es decir, de la forma más comprensible para los analistas corporativos". , e identificó los requisitos generales para los sistemas OLAP que amplían la funcionalidad del DBMS relacional e incluyen el análisis multivariado como una de sus características.

Clasificación de productos OLAP según la forma en que se presentan los datos.

Actualmente, hay una gran cantidad de productos en el mercado que brindan funcionalidad OLAP en un grado u otro. Aproximadamente 30 de los más conocidos se enumeran en el servidor web de encuestas http://www.olapreport.com/. Al proporcionar una vista conceptual multidimensional desde la interfaz de usuario hasta la base de datos de origen, todos los productos OLAP se dividen en tres clases, similares a la base de datos de origen.

Los primeros sistemas de procesamiento analítico en línea (por ejemplo, Essbase de Arbor Software, Oracle Express Server de Oracle) pertenecían a la clase MOLAP, es decir, solo podían trabajar con sus propias bases de datos multidimensionales. Se basan en tecnologías patentadas de DBMS multidimensionales y son las más caras. Estos sistemas proporcionan un ciclo completo de procesamiento OLAP. Incluyen, además del componente de servidor, su propia interfaz de cliente integrada o utilizan programas de hoja de cálculo externos para comunicarse con el usuario. Para mantener dichos sistemas, se requiere un personal especial de empleados para instalar, mantener el sistema y formar representaciones de datos para los usuarios finales.

Los sistemas de procesamiento analítico relacional en línea (ROLAP) le permiten representar datos almacenados en una base de datos relacional en una forma multidimensional, proporcionando la transformación de la información en un modelo multidimensional a través de una capa de metadatos intermedia. Los sistemas ROLAP son adecuados para trabajar con grandes instalaciones de almacenamiento. Al igual que los sistemas MOLAP, requieren un mantenimiento de TI significativo y son multiusuario.

Finalmente, los sistemas híbridos (Hybrid OLAP, HOLAP) están diseñados para combinar las ventajas y minimizar las desventajas inherentes a las clases anteriores. Esta clase incluye Media / MR de Speedware. Según los desarrolladores, combina la flexibilidad analítica y la capacidad de respuesta de MOLAP con el acceso constante a datos reales inherentes a ROLAP.

OLAP multidimensional (MOLAP)

En los DBMS especializados basados ​​en la representación de datos multidimensionales, los datos no se organizan en forma de tablas relacionales, sino en forma de matrices multidimensionales ordenadas:

1) hipercubos (todas las celdas almacenadas en la base de datos deben tener la misma dimensión, es decir, estar en la base de medidas más completa) o

2) policubos (cada variable se almacena con su propio conjunto de medidas, y todas las dificultades de procesamiento asociadas se trasladan a los mecanismos internos del sistema).

El uso de bases de datos multidimensionales en sistemas de procesamiento analítico en línea tiene las siguientes ventajas.

En el caso de utilizar un DBMS multidimensional, la búsqueda y selección de datos es mucho más rápida que con una vista conceptual multidimensional de una base de datos relacional, ya que la base de datos multidimensional está desnormalizada, contiene indicadores preagregados y brinda un acceso optimizado a las celdas solicitadas.

Los DBMS multidimensionales hacen frente fácilmente a las tareas de incluir varias funciones integradas en el modelo de información, mientras que las limitaciones objetivamente existentes del lenguaje SQL hacen que sea bastante difícil y, a veces, imposible realizar estas tareas sobre la base de DBMS relacionales.

Por otro lado, existen limitaciones importantes.

Los DBMS multidimensionales no permiten trabajar con grandes bases de datos. Además, debido a la desnormalización y la agregación preliminar, la cantidad de datos en una base de datos multidimensional, por regla general, corresponde (según Codd) a 2.5-100 veces menos que el volumen de los datos detallados originales.

Los DBMS multidimensionales utilizan la memoria externa de manera muy ineficiente en comparación con los relacionales. En la inmensa mayoría de los casos, el hipercubo de información es muy escaso y, dado que los datos se almacenan en forma ordenada, los valores indefinidos se pueden eliminar solo eligiendo el orden de clasificación óptimo que permita organizar los datos en los grupos contiguos más grandes. Pero incluso en este caso, el problema solo se resuelve parcialmente. Además, es probable que el orden de clasificación óptimo para almacenar datos dispersos sea diferente del orden que se usa con más frecuencia en las consultas. Por lo tanto, en sistemas reales, debe encontrar un compromiso entre el rendimiento y la redundancia del espacio en disco ocupado por la base de datos.

Por lo tanto, el uso de DBMS multidimensionales se justifica solo bajo las siguientes condiciones.

El volumen de datos iniciales para el análisis no es demasiado grande (no más de varios gigabytes), es decir, el nivel de agregación de datos es bastante alto.

El conjunto de dimensiones de la información es estable (ya que cualquier cambio en su estructura casi siempre requiere una reestructuración completa del hipercubo).

El tiempo de respuesta del sistema a las solicitudes ad hoc es el parámetro más crítico.

Se requiere un uso extensivo de funciones integradas complejas para realizar cálculos multidimensionales en las celdas de un hipercubo, incluida la capacidad de escribir funciones personalizadas.

OLAP relacional (ROLAP)

El uso directo de bases de datos relacionales en sistemas de procesamiento analítico en línea tiene las siguientes ventajas.

En la mayoría de los casos, los almacenes de datos corporativos se implementan utilizando herramientas DBMS relacionales y las herramientas ROLAP le permiten realizar análisis directamente sobre ellos. Al mismo tiempo, el tamaño de almacenamiento no es un parámetro tan crítico como en el caso de MOLAP.

En el caso de una dimensión variable del problema, cuando hay que realizar cambios en la estructura de medición con bastante frecuencia, los sistemas ROLAP con una representación dinámica de la dimensión son la solución óptima, ya que en ellos tales modificaciones no requieren una reorganización física de la dimensión. la base de datos.

Los DBMS relacionales brindan un nivel significativamente más alto de protección de datos y buenas oportunidades para diferenciar los derechos de acceso.

La principal desventaja de ROLAP en comparación con DBMS multidimensionales es un rendimiento más bajo. Los sistemas relacionales requieren un esquema de base de datos cuidadoso y un ajuste de índices para lograr un rendimiento comparable al de MOLAP, lo que significa un gran esfuerzo por parte de los administradores de bases de datos. Solo mediante el uso de esquemas en estrella, el rendimiento de los sistemas relacionales bien ajustados puede acercarse al rendimiento de los sistemas basados ​​en bases de datos multidimensionales.

El concepto de tecnología OLAP fue formulado por Edgar Codd en 1993.

Esta tecnología se basa en la construcción de conjuntos de datos multidimensionales, los llamados cubos OLAP (no necesariamente tridimensionales, como se podría concluir de la definición). El propósito de utilizar las tecnologías OLAP es analizar los datos y presentar este análisis en una forma que sea conveniente para que el personal gerencial los perciba y tome decisiones con base en ellos.

Requisitos clave para aplicaciones de análisis multivariante:

  • - proporcionar al usuario los resultados del análisis en un tiempo razonable (no más de 5 s.);
  • - acceso de múltiples usuarios a los datos;
  • - presentación de datos multidimensionales;
  • - la capacidad de acceder a cualquier información independientemente de su ubicación y volumen de almacenamiento.

Las herramientas de los sistemas OLAP brindan la capacidad de ordenar y seleccionar datos de acuerdo con condiciones específicas. Se pueden especificar varias condiciones cualitativas y cuantitativas.

El modelo de datos principal utilizado en numerosas herramientas para crear y mantener bases de datos, DBMS, es el modelo relacional. Los datos que contiene se presentan en forma de un conjunto de tablas de relaciones bidimensionales vinculadas por campos clave. Para eliminar la duplicación, la inconsistencia, reducir los costos laborales para el mantenimiento de las bases de datos, se utiliza un aparato formal para normalizar las tablas de entidades. Sin embargo, su uso está asociado con un tiempo adicional dedicado a generar respuestas a las consultas de la base de datos, aunque se ahorran recursos de memoria.

Un modelo de datos multidimensional representa el objeto en estudio en forma de cubo multidimensional, más a menudo se utiliza un modelo tridimensional. Las dimensiones o atributos de atributo se trazan a lo largo de los ejes o caras del cubo. Los atributos básicos son el llenado de las celdas del cubo. Un cubo multidimensional se puede representar mediante una combinación de cubos tridimensionales para facilitar la percepción y presentación en la formación de informes y documentos analíticos y presentaciones multimedia basados ​​en los materiales del trabajo analítico en el sistema de soporte de decisiones.

En el marco de las tecnologías OLAP, en base a que la presentación multidimensional de datos puede ser organizada tanto mediante DBMS relacionales como herramientas multidimensionales especializadas, existen tres tipos de sistemas OLAP multidimensionales:

  • - OLAP-MOLAP multidimensional;
  • - OLAP-ROLAP relacional (Relación);
  • - OLAP-HOLAP mixtos o híbridos (Híbridos).

En los DBMS multidimensionales, los datos se organizan no en forma de tablas relacionales, sino en forma de matrices multidimensionales ordenadas en forma de hipercubos, cuando todos los datos almacenados deben tener la misma dimensión, lo que significa la necesidad de formar la base más completa de mediciones. Los datos se pueden organizar en forma de policubos, en esta versión los valores de cada indicador se almacenan con su propio conjunto de medidas, el procesamiento de los datos lo realiza la propia herramienta del sistema. La estructura de almacenamiento en este caso se simplifica, ya que no hay necesidad de un área de almacenamiento multidimensional u orientada a objetos. Se reducen los enormes costos laborales para crear modelos y sistemas para transformar datos de un modelo relacional a un modelo de objetos.

Las ventajas de MOLAP son:

  • - recepción de respuestas a las solicitudes más rápida que con ROLAP - el tiempo empleado es de uno a dos órdenes de magnitud menor;
  • - Muchas funciones integradas son difíciles de implementar debido a las limitaciones de SQL.

Las restricciones de MOLAP incluyen:

  • - tamaño relativamente pequeño de bases de datos;
  • - debido a la desnormalización y la agregación preliminar, las matrices multidimensionales utilizan entre 2,5 y 100 veces más memoria que los datos originales (el consumo de memoria crece exponencialmente con un aumento en el número de mediciones);
  • - no existen estándares para la interfaz y las herramientas de manipulación de datos;
  • - existen restricciones al cargar datos.

El esfuerzo necesario para crear datos multidimensionales aumenta drásticamente. en esta situación, prácticamente no existen medios especializados para objetivar el modelo de datos relacionales contenido en el almacenamiento de información. El tiempo de respuesta a las consultas a menudo no puede cumplir con los requisitos de los sistemas OLAP.

Las ventajas de los sistemas ROLAP son:

  • - la capacidad de analizar rápidamente los datos contenidos directamente en el almacén de datos, porque la mayoría de las bases de datos de origen son relacionales;
  • - con una dimensión variable del problema, RO-LAP gana, porque no se requiere una reorganización física de la base de datos;
  • - Los sistemas ROLAP pueden utilizar estaciones cliente y servidores menos potentes, y los servidores soportan la mayor parte de la carga de procesar consultas SQL complejas;
  • - El nivel de protección de la información y diferenciación de derechos de acceso en los DBMS relacionales es incomparablemente más alto que en los multidimensionales.

Las desventajas de los sistemas ROLAP son un rendimiento más bajo, la necesidad de una elaboración cuidadosa de los esquemas de la base de datos, un ajuste especial de los índices, el análisis de las estadísticas de consulta y la consideración de los resultados del análisis al modificar los esquemas de la base de datos, lo que genera costos laborales adicionales significativos.

El cumplimiento de estas condiciones permite, al utilizar sistemas ROLAP, lograr indicadores similares a los sistemas MOLAP en términos de tiempo de acceso, así como superar en ahorro de memoria.

Los sistemas OLAP híbridos son una combinación de herramientas que implementan un modelo de datos relacional y multidimensional. Esto le permite reducir drásticamente el costo de los recursos para la creación y mantenimiento de dicho modelo, el tiempo de respuesta a las solicitudes.

Este enfoque aprovecha las ventajas de los dos primeros enfoques y compensa sus desventajas. Este principio se implementa en los productos de software más desarrollados para este propósito.

El uso de arquitectura híbrida en sistemas OLAP es la forma más adecuada de resolver los problemas asociados al uso de herramientas software en análisis multivariante.

El modo de detección de patrones se basa en el procesamiento de datos inteligente. La tarea principal aquí es identificar patrones en los procesos bajo estudio, interrelaciones e interacciones de varios factores, buscar grandes desviaciones "inusuales", pronosticar el curso de varios procesos esenciales. Esta área pertenece a la minería de datos.

La principal diferencia entre hechos e información es que recibimos y tomamos nota de los datos, y podemos usar la información para nuestro beneficio. A grandes rasgos, la información es un dato analizado y sistematizado. Gracias a la información recibida a tiempo, muchas empresas logran resistir tanto la crisis financiera como la competencia más feroz. No es suficiente recopilar hechos y tener todos los datos que necesita. También necesita poder analizarlos. Se han desarrollado varios sistemas de soporte para facilitar a las personas la toma de decisiones comerciales importantes. Es con este propósito que se han desarrollado varios sistemas complejos que le permiten analizar grandes conjuntos de datos heterogéneos y convertirlos en información útil para un usuario empresarial. El nuevo campo de la inteligencia empresarial busca mejorar la gestión de procesos de los sistemas empresariales mediante el uso de almacenes de datos y tecnologías.

El mercado de sistemas de información para empresas ofrece hoy en día una amplia gama de soluciones que ayudan a una empresa a organizar la contabilidad administrativa, garantizar la gestión operativa de la producción y las ventas e interactuar de manera eficaz con clientes y proveedores.

Un nicho separado en el mercado de sistemas comerciales lo ocupan los productos de software analítico diseñados para respaldar la toma de decisiones en el nivel estratégico de la gestión empresarial. La principal diferencia entre estas herramientas y los sistemas de gestión operativa es que estos últimos proporcionan gestión empresarial en un "modo de funcionamiento", es decir, la implementación de un programa de producción bien definido, mientras que los sistemas analíticos a nivel estratégico ayudan a la gestión de la empresa para elaborar soluciones en un "modo de desarrollo".

La escala de los cambios realizados puede variar desde una profunda reestructuración hasta una renovación parcial de tecnologías en determinadas áreas productivas, pero, en cualquier caso, los tomadores de decisiones están considerando alternativas de desarrollo de las que depende el destino de la empresa en el largo plazo.

No importa cuán poderoso y desarrollado sea el sistema de información de la empresa, no puede ayudar a resolver estos problemas, en primer lugar, porque está sintonizado con procesos comerciales estacionarios y bien establecidos, y en segundo lugar, no es ni puede ser información para toma de decisiones sobre nuevas áreas de negocio, nuevas tecnologías, nuevas decisiones organizativas.

Gracias a la tecnología de procesamiento de datos OLAP (procesamiento analítico en línea), cualquier organización puede recibir casi instantáneamente (en cinco segundos) los datos que necesita para funcionar. OLAP se puede resumir en cinco palabras clave.

RÁPIDO (Rápido): esto significa que la búsqueda y entrega de la información necesaria no toma más de cinco segundos. Las consultas más simples se procesan en un segundo y solo unas pocas consultas complejas tienen un tiempo de procesamiento de más de veinte segundos. Para lograr este resultado, se utilizan varios métodos, desde formas especiales de almacenamiento de datos hasta un extenso cálculo previo. Por lo tanto, puede obtener un informe en un minuto, que anteriormente requería días para preparar.

ANÁLISIS (Analítico) dice que el sistema puede hacer cualquier análisis, tanto estadístico como lógico, y luego lo almacena en una forma accesible.

COMPARTIDO significa que el sistema proporciona la privacidad necesaria, hasta el nivel de celda

MULTIDIMENSIONAL - Ésta es la característica principal de OLAP. El sistema debe soportar plenamente las jerarquías y múltiples jerarquías, ya que de esta forma es más lógico analizar tanto el negocio como las actividades de las organizaciones.

INFORMACIÓN La información que necesita debe entregarse donde sea necesaria.

Durante el trabajo de una organización, los datos relacionados con su campo de actividad siempre se acumulan, que a veces se almacenan en lugares completamente diferentes, y no es fácil ni requiere mucho tiempo reunirlos. Es con el fin de acelerar la adquisición de datos para probar hipótesis comerciales emergentes que se desarrolló la tecnología de procesamiento de datos analíticos interactivos u OLAP. El objetivo principal de estos sistemas OLAP es responder rápidamente a las solicitudes arbitrarias de los usuarios. Tal necesidad surge a menudo cuando se desarrolla algún proyecto empresarial importante, cuando el desarrollador necesita una hipótesis de trabajo que ha surgido. La mayoría de las veces, la información que necesita el usuario debe presentarse en forma de algún tipo de dependencia, por ejemplo, cómo el volumen de ventas depende de la categoría de producto, la región de ventas, la temporada, etc. Gracias a OLAP, tiene la capacidad de recibir inmediatamente los datos necesarios en el diseño deseado para el período seleccionado.

La tecnología OLAP interactiva transforma grandes cantidades de informes y toneladas de datos en información útil y precisa que ayudará a un empleado a tomar una decisión comercial o financiera informada en el momento adecuado.

Además, gracias a OLAP, la eficiencia del procesamiento aumenta y el usuario puede obtener grandes volúmenes de información clasificada (agregada) casi al instante. Gracias a OLAP, el usuario puede ver claramente qué tan eficazmente está funcionando su organización, tiene la capacidad de responder de manera rápida y flexible a los cambios externos y tiene la capacidad de minimizar las pérdidas financieras de su organización. OLAP proporciona información precisa que mejora la calidad de sus decisiones.

El único inconveniente de los sistemas de inteligencia empresarial es su elevado coste. La construcción de un almacén de información personal requiere tiempo y mucho dinero.

El uso de la tecnología OLAP en los negocios le permite obtener rápidamente la información necesaria, que, a solicitud del usuario, se puede presentar en la forma habitual: informes, gráficos o tablas.

Los procedimientos de integración de sistemas para estructuras comerciales se basan en el uso de soluciones conjuntas ERP, CRM y SCM. En muchos casos, los sistemas son suministrados por diferentes fabricantes, y los datos importados deben pasar por un procedimiento de conciliación de datos y presentación en forma de datos heterogéneos. En un entorno empresarial, se asume un requisito inequívoco: un análisis completo de los datos, que implica ver los informes consolidados desde diferentes puntos de vista.

Los diferentes proveedores tienen diferentes mecanismos de presentación. El procedimiento de representación heterogénea implica extracción, transformación y carga (ETL). Por ejemplo, en Microsoft SQL Server 2005 Analysis Services, el problema de consolidación de datos se implementa mediante vistas de origen de datos, que son tipos de orígenes de datos que describen modelos de vista analítica.

Aplicaciones empresariales basadas en tecnologías OLAP, ejemplos de productos. Las aplicaciones más comunes de las tecnologías OLAP son:

Análisis de los datos.

La tarea para la que se utilizaron originalmente las herramientas OLAP y sigue siendo la más popular. Un modelo de datos multidimensional, la capacidad de analizar cantidades significativas de datos y una rápida respuesta a las solicitudes hacen que estos sistemas sean indispensables para analizar ventas, actividades de marketing, distribución y otras tareas con una gran cantidad de datos iniciales.

Ejemplos de productos: tablas dinámicas de Microsoft Excel, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Planificación financiera y presupuestación.

Un modelo multidimensional le permite ingresar datos simultáneamente y analizarlos fácilmente (por ejemplo, análisis plan-hecho). Por lo tanto, varios productos modernos de la clase CPM (Corporate Performance Management) utilizan el modelo OLAP%. Una tarea importante es el cálculo inverso multidimensional (backsolve, breakback, writeback), que le permite calcular los cambios necesarios en las celdas de detalle cuando cambia el valor agregado. Es una herramienta de análisis hipotética. para reproducir varias variantes de eventos al planificar.

Ejemplos de productos: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

Consolidación financiera.

La consolidación de datos de acuerdo con las normas internacionales de contabilidad, teniendo en cuenta las participaciones en la propiedad, las distintas monedas y la rotación interna, es una tarea urgente en relación con los requisitos cada vez más estrictos de las autoridades de auditoría (SOX, Basilea II) y las empresas que ingresan a OPI. Las tecnologías OLAP permiten agilizar el cálculo de informes consolidados y aumentar la transparencia de todo el proceso.

Ejemplos de productos: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Almacenes de datos y tecnologías de procesamiento analítico en línea (OLAP)
son elementos importantes de apoyo a las decisiones comerciales, que se están convirtiendo cada vez más en una parte integral de cualquier industria. El uso de tecnologías OLAP como herramienta de inteligencia empresarial brinda mayor control y acceso oportuno a estrategias
información que contribuya a una toma de decisiones eficaz.
Esto brinda la capacidad de simular pronósticos del mundo real y un uso más eficiente de los recursos. OLAP permite que una organización responda más rápidamente a las demandas del mercado.

Bibliografía:

1. Erik Thomsen. Soluciones OLAP: Construcción de sistemas de información multidimensionales Segunda edición. Wiley Computer Publishing John Wiley & Sons, Inc., 2002.

2. Informe técnico del consejo OLAP, http://www.olapcouncil.org/research/whtpaply.htm

3. Gerd Stumme y Bernhard Ganter. Análisis de conceptos formales _ Fundamentos matemáticos.