Menu
Jest wolny
Zameldować się
główny  /  Oprogramowanie Program OLAP. Systemy OLAP.

Program OLAP. Systemy OLAP.

4. Klasyfikacja produktów OLAP.

5. Zasady klientów OLAP.

7. Zakres zastosowań OLAP-Technologies.

8. Przykład korzystania z technologii OLAP do analizy sprzedaży.

1. Umieść OLAP w strukturze informacyjnej przedsiębiorstwa.

Termin "OLAP" jest nierozerwalnie związany z terminem "hurtownia danych" (hurtownia danych).

Dane w repozytorium spadają z systemów operacyjnych (systemów OLTP), które są przeznaczone do automatyzacji procesów biznesowych. Ponadto przechowywanie można uzupełnić ze względu na źródła zewnętrzne, takie jak raporty statystyczne.

Zadaniem repozytorium jest dostarczanie "surowców" do analizy w jednym miejscu i prostej, zrozumiałej strukturze.

Istnieje kolejny powód, dla którego uzasadnia pojawienie się oddzielnego repozytorium - złożone wnioski analityczne dotyczące informacji operacyjnych hamują bieżące prace firmy, blokowanie tabel przez długi czas i przechwytując zasoby serwera.

W ramach repozytorium nie można zrozumieć niezbędnej gigantycznej akumulacji danych - najważniejsze jest to, że jest to wygodne do analizy.

Centralizacja i wygodna struktura nie jest wszystkim, co jest potrzebne przez Analytics. Nadal wymaga narzędzia do oglądania, wizualizacji informacji. Tradycyjne raporty, nawet zbudowane na podstawie pojedynczego przechowywania, są pozbawione jednej elastyczności. Nie mogą być "twist", "wdrożyć" lub "upadek", aby uzyskać żądaną prezentację danych. To byłoby jego narzędzie, które pozwoliłoby wdrożyć i obrócić dane po prostu i wygodne! Jako taki narzędzie i wykonuje OLAP.

Chociaż OLAP nie jest niezbędnym atrybutem hurtowni danych, coraz częściej stosuje się analizę informacji gromadzonych w tym magazynie.

Miejsce OLAP w strukturze informacyjnej przedsiębiorstwa (rys. 1).

Obrazek 1. MiejsceOlej. w strukturze informacyjnej przedsiębiorstwa

Dane operacyjne są gromadzone z różnych źródeł, oczyszczane, zintegrowane i złożone do magazynowania relacyjnego. Jednocześnie są one już dostępne do analizy przy użyciu różnych sposobów raportów budowlanych. Następnie dane (w pełni lub częściowo) są przygotowane do analizy OLAP. Można je załadować do specjalnej bazy danych OLAP lub pozostawione w magazynie relacyjnym. Najważniejszym elementem jest metadane, tj. Informacje o strukturze, umiejscowieniu i transformacji danych. Dzięki nim zapewniona jest skuteczna interakcja różnych składników magazynowania.

Podsumowanie, możliwe jest określenie OLAP jako zestaw środków wielowymiarowej analizy danych nagromadzonych w repozytorium.

2. Operacyjne przetwarzanie danych analitycznych.

Podstawą koncepcji OLAP leży zasadę wielowymiarowej prezentacji danych. W 1993 r. EF Codd uważał niedociągnięcia modelu relacyjnego, przede wszystkim, co wskazuje na niemożność "łączenia, przeglądania i analizowania danych z punktu widzenia wielości pomiarów, czyli najbardziej zrozumiałe dla analityków korporacyjnych w Metoda "i zidentyfikowane ogólne wymagania dotyczące systemów OLAP rozszerzając funkcjonalność Relacyjną DBMS i w tym analizę wielowymiarową jako jedną z jego charakterystyk.

Według kodu wielowymiarową koncepcyjną reprezentację danych jest wielokrotną perspektywą składającą się z kilku niezależnych pomiarów, wzdłuż których można analizować pewne zestawy danych.

Jednoczesna analiza kilku pomiarów jest zdefiniowana jako analiza wielowymiarowa. Każdy pomiar obejmuje kierunki konsolidacji danych składających się z serii kolejnych poziomów uogólnienia, w których każdy wyższy poziom odpowiada większym stopniu agregacji danych w odpowiednim pomiarze.

Tak więc pomiar wykonawcy można określić kierunek konsolidacji składającej się z poziomów uogólnienia "Przedsiębiorstwo - Wydział - Dział - pracownik". Czas pomiaru może nawet zawierać dwie wskazówki konsolidacyjne - "Rok-kwartał - miesiąc - dzień" i "Dzień tygodnia", ponieważ odliczanie przez miesiące i tygodnie są niezgodne. W tym przypadku możliwe jest, aby dowolnie wybór pożądanego poziomu szczegółowości informacji na temat każdego z pomiarów.

Operacja pochodzenia (wiercenie) odpowiada ruchowi z najwyższych etapów konsolidacji do niższej; Wręcz przeciwnie, operacja podnoszenia (walcowanie) oznacza ruch z niższych poziomów do wyższej (rys. 2).


Rysunek 2. Pomiary i kierunki Konsolidacja danych

3. Wymagania dotyczące sposobu operacyjnego przetwarzania analitycznego.

Wielowymiarowe podejście powstało niemal jednocześnie i równolegle z relacyjnym. Jednak tylko począwszy od połowy lat dziewięćdziesiątych, a raczej
1993, zainteresowanie IUUBD. Zaczął zdobywać uniwersalny charakter. W tym roku był nowy artykuł oprogramowania pojawił się jednym z założycieli podejścia relacyjnego. E. Codda.W którym sformułował 12 podstawowych wymagań dotyczących wdrożenia Olej. (Tabela 1).

Tabela 1.

Wielowymiarowa reprezentacja danych.

Narzędzia muszą obsługiwać wielowymiarowy widok danych na poziomie koncepcyjnym.

Przezroczystość

Użytkownik nie powinien wiedzieć, jakie konkretne środki są używane do przechowywania i przetwarzania danych, ponieważ dane są zorganizowane i gdzie są pobierane.

Dostępność

Oznacza muszą wybrać i komunikować się z najlepszymi, aby utworzyć odpowiedź na to żądanie źródła danych. Narzędzia powinny zapewnić automatyczne wyświetlanie własnego obwodu logika w różnych heterogenicznych źródłach danych.

Spójna wydajność

Wydajność praktycznie nie powinna zależeć od liczby pomiarów w żądaniu.

Obsługa serwera klienta architektury

Fundusze powinny pracować w architekturze klient-serwer.

Równość wszystkich pomiarów

Żaden z pomiarów nie powinien być prosty, wszystkie muszą być równe (symetryczne).

Dynamiczne przetwarzanie rzadkich matryc

Niepewne wartości muszą być przechowywane i przetwarzane w najbardziej wydajny sposób.

Obsługa trybu danych wieloosobowych

Narzędzia powinny stanowić możliwość pracy więcej niż jednego użytkownika.

Wsparcie dla operacji na podstawie różnych pomiarów

Wszystkie wielowymiarowe operacje (na przykład agregowanie) powinny być równomiernie i skoordynowane do dowolnej liczby jakichkolwiek pomiarów.

Łatwe dane manipulacyjne

Fundusze muszą mieć najwygodniejszy, naturalny i wygodny interfejs użytkownika.

Opracowane narzędzia do zgłoszenia danych

Fundusze muszą utrzymać różne metody Wizualizacja (prezentacja) danych.

Nieograniczona liczba pomiarów i poziomu agregacji danych

Nie powinno być żadnych ograniczeń liczby obsługiwanych pomiarów.

Zasady oceny produktów oprogramowania OLAP

Zestaw tych wymagań, które służyły jako rzeczywista definicja OLAP, powinna być uważana za doradztwo, a konkretne produkty do oceny stopnia podejścia do idealnej zgodności ze wszystkimi wymaganiami.

Później definicja kodu została przerobowana w tak zwany test Fasmi, który wymaga zastosowania OLAP, aby zapewnić możliwość szybkiego analizy współdzielonych informacji wielowymiarowych.

Pamiętaj, że 12 coddo zasad zbyt uciążliwe dla większości ludzi. Okazało się, że możesz podsumować definicję OLAP tylko pięć słów kluczowych: Szybka analiza wspólnych informacji wielowymiarowych - lub krótko - Fasmi (przetłumaczone z języka angielskiego:FA. ast. ZA. naliza. S. nękany. M. uLTIDIMENSION. JA. normacja).

Ta definicja została najpierw sformułowana na początku 1995 r. I od tego czasu nie musiała się poprawiać.

Szybki ( Szybki ) - Wskazuje, że system powinien zapewnić wydawanie większości odpowiedzi dla użytkowników w ciągu około pięciu sekund. Jednocześnie najprostsze żądania są przetwarzane w ciągu jednej sekundy i bardzo niewiele - więcej niż 20 sekund. Badania wykazały, że użytkownicy końcowi postrzegają proces nieudany, jeśli wyniki nie są odbierane po 30 sekundach.

Na pierwszy rzut oka może wydawać się zaskakujące, że przy otrzymaniu raportu przez minutę, na które były potrzebne, użytkownik bardzo szybko zaczyna tęsknić podczas oczekiwań, a projekt jest znacznie mniej udany niż w przypadku natychmiastowej odpowiedzi, nawet co najmniej mniej szczegółowa analiza.

Analiza (analiza) oznacza, że \u200b\u200bsystem może poradzić sobie z dowolną charakterystyką analizy logicznej i statystycznej ta aplikacjaI zapewnia oszczędność w formularzu dostępnym dla użytkownika końcowego.

Nie jest tak ważne, jeśli ta analiza zostanie wykonana w narzędziach własnych dostawcy lub w powiązanym oprogramowaniu zewnętrznym Rodzaj produktu Arkusza kalkulacyjnego, po prostu wszystkie wymagane funkcjonalność analizy muszą być dostarczone w intuicyjny sposób dla użytkowników końcowych. Narzędzia analizy mogą obejmować pewne procedury, takie jak analizowanie serii czasu, dystrybucję kosztów, transfery walutowe, wyszukiwanie celów, zmiany w strukturach wielowymiarowych, nie zatężono modelowanie, identyfikację wyłącznych sytuacji, ekstrakcji danych i pozostałe zależne od operacji. Takie możliwości są szeroko rozpowszechnione wśród produktów, w zależności od orientacji docelowej.

Wspólny (wspólny) Oznacza to, że system zapewnia wszystkie wymagania ochrony poufności (być może na poziomie komórki), a jeśli potrzebna jest wiele dostępu do nagrywania, zapewnia blokowanie modyfikacji na odpowiednim poziomie. Nie wszystkie aplikacje mają potrzebę nagrywania danych. Jednak liczba takich zastosowań rośnie, a system musi być w stanie obsługiwać wiele modyfikacji terminowo, bezpieczny sposób.

Wielowymiarowy (wielowymiarowy) - jest to kluczowy wymóg. Gdyby konieczne było zdefiniowanie OLAP jednym słowem, wybraliby go. System powinien zapewnić wielowymiarową prezentację koncepcyjną danych, w tym pełne wsparcie dla hierarchii i wielu hierarchii, ponieważ jest to zdecydowanie najbardziej logiczny sposób na analizę biznesu i organizacji. Minimalna liczba pomiarów, które muszą być przetwarzane, ponieważ zależy również od aplikacji, a większość produktów OLAP ma wystarczającą liczbę pomiarów dla tych rynków, które są one ukierunkowane.

Informacje o informacjach - To wszystko. Niezbędne informacje należy uzyskać tam, gdzie jest to konieczne. Jednak wiele zależy od aplikacji. Moc różnych produktów mierzy się pod względem liczby danych wejściowych, które mogą przetwarzać, ale nie ile gigabajtów mogą przechowywać. Moc produktu jest bardzo różna - największe produkty OLAP mogą obsługiwać co najmniej tysiąc razy z dużą liczbą danych w porównaniu z najmniejszym. Z tej okazji należy wziąć pod uwagę wiele czynników, w tym duplikacja danych wymagana przez pamięć RAM, korzystanie z miejsca na dysku, wskaźniki operacyjne, integracja z magazynami informacyjnymi itp.

Test Fasmi jest rozsądną i zrozumiałą definicją celów, osiągnięciem, którego OLAP jest skoncentrowany.

4. KlasyfikacjaOlej.- Produkty.

Więc istota OLAP Jest to, że źródło informacji do analizy przedstawiono w postaci wielowymiarowej kostki i możliwe jest arbitralnie manipulowanie go i otrzymuje niezbędne obniżki informacji - raporty. W tym przypadku użytkownik końcowy widzi kostkę jako wielowymiarową tabelę dynamiczną, która automatycznie podsumowuje dane (fakty) w różnych cięciach (pomiary) i umożliwia interaktywnie zarządzać obliczeniami i formularzem raportu. Zapewnione są te operacjeOlej. - maszyna (lub maszynaOlap-ataków).

Do tej pory wiele produktów realizowanych na świecieOlej. -Technologie. Ułatwić nawigację wśród nich, użyj klasyfikacjiOlej. - Produkty: zgodnie z metodą przechowywania danych do analizy i lokalizacjiOlej. -samochody. Rozważ każdą kategorięProdukty OLAP.

Klasyfikacja do przechowywania danych

Wielowymiarowe kostki opierają się na danych źródłowych i agregujących. Zarówno źródło, jak i łączne dane dla kostek można przechowywać zarówno w bazach danych relacyjnych, jak i wielowymiarowych. Dlatego obecnie stosowane są trzy metody przechowywania danych:Molap (wielowymiarowa OLAP), Rolap (Relacyjna OLAP) i Holap (Hybrid Olap ). Odpowiednio,Olej. - Produkty zgodnie z metodą przechowywania danych są podzielone na trzy podobne kategorie:

1. W przypadku molaku , dane początkowe i kruszywe są przechowywane w wielowymiarowej bazie danych lub na wielowymiarowej lokalnej Kubie.

2. W Rolap. - Produkty Dane źródłowe są przechowywane w relacyjnych bazach danych lub w płaskich tabelach lokalnych na serwerze plików. Dane zbiorcze można umieścić w tabelach serwisowych w tej samej bazie danych. Transformacja danych z relacyjnej bazy danych w kostkach wielowymiarowych występuje na życzenieOLAP-STOSOWANIE.

3. W przypadku użyciaHolap Architektura Początkowe dane pozostaje w zasadzie relacyjnej, a jednostki są umieszczane w wielowymiarowych. BudynekOlej. -Kuba odbywa się na życzenieOlej. - ulga oparta na danych relacyjnych i wielowymiarowych.

Klasyfikacja na umieszczeniu Olej.-samochody.

Dla tego znakuOlej. - Produkty są podzielone przezSerwery OLAP i OLAP-Clements:

· W serwerze OLAP - Obliczenia i przechowywanie danych kruszywa są wykonywane przez oddzielny proces - serwer. Aplikacja klienta otrzymuje tylko wyniki zapytań do kostek wielowymiarowych, które są przechowywane na serwerze. TrochęOlej. -Servers wspierają przechowywanie danych tylko w zasadach relacyjnych, niektóre są tylko wielowymiarowe. Wiele nowoczesnychOlej. -Servers obsługują wszystkie trzy metody przechowywania:Molap, Rolap i Holap.

Molak.

Molap jest Wielowymiarowa przetwarzanie analityczne on-line,to jest wielowymiarowa OLAP.Oznacza to, że serwer pamięci wykorzystuje wielowymiarową bazę danych (MBD). Znaczenie użycia MBD jest oczywiste. Może skutecznie przechowywać dane wielowymiarowe ze względu na swój charakter, zapewniając szybkie narzędzia do baz danych. Dane są przesyłane z źródła danych do wielowymiarowej bazy danych, a następnie bazy danych jest narażony na działanie agregacji. Wstępne obliczenia jest czymś, co przyspiesza zapytania OLAP, ponieważ obliczenie skonsolidowanych danych jest już produkowane. Czas zapytania staje się funkcją wyłącznie czasu wymaganego do uzyskania dostępu do oddzielnego fragmentu i obliczeń danych. Ta metoda obsługuje koncepcję, zgodnie z którą praca jest przeprowadzana raz, a wyniki są następnie używane ponownie. Wielowymiarowe bazy danych są stosunkowo nową technologią. Korzystanie z MBD ma takie same wady jak większość nowych technologii. Mianowicie - nie są tak stabilne, jak relacyjne bazy danych (RBD) i nie są zoptymalizowane w takim samym stopniu. Innym słabym punktem MBD jest niemożność korzystania z większości wielowymiarowych baz danych w procesie agregacji danych, dlatego wymaga czasu, aby nowe informacje były dostępne do analizy.

Rolap.

Rolap jest Relacyjne przetwarzanie analityczne on-line,to jest relacyjny olej.Termin Rolap wskazuje, że serwer OLAP jest oparty na relacyjnej bazie danych. Dane źródłowe są wprowadzane do relacyjnej bazy danych, zazwyczaj zgodnie z programem "Star" schemat lub schemat śniegu, który pomaga zmniejszyć czas ekstrakcji. Serwer zapewnia wielowymiarowy model danych za pomocą zoptymalizowanych zapytań SQL.

Istnieje wiele powodów wyboru relacji, a nie wielowymiarowej bazy danych. RBD jest dobrze rozwiniętą technologią, która ma wiele możliwości optymalizacji. Wykorzystanie rzeczywistych warunków spowodowały wynik bardziej pracował produkt. Ponadto RBD obsługuje większe objętości danych niż MBD. Są one po prostu zaprojektowane do takich woluminów. Głównym argumentem przeciwko RBD jest złożoność żądań wymaganych do uzyskania informacji z dużej bazy danych za pomocą SQL. Niedoświadczony programista SQL może łatwo obciążyć cenne zasoby systemowe próby przeprowadzenia jakiegoś żądania, które w MBD jest znacznie prostsze.

Zagregowane / wstępnie zagregowane dane.

Szybka implementacja zapytania jest konieczna dla OLAP. Jest to jedna z podstawowych zasad OLAP - zdolność do intuicyjnie manipulowania danymi wymaga szybkiego wydobycia informacji. Ogólnie rzecz biorąc, im bardziej obliczanie jest konieczne, aby wytworzyć fragment informacji, wolniej występuje odpowiedź. Dlatego, aby zachować mały czas wdrożenia zapytań, fragmenty informacji, odwołanie, do którego zwykle dzieje się najczęściej, ale które wymagają obliczeń, są przed agregacją. Oznacza to, że są liczone, a następnie przechowywane w bazie danych jako nowe dane. Jako przykład typu danych, który jest dopuszczalny do obliczenia z góry, możliwe jest doprowadzenie danych podsumowujących - na przykład wskaźniki sprzedaży od miesięcy, kwartałów lub lat, dla których naprawdę wprowadzono dzienne wskaźniki.

Różni dostawcy przylegają do różnych metod wyboru parametrów wymagających wstępnej agregacji i liczby wstępnie obliczonych wartości. Podejście do agregacji wpływa na bazę danych i podczas wdrażania żądań. Jeśli obliczono więcej wartości, prawdopodobieństwo, że użytkownik żąda zwiększenia obliczonej wartości, a zatem czas reakcji jest zmniejszony, ponieważ nie jest konieczne poprosić o początkową wartość do obliczania. Jednakże, jeśli obliczysz wszystkie możliwe wartości - to nie jest najlepsze rozwiązanie - w tym przypadku rozmiar bazy danych znacznie rośnie, co sprawi, że jest niezarządzany, a czas agregacji będzie zbyt duży. Ponadto wartości numeryczne są dodawane do bazy danych lub jeśli się zmieniają, informacje te powinny być odzwierciedlone w wstępnie obliczonych wartościach w zależności od nowych danych. W ten sposób aktualizacja bazy danych może również zajmować dużo czasu w przypadku dużej liczby wstępnie obliczonych wartości. Ponieważ zwykle, podczas agregacji baza danych działa autonomicznie, pożądane jest, aby czas agregacji nie jest zbyt długi.

· OLAP. -Client jest zaprojektowany inaczej. Budowanie wielowymiarowej kostki iOlej. - Aktywacje są wykonywane w pamięci komputera klienckiego.Olej. -klinery są również podzielone naRolap i Molap. A niektóre mogą obsługiwać obie opcje dostępu do danych.

Każde z tych podejść, są "plusy" i "minusy". Wbrew wspólnej opinii na temat korzyści płynących z narzędziami serwerowymi przed klientem, ogólnie, szereg przypadków.Olej. -Clin dla użytkowników może być bardziej wydajny i bardziej opłacalnyOlap służyć.

Rozwój zastosowań analitycznych przy użyciu klienta OLAP Funds - proces jest szybki i nie wymaga specjalnego przygotowania wykonawcy. Użytkownik, który zna fizyczną realizację bazy danych, może opracować zastosowanie analityczne niezależnie bez atrakcyjności specjalisty IT.

Podczas korzystania z serwera OLAP musisz studiować 2 różne systemy, czasami od różnych dostawców - tworzyć kostki na serwerze i opracować aplikację klienta.

Klient OLAP zapewnia pojedynczy interfejs wizualny, aby opisać kostki i konfigurowanie interfejsów użytkownika.

Tak więc, w jakich przypadkach zastosowanie klienta OLAP dla użytkowników może być bardziej wydajny i bardziej opłacalny w użyciu serwera OLAP?

· Ekonomiczna wykonalność aplikacjiOlej. -Server występuje, gdy ilość danych jest bardzo wysoka i nieznośnaOlej. -Clin, w przeciwnym razie użycie tego ostatniego jest bardziej uzasadnione. W tym przypadkuOlej. - łączy wysoką charakterystykę i niski koszt.

· Potężni analitycy PC - kolejny argument na korzyśćOlej. -Clinenty. Po zastosowaniuOlej. Slover Te moc nie są używane.

Wśród zalet klientów OLAP można również nazwać:

· Koszty wdrażania i konserwacjiOlej. -Clin jest znacznie niższy niż kosztSerwer OLAP.

· Za pomocąOlej. -Klinia z wbudowaną maszyną transmisji danych przez sieć jest wykonana raz. Podczas robieniaOlej. - Operacje nowych strumieni danych nie są generowane.

5. Zasady pracy Olej.-Clinenty.

Rozważ proces tworzenia aplikacji OLAP za pomocą narzędzia instrumentalnego klienta (rys. 1).

Obrazek 1. Tworzenie aplikacji OLAP za pomocą Rolap Klient

Zasada działania klientów Rolap jest wstępnym opisem warstwy semantycznej, która ukrywa fizyczną strukturę danych źródłowych. W takim przypadku źródła danych mogą być: lokalne tabele, RDBD. Lista obsługiwanych źródeł danych jest określona przez określony produkt oprogramowania. Następnie użytkownik może niezależnie manipulować obiektami zrozumiałą do niego pod względem obszaru tematycznego tworzenia kostek i interfejsów analitycznych.

Zasada działania serwera OLAP jest inna. Na serwerze OLAP, podczas tworzenia kostek, użytkownik manipuluje fizycznymi opisami bazy danych. W tym samym czasie niestandardowe opisy są tworzone na samej Kuby. Klient Server Olap jest skonfigurowany tylko do kostki.

Podczas tworzenia warstwy semantycznej źródła danych - stoły sprzedażowe i transakcyjne są opisane przez zrozumiałe terminy użytkownika końcowego i skręć w "produkty" i "transakcje". Pole "ID" z tabeli "Produkty" przemianowano na "Kod", a "Nazwa" - w "produkcie" itp.

Następnie tworzony jest obiekt biznesowy "sprzedaż". Obiekt biznesowy jest płaskim stołem, na podstawie wielowymiarowej kostki. Podczas tworzenia obiektu biznesowego "Tabela" Produkty "i" Transakcje "są połączone przez pole" Kodeks "towarów. Ponieważ wszystkie pola tabel nie są wymagane do wyświetlenia w raporcie - obiekt biznesowy używa tylko pól "Produkt", "data" i "Ilość".

W naszym przykładzie na podstawie zakładu biznesowego "sprzedaży" utworzono raport o sprzedaży towarów miesięcznie.

Podczas pracy z raportem interaktywnym Użytkownik może ustawić warunki filtrowania i grupowania z tymi samymi prostymi ruchami "mysz". W tym momencie klient Rolap odwołuje się do danych w pamięci podręcznej. Klient serwera OLAP generuje nowy wniosek do wielowymiarowej bazy danych. Na przykład stosując filtr sprzedaży w raporcie sprzedaży, możesz uzyskać raport o sprzedaży towarów interesujących dla nas.

Wszystkie ustawienia aplikacji OLAP można przechowywać w dedykowanym repozytorium metadanych, w aplikacji lub w wielowymiarowym repozytorium systemu bazy danych. Wdrożenie zależy od konkretnego produktu.

Wszystko, co jest zawarte w tych aplikacjach, jest standardowym widokiem na interfejs, z góry określone funkcje i strukturę, jak również szybkie rozwiązania Dla mniej lub bardziej standardowych sytuacji. Na przykład popularne są pakiety finansowe. Wstępnie utworzone wnioski finansowe pozwolą specjalistom wykorzystać znane instrumenty finansowe bez konieczności zaprojektowania struktury bazy danych lub ogólnie przyjętych formularzy i raportów.

Internet jest nowa forma klient. Ponadto niesie druk nowych technologii; wiele rozwiązania internetowe. Znacznie różni się w swoich możliwościach jako całość i jako rozwiązanie OLAP - w szczególności. Istnieje wiele zalet w formacji raportów OLAP przez Internet. Najważniejszym jest brak potrzeby specjalistycznego oprogramowania do uzyskania dostępu do informacji. Oszczędza przedsiębiorstwo kilka czasu i pieniędzy.

6. Wybierz architekturę aplikacji OLAP.

Przy wdrażaniu informacji i systemu analitycznego ważne jest, aby nie mylić się w wyborze architektury aplikacji OLAP. Doskonałe tłumaczenie terminu procesu analitycznego on-line - "operacyjny przetwarzanie analityczne" - jest często postrzegane dosłownie w tym sensie, że dane wprowadzające system jest szybko przeanalizowany. Jest to nieporozumienie - analiza analizy nie jest związana z rzeczywistym czasem aktualizacji danych w systemie. Ta cecha odnosi się do czasu odpowiedzi systemu OLAP na żądania użytkownika. Jednocześnie często analizowane dane są migawką informacji "na wczoraj", jeśli na przykład dane w magazynie są aktualizowane raz dziennie.

W tym kontekście OLAP jest bardziej dokładny jako "interaktywny przetwarzanie analityczne". Jest to możliwość analizy danych w trybie interaktywnym, który wyróżnia system OLAP z systemów do przygotowania raportów regulowanych.

Inną cechą interaktywnego przetwarzania w preparacie OLAP OLAP OLAP jest możliwość "łączenia, przeglądania i analizy danych z punktu widzenia wielości pomiarów, tj. Najbardziej zrozumiałe dla analityków korporacyjnych w sposób". W samym kodzie termin OLAP oznacza wyłącznie specyficzny sposób reprezentowania danych na poziomie koncepcyjnym - wielowymiarowe. Na poziomie fizycznym dane mogą być przechowywane w relacyjnych bazach danych, ale w rzeczywistości instrumenty OLAP, z reguły działają z wielowymiarowymi bazami danych, w których dane są uporządkowane jako hipercube (rys. 1).

Obrazek 1. Olej. - Cube (Hypercub, Metakub)

W tym przypadku znaczenie tych danych jest określony przez moment wypełnienia hiperkuby nowymi danymi.

Oczywiście czas tworzenia wielowymiarowej bazy danych znacząco zależy od ilości załadowanego do niego danych, więc rozsądne jest ograniczenie tego objętości. Ale jak nie zawęża zdolności do analizy i nie pozbawiania użytkownika dostępu do wszystkich zainteresowanych informacjami? Istnieją dwie alternatywne ścieżki: Analizuj następnie zapytanie ("Pierwsza analiza - poproś o dodatkowe informacje") i zapytanie, a następnie analizuj ("Dane pierwszego żądania - następnie analizowane").

Wyznawcy pierwszej ścieżki oferują przesyłanie uogólnionych informacji do wielowymiarowej bazy danych, na przykład miesięcznych, kwartalnych, rocznych wyników według działów. A jeśli musisz szczegółowy te dane, użytkownik jest zaproszony do utworzenia raportu na podstawie relacyjnej, zawierającym wymaganą próbkę, na przykład, na przykład przez daną jednostkę lub miesiąc i personel wybranego podziału.

Zwolennicy drugiej ścieżki, wręcz przeciwnie, oferują użytkownika, przede wszystkim, aby zdecydować o danych, które zamierza i precyzyjnie pobrać je do mikrokubu - mała wielowymiarowa baza danych. Oba podejścia różnią się na poziomie koncepcyjnym i mają swoje zalety i wady.

Zalety drugiego podejścia powinny obejmować "świeżość" informacji, które użytkownik otrzymuje w formie raportu wielowymiarowego, jest "mikrokub". Mikrokub jest utworzony na podstawie żądanego informacji z bieżącej relacyjnej bazy danych. Praca z mikrokube odbywa się w trybie interaktywnym - uzyskanie sekcji informacji, a jego szczegół w mikrokubie jest natychmiast przeprowadzony. Innym pozytywnym punktem jest to, że projektowanie struktury i napełniania mikrokuba prowadzi użytkownika "w locie", bez udziału administratora bazy danych. Jednak podejście cierpi z powodu poważnych niedociągnięć. Użytkownik nie widzi obrazu Ogólnego i musi być określony z wyprzedzeniem z kierunkiem jego badań. W przeciwnym razie żądany mikrokub może być zbyt mały i nie zawierają wszystkich danych danych, a użytkownik będzie musiał poprosić o nowy mikrokub, a następnie nowy, a następnie. Zapytanie następnie analizuje podejście wdraża narzędzie BusinessObjects do firmy firmy o tej samej nazwie przybory Platformy Contour Company.Intersoft.Laboratorium.

Po zbliżaniu się do analizy zapytanie, ilość danych załadowanych do wielowymiarowej bazy danych może być dość duży, wypełnienie musi być wykonane zgodnie z przepisami i może potrwać sporo czasu. Jednak wszystkie te wady wypłacają potem, gdy użytkownik ma dostęp do prawie wszystkich niezbędnych danych w dowolnej kombinacji. Odwołanie do danych źródłowych w relacyjnej bazy danych odbywa się tylko jako ostatni ośrodek w razie potrzeby dokładna informacjaNa przykład na określonej fakturze.

W sprawie działania pojedynczej wielowymiarowej bazy danych liczba użytkowników atrakcyjnych do niego praktycznie nie ma wpływu. Przeczytają tylko dane tam dostępne w przeciwieństwie do zapytania, a następnie analizuj podejście, w którym liczba mikrokubów w przypadku ograniczającego może rosnąć z taką samą prędkością, jak liczba użytkowników.

Dzięki temu podejściu ładunek usług informatycznych wzrasta, które inne bazy danych są również zmuszone do obsługi nawet relacyjnych baz danych. To są te usługi odpowiedzialne za terminowe automatyczne aktualizowanie danych w wielowymiarowych bazach danych.

Najbardziej uderzający przedstawiciele analizy wówczas podejście do zapytań są narzędzia POWERPLAY i Firma Impromptu Cognos.

Wybór i podejście, oraz instrument jego wdrażania, w zależności od pierwszego ze wszystkich celów docelowej: zawsze muszą równoważyć między oszczędnościami budżetowymi i poprawić jakość usług użytkowników końcowych. Należy pamiętać, że w planie strategicznym utworzenie systemów informacyjnych i analitycznych jest nawiedzany przez cel osiągnięcia przewagi konkurencyjnej, a nie unikanie wydatków na automatyzację. Na przykład, informacja korporacyjna i system analityczny może zapewnić niezbędne, terminowe i wiarygodne informacje o firmie, której publikacja dla potencjalnych inwestorów zapewni przejrzystość i przewidywalność tej firmy, która nieuchronnie stała się warunkami jego atrakcyjności inwestycyjnej.

7. Zakres zastosowań OLAP-Technologies.

OLAP Zastosuj tam, gdziekolwiek jest zadanie analizy danych wielowarodowych. Ogólnie rzecz biorąc, jeśli istnieje jakaś tabela z danymi, w której istnieje co najmniej jedna kolumna opisowa (pomiar) i jedna kolumna z liczbami (miarami lub faktami) narzędzie OLAP, z reguły będzie skutecznym środkiem analizy i generowania raportów .

Rozważmy niektóre zastosowania technologii OLAP zaczerpnięte z prawdziwego życia.

1. Sprzedaż.

W oparciu o analizę struktury sprzedaży, pytania są rozwiązane niezbędne do dokonywania decyzji o zarządzaniu: zmiana w zakresie towarów, cen, zamykania i otwarcia sklepów, oddziałów, zakończenia i podpisywania umów z dealerami lub zakończenie kampanii reklamowych itp.

2. Zamówienia.

Zadanie powrót przeciwnej analizy sprzedaży. Wiele przedsiębiorstw kupuje komponenty i materiały od dostawców. Przedsiębiorstwa handlowe Kup towary do odsprzedaży. Możliwe zadania podczas analizy zestawu zamówień, od planowania pieniędzy opartych na wcześniejszych doświadczeniach kontrole dla menedżerówWybór dostawców.

3. Ceny.

Analiza cen rynkowych jest zamknięty analizą zamówień. Celem tej analizy jest zoptymalizowanie kosztów, wybór najbardziej opłacalnych propozycji.

4. Marketing.

W ramach analizy marketingowej będziemy pamiętać tylko o obszarach analizy klientów lub usług konsumenckich. Zadaniem tej analizy jest prawidłowe pozycjonowanie towarów, identyfikując grupy kupujących do reklamy docelowej, optymalizacji zakresu. Zadaniem OLAP w tym przypadku jest podanie użytkownika szybkiego narzędzia, w tempie myśli, otrzymując odpowiedzi na pytania, intuicyjnie występująca analiza danych.

5. Magazyn.

Analiza struktury pozostałości w magazynie w kontekście rodzajów towarów, magazynów, analiza przechowywania towarów, analiza wysyłki przez odbiorców i wiele innych ważnych rodzajów analizy jest możliwa, jeśli istnieje księgowość magazynowa.

6. Ruch pieniędzy.

Jest to cały obszar analizy, który ma wiele szkół i technik. Technologia OLAP może służyć jako narzędzie do wdrażania lub poprawy tych technik, ale nie zastępować ich. Ceny gotówkowe bezgotówkowe i gotówkowe w operacjach biznesowych R AZreza, kontrahenta, waluty i czas na optymalizację przepływów, płynności itp. Są analizowane. Skład pomiarów silnie zależy od specyfiki biznesowej, przemysłu, technik.

7. Budżet.

Jedna z najbardziej żyznych zastosowań technologii OLAP. Nie prezent, nie jest uważany za nowoczesny system budżetowania, bez dostępności narzędzi OLAP dla analizy budżetowej. Większość raportów budżetowych jest łatwo zbudowana na podstawie systemów OLAP. Jednocześnie raporty reagują na bardzo szeroką gamę problemów: analiza kosztów wydatków i dochodów, porównując koszty niektórych artykułów z różnych jednostek, analiza dynamiki i trendów wydatków na niektóre artykuły, analiza kosztów i zyski.

8. Konta rachunkowości.

Klasyczny raport bilansowy składający się z numeru konta i zawierające pozostałości przychodzące, obręcze i pozostałości wychodzące mogą być doskonale analizowane w systemie OLAP. Ponadto system OLAP może automatycznie i bardzo szybko obliczyć skonsolidowane bilansy organizacji multifilii, salda na miesiąc, kwartał i rok, zagregowane salda balansowe, salda analityczne oparte na znakach analitycznych.

9. Sprawozdanie finansowe.

System raportowania technologicznego nie ma nic podobnego do zestawu wymienianych wskaźników z wartościami w dniu, który jest wymagany do zgrupowania i podsumowania w różnych kawałkach w celu uzyskania konkretnych raportów. Gdy tak jest, wyświetlacz i raporty drukowania są najprostsze i tanie są realizowane w systemach OLAP. W każdym przypadku wewnętrzny system raportowania przedsiębiorstwa nie jest tak zachowany i może zostać przebudowany w celu uratowania środków na prace techniczne dotyczące tworzenia raportów i możliwości wielowymiarowej analizy operacyjnej.

10. Obecność witryny.

Plik dziennika serwera internetowego jest wielwiodowa z natury, a zatem nadaje się do analizy OLAP. Fakty są: liczba wizyt, liczba trafień, czas spędzony na stronie i inne informacje dostępne w dzienniku.

11. Woluminy produkcyjne.

Jest to kolejny przykład analizy statystycznej. W ten sposób możliwe jest analizę woluminów uprawnych ziemniaków, stal produkowany wytwarzany przez towary.

12. Zużycie materiałów eksploatacyjnych.

Wyobraź sobie roślinę składającą się z dziesiątki sklepów, w których chłodzenie, płyny do mycia, oleje, szmaty, papier ścierny - setki materiałów eksploatacyjnych. W celu dokładnego planowania optymalizacja kosztów wymaga dokładnej analizy rzeczywistej zużycia materiałów eksploatacyjnych.

13. Wykorzystanie pomieszczeń.

Inny rodzaj analizy statystycznej. Przykłady: analiza obciążenia nauki odbiorców, wynajętych budynków i pomieszczeń, przy użyciu hal dla konferencji itp.

14. Płynność personelu w przedsiębiorstwie.

Analiza przepływu personelu w przedsiębiorstwie w kontekście oddziałów, działów, zawodów, poziomu edukacji, płci, wieku, czas.

15. Ruch pasażerski.

Analiza liczby biletów i sum w kontekście sezonów, kierunków, typów samochodów (klas), pociągów pociągów (samolot).

Ta lista nie jest ograniczona do zakresu aplikacjiOlej. - Technologia. Na przykład rozważ technologięOlej. - Analiza sprzedaży.

8. Przykład użyciaOlej. - Technologie do analizy w sferze sprzedaży.

Projektowanie wielowymiarowej prezentacji danych dlaOlej. "Analiza zaczyna się od utworzenia karty pomiarowej. Na przykład, gdy analizując sprzedaż, może być wskazane, przydzielenie poszczególnych części rynku (rozwój, stabilny, dużych i małych konsumentów, prawdopodobieństwo nowych konsumentów itp.) I oceniać sprzedaż produktów, terytoriów, nabywców, segmentów rynku , kanały sprzedaży i rozmiary zamówień. Kierunki te tworzą siłę współrzędnej wielowymiarowej prezentacji sprzedaży - struktury jego pomiarów.

Ponieważ działalność każdego przedsiębiorstwa wpływa na czas, pierwsze pytanie, które występuje podczas analizy, jest kwestia dynamiki rozwoju biznesu. Prawidłowa organizacja osi czasu pozwoli Ci jakościowo odpowiedzieć na to pytanie. Zwykle osi czasu jest podzielona na lata, kwartały i miesiące. Być może jeszcze bardziej zgnieciony przez kilka tygodni i dni. Tymczasowa struktura pomiarowa jest utworzona, biorąc pod uwagę częstotliwość odbioru danych; Może być również określony przez częstotliwość wymagających informacji.

Pomiar opracowywania "grupy towarów" jest rozwijany tak, aby zmaksymalizować stopień odzwierciedlania struktury sprzedanych produktów. Jednocześnie ważne jest, aby spełnić pewną równowagę, która z jednej strony, aby uniknąć nadmiernego szczegółów (liczba grup powinna być przewidywana), a z drugiej - nie przegapić znaczącego segmentu rynku.

Pomiar "klientów" odzwierciedla strukturę sprzedaży w zasadzie geograficznej terytorialnej. W każdym wymiarze może występować RARAFY, na przykład, w tym pomiarze może być struktura: kraje - regiony - miasta - klienci.

Aby przeanalizować skuteczność jednostek, konieczne jest utworzenie pomiaru. Na przykład można wyróżnić dwa poziomy hierarchii: Wydziały i działy zawarte w nich, które powinny być odzwierciedlone w wymiarze wymiarowym.

W rzeczywistości pomiary "czas", "towary", "klienci" całkiem w pełni określają przestrzeń obszaru.

Ponadto przydatne jest rozbicie tej przestrzeni na obszarach warunkowych, przyjęcie obliczonych cech jako podstawy, na przykład, zakresy transakcji w warunkach wartościowych. Wtedy cały biznes można podzielić na szereg cennych zakresów, w których jest przeprowadzana. W tym przykładzie może być ograniczona do następujących wskaźników: sprzedaż towarów, liczba sprzedanych towarów, kwotę dochodów, liczba transakcji, liczba klientów, wielkość zakupów z producentów.

Olap - Cube do analizy zostanie oglądany (rys. 2):


Rysunek 2.Olej. - Cube do analizy sprzedaży

Jest to trójwymiarowa tablica pod względem OLAP i nazywa się sześcianem. W rzeczywistości, z punktu widzenia ścisłej matematyki, taka tablica nie zawsze będzie: na tej Kubie liczba elementów we wszystkich wymiarach powinna być taka sama, a nie ma takich ograniczeń z kostek OLAP. Olap Cube niekoniecznie musi być trójwymiarowy. Może być dwu-, i wielowymiarowy - w zależności od rozwiązania zadania. Poważne produkty OLAP są obliczane na liczbie pomiarów zamówienia 20. Bardziej proste aplikacje pulpitu utrzymuje się gdzieś 6 pomiarów.

Nie wszystkie elementy Kuby muszą być wypełnione: Jeśli nie ma informacji o sprzedaży klienta towarów 2 3 w trzecim kwartale, wartość w odpowiedniej komórce jest po prostu nie zdefiniowana.

Jednak sam sześcian nie nadaje się do analizy. Jeśli nadal możesz odpowiednio wysłać lub przedstawić trójwymiarową kostkę, a następnie z sześcioma lub nineteenimenal. Sytuacja jest znacznie gorsza. Dlatego konwencjonalne dwuwymiarowe tabele są usuwane przed użyciem wielowymiarowej kostki. Ta operacja nazywa się "cięcia" kostki. Analityk, jakby przyjmuje i "zmniejsza" pomiary Kuby za swoje interesy. W ten sposób analityk otrzymuje dwuwymiarową kubę (raport) i współpracuje z nim. Struktura raportu jest prezentowana na rysunku 3.

Rysunek 3.Struktura raportu analitycznego

Przesiemy nasz Cube OLAP i otrzymamy raport sprzedaży za trzeci kwartał, będzie miał następujący formularz (rys.4).

Rysunek 4. Raport sprzedaży za trzeci kwartał

Możesz wyciąć kostkę wzdłuż innej osi i uzyskać raport o sprzedaży grupy towarów 2 w ciągu roku (rys. 5).

Rysunek 5.Kwartalny raport o sprzedaży towarów 2

Podobnie możesz przeanalizować relację z klientem 4, cięcie kostki według etykiety klienta (Rys. 6)

Rysunek 6. Sprawozdanie z dostaw towarów do klienta 4

Możesz szczegółowy szczegółowy raport lub porozmawiać o dostawie towarów do pewnego oddziału klienta.

magazyn danych. formularz na podstawie ustalonych okresów natychmiastowego czasu bazy danych operacyjnych system informacyjny I być może różne źródła zewnętrzne. W magazynach danych stosuje się technologię bazy danych, analizą i analizą danych, wizualizację danych.

Główne cechy magazynów danych.

  • zawiera dane historyczne;
  • szczegóły przechowuje, a także częściowo i w pełni uogólnione dane;
  • dane są głównie statyczne;
  • nie zapinana, nieustrukturyzowana i heurystyczna metoda przetwarzania danych;
  • intensywność przetwarzania średnich i niskich transakcji;
  • nieprzewidywalna metoda korzystania z danych;
  • przeznaczony do analizy;
  • skupiony na obszary podlegające;
  • wsparcie do podejmowania decyzji strategicznych;
  • służy stosunkowo niewielką liczbę starszych pracowników.

OLAP Termin (przetwarzanie analityczne on-line) służy do opisania modelu reprezentacji danych i zgodnie z ich technologią przetwarzania w magazynach danych. OLAP wykorzystuje wielowymiarowy widok zagregowanych danych, aby zapewnić szybki dostęp do strategicznie ważnych informacji dla dogłębnej analizy. Aplikacje OLAP muszą mieć następujące podstawowe właściwości:

  • wielowymiarowy prezentacja danych;
  • Wsparcie dla kompleksowych obliczeń;
  • prawa księgowość współczynnika czasu.

OLAP ZALETY:

  • wychowywanie występ Personel produkcyjny, deweloperzy stosowane oprogramowanie. Terminowy dostęp do informacji strategicznych.
  • udostępnianie użytkowników o wystarczających możliwościach, aby wprowadzić własne zmiany w programie.
  • aplikacje OLAP są oparte na magazyn danych. i system OLTP, otrzymujący rzeczywiste dane z nich, co zapewnia konserwację kontrola integralności dane korporacyjne.
  • obniżenie obciążenia systemu OLTP i magazyn danych..

Olap i olp. Charakterystyka i główne różnice

Olej. Oltp.
Magazyn danych Powinien zawierać zarówno wewnętrzne dane korporacyjne, jak i dane zewnętrzne. głównym źródłem informacji w bazie danych operacyjnych jest działalność korporacji, a do analizy danych wymaga atrakcyjności zewnętrznych źródeł informacji (na przykład raporty statystyczne)
Objętość bazy danych analitycznych jest co najmniej kolejność wielkości więcej niż operacyjna. W przypadku niezawodnej analizy i prognozowania magazyn danych Konieczne jest posiadanie informacji o działaniach korporacji i stanu rynku przez kilka lat W przypadku przetwarzania operacyjnego wymaga danych w ciągu ostatnich kilku miesięcy
Magazyn danych Powinien zawierać równomiernie przedstawione i spójne informacje, najbardziej odpowiedniej treści baz danych operacyjnych. Komponent jest niezbędny do ekstrakcji i "czyszczenia" informacji z różnych źródeł. W wielu dużych korporacjach istnieje kilka operacyjnych IPS z własnymi bazami danych (z przyczyn historycznych). Bazy danych operacyjnych mogą zawierać semantycznie równoważne informacje przedstawione różne formaty, z różnym wskazaniem czasu przyjazdu, czasami nawet sprzeczne
Zestaw żądań analitycznej bazy danych jest niemożliwe do przewidzenia. magazyn danych. W celu reagowania na żądania analityków nie wybranych analityków. Możesz liczyć tylko na fakt, że żądania nie przepłyną zbyt często i wpływają na duże ilości informacji. Wymiary bazy danych analitycznych stymulują zastosowanie żądań z agregatami (kwotą, minimum, maksimum, oznaczać itp.) Systemy przetwarzania danych są tworzone na roztworze specyficzne zadania. Informacje z bazy danych są często wybierane i w małych porcjach. Zwykle zestaw wniosków do bazy operacyjnej jest już znany podczas projektowania
Dzięki niskiej zmienności analitycznych baz danych (tylko wtedy, gdy ładowanie danych) istnieją rozsądne tablice, szybsze metody indeksowania do próbki masowej, przechowywanie danych wstępnie zagregowanych Systemy przetwarzania danych są bardzo zmienne, co jest brane pod uwagę w stosowanym DBMS (znormalizowana struktura bazy danych, struny są przechowywane nieuporządkowane, b- drzewa do indeksowania, transakcjonalność)
Informacje o bazie danych analitycznej jest tak krytyczne dla korporacji, że wymagane jest duże granulacja ochrony (indywidualne prawa dostępu do niektórych linii i / lub kolumn tabeli) Do systemów przetwarzania danych zwykle chwyta ochrona informacji Na poziomie tabeli

Kod kodu dla systemów OLAP

W 1993 r. Kod opublikował pracę o nazwie "OLAP dla użytkowników analityków: co powinno być". Nakrecjonalizował podstawowe koncepcje przetwarzania analitycznego operacyjnego i zidentyfikowało 12 zasad, które mają być zadowoleni z produktów, które zapewniają zdolność do wykonywania operacyjnego przetwarzania analitycznego.

  1. Konceptualna reprezentacja wielowymiarowa. Model OLAP musi być wieloidymensowy u podstawy. Wielowymiarowy program konceptualny lub niestandardowa reprezentacja ułatwia modelowanie i analizę, jednak jako obliczenia.
  2. Przezroczystość. Użytkownik jest w stanie uzyskać wszystkie niezbędne dane z OLAP-MASHINA, bez nawet podejrzanego, skąd pochodzą. Niezależnie od tego, czy produkt OLAP jest częścią narzędzi użytkownika, czy nie, fakt ten musi być niewidoczny dla użytkownika. Jeśli OLAP jest dostarczany przez Klienta Klienta, to również fakt, jeśli to możliwe, powinno być niewidoczne dla użytkownika. OLAP powinien być podany w kontekście prawdziwie otwartej architektury, umożliwiając użytkownikowi, gdziekolwiek jest komunikować się z pomocą narzędzia analitycznego z serwerem. Ponadto należy osiągnąć przejrzystość i interakcję narzędzia analitycznego z jednorodnymi i heterogenicznymi środowiskami bazy danych.
  3. Dostępność. OLAP musi zapewnić własne schemat logiczny Aby uzyskać dostęp w heterogenicznym środowisku bazy danych i wykonaj odpowiednie konwersje, aby dostarczyć dane użytkownikowi. Ponadto konieczne jest zadbanie o to, gdzie i jak i jakie typy organizacja fizyczna dane będą naprawdę używane. OLAPA Systema musi być dostępny tylko do wymagania danych i nie ma zastosowania ogólna zasada "Lejek kuchenny", który pociąga za sobą niepotrzebne wejście.
  4. Stały występ Podczas rozwijania raportów. Występ Raportowanie nie musi znacząco spada wraz ze wzrostem liczby pomiarów i rozmiarów bazy danych.
  5. Architektura serwera klienta. Wymagane jest, aby produkt jest nie tylko serwery, ale także, że komponent serwera jest wystarczająco inteligentny dla różnych klientów do łączenia się z minimalnym wysiłkiem i programowaniem.
  6. Ogólna wielowymiarowość. Wszystkie pomiary muszą być równoważne, każdy pomiar musi być równoważny zarówno w strukturze, jak iw możliwościach operacyjnych. PRAWDA, dodatkowe możliwości operacyjne są dozwolone dla poszczególnych pomiarów (najwyraźniej, pojawi się czas), ale takie dodatkowe funkcje Należy dostarczyć dowolnym pomiarze. Nie powinien być tak, że podstawowy struktury danych.Formaty obliczeniowe lub raportujące były bardziej charakterystyczne dla jednego wymiaru.
  7. Dynamiczne zarządzanie sabble matryce.. Systemy OLAP muszą automatycznie dostosować swój wzór obwodu fizycznego w zależności od rodzaju modelu, wolumenów danych i prześwitu bazy danych.
  8. Wsparcie dla wielu graczy. Narzędzie OLAP musi zapewnić możliwości wspólny dostęp (Prośba i dodatki), integralność i bezpieczeństwo.
  9. Nieograniczone operacje krzyżowe. Wszystkie rodzaje operacji muszą być dozwolone dla wszelkich pomiarów.
  10. Intuicyjna manipulacja danych. Manipulacja danych przeprowadzono poprzez bezpośrednie działania na komórki w trybie przeglądania bez korzystania z menu i wielu operacji.
  11. Elastyczne możliwości odbioru. Pomiary muszą być opublikowane w raporcie, ponieważ jest to konieczne dla użytkownika.
  12. bez limitu

Wprowadzenie

Obecnie niemal jakakolwiek organizacja, zwłaszcza wśród tych, którzy tradycyjnie koncentruje się na interakcji z klientami, nie pracują w naszym czasie bez systemów zarządzania bazy danych. Banki firmy ubezpieczeniowe, Lotnictwo i inne firmy transportowe, łańcuchy supermarketów, firmy telekomunikacyjne i marketingowe, organizacje zatrudnione w sektorze usług i innych - wszyscy zbierają i przechowują w swoich bazach danych gigabajtów klientów, produktów i usług. Wartość takich informacji jest niewątpna. Takie bazy danych są nazywane działaniem lub transakcyjnym, ponieważ charakteryzują się one ogromną liczbą małych transakcji lub operacji zapisu odczytu. Systemy komputeroweRachunkowość Operacji i faktycznie dostęp do baz danych transakcyjnych jest zwyczajowo nazywa się systemami operacyjnymi transakcyjnymi (OLTP - On-line Transaccional Przetwarzanie) lub systemy księgowe.

Systemy księgowe są skonfigurowane i zoptymalizowane, aby wykonać maksymalną liczbę transakcji w krótkich odstępach czasu. Zwykle indywidualne operacje są bardzo małe i nie są ze sobą połączone. Jednak każdy rekord danych, który charakteryzuje interakcję z klientem (wezwanie do serwisu wsparcia, operacji gotówkowej, zamówienia przez katalog, odwiedzenie strony internetowej firmy itp.) Może być używany do uzyskania jakościowo nowych informacji, a mianowicie tworzenia raportów i analizowania działań firmy.

Zestaw funkcji analitycznych w systemach księgowych jest zwykle bardzo ograniczony. Schematy stosowane w aplikacjach OLTP komplikują tworzenie nawet prostych raportów, ponieważ dane są najczęściej rozłożone na ustawionych tabelach, a kompleksowe łączne operacje muszą być wykonywane dla ich agregacji. Z reguły próby tworzenia kompleksowych raportów wymagają dużej mocy obliczeniowej i prowadzić do utraty wydajności.

Ponadto stale zmieniające się dane są przechowywane w systemach księgowych. Ponieważ transakcje zbierają, całkowite wartości są bardzo szybko zmieniane, więc dwie analizy przeprowadzane w przedziale w ciągu kilku minut mogą dać różne wyniki. Najczęściej analiza przeprowadza się na końcu okresu sprawozdawczego, w przeciwnym razie obraz może być zniekształcony. Ponadto dane wymagane do analizy mogą być przechowywane w kilku systemach.

Niektóre rodzaje analizy wymagają takich zmian strukturalnych, które są nieprawidłowe w bieżącym środowisku operacyjnym. Na przykład, musisz dowiedzieć się, co się stanie, jeśli firma wydaje się nowe produkty. Żywe badanie jest niemożliwe do przeprowadzenia takich badań. W związku z tym skuteczna analiza jest możliwa do wykonania bezpośrednio w systemie księgowości.

Systemy wsparcia obsługującego rozwiązanie zwykle mają środki do dostarczenia użytkownikowi danych zbiorczych dla różnych próbek ze źródła ustawionego w wygodnym do postrzegania i analizy. Z reguły takie funkcje zbiorcze tworzą wielowymiarowe (a zatem nieregularny) zestaw danych (często nazywany hipercubusem lub metaktuchem), których osie zawierają parametry i komórki - łączne dane w zależności od nich - i Te same dane mogą być przechowywane w tabelach relacyjnych. Wzdłuż każdej osi można zorganizować w formie hierarchii reprezentującej różne poziomy ich dane. Dzięki temu modelowi danych użytkownicy mogą sformułować złożone żądaniaGeneruj raporty, aby uzyskać podzbiory danych.

Dokładnie było zainteresowanie wspierającymi systemami decyzyjnymi, które stały się głównym zakresem OLAP (przetwarzanie analityczne on-line, przetwarzanie analityczne operacyjne, analizę operacyjną danych), która zamienia "ruda" systemów OLTP do gotowego "produktu "Który menedżerowie i analitycy mogą bezpośrednio wykorzystać. Ta metoda pozwala analitykom, menedżerom i menedżerom "wprowadzić do istoty" zgromadzonych danych przez szybki i skoordynowany dostęp do szerokiego zakresu reprezentacji informacyjnych.

Cel, powód praca semestralna Rozważa technologię OLAP.

wielowymiarowa przetwarzanie analityczne

Głównym elementem

1 OLAP Podstawowe informacje

Podstawą koncepcji OLAP leży zasadę wielowymiarowej prezentacji danych. W 1993 roku termin Olaped Edgar Codd. Uznając niedociągnięcia modelu relacyjnego, po raz pierwszy wskazywał niezdolność do "łączenia, przeglądania i analizowania danych z punktu widzenia wielości pomiarów, które jest najbardziej jasne dla analityków korporacyjnych w metodzie" i ustalone generalne Wymagania dotyczące systemów OLAP, które rozszerza funkcjonalność relacyjnej DBMS i obejmującej analizę wielowymiarową jako jedną z jego cech.

W dużej liczbie publikacji skrót OLAP jest wskazany nie tylko wielowymiarowy widok danych, ale także przechowywanie samych danych w wielowymiarowej bazy danych. Ogólnie rzecz biorąc, jest to nieprawidłowe, ponieważ sam kod zauważa, że \u200b\u200b"relacyjne bazy danych były, istnieją najbardziej odpowiednią technologię do przechowywania danych korporacyjnych. Potrzeba istnieje nowa technologia DB, A raczej w narzędziach analitycznych, które uzupełniają funkcje istniejącego DBMS i są dość elastyczne, aby zapewnić i zautomatyzować różne typy analizy intelektualnej nieodłączytelnych w OLAP. Takie zamieszanie prowadzi do opozycji, takich jak "OLAP lub Rolap", co nie jest całkowicie Popraw, ponieważ Rolap (Relacyjny OLAP) na poziomie koncepcyjnym obsługuje całą funkcję termiczną OLAP. Wydaje się bardziej korzystne dla OLAP w oparciu o wielowymiarowe DBMS specjalnego terminala Molaku. Według kodu, wielowymiarową reprezentację koncepcyjną (wielowymiarowy widok koncepcyjny) jest wielokrotną perspektywą składającą się z kilku niezależnych pomiarów, wzdłuż których można analizować pewne zestawy danych. Jednoczesna analiza przez wiele pomiarów jest zdefiniowana jako analiza wielowymiarowa. Każdy pomiar obejmuje kierunki konsolidacji danych składającej się z serii kolejnych poziomów uogólnienia, gdzie każdy wyższy poziom NY odpowiada większym stopniu agregacji danych na odpowiedni pomiar. Tak więc pomiar.

Wykonawca może być określony przez kierunek konsolidacji składającej się z poziomów uogólnienia "Przedsiębiorstwo - Wydział - Dział - Pracownik". Czas pomiaru może nawet zawierać dwie wskazówki konsolidacyjne - "Rok-kwartał - miesiąc - dzień" i "Dzień tygodnia", ponieważ odliczanie przez miesiące i tygodnie są niezgodne. W tym przypadku możliwe jest, aby dowolnie wybór pożądanego poziomu szczegółowości informacji na temat każdego z pomiarów. Operacja pochodzenia (wiercenie) odpowiada ruchowi z najwyższych etapów konsolidacji do niższej; Wręcz przeciwnie, operacja podnoszenia (walcowanie w górę) oznacza przemieszczanie się z niższych poziomów do najwyższego.

Codd zdefiniowany 12 zasad do zaspokojenia oprogramowanie klasa OLAP.

1.2 Wymagania dotyczące sposobu operacyjnego przetwarzania analitycznego

Wielowymiarowa prezentacja danych koncepcyjnych (widok koncepcyjny multi wymiarowy). Konceptualna reprezentacja modelu danych w produkcie OLAP powinna być w charakterze wielowymiarowa, czyli, pozwala analitykom wykonywać intuicyjne operacje "analizy wzdłuż i w całej" ("plasterka i kości"), rotacja (obrócić) i konsolidację umieszczania (obrotowa) kierunki. Przezroczystość. Użytkownik nie powinien wiedzieć, jakie konkretne środki są używane do przechowywania i przetwarzania danych, ponieważ dane są zorganizowane i skąd pochodzą.

Dostępność. Analityk powinien być w stanie przeprowadzić analizę w ramach ogólnego systemu konceptualnego, ale dane mogą pozostać pod kontrolą DBMS pozostającego ze starego dziedziczenia, podczas gdy dołączony do ogólnego modelu analitycznego. Oznacza to, że toolkit OLAP musi zastosować swój schemat logiczny do fizycznych tablic danych, wykonując wszystkie transformacje wymagane do zapewnienia pojedynczego, spójnego i holistycznego widoku z boku użytkownika.

Zrównoważona wydajność (spójna wydajność raportowania). Wraz ze wzrostem liczby pomiarów i rozmiary bazy danych analityki nie powinien napotkać żadnej wydajności do żadnego zmniejszenia. Zrównoważona wydajność jest niezbędna do utrzymania łatwości użytkowania i wolności od komplikacji, które są wymagane do wprowadzenia OLAP do użytkownika końcowego.

Klient - architektura serwera (architektura serwera klient). Większość danych wymagających operacyjnego przetwarzania analitycznego jest przechowywana w systemach mainframe i ekstrahowana komputery osobiste. Dlatego jednym z wymagań jest zdolność produktów OLAP do pracy w środowisku serwera klient. Główną ideą jest to, że składnik serwera narzędzia OLAP musi być wystarczająco inteligentny i mają możliwość zbudowania wspólnego systemu konceptualnego opartego na uogólnianiu i konsolidacji różnych schematów logicznych i fizycznych baz danych korporacyjnych, aby zapewnić efekt przejrzystości.

Równość pomiarowa (ogólna wymiarowość). Wszystkie pomiary danych muszą być równe. Dodatkowe cechy mogą być wyposażone w oddzielne pomiary, ale ponieważ wszystkie są symetryczne, ta dodatkowa funkcjonalność może być dostarczona do dowolnego wymiaru. Podstawowa struktura danych, formuły i formaty raportu nie powinny być oparte na jakimś rodzaju pomiaru.

Dynamiczne przetwarzanie rearfied macierzy (dynamiczna rzadka mandalizacja matrycy). Narzędzie OLAP musi zapewnić optymalne przetwarzanie rzadkich matryc. Prędkość dostępu powinna być przechowywana niezależnie od lokalizacji komórek danych i być stałą wartością dla modeli o innej liczbie pomiarów i różnych sparów danych.

Obsługa wieloosobowa (obsługa wielu użytkowników). Często kilka analityków ma potrzebę pracy jednocześnie z jednym modelem analitycznym lub tworzyć różne modele oparte na niektórych danych korporacyjnych. Narzędzie OLAP musi zapewnić im konkurencyjny dostęp, zapewniają integralność i ochronę danych.

Nieograniczone wsparcie operacji międzywymiarowych (nieograniczone operacje międzywymiarowe). Obliczenia i manipulowanie danych zgodnie z dowolną liczbą pomiarów nie powinny zakazać ani ograniczyć żadnego związku między komórkami danych. Przekształcenia wymagające arbitralnej definicji należy ustawić na funkcjonalnym języku pełnotwórczym.

Intuicyjna manipulacja danych (intuicyjna manipulacja danych). Reorientacja wskazówek konsolidacji, dane szczegółowe w kolumnach i liniach, agregacji i innych manipulacjach, charakterystyczne dla struktury hierarchii kierunków konsolidacji, muszą być wykonywane jako wygodny, naturalny i wygodny interfejs użytkownika.

Elastyczny mechanizm generowania raportów (elastyczny raportowanie). Należy zachować różne metody wizualizacji danych, czyli raporty należy składać w jakiejkolwiek możliwej orientacji.

Nieograniczony poziom pomiaru i agregacji (nieograniczone wymiary i poziomy agregacji). Jest to zdecydowanie zalecane założenie w każdym poważnym narzędziem OLAP co najmniej piętnaście i lepsze dwadzieścia, pomiary w modelu analitycznym.

2 Systemy OLAP Systems

2.1 Serwer. Klient. Internet

OLAP pozwala szybko i skutecznie przeanalizować duże ilości danych. Dane są przechowywane w formie wielowymiarowej, która najbardziej ściśle odzwierciedla naturalny stan rzeczywistych danych biznesowych. Ponadto OLAP zapewnia użytkownikom szybszy i łatwiej otrzymywać dane podsumowujące. W razie potrzeby mogą, w razie potrzeby, aby pogłębiać (wiercić) w treści tych danych w celu uzyskania bardziej szczegółowych informacji.

System OLAP składa się z różnych komponentów. Na poziomie najwyższego poziomu system zawiera źródło danych, serwer OLAP i klient. Źródłem danych jest źródłem, z którego podejmowane są dane dotyczące analizy. Dane z źródła są przesyłane lub kopiowane do serwera OLAP, gdzie są one systematyzowane i przygotowane do szybszego, a następnie tworząc odpowiedzi na żądania. Klient jest interfejsem użytkownika do serwera OLAP. Ta sekcja artykułu opisuje funkcje każdego składnika i wartości całego systemu jako całości. Źródła. Źródło w systemach OLAP to serwer dostarcza danych do analizy. W zależności od obszaru użytkowania produktu OLAP, źródło może służyć jako magazyn danych, dziedziczna baza danych zawierająca ogólne dane, zestaw tabel, które łączą dane finansowe lub dowolną kombinację wymienionych. Zdolność produktu OLAP do pracy z danymi z różnych źródeł jest bardzo ważna. Wymóg pojedynczego formatu lub pojedyncza bazaW którym wszystkie dane źródłowe byłyby przechowywane, a nie odpowiednich administratorów bazy danych. Ponadto podejście to zmniejsza elastyczność i moc produktu OLAP. Administratorzy i użytkownicy uważają, że produkty OLAP, które zapewniają ekstrakcję danych nie tylko z różnych, ale także z wielu źródeł, okazują się być bardziej elastyczne i przydatne niż te, które mają bardziej rygorystyczne wymagania.

Serwer. Podmiotem systemu OLAP jest serwer OLAP. Ten komponent wykonuje wszystkie prace (w zależności od modelu systemu) i przechowuje wszystkie informacje, do których zapewniona jest aktywny dostęp. Architektura serwera zarządza różnymi koncepcjami. W szczególności głównym charakterystyką funkcjonalną produktu OLAP jest użycie wielowymiarowych danych (MMBD, MDDB) lub relacyjnej (RDB, RDB) lub relacyjnej bazy danych. Dane zagregowane / wstępnie zagregowane

Szybka implementacja zapytania jest konieczna dla OLAP. Jest to jedna z podstawowych zasad OLAP - zdolność do intuicyjnie manipulowania danymi wymaga szybkiego wydobycia informacji. Ogólnie rzecz biorąc, im bardziej obliczanie jest konieczne, aby wytworzyć fragment informacji, wolniej występuje odpowiedź. Dlatego, aby zachować mały czas wdrożenia zapytań, fragmenty informacji, odwołanie, do którego zwykle dzieje się najczęściej, ale które wymagają obliczeń, są przed agregacją. Oznacza to, że są liczone, a następnie przechowywane w bazie danych jako nowe dane. Jako przykład typu danych, który jest dopuszczalny do obliczenia z góry, możliwe jest doprowadzenie danych podsumowujących - na przykład wskaźniki sprzedaży od miesięcy, kwartałów lub lat, dla których naprawdę wprowadzono dzienne wskaźniki.

Różni dostawcy przylegają do różnych metod wyboru parametrów wymagających wstępnej agregacji i liczby wstępnie obliczonych wartości. Podejście do agregacji wpływa na bazę danych i podczas wdrażania żądań. Jeśli obliczono więcej wartości, prawdopodobieństwo, że użytkownik żąda zwiększenia obliczonej wartości, a zatem czas reakcji jest zmniejszony, ponieważ nie jest konieczne poprosić o początkową wartość do obliczania. Jednakże, jeśli obliczysz wszystkie możliwe wartości - to nie jest najlepsze rozwiązanie - w tym przypadku rozmiar bazy danych znacznie rośnie, co sprawi, że jest niezarządzany, a czas agregacji będzie zbyt duży. Ponadto wartości numeryczne są dodawane do bazy danych lub jeśli się zmieniają, informacje te powinny być odzwierciedlone w wstępnie obliczonych wartościach w zależności od nowych danych. W ten sposób aktualizacja bazy danych może również zajmować dużo czasu w przypadku dużej liczby wstępnie obliczonych wartości. Ponieważ zwykle, podczas agregacji baza danych działa autonomicznie, pożądane jest, aby czas agregacji nie jest zbyt długi.

Klient. Klient jest właśnie używany do reprezentowania i manipulowania danych w bazie danych. Klient może być dość prosty - w postaci tabeli, która obejmuje takie możliwości OLAP, takie jak na przykład obrót danych (obracanie danych) i pogłębienie do danych (wiercenie) i jest wyspecjalizowany, ale taki sam oznacza wyświetlanie raportów lub bądź taki sam potężny narzędzie, jak utworzono, aby zamówić aplikację przeznaczoną do kompleksowych manipulacji z danymi. Internet jest nową formą klienta. Ponadto niesie druk nowych technologii; Wiele rozwiązań internetowych znacznie różnią się w ich możliwościach jako całość i jako rozwiązanie OLAP - w szczególności. Ta sekcja omawia różne właściwości funkcjonalne każdego typu klientów.

Pomimo faktu, że serwer jest jak rozwiązania OLAP "Ridge", klient nie jest mniej ważny. Serwer może zapewnić solidne podstawy, aby ułatwić manipulacje danych, ale jeśli klient jest skomplikowany lub mały, użytkownik nie będzie w stanie korzystać z wszystkich zalet potężnego serwera. Klient jest tak ważny, że wielu dostawców skupiają swoje wysiłki wyłącznie na temat rozwoju klienta. Wszystko, co jest zawarte w tych aplikacjach, jest standardowym spojrzeniem na interfejs, predefiniowane funkcje i strukturę, a także szybkie rozwiązania dla mniej lub bardziej standardowych sytuacji. Na przykład popularne są pakiety finansowe. Wstępnie utworzone wnioski finansowe pozwolą specjalistom wykorzystać znane instrumenty finansowe bez konieczności zaprojektowania struktury bazy danych lub ogólnie przyjętych formularzy i raportów. Żądaj narzędzi / generator raportów. Żądanie Narzędzia lub Generator raportów oferuje łatwy dostęp do danych OLAP. Są łatwe w użyciu interfejs graficzny i pozwól użytkownikom tworzyć raporty do ruchu obiektów w raporcie metodą " przeciągnij i. Drop ". Podczas gdy tradycyjny generator raportów zapewnia użytkownikowi możliwość szybkiego wydania sformatowanych raportów, generatorów raportów wspierających raporty bieżące OLAP Postać. Produktem końcowym jest raportem o pogłębiającym możliwości do danych do poziomu szczegółów, rotacji (piwaterów ), hierarchie wspierające i dr. dodatki (dodatki) arkuszy kalkulacyjnych.

Dzisiaj, w wielu obszarach biznesowych, różne formy analizy danych korporacyjnych są produkowane za pomocą arkuszy kalkulacyjnych. W pewnym sensie jest to idealne narzędzie do tworzenia danych i przeglądania danych. Analityk może tworzyć makra pracujące z danymi w wybranym kierunku, a szablon może być zaprojektowany w taki sposób, że gdy wystąpi dane wejściowe, wzory obliczają prawidłowe wartości, eliminując potrzebę wielokrotnej wprowadzania prostych obliczeń.

Niemniej jednak, wszystko to daje raport "płaski" w wyniku tego, co oznacza, że \u200b\u200bjak tylko zostanie utworzony, trudno jest rozważyć go w różnych aspektach. Na przykład diagram wyświetla informacje na jakiś czas, powiedzmy na miesiąc. A jeśli ktoś chce zobaczyć wskaźniki dziennie (w przeciwieństwie do danych przez miesiąc), konieczne będzie stworzenie absolutnie nowego diagramu. Należy zdefiniować nowe zestawy danych, dodają nowe etykiety do wykresu i dokonać wielu innych prostych, ale intensywnych zmian. Ponadto istnieje wiele obszarów, w których można dokonać błędów, co w ogóle zmniejsza niezawodność. Gdy OLAP jest dodawany do stołu, możliwe jest utworzenie pojedynczego diagramu, a następnie poddane różnym manipulacjom, aby zapewnić użytkownikowi niezbędne informacje bez obciążenia samego, tworząc wszystkie możliwe reprezentacje. Internet jako klient. Nowy członek rodziny klienta OLAP jest Internet. Istnieje wiele zalet w formacji raportów OLAP przez Internet. Najważniejszym jest brak potrzeby specjalistycznego oprogramowania do uzyskania dostępu do informacji. Oszczędza przedsiębiorstwo kilka czasu i pieniędzy.

Każdy produkt internetowy jest specyficzny. Niektórzy upraszczają tworzenie stron internetowych, ale mają mniejszą elastyczność. Inni pozwalają na tworzenie widoków danych, a następnie zapisać je jako statyczne pliki HTML. Wszystko to umożliwia przeglądanie danych przez Internet, ale już nie więcej. Niemożliwe jest aktywnie manipulować danymi za pomocą ich pomocy.

Istnieje inny rodzaj produktu - interaktywne i dynamiczne, obracając takie produkty do w pełni funkcjonalnych narzędzi. Użytkownicy mogą pogłębiać dane, obracanie, limit pomiarowy itp. Przed wyborem środka wdrażania Internetu, ważne jest, aby zrozumieć, która funkcjonalność jest wymagana z rozwiązania Web, a następnie określić, który produkt najlepszym sposobem uosabiają tę funkcjonalność.

Aplikacje. Aplikacje są typem klienta, który wykorzystuje bazy danych OLAP. Są one identyczne z narzędziami zapytań i generatory raportów opisanych powyżej, ale ponadto przyczyniają się do szerszej funkcjonalności produktu. Aplikacja zwykle ma większą moc niż narzędzie żądania.

Rozwój. Zwykle dostawcy OLAP zapewniają środowisko rozwojowe do tworzenia użytkowników własnych skonfigurowanych aplikacji. Środowisko programistyczne jako całość jest graficznym interfejsem obsługującym rozwój aplikacji zorientowany obiektowo. Ponadto większość dostawców zapewnia API, które można wykorzystać do integracji baz danych OLAP z innymi aplikacjami.

2.2 OLAP - Klienci

Klienci OLAP z wbudowaną maszyną OLAP są instalowane na komputerach użytkownika. Nie wymagają serwera do obliczeń i są nieodłącznymi administracją zerową. Taki klienci pozwalają użytkownikowi dostroić się do istniejących bazy danych; Z reguły tworzy słownik, który ukrywa fizyczną strukturę danych do opisu przedmiotu, wyraźny specjalista. Po tym klient OLAP wykonuje dowolne żądania, a ich wyniki wyświetla je w tabeli OLAP. W tej tabeli, z kolei użytkownik może manipulować danymi i odbierać setki różnych raportów na ekranie lub na papierze. Klienci OLAP przeznaczony do pracy z RDBD umożliwiają analizę danych dostępnych w korporacji, na przykład przechowywanej w bazie danych OLTP. Jednak ich drugie zadanie może być szybkie i tanie tworzenie repozytoriów lub prezentacji danych - w tym przypadku programistry organizacji potrzebują tylko do utworzenia zestawu tabel typu w relacyjnych bazach danych i procedurach ładowania danych. Najbardziej czasochłonną częścią pracy jest napisanie interfejsów z licznych opcji zapytań i raportów - jest zaimplementowany w kliencie OLAP dosłownie za kilka godzin. Ostatecznym użytkownikiem rozwoju takiego programu wymaga około 30 minut. Klienci OLAP są dostarczane przez samych programistów bazy danych, zarówno wielowymiarowych, jak i relacyjnych. Ten reporter korporacyjny SAS, który jest prawie odniesieniem dla wygody i urody przez produkt, Oracle Discoverer, usługi MS Pivot i stół obrotowy itp. Wiele programów przeznaczonych do pracy z usługami MS OLAP są dostarczane w ramach OLAP w kampanii masowej , który prowadzi Microsoft Corporation. Z reguły są one ulepszone opcje tabeli obrotów i są przeznaczone do użytku w przeglądarce MS Office lub WWW. Są to produkty Matryx, firmy Knosys itp., Dzięki prostocie, tanio i wydajności, zdobyli dużą popularność na Zachodzie.

3 klasyfikacja produktu OLAP

3.1 Wielowymiarowa OLAP.

Obecnie na rynku obecna jest duża liczba produktów, co w różnym stopniu zapewnia funkcjonalność OLAP. Zapewnienie wielowymiarowej reprezentacji koncepcyjnej przez interfejs użytkownika do bazy danych źródłowej, wszystkie produkty OLAP są podzielone na trzy klasy według rodzaju źródłowej bazy danych.

1. Pierwsze operacyjne systemy przetwarzania analityczne (na przykład, oprogramowanie ESSBASE Arbor, Firma Oracle Express Server) związana z klasą molaków, to znaczy, mogliby pracować tylko z własnymi wielowymiarowymi bazami danych. Opierają się na zastrzeżonych technologiach wielowymiarowych DBMS i są najdroższe. Systemy te zapewniają kompletny cykl przetwarzania OLAP. Albo zawierają, oprócz komponentu serwera, własny zintegrowany interfejs klienta lub używany do komunikacji z użytkownikiem. programy zewnętrzne Pracuj z arkuszami kalkulacyjnymi. Aby zachować takie systemy, specjalny personel jest wymagany przez instalację, wraz z systemem, tworzenie widoków danych dla użytkowników końcowych.

2. Systemy operacyjnego przetwarzania analitycznych danych relacyjnych (Rolap) umożliwiają przechowywane dane w zasadzie relacyjnej w formie wielowymiarowej, dostarczając informacji do modelu wielowymiarowego przez pośredni warstwę metadanych. Klasa ta obejmuje pakiet DSS MicroStrategy, firmy MetaCube Informix, zaleta informacyjno-informacyjna i innych. Pakiet oprogramowania Infovist, opracowany w Rosji, na Uniwersytecie Energii Ivanovo, jest również systemem tej klasy. Systemy Rolap są dobrze przystosowane do pracy z dużym magazynem. Podobnie jak systemy MOLAP, wymagają znacznych kosztów usług dla profesjonalistów technologii informacyjnych i dostarczają operacji wieloosobowej.

3. Wreszcie, systemy hybrydowe (hybrydowe OLAP, HOLAP) są zaprojektowane tak, aby łączyć korzyści i zminimalizować niedociągnięcia wraz z poprzednimi klasami. Media Speedware / MR obejmuje tę klasę. Według programistów łączy elastyczność analityczną i szybkość reakcji molaków ze stałym dostępem do rzeczywistych danych osobliwych do Rolap.

Oprócz funduszy wymienionych, istnieje inna klasa - narzędzia do generowania żądań i raportów dla komputerów stacjonarnych, uzupełnionych funkcjami OLAP lub zintegrowane z zewnętrznymi środkami, które wykonują funkcje. Te dobrze rozwinięte systemy wykonują próbkę danych ze źródeł źródeł, konwertuj je i umieszczane w dynamicznej wielowymiarowej bazy danych działającej na stacji użytkownika końcowego klienta. Głównymi przedstawicielami tej klasy to biznesowa firma firmy, firma BRIOQUERY Brio Technology i PowerPlay Cognos. Przegląd niektórych produktów OLAP podano w aplikacji.

W wyspecjalizowanych DBMS na podstawie wielowymiarowej prezentacji danych, dane nie są organizowane w postaci tabel relacyjnych, ale w postaci zamówionych tablic wielowymiarowych:

1) Hypercubes (wszystkie komórki przechowywane w bazie danych muszą mieć ten sam wymiar, czyli, aby mieć maksymalną pełną podstawę pomiaru) lub

2) Polykuby (każda zmienna jest przechowywana z własnym zestawem pomiarów, a wszystkie związane z tym złożoność przetwarzania jest przenoszona do wewnętrznych mechanizmów systemu).

Zastosowanie wielowymiarowych baz danych w systemach przetwarzania analitycznego operacyjnego ma następujące zalety.

1. W przypadku korzystania z wielowymiarowego DBMS, wyszukiwanie i pobieranie danych są przeprowadzane znacznie szybciej niż z wielowymiarowym koncepcyjnym spojrzeniem na relacyjną bazę danych, ponieważ wielowymiarowa baza danych jest zdenormalizowana, zawiera wstępnie zagregowane wskaźniki i zapewnia zoptymalizowany dostęp do Żądane komórki.

2. Wielowymiarowe DBMSS z łatwością radzą sobie z zadaniami włączenia do modelu informacji różnych funkcji wbudowanych, podczas obiektywnie istniejących ograniczeń język SQL. Spraw, aby te zadania oparte na relacyjnym dBms dość złożonym, a czasem niemożliwe.

Z drugiej strony istnieją znaczne ograniczenia.

1. Wielowymiarowe DBMSS nie pozwalają na pracę z dużymi bazami danych. Ponadto, ze względu na denormalizację i wstępnie wykonywane agregację, ilość danych w wielowymiarowej podstawie, z reguły, odpowiada (oceniając kod) w 2,5-100 razy mniejsza objętość źródła szczegółowych danych.

2. Wielowymiarowa DBMS w porównaniu z relacją są bardzo nieefektywnie stosowane pamięć zewnętrzna. W przytłaczającej większości przypadków hypercube informacje są silnie rozrachowane, a ponieważ dane są przechowywane w zamówionej formie, niepewne wartości są usuwane tylko przez wybór optymalnego zamówienia sortowania, co pozwala na organizację danych do maksymalnych grup ciągłych . Ale nawet w tym przypadku problem jest rozwiązany tylko częściowo. Ponadto procedura sortowania jest najprawdopodobniej optymalna z punktu widzenia pamięci, kolejność sortowania najprawdopodobniej nie pokrywa się z zamówieniem, który jest najczęściej używany w zapytaniach. Dlatego B. real Systems. Musisz szukać kompromisu między prędkością a redundancją miejsca na dysku zajmowanej przez bazę danych.

W konsekwencji stosowanie wielowymiarowych DBMS jest uzasadnione tylko w następujących warunkach.

1. Ilość danych źródłowych do analizy nie jest zbyt duża (nie więcej niż kilka gigabajtów), czyli poziom agregacji danych jest dość wysoki.

2. Zestaw pomiarów informacji jest stabilny (ponieważ każda zmiana ich struktury prawie zawsze wymaga kompletnej restrukturyzacji hipercube).

3. Czas odpowiedzi systemu dla żądań nie wybranych jest najbardziej krytycznym parametrem.

4. Wymagane jest szerokie zastosowanie złożonych funkcji wbudowanych do wykonywania obliczeń międzywymiarowych przez komórki hiperkuby, w tym możliwość pisania funkcji użytkownika.

Bezpośrednie wykorzystanie relacyjnych baz danych w systemach przetwarzania analitycznego operacyjnego ma następujące zalety.

1. W większości przypadków magazyny danych korporacyjnych są realizowane za pomocą relacyjnego DBMS, a narzędzia Rolap umożliwiają przeanalizowanie bezpośrednio nad nimi. W tym przypadku rozmiar pamięci nie jest taki krytyczny parametr, jak w przypadku molaku.

2. W przypadku zmiennego wymiaru zadania, gdy należy wprowadzić zmiany w strukturze pomiarowej, system Rolap z reprezentacją dynamicznego wymiaru jest optymalnym rozwiązaniem, ponieważ te modyfikacje nie wymagają fizycznej reorganizacji bazy danych .

3. Relacyjne DBMSS zapewniają znacznie wyższy poziom ochrony danych i dobrych praw dostępu do rozgraniczenia.

Główną wadą Rolap w porównaniu z wielowymiarowymi DBMS jest mniejsza wydajność. Aby zapewnić wydajność porównywalną z MOLAP, systemy relacyjne wymagają dokładnego badania diagramu bazy danych i ustawień indeksu, czyli duże wysiłki od administratorów bazy danych. Tylko w przypadku stosowania schematów w kształcie gwiazdy, wydajność dobrze skonfigurowanych systemów relacyjnych można zbliżyć przez wydajność systemów opartych na wielowymiarowych bazach danych.

Opis schematu gwiazdkowy (STAR \u200b\u200bSchema) i zalecenia dotyczące jego użycia są w pełni oddane do pracy. Jego pomysł jest to, że dla każdego pomiaru znajdują się tabele, a wszystkie fakty są umieszczane w jednej tabeli, indeksowanej przez kluczowy klawisz ze skompilowany z klawiszy indywidualnych pomiarów (dodatek A). Każdy promień ustawień schematu Star, w Kodeksie Kodeksu, kierunek konsolidacji danych na odpowiedni pomiar.

W trudnych zadaniach z pomiarami wielopoziomowych ma sens do odnoszenia się do rozszerzeń schematu STAR - schemat konstelacji (schemat konstelacji) i schematu płatka śniegu (schemat Snowflake). W takich przypadkach tworzone są indywidualne tabele faktów dla możliwych kombinacji poziomów uogólnienia różnych pomiarów (dodatek B). Umożliwia to osiągnięcie lepszej wydajności, ale często prowadzi do redundancji danych i znaczących komplikacji w strukturze bazy danych, w której się okazuje wielka kwota Stoły faktyczne.

Zwiększenie liczby faktów faktów w bazie danych może doprowadzić nie tylko z wielości poziomów różnych pomiarów, ale także z faktu, że w ogóle fakty mają różne zestawy pomiarów. Gdy abstrakcja z indywidualnych pomiarów, użytkownik musi otrzymać projekcję maksymalnego pełnego hipercube, i daleko od zawsze wartości wskaźników w nim powinny być wynikiem podstawowego sumowania. Zatem, z dużą liczbą niezależnych pomiarów, konieczne jest wspieranie wielokrotnych tabel faktycznych, które odpowiadają każdej możliwej kombinacji żądań pomiarowych, co prowadzi również do nieeokomomowego wykorzystania pamięci zewnętrznej, zwiększenie czasu ładowania danych w bazie danych Diagram gwiazdy z zewnętrznych źródeł i trudności podawania.

Częściowo rozwiąż ten problem rozszerzeń języka SQL (Grupa przez operatorów Cube, "Grupa przez ROLLUP" i "Grupa przez grupowanie zestawów"); Ponadto, pomiędzy redundancją a prędkością, zalecając tworzenie tabel faktycznych nie dla Wszystkie możliwe kombinacje pomiarowe., Ale tylko dla tych, których komórki nie można uzyskać przy użyciu późniejszej agregacji bardziej pełniejszych faktów faktów (dodatek B).

W każdym przypadku, jeśli wielowymiarowy model jest wdrażany jako relacyjna baza danych, powinieneś tworzyć długie i "wąskie" tabele faktów i stosunkowo małe i "szerokie" tabele pomiarowe. Tabele faktów zawierają wartości numeryczne komórek hipercube, a pozostałe tabele określają wielowymiarowe podstawy pomiaru zawierające ich wielowymiarowe podstawy. Niektóre informacje można uzyskać za pomocą dynamicznego agregacji danych rozproszonych przez jednolite znormalizowane struktury, chociaż należy pamiętać, że zapytanie obejmuje agregację z bardzo uszkodzoną strukturą BD, można wykonać całkiem wolno.

Orientacja na temat prezentacji wielowymiarowych informacji za pomocą modeli relacyjnych w kształcie gwiazdy pozwala pozbyć się problemu optymalizacji przechowywania rozrzedzonych macierzy, ostro skierowaną do wielowymiarowych dBms (gdzie problem produktu rozwiązuje specjalny wybór obwodu). Chociaż cały wpis służy do przechowywania każdej komórki, która oprócz samych wartości obejmuje przyciski wtórne - odniesienia do tabel pomiarowych, nieistniejące wartości są po prostu nie uwzględniane w tabeli faktów.

Wniosek

Po rozważaniu kwestii pracy i stosowania technologii Olappered firmy pojawiają się pytania, odpowiedzi, na które pozwolą Ci wybrać produkt najlepiej spełnić potrzeby użytkownika.

Są to następujące pytania:

Skoro pochodzą dane? - Dane do analizy mogą być w różnych miejscach. Możliwe jest, że baza danych OLAP otrzyma je z magazynu danych korporacyjnych lub z systemu OLTP. Jeśli produkt OLAP ma już możliwość dostępu do źródła danych, kategoryzacji i procesów czyszczenia danych są zmniejszone.

Jakie manipulacje użytkownika wykonuje dane? -
Gdy tylko użytkownik uzyskał dostęp do bazy danych i zaczął wykonywać analizę, ważne jest, aby był odpowiednio uruchomić dane. W zależności od potrzeb użytkownika może być potężny generator raportu lub możliwość tworzenia i umieszczenia dynamicznych stron internetowych. Jednocześnie może być bardziej preferowany, aby mieć proste i szybkie tworzenie własnych aplikacji do dyspozycji.

Jaka jest całkowita ilość danych? - Jest to najważniejszy czynnik w określaniu bazy danych OLAP. Relacyjne produkty OLAP są w stanie działać w dużych ilościach danych lepiej niż wieloidomeny. Jeśli ilość danych nie wymaga stosowania podstawy relacyjnej, produkt wielowymiarowy może być używany bez końca.

Kto jest użytkownikiem? - Przy określaniu klienta OLAP, poziom poziomu kwalifikacji użytkownika jest ważny. Niektórzy użytkownicy są wygodniejsze do zintegrowania OLAP ze stołem, podczas gdy inni wolą wyspecjalizowaną aplikację. W zależności od kwalifikacji użytkownika zostanie również rozwiązana kwestia prowadzenia szkoleń. Duża firma może zapłacić szkolenia dla użytkowników, mniejsza firma może ich odmówić. Klient powinien być taki, że użytkownicy czują się pewni i mogą skutecznie go używać.

Dziś większość światowych firm przeniósł się do stosowania OLAP jako technologia bazowa Dostarczyć informacje decydentom. Dlatego też główne pytanie, które należy ustalić, nie jest kontynuowanie stosowania arkuszy kalkulacyjnych jako głównej platformy do raportowania, budżetowania i prognozowania. Firmy powinny zadać sobie, czy są one gotowe do stracenia konkurencyjnych korzyści przy użyciu niedokładnych, nieistotnych i niekompletnych informacji, zanim dojrzewają i rozważyć alternatywne technologie.

Również, podsumowując, należy zauważyć, że możliwości analityczne technologii OLAP zwiększa wykorzystanie danych przechowywanych w przechowywaniu informacji korporacyjnych, co pozwala firmie skuteczniej współdziałać z klientami.

Słownik

Pojęcie Definicja
1 BI narzędzia Narzędzia i technologie używane do uzyskania dostępu do informacji. Obejmują technologię OLAP, wydobycie danych i złożoną analizę; Zrozumienie narzędzi i narzędzi do budowania niezapytanych żądań, pasek narzędzi do monitorowania działalności gospodarczej i generatorów raportowania korporacyjnego.
2 Przetwarzanie analityczne OLOP, OLAP (operacyjna przetwarzanie analityczne) Technologia przetwarzania informacji analitycznych w czasie rzeczywistym, w tym kompilacja i dynamiczna publikacja raportów i dokumentów.
3 Plasterek i kostki (sekcje wzdłużne i poprzeczne, dosłownie - "Cięcie na plasterkach i kostkach") Termin używany do opisania funkcji złożonej analizy danych dostarczanych przez narzędzia OLAP. Wybieranie danych z wielowymiarowej kostki o określonych wartościach i danym wzajemnym układzie pomiaru.
4 Dane rotacji (dane) (przestawnik danych) Proces obracania tabeli z danymi, tj. Konwersja kolumn do ciągów i odwrotnie.
5 Obliczony członek Element pomiarowy, którego wartość jest określana przez wartości innych elementów (na przykład aplikacje matematyczne lub logiczne). Obliczony element może być częścią serwera OLAP lub być opisany przez użytkownika podczas sesji interaktywnej. Obliczony element to dowolny element, który nie jest wprowadzany, ale jest obliczany.
6 Globalne modele biznesowe (Globalne modele biznesowe) Rodzaj hurtowni danych, który zapewnia dostęp do informacji dystrybuowanych w różnych systemach przedsiębiorstwa i jest pod kontrolą różnych działów lub działów z różnymi bazami danych i modeli danych. Ten rodzaj hurtowni danych jest trudny do zbudowania ze względu na potrzebę połączenia wysiłków użytkowników różnych działów w celu opracowania wspólnego modelu danych dla repozytorium.
7 Górnictwo danych (wydobycie danych) Techniki techniczne, które używają narzędzia oprogramowaniaDla takiego użytkownika, który z reguły nie może powiedzieć z wyprzedzeniem, który jest specjalnie poszukiwany, i może wskazywać tylko pewne próbki i wskazówki wyszukiwania.
8 Klient / Server (Client / Server) Podejście technologiczne polegające na oddzieleniu procesu do oddzielania funkcji. Serwer wykonuje kilka funkcji - zarządzanie komunikacją, utrzymanie usługi bazy danych itp. Klient wykonuje indywidualne funkcje użytkownika - dostarczanie odpowiednich interfejsów, wykonujących nawigację między ekranem, zapewniając funkcje pomocy (pomoc) itp.
9 Multi-wymiarowy, Sumbd (wielowymiarowa baza danych, MCBS i MDBMS) Potężna baza danych, umożliwiająca użytkownikom analizowanie dużych ilości danych. Baza danych ze specjalną organizacją przechowywania - kostki, zapewniając dużą prędkość pracy z danymi zapisanymi jako zestaw faktów, pomiarów i wstępnie obliczonych agregatów.
10 Wierdź (Wierdź w dół) Metoda studiowania szczegółowych danych wykorzystywanych w analizie całkowitego poziomu danych. Poziomy "pogłębienia" zależą od stopnia szczegółów danych w [RANKER.
11 Central Warehouse (Central Warehouse)

1. Baza danych zawierająca dane zebrane z system operacyjny Organizacje. Ma strukturę, która jest wygodna do analizy danych. Zaprojektowany, aby wspierać podejmowanie decyzji i tworzenie pojedynczej przestrzeni informacyjnej korporacji.

2. Metoda automatyki obejmująca wszystkie systemy informacyjne zarządzane z jednego miejsca.

1 Golitsin o.l., Maksimov N.v., Popov I.I. Baza danych: Instruktaż. - M.: Forum: Infra-M, 2003. - 352 p.

2 Data K. Wprowadzenie do systemów bazy danych. - M.: Huka, 2005 - 246 p.

3 Elmanova N.v., Fedorow A.a. Wprowadzenie do technologii Microsoft OLAP. - M.: Dialog Mafi, 2004. - 312 p.

4 Karpova Ts. Bazy danych: modele, rozwój, wdrożenie. - SPB.: Peter, 2006. - 304 p.

5 Korowin S. D., Levenz I. A. Ratmanova I. D., Starykh V. A. Schowelev L. V. rozwiązanie problemu kompleksowej analizy operacyjnej informacji o harmonogramach danych // DBMS. - 2005. - № 5-6. - 47-51 p.

6 Kchedov N., Ivanov P. Produkty do analizy intelektualnej danych Computerweek-Moskwy. - 2003. - № 14-15. - 32-39 p.

7 Priyalkovsky V.v. Trudna analiza danych o dużej objętości: Nowe perspektywy komputerów // DBMS. - 2006. - № 4. - 71-83 p.

8 Sacharow A. A. Koncepcja budynku i wdrażania systemów informacyjnych zorientowanych danych // DBMS. - 2004. - № 4. - 55-70 p.

9 Ulman J. Podstawy systemów bazy danych. - M.: Finanse i statystyki, 2003. - 312 c.

10 HUBBARD J. Zautomatyzowany projekt bazy danych. - m.: Mir, 2007. - 294 p.


Korowin S. D., Levenz I. A. Ratmanova I. D., Starykh V. A. Schowelev L. V. Rozwiązywanie problemu zintegrowanej analizy operacyjnej informacji o harmonogramach // DBMS. - 2005. - № 5-6. - 47-51 p.

Ulman J. Podstawy systemów bazy danych. - M.: Finanse i statystyki, 2003. - 312 C.

Barcegian A.a., Kupriyanov M.S. Technologie analizy danych: Datamining, Visualmining, Texmining, OLAP. - SPB.: BHV-Petersburg, 2007. - 532 p.

Elmanova N.v., Fedorow A.a. Wprowadzenie do technologii Microsoft OLAP. - m.: Dialog Mafi, 2004. - 312 p.

Data K. Wprowadzenie do systemów bazy danych. - M.: Huka, 2005 - 246 p.

Golitsina o.l., Maksimov N.v., Popov I.I. Bazy danych: Tutorial. - M.: Forum: Infra-M, 2003. - 352c.

Sahars A. A. Koncepcja konstrukcji i wdrażanie analizy danych zorientowanych na systemy // DBMS. - 2004. - № 4. - 55-70 p.

PRYLOKOVSKY V.V. Trudna analiza danych Duży wolumin: Nowe perspektywy komputera // DBMS. - 2006. - № 4. - 71-83 p.

Koncepcja wielowymiarowej analizy danych jest ściśle związana z analizą operacyjną, która jest wykonywana przez systemy OLAP.

OLAP (przetwarzanie analityczne on-line) - technologia operacyjnego przetwarzania danych analitycznych przy użyciu metod i środków do zbierania, przechowywania i analizowania wielowymiarowych danych do wspierania procesów decyzyjnych.

Głównym celem systemów OLAP - wsparcie dla działań analitycznych, arbitralnych (często używanych terminów ad-hoc) użytkowników analityków. Celem analizy OLAP jest sprawdzenie pojawiających się hipotez.

Na źródłach technologii OLAP jest założyciel podejścia relacyjnego E. Codd. W 1993 r. Opublikował artykuł zatytułowany "OLAP dla użytkowników analityków: Co powinno być". W artykule przedstawiono główne koncepcje przetwarzania analitycznego operacyjnego, a określone są następujące 12 wymagań, które muszą być spełnione z produktami umożliwiającymi operacyjne przetwarzanie analityczne. Tokmakov G.P. Baza danych. Koncepcja baz danych, relacyjny model danych, języki SQL. P. 51.

Poniższe zasady określone przez kod i definiowanie OLAP są wymienione poniżej.

1. MultiDimencjonalność - system OLAP na poziomie koncepcyjnym powinien składać dane w postaci modelu wielowymiarowego, co upraszcza procesy analizy i postrzegania informacji.

2. Przezroczystość - system OLAP musi ukryć się od użytkownika prawdziwą realizację wielowymiarowego modelu, metody organizacji, źródeł, przetwarzania i magazynów.

3. Dostępność - system OLAP powinien dostarczyć użytkownikowi za pomocą jednego, spójnego i holistycznego modelu danych, zapewniając dostęp do danych niezależnie od tego, jak i gdzie są przechowywane.

4. Stała wydajność Podczas opracowywania raportów - wydajność systemów OLAP nie powinna być znacznie zmniejszona, zwiększając liczbę pomiarów, dla których przeprowadzana jest analiza.

5. Architektura klienta-serwera - system OLAP musi być w stanie pracować w środowisku "Serwer klient", ponieważ Większość wymaganych danych, które są wymagane, podlegające obróbce analitycznej operacyjnej, są przechowywane. Główną ideą jest to, że składnik serwera narzędzia OLAP powinien być wystarczająco inteligentny i pozwala nam zbudować ogólny system koncepcyjny oparty na uogólnieniu i konsolidacji różnych systemów logicznych i fizycznych baz danych korporacyjnych w celu zapewnienia efektu przejrzystości.

6. Prosty pomiarowe - system OLAP musi obsługiwać wielowymiarowy model, w którym wszystkie pomiary są równe. Jeśli to konieczne dodatkowe cechy Może być wyposażony w oddzielne pomiary, ale ta możliwość musi być dostarczona do dowolnego wymiaru.

7. Dynamiczna kontrola matryc Racked - system OLAP powinien zapewnić optymalne przetwarzanie rzadkich matryc. Prędkość dostępu powinna być przechowywana niezależnie od lokalizacji komórek danych i być stałą wartością dla modeli o różnych pomiarach i innym stopniu wydajności danych.

8. Obsługa trybu wieloosobowego - system OLAP powinien stanowić okazję do pracy z kilkoma użytkownikami wraz z jednym modelem analitycznym lub tworzyć różne modele z jednolitych danych dla nich. Jest to możliwe, zarówno czytanie, jak i nagrywane dane, więc system powinien zapewnić ich integralność i bezpieczeństwo.

9. Unlimited Cross-Operations - System OLAP powinien zapewnić zachowanie stosunków funkcjonalnych opisanych przy użyciu pewnego języka formalnego między komórkami hipercube podczas wykonywania dowolnej operacji obniżania, rotacji, konsolidacji lub szczegółów. System musi niezależnie (automatycznie) wykonać konwersję zestawu relacji, bez konieczności konieczności ich przedefiniowania.

10. Intuicyjna manipulacja danych - system OLAP powinien zapewniać metodę wykonywania operacji cięcia, rotacji, konsolidacji i szczegółowości nad hiperkubem bez konieczności podejmowania różnych działań z interfejsem. Pomiary określone w modelu analitycznym muszą zawierać wszystkie niezbędne informacje do wykonania powyższych operacji.

11. Elastyczne możliwości raportowania - system OLAP musi obsługiwać różne sposoby wizualizacji danych, tj. Raporty muszą być złożone w jakiejkolwiek możliwej orientacji. Narzędzia raportowania muszą zapewnić syntetyzowane dane lub informacje, które są następujące od modelu danych w jego możliwej orientacji. Oznacza to, że łańcuchy, kolumny lub strony powinny być pokazane jednocześnie od pomiarów 0 do N, gdzie N - liczba pomiarów całego modelu analitycznego. Ponadto każdy pomiar zawartości pokazany w jednym wpisie, kolumnie lub stronie musi zezwolić na każdy podzbiór elementów (wartości) zawartych w wymiarze w dowolnej kolejności.

12. Nieograniczony wymiar i liczba poziomów agregacji - badania nad możliwą liczbą niezbędnych pomiarów wymaganych w modelu analitycznym wykazały, że do 19 pomiarów można stosować w tym samym czasie. Wynika z ostatecznego zalecenia, aby zapewnić, że narzędzie analityczne może jednocześnie zapewnić co najmniej 15, a korzystnie 20 pomiarów. Ponadto każda z całkowitych wymiarów nie powinna być ograniczona przez liczbę określonych przez użytkownika poziomów poziomów agregacji i ścieżek konsolidacyjnych.

Dodatkowe przepisy kodu.

Zestaw tych wymagań podawanych jako definitywna definicja OLAP, dość często powoduje różne skargi, na przykład, reguły 1, 2, 3, 6 są wymogami i zasadami 10, 11 - życzenia nieformalizowane. Tokmakov G.P. Baza danych. Koncepcja baz danych, relacyjny model danych, języki SQL. P. 68 Zatem wymienione wymogi 12 kodu nie pozwalają dokładnie określić OLAP. W 1995 r. Kod listy dodał następujące sześć zasad:

13. Wydobywanie partii przeciwko interpretacji - system OLAP powinien równie skutecznie zapewniać dostęp do danych własnych, jak i zewnętrznych.

14. Obsługa wszystkich modeli analizy OLAP - system OLAP musi utrzymywać wszystkie cztery modele analizy danych określonych przez kod: kategoryczne, interpretowanie, spekulacyjne i stereotypowe.

15. Przetwarzanie nieprawidłowych danych - system OLAP musi być zintegrowany z nieprawidłowymi źródłami danych. Modyfikacje danych dokonane w pożywce OLAP nie powinny prowadzić do zmian danych przechowywanych w źródłowych systemach zewnętrznych.

16. Zapisywanie wyników OLAP: Przechowywanie ich oddzielnie od danych źródłowych - system OLAP działający w trybie zapisu odczytu, po modyfikowaniu danych źródłowych, wyniki powinny być zapisywane oddzielnie. Innymi słowy zapewnione jest bezpieczeństwo danych źródłowych.

17. Wyłączenie brakujących wartościach - system OLAP, prezentujący ich użytkownikowi, musi odrzucić wszystkie brakujące wartości. Innymi słowy, brakujące wartości powinny różnić się od wartości zero.

18. Przetwarzanie brakujących wartości - system OLAP musi zignorować wszystkie brakujące wartości bez uwzględnienia ich źródła. Ta funkcja jest powiązana z 17. regułą.

Ponadto Codd złamał wszystkie 18 reguł dla następnych czterech grup, dzwoniąc do nich funkcje. Grupy te otrzymały nazwy, S, R i D.

Główne cechy (b) obejmują następujące zasady:

Wielowymiarowa koncepcyjna reprezentacja danych (art. 1);

Intuicyjna manipulacja danych (reguła 10);

Dostępność (reguła 3);

Wydobywanie partii przeciwko interpretacji (art. 13);

Wsparcie dla wszystkich modeli analizy OLAP (art. 14);

Architektura "serwer klienta" (reguła 5);

Przejrzystość (reguła 2);

Wsparcie dla wielu graczy (art. 8)

Cechy specjalne:

Przetwarzanie nieprawidłowych danych (zasada 15);

Zapisywanie Wyniki OLAP: Przechowywanie ich oddzielnie od danych źródłowych (reguła 16);

Eliminacja brakujących wartości (art. 17);

Przetwarzanie brakujących wartości (art. 18). Funkcje raportowania (R):

Elastyczność zgłaszania (art. 11);

Standardowa wydajność raportu (reguła 4);

Automatyczna konfiguracja warstwy fizycznej (zmodyfikowana oryginalna reguła 7).

Zarządzanie pomiarami (D):

Uniwersalność pomiarów (art. 6);

Nieograniczona liczba pomiarów i poziomów agregacji (art. 12);

Nieograniczone operacje między wymiarami (zasada 9).

Warunki konkurencji i rosnącej dynamiki środowiska zewnętrznego dyktują zwiększone wymagania dotyczące systemów zarządzania przedsiębiorstwami. Rozwój teorii i praktyki zarządzania towarzyszyły pojawienie się nowych metod, technologii i modeli koncentrowanych na poprawie wydajności działalności. Metody i modele z kolei przyczyniły się do powstania systemów analitycznych. Zapotrzebowanie na systemy analityczne w Rosji jest wysokie. Najbardziej interesujący pod względem stosowania tych systemów w sektorze finansowym: banki, biznes ubezpieczeniowy, firmy inwestycyjne. Wyniki pracy systemów analitycznych są wymagane przede wszystkim ludziom, których decyzje zależy od rozwoju firmy: menedżerowie, eksperci, analitycy. Systemy analityczne umożliwiają rozwiązywanie zadań konsolidacyjnych, raportowania, optymalizacji i prognozowania. Do tej pory nie było ostateczną klasyfikacją systemów analitycznych, ponieważ nie ma wspólnego systemu definicji w kategoriach stosowanych w tym kierunku. Struktura informacyjna przedsiębiorstwa mogą być reprezentowane przez sekwencję poziomów, z których każdy charakteryzuje się metodą przetwarzania i zarządzania informacjami, i ma własną funkcję w procesie zarządzania. Tak więc systemy analityczne będą zlokalizowane hierarchicznie na różnych poziomach tej infrastruktury.

Poziom systemów transakcyjnych

Poziom magazynu danych

Poziom prezentacji danych

Poziom OLAP - systemy

Poziom zastosowań analitycznych

OLAP - systemy - (przetwarzanie analityczne online, leczenie analityczne w obecnym czasie) - to technologia kompleksowej wielowymiarowej analizy danych. OLAP - systemy mają zastosowanie tam, gdzie istnieje zadanie analizy danych wielowarstwowych. Istnieją skuteczne środki analizy i generowania raportów. Powyższe magazyny danych, prezentacje danych i systemy OLAP odnoszą się do systemów Business Intelligence (Business Intelligence, BI).

Bardzo często systemy informacyjne i analityczne utworzone w bezpośrednim wykorzystaniu osób decyzyjnych są niezwykle proste w użyciu, ale są sztywno ograniczone w funkcjonalności. Takie statyczne systemy są wywoływane w literaturze. Systemy informacyjne. HEAD (IPR) lub systemy informacyjne wykonawcze (EIS). Zawierają predefiniowane wielokrotne wnioski i, będąc wystarczającym do przeglądu codziennego, nie jest w stanie odpowiedzieć na wszystkie pytania do dostępnych danych, które mogą pojawić się przy podejmowaniu decyzji. Wynik takiego systemu, z reguły, to raporty wielostronicowe, po dokładnym badaniu, którego pojawia się analityk nowa seria pytania. Jednak każdy nowy wniosek, nieprzewidziany przy projektowaniu takiego systemu, powinien być formalnie opisany formalnie, zakodowany przez programator i jest następnie wykonywany. Czas oczekiwania w tym przypadku może dokonać godzin i dni, które nie zawsze są dopuszczalne. W związku z tym zewnętrzna prostota statycznego SPPR, dla której większość klientów systemów informacyjnych i analitycznych aktywnie walczy, włącza się na katastrofalną utratę elastyczności.



Dynamiczne SPPRS, wręcz przeciwnie, koncentrują się na przetwarzaniu nie wybieranych (ad hoc) analityków do danych. Najbardziej głębokie wymagania dotyczące takich systemów przeglądały E. F. Codd w artykule, który opublikował początek pojęcia OLAP. Prace analityków z tymi systemami jest interaktywna sekwencja zapytania i studiuje ich wyniki.

Ale dynamiczne SPPRS mogą działać nie tylko w dziedzinie przetwarzania analitycznego operacyjnego (OLAP); Wsparcie dla podejmowania decyzji o zarządzaniu opartym na zgromadzonych danych można wykonać w trzech podstawowych obszarach.

Sfera szczegółowych danych. Jest to obszar działania większości systemów mających na celu znalezienie informacji. W większości przypadków relacyjne dbmss doskonale radzą sobie z zadaniami. Ogólnie akceptowany standard języka manipulacyjnego o danych relacyjnych jest SQL. Informacje i wyszukiwarki, które zapewniają interfejs użytkownika końcowego w zadaniach wyszukiwania szczegółowych informacji można stosować jako dodatki zarówno nad oddzielnymi bazami danych systemów transakcyjnych i nad wspólnym przechowywaniem danych.

Kula zagregowanych wskaźników. Kompleksowe spojrzenie na informacje zebrane w hurtowni danych, jej uogólnienie i agregacji, reprezentacji hipercubicznej i analiza wielowymiarowa to zadania systemów operacyjnych analitycznych systemów przetwarzania danych (OLAP). Tutaj możesz lub skupić się na specjalnych wielowymiarowych dBms lub pozostać w zakresie technologii relacyjnych. W drugim przypadku dane przed zagregowane można pobierać w bazie danych typu podobnego do gwiazd lub agregację informacji można przeprowadzić w locie w procesie skanowania szczegółowych tabel relacyjnej bazy danych.

Kula wzorów. Inteligentne przetwarzanie jest wykonywane przez metody inteligentnej analizy danych (Jaad, wydobycie danych), których głównymi zadaniami jest wyszukiwanie wzorców funkcjonalnych i logicznych w skumulowanych informacji, budowie modeli i reguł, które wyjaśniają znalezione anomalie i / lub przewidzieć rozwój niektórych procesów.

Operacyjne przetwarzanie danych analitycznych

Podstawą koncepcji OLAP leży zasadę wielowymiarowej prezentacji danych. W 1993 r. Artykuł Codd EF rozważył braki modelu relacyjnego, przede wszystkim określającego niezdolność do "łączenia, przeglądania i analizowania danych z punktu widzenia wielości pomiarów, czyli najbardziej zrozumiałe dla korporacyjnych analityków w Droga "i zidentyfikowano ogólne wymagania dotyczące systemów OLAP rozszerzających funkcjonalność relacyjnej DBMS i obejmują analizę wielowymiarową jako jedną z jego cech.

Klasyfikacja produktów OLAP zgodnie z metodą reprezentacji danych.

Obecnie na rynku obecna jest duża liczba produktów, co w różnym stopniu zapewnia funkcjonalność OLAP. Około 30 najsłynniejszych jest wymienione na liście przeglądu serwera WWW http://www.olapreport.com/. Zapewnienie wielowymiarowej reprezentacji koncepcyjnej przez interfejs użytkownika do bazy danych źródłowej, wszystkie produkty OLAP są podzielone na trzy klasy według rodzaju źródłowej bazy danych.

Najpierw pierwsze operacyjne systemy przetwarzania analityczne (na przykład, oprogramowanie ESSBASE Arbor, Firma Oracle Oracle Express Server) należała do klasy Molap, to znaczy mogliby działać tylko z własnymi wielowymiarowymi bazami danych. Opierają się na zastrzeżonych technologiach wielowymiarowych DBMS i są najdroższe. Systemy te zapewniają kompletny cykl przetwarzania OLAP. Albo zawierają, oprócz komponentu serwera, ich własny zintegrowany interfejs klienta jest używany do komunikowania się z zewnętrznymi programami prac użytkownikowymi z arkuszami kalkulacyjnymi. Aby zachować takie systemy, specjalny personel jest wymagany przez instalację, wraz z systemem, tworzenie widoków danych dla użytkowników końcowych.

Operacyjne analityczne systemy przetwarzania danych (Rolap) zapewniają dane przechowywane w bazie relacyjnej, w formie wielowymiarowej, zapewniając transformację informacji do modelu wielowymiarowego przez warstwę pośrednią metadanych. Systemy Rolap są dobrze przystosowane do pracy z dużym magazynem. Podobnie jak systemy MOLAP, wymagają znacznych kosztów usług dla profesjonalistów technologii informacyjnych i dostarczają operacji wieloosobowej.

Wreszcie systemy hybrydowe (hybrydowe OLAP, HOLAP) są zaprojektowane tak, aby łączyć korzyści i zminimalizować niedociągnięcia wraz z poprzednimi klasami. Media Speedware / MR obejmuje tę klasę. Według programistów łączy elastyczność analityczną i szybkość reakcji molaków ze stałym dostępem do rzeczywistych danych osobliwych do Rolap.

Wielowymiarowa OLAP (MOLAP)

W wyspecjalizowanych DBMS na podstawie wielowymiarowej prezentacji danych, dane nie są organizowane w postaci tabel relacyjnych, ale w postaci zamówionych tablic wielowymiarowych:

1) Hypercubes (wszystkie komórki przechowywane w bazie danych muszą mieć ten sam wymiar, czyli, aby mieć maksymalną pełną podstawę pomiaru) lub

2) Polykuby (każda zmienna jest przechowywana z własnym zestawem pomiarów, a wszystkie związane z tym złożoność przetwarzania jest przenoszona do wewnętrznych mechanizmów systemu).

Zastosowanie wielowymiarowych baz danych w systemach przetwarzania analitycznego operacyjnego ma następujące zalety.

W przypadku korzystania z wielowymiarowego DBMS, wyszukiwanie i próbka danych odbywa się znacznie szybciej niż z wielowymiarowym koncepcyjnym spojrzeniem w relacyjnej bazy danych, ponieważ wielowymiarowa baza danych jest zdenormalizowana, zawiera wstępnie zagregowane wskaźniki i zapewnia zoptymalizowany dostęp do żądanych komórek .

Wielowymiarowe DBMSS łatwo radzą sobie z zadaniami włączenia do modelu informacji różnych funkcji wbudowanych, natomiast obiektywnie istniejących ograniczeń językowych SQL sprawiają, że zadania te są oparte na relacyjnych dbmss dość skomplikowanych, a czasem niemożliwe.

Z drugiej strony istnieją znaczne ograniczenia.

Wielowymiarowe DBMSS nie pozwalają na pracę z dużymi bazami danych. Ponadto, ze względu na denormalizację i wstępnie wykonywane agregację, ilość danych w wielowymiarowej podstawie, z reguły, odpowiada (oceniając kod) w 2,5-100 razy mniejsza objętość źródła szczegółowych danych.

Wielowymiarowe DBMS w porównaniu z relacją są bardzo nieefektywnie korzystające z pamięci zewnętrznej. W przytłaczającej większości przypadków hypercube informacje są silnie rozrachowane, a ponieważ dane są przechowywane w zamówionej formie, niepewne wartości są usuwane tylko przez wybór optymalnego zamówienia sortowania, co pozwala na organizację danych do maksymalnych grup ciągłych . Ale nawet w tym przypadku problem jest rozwiązany tylko częściowo. Ponadto procedura sortowania jest najprawdopodobniej optymalna z punktu widzenia pamięci, kolejność sortowania najprawdopodobniej nie pokrywa się z zamówieniem, który jest najczęściej używany w zapytaniach. Dlatego w prawdziwych systemach konieczne jest wyszukiwanie kompromisu między prędkością a redundancją miejsca na dysku zajmowanej przez bazę danych.

W konsekwencji stosowanie wielowymiarowych DBMS jest uzasadnione tylko w następujących warunkach.

Ilość danych źródłowych do analizy nie jest zbyt duża (nie więcej niż kilka gigabajtów), czyli poziom agregacji danych jest dość wysoki.

Zestaw pomiarów informacji jest stabilny (ponieważ każda zmiana ich struktury prawie zawsze wymaga kompletnej restrukturyzacji hipercube).

Czas odpowiedzi systemu dla żądań nie wybranych jest najbardziej krytycznym parametrem.

Wymagane jest szerokie zastosowanie kompleksowych funkcji wbudowanych do wykonywania obliczeń międzywymiarowych przez komórki hipercube, w tym możliwość pisania funkcji użytkownika.

Relacja OLAP (Rolap)

Bezpośrednie wykorzystanie relacyjnych baz danych w systemach przetwarzania analitycznego operacyjnego ma następujące zalety.

W większości przypadków magazyny danych korporacyjnych są realizowane za pomocą relacyjnego DBMS, a narzędzia Rolap umożliwiają przeanalizowanie bezpośrednio nad nimi. W tym przypadku rozmiar pamięci nie jest taki krytyczny parametr, jak w przypadku molaku.

W przypadku zmiennego wymiaru zadania, gdy wprowadzono zmiany w strukturze pomiarowej, system Rolap z dynamiczną reprezentacją wymiaru jest najlepszym rozwiązaniem, ponieważ takie modyfikacje nie wymagają fizycznej reorganizacji bazy danych.

Relacyjne DBMSS zapewniają znacznie wyższy poziom ochrony danych i dobrych praw dostępu do rozgraniczenia.

Główną wadą Rolap w porównaniu z wielowymiarowymi DBMS jest mniejsza wydajność. Aby zapewnić wydajność porównywalną z MOLAP, systemy relacyjne wymagają dokładnego badania diagramu bazy danych i ustawień indeksu, czyli duże wysiłki od administratorów bazy danych. Tylko w przypadku stosowania schematów w kształcie gwiazdy, wydajność dobrze skonfigurowanych systemów relacyjnych można zbliżyć przez wydajność systemów opartych na wielowymiarowych bazach danych.