Menü
Ingyenes
becsekkolás
a fő  /  Firmware / OLAP program. OLAP rendszerek

OLAP program. OLAP rendszerek

4. Az OLAP termékek osztályozása.

5. Az OLAP ügyfelek alapelvei.

7. Alkalmazási kör OLAP-Technologies.

8. Példa az Olap Technologies alkalmazására az értékesítés elemzéséhez.

1. Helyezze az OLAP-t a vállalkozás információs struktúrájába.

Az "OLAP" kifejezés elválaszthatatlanul kapcsolódik az "Adatraktár" kifejezéssel (adatraktár).

A tároló adatai az operatív rendszerekből (OLTP rendszerek), amelyek az üzleti folyamatok automatizálására szolgálnak. Ezenkívül a tárolást külső források, például statisztikai jelentések miatt feltöltheti.

A tároló feladata, hogy "nyersanyagokat" biztosítson egy helyen és egy egyszerű, érthető szerkezetben.

Van egy másik ok, ami igazolja a különálló tárhely megjelenését - komplex analitikai kérelmek a működési információk gátolja a vállalat jelenlegi munkáját, blokkolja a táblázatokat hosszú ideig, és rögzíti a kiszolgáló erőforrásait.

A tároló alatt nem értheti meg a szükséges gigantikus adatfelhalmozódás - a legfontosabb dolog az, hogy kényelmes az elemzéshez.

A központosítás és a kényelmes strukturálás nem minden, amire szükség van az Analytics által. Még mindig szükségessé teszi az információk megtekintéséhez, megjelenítéséhez. A hagyományos jelentések, még egyetlen tárolás alapján is épültek, megfosztják az egyik rugalmasságot. Nem lehet "csavarok", "telepítve" vagy "összeomlás", hogy megkapja a kívánt adatremenet. Ez lenne az a szerszáma, amely lehetővé tenné az adatok telepítését és megfordítását egyszerűen és kényelmes! Mint egy eszköz, és elvégzi az OLAP-t.

Bár az OLAP nem szükséges az adatraktár szükséges attribútuma, egyre gyakrabban használják a tárolás során felhalmozott információk elemzését.

OLAP hely a vállalkozás információs struktúrájában (1. ábra).

1. kép. Egy helyOLAP. a vállalkozás információs struktúrájában

A működési adatokat különböző forrásokból gyűjtik össze, tisztítják, integrálják és összecsukják a relációs tárolásra. Ugyanakkor már rendelkezésre állnak az elemzéshez különböző építési jelentések felhasználásával. Ezután az adatok (teljesen vagy részben) készültek az OLAP elemzéshez. Ezek egy speciális OLAP adatbázisba vagy egy relációs tárolóban maradhatnak. A legfontosabb elem a metaadatok, azaz az adatok szerkezetéről, elhelyezéséről és átalakításáról. Köszönjük, hogy a különböző tárolókomponensek hatékony kölcsönhatása biztosított.

Összefoglalva, lehetséges meghatározni az OLAP-t, mint a tárolóban felhalmozott adatok többdimenziós elemzésének eszközét.

2. Működési analitikai adatfeldolgozás.

Az OLAP fogalmának alapja a többdimenziós adatok bemutatásának elve. 1993-ban az EF Codd úgy vélte, hogy a relációs modell hiányosságai, elsősorban a mérések sokaságának szemszögéből való "kombinálható, megtekintése és elemzésének képtelensége, azaz a vállalati elemzők számára a és azonosított az OLAP rendszerek általános követelményei bővítve a funkcionalitás relációs DBMS-t és a többdimenziós elemzést, mint az egyik jellemzőjét.

Kód szerint az adatok többdimenziós fogalmi ábrázolása több független mérésből álló többszörös perspektíva, amely mentén bizonyos adatkészleteket elemezhetünk.

Több mérés egyidejű elemzése többdimenziós analízis. Mindegyik mérés magában foglalja az adatok konszolidációs irányait, amelyek az egymást követő általánosított szintek sorozatából állnak, ahol az egyes magasabb szint megfelel a megfelelő mérésnél nagyobb adatgyűjtésnek.

Tehát a vállalkozó mérését a konszolidáció irányával határozhatjuk meg, amely az általánosítási "Enterprise - Division - Osztály - Munkavállaló" szintjét tartalmazza. A mérési idő két konszolidációs irányba is tartalmazhat - "Év-negyedév - egy hónapos nap" és "hétnap", mivel az idő és a hetek közötti idők összeegyeztethetetlenek. Ebben az esetben lehetővé válik, hogy önkényes választékot választsunk az egyes mérésekre vonatkozó információk részletezési szintjének.

A leszállási művelet (fúrás) megfelel a legmagasabb konszolidációs lépésekből az alacsonyabb mozgáshoz; Éppen ellenkezőleg, a felvonó működése (gördülő) azt jelenti, hogy az alacsonyabb szintektől a magasabbra mozog (2. ábra).


2. ábra. Mérések és irányok az adatok megszilárdítása

3. A működési analitikai feldolgozás eszközeire vonatkozó követelmények.

A többdimenziós megközelítés szinte egyszerre és párhuzamosan merült fel a relációs. Csak a kilencvenes évek közepétől kezdődően, vagy inkább
1993, érdeklődés Iuubd Elkezdett egyetemes karaktert szerezni. Ez az év, hogy új szoftver cikk jelent meg a relációs megközelítés egyik alapítójának. E. CODDAamelyben 12 alapvető követelményt fogalmazott meg a végrehajtáshoz OLAP. (Asztal 1).

Asztal 1.

Többdimenziós adatok képviselet

Az eszközöknek támogatniuk kell az adatok többdimenziós nézetét a fogalmi szintre.

Átláthatóság

A felhasználó nem tudja, hogy milyen konkrét eszközöket használnak az adatok tárolására és feldolgozására, mivel az adatok szerveződnek és honnan származnak.

Elérhetőség

Az eszközöknek a lehető legjobban meg kell választaniuk és kommunikálniuk, hogy válaszoljanak erre az adatforrásra. Az eszközöknek saját logikai áramkörük automatikus megjelenítését kell biztosítaniuk különböző heterogén adatforrásokban.

Következetes teljesítmény

A teljesítmény gyakorlatilag nem függ a kérés mérésének számától.

Támogatás architektúra ügyfélszerver

Az alapoknak az ügyfél-kiszolgáló architektúrájában kell működniük.

Az összes mérés egyenlősége

A mérések egyike sem kell alapulnia, mindegyiknek egyenlőnek kell lennie (szimmetrikus).

A ritka mátrixok dinamikus feldolgozása

A bizonytalan értékeket a leghatékonyabb módon kell tárolni és feldolgozni kell.

Támogatja a multiplayer adatmódot

Az eszközöknek lehetőséget kell biztosítani egynél több felhasználó számára.

A különböző méréseken alapuló műveletek támogatása

Minden többdimenziós műveletet (például az aggregációt) egyenletesen és összehangolnia kell bármely méréshez.

Könnyű manipulációs adatok

A pénzeszközöknek rendelkezniük kell a legmegfelelőbb, természetes és kényelmes felhasználói felületnek.

Fejlesztett adatszolgáltatási eszközök

A pénzeszközöknek meg kell felelniük különböző módszerek Az adatok megjelenítése (bemutató).

Korlátlan számú mérés és az adatgyűjtés szintje

A támogatott mérések számának nincs korlátozása.

Szabályok értékelésére vonatkozó szabályok OLAP

Az OLAP tényleges meghatározásaként szolgáló követelmények egy sorát tanácsadónak és konkrét termékeknek kell tekinteni, hogy felmérjék a megközelítés mértékét az összes követelménynek való megfeleléshez.

Később a kód meghatározását átdolgozták az úgynevezett FASMI tesztbe, amely megköveteli az OLAP alkalmazást, hogy képes legyen gyorsan elemezni a megosztott többdimenziós információkat.

Ne feledje, hogy a 12 CODDO szabályok túlságosan zavarosak a legtöbb ember számára. Kiderült, hogy csak öt kulcsszót foglalhat össze az OLAP-Definition-nek: A megosztott többdimenziós információ gyors elemzése - vagy röviden - Fasmi (angolul lefordítva:F. aST. A. nalízis. S. hared. M. ultidimenzionális ÉN. nformáció).

Ezt a meghatározást először 1995 elején fogalmazták meg, és azóta nem kellett felülvizsgálnia.

Gyors ( Gyors) - Azt jelzi, hogy a rendszernek a legtöbb válasz kiadását a felhasználóknak körülbelül öt másodpercen belül kell megadnia. Ugyanakkor a legegyszerűbb kéréseket egy másodpercen belül és nagyon kevés - több mint 20 másodpercen belül feldolgozzák. Tanulmányok kimutatták, hogy a végfelhasználók sikertelenek, ha az eredmények nem érkeznek 30 másodperc után.

Első pillantásra meglepőnek tűnhet, hogy egy percig jelentést kap, mely napokra szükség volt, a felhasználó nagyon gyorsan elkezd hiányozni a várakozások során, és a projekt sokkal kevésbé sikeres, mint egy azonnali válasz esetén legalább kevésbé részletes elemzés.

Elemzés (elemzés) azt jelenti, hogy a rendszer megbirkózhat bármely logikus és statisztikai elemzéssel ez az alkalmazásÉs biztosítja annak megtakarítását a végfelhasználó számára elérhető űrlapon.

Nem olyan fontos, ha ezt az elemzést a beszállító saját eszközeiben vagy a mellékelt külső szoftvertípusban készítik el, egyszerűen az elemzés összes szükséges funkcióit a végfelhasználók számára intuitív módon kell biztosítani. Elemzés eszközök magukban bizonyos eljárások, mint például az elemzés idősorok, költség elosztás, deviza átutalások, keressen célokra változások többdimenziós struktúrák, nem koncentrált modellezés, azonosító exkluzív helyzetek, adatok kinyerése és egyéb műveletek függő. Az ilyen lehetőségek széles körben elterjedtek a termékek között, a célorientációtól függően.

Megosztott (megosztott) Ez azt jelenti, hogy a rendszer minden titoktartási védelmi követelményt (esetleg a sejtszintre) biztosítja, és ha több hozzáférés szükséges a felvételhez, a megfelelő szinten a módosítások blokkolását biztosítja. Nem minden alkalmazásnak szüksége van az adatok rögzítésére. Az ilyen alkalmazások száma azonban növekszik, és a rendszernek képesnek kell lennie arra, hogy időszerű, biztonságos módon kezelje a több módosítást.

Többdimenziós (többdimenziós) - ez kulcsfontosságú követelmény. Ha az OLAP-ot egy szóban kell meghatározni, akkor választották volna. A rendszernek többdimenziós koncepcionális bemutatót kell adnia az adatoknak, beleértve a hierarchiák teljes támogatását és több hierarchiát, mivel határozottan a leg logikusabb módja az üzleti és szervezetek elemzéséhez. A mérések minimális száma, amelyet feldolgozni kell, mivel az alkalmazástól függ, és a legtöbb OLAP terméknek elegendő számú mérése van azoknak a piacoknak, amelyek célzottak.

Információs információk - Mindez. A szükséges információkat meg kell szerezni, ahol szükséges. Az alkalmazástól azonban sokan függnek. A különböző termékek erejét mérik, hogy hány bemeneti adatot tudnak feldolgozni, de nem mennyi gigabájtokat tárolhatnak. A termék teljesítménye nagyon eltérő - a legnagyobb OLAP termékek legalább ezer alkalommal működhetnek nagyszámú adatokkal a legkisebbhez képest. Ezen az alkalomban számos tényezőt kell figyelembe venni, beleértve a RAM által megkövetelt adat-duplikációt, a lemezterület, a működési mutatók, az információs raktárak integrálását stb.

A fasci teszt a célok ésszerű és érthető meghatározása a célok, amelynek eredménye, amelynek az OLAP összpontosul.

4. BesorolásOLAP.- Termékek.

Szóval, az OLAP lényege Ez az, hogy az analízis információforrása többdimenziós kocka formájában jelenik meg, és lehet, hogy önkényesen manipulálja azt, és megkapja a szükséges információcsökkentéseket - jelentések. Ebben az esetben a végfelhasználó többdimenziós dinamikus táblázatként látja a kockát, amely automatikusan összefoglalja az adatokat (tények) különböző vágásokban (mérések), és lehetővé teszi, hogy interaktív módon kezelje a számításokat és a jelentési űrlapot. E műveletek végrehajtása biztosítottOLAP. - gép (vagy gép)OLAP-támadások).

A mai napig számos terméket hajtottak végre a világonOLAP. -Technológiák. Hogy könnyebben navigáljon közöttük, használjon osztályozásokatOLAP. - Termékek: Az elemzés és a helyszín adat tárolási módja szerintOLAP. -As. Tekintsük minden kategóriátOLAP termékek.

Az adattárolás osztályozása

A többdimenziós kockák a forráson és az összesített adatokon alapulnak. Mind a kockák forrását, mind az összesített adatait relációs és többdimenziós adatbázisokban tárolhatják. Ezért jelenleg az adattároló módszert alkalmazzák:Molap (multidimenzionális OLAP), rolap (relációs OLAP) és holap (hibrid OLAP) ). Illetőleg,OLAP. - Az adat tárolási módszere szerinti termékek három hasonló kategóriára vannak osztva:

1. A molap esetében , A kezdeti és az összesített adatokat többdimenziós adatbázisban vagy többdimenziós helyi Kuba tárolja.

2. A ROLAP-ban. - Termékek A forrásadatokat relációs adatbázisokban vagy lapos helyi táblázatokban tárolják a fájlkiszolgálón. Az összesített adatokat ugyanabban az adatbázisban helyezhetjük el a szerviz táblákba. Adatok átalakítása a relációs adatbázisból a többdimenziós kockákban kérésre történikOLAP-Használat.

3. Használat eseténHolap Építészet A kezdeti adatok relációs alapon maradnak, és az egységek többdimenziós. ÉpületOLAP. -Kuba kérésre történikOLAP. - relációs és többdimenziós adatokon alapuló segítség.

Az elhelyezés osztályozása OLAP.-As.

Ehhez a jelhezOLAP. - A termékek osztva vannakOLAP szerverek és Olap-Clements:

· A szerver OLAP-ban - Az összesített adatok kiszámítása és tárolása különálló folyamat-kiszolgálóval történik. Az ügyfélalkalmazás csak a lekérdezések eredményeit kapja a szerveren tárolt többdimenziós kockákra. NéhányOLAP. -Servers támogatja az adatok tárolását csak relációs alapokon, egyesek csak többdimenziós. Sok modernOLAP. -Servers támogatja mindhárom tárolási módszert:Molap, rolap és holap.

Molap.

A molap Többdimenziós on-line analitikai feldolgozás,azaz többdimenziós OLAP.Ez azt jelenti, hogy a tárolószerver többdimenziós adatbázist (MBD) használ. Az MBD használatának jelentése nyilvánvaló. Hatékonyan tárolja a multidimenziós adatokat a természetével, gyorsítóeszközökkel az adatbázisok számára. Az adatokat az adatforrásból többdimenziós adatbázisba továbbítják, majd az adatbázis aggregációnak van kitéve. Az előzetes számítás olyan, amely felgyorsítja az OLAP lekérdezéseit, mivel a konszolidált adatok kiszámítása már előállított. A lekérdezési idő kizárólag az adott adatfragmentumhoz és számításhoz szükséges idő függvényében válik. Ez a módszer támogatja azt a koncepciót, amely szerint a munkát egyszer végzik, és az eredményeket újra és újra használják. A többdimenziós adatbázisok viszonylag új technológiák. Az MBD használata ugyanazokkal a hátrányokkal jár, mint az új technológiák többsége. Nevezetesen - nem olyan stabilak, mint a relációs adatbázisok (RBD), és nem optimalizálják ugyanolyan mértékben. Az MBD másik gyenge pontja a legtöbb multidimenzionális adatbázisok használata az adatgyűjtési folyamatban, ezért időt vesz igénybe annak érdekében, hogy az új információ elérhetővé váljon az elemzéshez.

Rolap.

Rolap Relációs on-line analitikai feldolgozás,ez relációs OLAP.A ROLAP kifejezés azt jelzi, hogy az OLAP kiszolgáló a relációs adatbázison alapul. A forrásadatok a relációs adatbázisba kerülnek, általában a "Star" rendszer szerint vagy egy hópehely rendszer szerint, ami segít csökkenteni az extrakciós időt. A szerver többdimenziós adatmodellt biztosít az optimalizált SQL lekérdezésekkel.

Számos oka van a relációs kiválasztásnak, nem pedig többdimenziós adatbázisban. Az RBD egy jól fejlett technológia, amely számos optimalizálási lehetőséget kínál. A valós körülmények felhasználásával egy dolgozott termék eredménye. Ezenkívül az RBD nagyobb adatmennyiséget támogat, mint az MBD. Ők csak ilyen kötetekre tervezték őket. Az RBD elleni fő érv a nagy adatbázisból származó információk beszerzéséhez szükséges kérések összetettsége az SQL használatával. A tapasztalatlan SQL programozó könnyedén terheli az értékes rendszererőforrásokat, hogy megpróbáljon valamilyen kérelmet elvégezni, amely az MBD-ben sokkal egyszerűbb.

Összesített / előtagolt adatok.

A gyors lekérdezés megvalósítása elengedhetetlen az OLAP számára. Ez az OLAP egyik alapelvei - az adatok intuitív manipulálási képessége az információ gyors kitermelését igényli. Általánosságban elmondható, hogy a több számítástechnika szükséges az információ töredékének előállításához, a lassabb a válasz. Ezért, hogy egy kis lekérdezési idő, az információs töredékek, a fellebbezés, amelyre általában leggyakrabban előfordul, de amelyek számításokat igényelnek, elő-aggregáció. Vagyis azokat az adatbázisban új adatokként kell tárolni. Egy olyan adattípus példájaként, amely megengedhető, hogy előre kiszámolható, összefoglaló adatok - például hónapok, negyedek vagy évek értékesítési mutatói, amelyekre a napi mutatókat ténylegesen beírják.

A különböző beszállítók betartják az elő-aggregációt igénylő paraméterek kiválasztásának különböző módszereit és az előre kiszámított értékek számát. Az aggregáció megközelítése befolyásolja az adatbázist és a kérelmek végrehajtása során. Ha több értéket számítanak ki, annak valószínűsége, hogy a felhasználó már kiszámított értéknövekedést kér, ezért a válaszidő csökken, mivel nem szükséges megkérdezni a kiszámításhoz szükséges kezdeti értéket. Ha azonban az összes lehetséges értéket kiszámítja - ez nem a legjobb megoldás - ebben az esetben az adatbázis mérete jelentősen növekszik, ami megnövekedett, és az aggregációs idő túl nagy lesz. Ezenkívül az adatbázishoz numerikus értékeket adnak hozzá, vagy ha változnak, ezeket az információkat az új adatoktól függően előre kiszámított értékekben kell tükrözni. Így az adatbázis-frissítés sok időt is igénybe vehet nagyszámú előre kiszámított érték esetén. Mivel általában az aggregáció során az adatbázis önállóan működik, kívánatos, hogy az aggregációs idő nem túl hosszú.

· OLAP. -Client másképp tervezett. Multidimenziós kocka építése ésOLAP. - A cselekvéseket az ügyfélszámítógép memóriájában végzik.OLAP. -Clinerek is fel vannak osztvaRolap és molap. És egyesek támogathatják mindkét adat-hozzáférési lehetőséget.

Mindezek a megközelítések, vannak "profik" és "mínusz". Ellentétben a szervereszközökkel kapcsolatos közös véleményével az ügyfél előtt, általában számos esetben.OLAP. -clin a felhasználók számára hatékonyabb és jövedelmezőbbek lehetnekOLAP szolgál.

Az elemző alkalmazások fejlesztése az ügyfél OLAP alapok használatával - a folyamat gyors, és nem igényel különleges előkészítést a vállalkozónak. A felhasználó, aki ismeri az adatbázis fizikai megvalósítását, az informatikai szakember vonzereje nélkül analitikus alkalmazást fejleszthet ki.

Az OLAP kiszolgáló használata esetén 2 különböző rendszert kell tanulnia, néha különböző beszállítókból - kockák létrehozása a szerveren, és az ügyfélalkalmazás fejlesztése.

Az OLAP kliens egyetlen vizuális felületet biztosít a kockák leírásához és a felhasználói felületek beállításához.

Tehát, milyen esetekben az OLAP kliens alkalmazása a felhasználók számára hatékonyabb és jövedelmezőbb lehet az OLAP kiszolgáló használatához?

· Az alkalmazás gazdasági megvalósíthatóságaOLAP. -Server akkor fordul elő, ha az adatok mennyisége nagyon magas és elviselhetetlenOLAP. -clin, különben az utóbbi használata igazolható. Ebben az esetbenOLAP. -Clent kombinálja a nagy teljesítményt és az alacsony költségeket.

· Erőteljes PC-elemzők - egy másik érv javáraOLAP. -Clinánsok. Amikor alkalmazzákOLAP. Slerver Ezek a hatalom nem használható.

Az OLAP ügyfelek előnyei között a következőknek is nevezhetők:

· A végrehajtás és a karbantartás költségeOLAP. -clin lényegesen alacsonyabb, mint a költségekOLAP szerver.

· HasználOLAP. -Clin a beépített adatátviteli gépen keresztül a hálózaton keresztül. KözbenOLAP. - Az új adatfolyamok műveletei nem keletkeznek.

5. A munka elvei OLAP.-Clinánsok.

Fontolja meg az OLAP alkalmazás létrehozásának folyamatát egy ügyfél instrumentális eszközzel (1. ábra).

1. kép. OLAP alkalmazás létrehozása ügyfél-rolap használatával

A ROLAP-ügyfelek működésének elve a szemantikai réteg előzetes leírása, amely elrejti a forrásadatok fizikai struktúráját. Ebben az esetben az adatforrások lehetnek: helyi asztalok, rdbd. A támogatott adatforrások listáját egy adott szoftver termék határozza meg. Ezt követően a felhasználó önállóan manipulálhatja az objektumokat, amelyek érthetőek a téma területén, hogy kockákat és analitikai interfészeket hozzanak létre.

Az OLAP kiszolgáló működésének elvét eltérő. Az OLAP kiszolgálóban, a kockák létrehozásakor a felhasználó manipulálja az adatbázis fizikai leírását. Ugyanakkor az egyéni leírások jönnek létre a Kubában. Az OLAP Server kliens csak a kockára van konfigurálva.

A szemantikai réteg létrehozásakor adatforrások - az értékesítési és foglalkozási táblákat érthető végfelhasználói feltételek írják le, és "termékek" és "tranzakciók". A "termékek" táblázatból származó "ID" mező átnevezi a "Kód" és a "Név" - a "termék" stb.

Ezután létrejön az "Értékesítési" üzleti objektum. Az üzleti objektum egy lapos asztal, multidimenzionális kocka alapján. Üzleti objektum létrehozásakor az "termékek" táblázat és a "tranzakciók" az áruk "kódja" mezőn keresztül kombinálódnak. Mivel a táblázat minden területe nem szükséges megjeleníteni a jelentésben - az üzleti objektum csak a "termék" mezőket használja, a "dátum" és az "összeg".

Példánkban az "Értékesítési" üzleti létesítmény alapján létrejött egy jelentést az áruk értékesítéséről havonta.

Az interaktív jelentéssel való együttműködésnél a felhasználó beállíthatja a szűrést és csoportosítási körülményeket ugyanazokkal az egyszerű mozgásokkal "egér". Ezen a ponton az ROLAP ügyfél a gyorsítótárban szereplő adatokat vonja maga után. Az OLAP kiszolgáló ügyfele új kérést generál egy többdimenziós adatbázisba. Például egy értékesítési szűrő értékesítési beszámoló alkalmazásában jelentést kaphat az érdeklődő áruk értékesítéséről.

Minden OLAP alkalmazás beállítása egy dedikált metaadat-tárolóban, egy alkalmazásban vagy többdimenziós adatbázis-rendszer tárolóban tárolható. A megvalósítás az adott szoftverterméktől függ.

Az ilyen alkalmazásokban szereplő összes szabványos nézet az interfészen, előre meghatározott funkciók és szerkezet, valamint gyors megoldások Többé-kevésbé szabványos helyzetekre. Például a pénzügyi csomagok népszerűek. Előre létrehozott pénzügyi alkalmazások lehetővé teszik a szakemberek, hogy használja a számára ismerős pénzügyi eszközöket, anélkül, hogy tervezzen egy olyan adatbázist, vagy általánosan elfogadott űrlapok és jelentések.

Az internet Új forma ügyfél. Ezenkívül új technológiák nyomtatását hordozza; sok internetes megoldások Jelentősen különbözik a képességeikben, mint egészben és OLAP-megoldásként - különösen. Rengeteg előnye van az OLAP jelentések kialakításában az interneten keresztül. A legjelentősebb a szakosodott szoftverek szükségességének hiánya az információk eléréséhez. Ez egy csomó időt és pénzt takarít meg.

6. Válassza ki az OLAP alkalmazás architektúráját.

Az információs és analitikai rendszer végrehajtásakor fontos, hogy ne tévesszenünk az OLAP alkalmazás architektúrájának kiválasztásában. Az on-line analitikai folyamat - "operatív analitikus feldolgozás" szó szerinti fordítása - gyakran észlelhető szó szerint abban az értelemben, hogy a rendszerbe belépő adatokat gyorsan elemzik. Ez félreértés - Az elemzés elemzése nem kapcsolódik a rendszer tényleges adatfrissítési idejéhez. Ez a jellemző az OLAP rendszer válaszidejére utal a felhasználói kérésekre. Ugyanakkor, gyakran az elemzett adatok egy pillanatfelvétel az információ "tegnap", ha például a raktárak adatai naponta egyszer frissülnek.

Ebben az összefüggésben az OLAP pontosabb, mint az "interaktív analitikus feldolgozás". Lehetőség van az interaktív üzemmódban olyan adatok elemzésére, amely megkülönbözteti az OLAP rendszert a szabályozott jelentések előkészítéséhez.

Az OLAP OLAP OLAP formulációjában az interaktív feldolgozás egy másik jellemzője, hogy "kombinálják, megtekinthessék és elemezzék az adatokat a mérések sokaságának szempontjából, azaz a vállalati elemzők számára a legmegfelelőbbek számára." A kóddal maga az OLAP kifejezés kizárólag konkrét módot jelent a fogalmi szinten - többdimenziós. A fizikai szinten az adatok relációs adatbázisokban tárolhatók, de valójában az OLAP eszközök általában többdimenziós adatbázisokkal működnek, amelyekben az adatokat hypercube-ként rendezik (1. ábra).

1. kép. OLAP. - kocka (hypercub, metakub)

Ebben az esetben ezen adatok relevanciáját a hiperkuba új adatokkal való feltöltésének pillanatában határozzák meg.

Nyilvánvaló, hogy a multidimenzionális adatbázis kialakulási ideje jelentősen attól függ, hogy milyen mennyiségű adat betöltött, ezért ésszerű korlátozni ezt a kötetet. De hogy ne szűkítse a képességét, hogy elemezze és ne megfosztja a hozzáférést az összes információhoz, amit érdekel? Két alternatív útvonal van: elemzés, majd lekérdezés ("első elemzés - Ezután további információkat kérjen") és lekérdezés, majd elemezni ("első kérés adat - majd elemzve").

Az első pályajáték követői, hogy általánosított információkat többdimenziós adatbázisba töltsük fel, például havi, negyedéves, éves eredményeket az osztalékok által. És ha részleteznie kell ezeket az adatokat, akkor a felhasználó felkérést kap arra, hogy jelentést készítsen relációs alapon, amely tartalmazza a szükséges mintát, például egy adott egység vagy hónap és a kiválasztott részleg személyzetét.

A második út támogatói, éppen ellenkezőleg, először felajánlják a felhasználót, elsősorban eldönteni az adatokat, amelyeket elemezni fog, és pontosan letölti őket a mikrokubárba - egy kis többdimenziós adatbázisba. Mindkét megközelítés különbözik a koncepcionális szinten, és előnyeik és hátrányai.

A második megközelítés előnyei közé tartozik a "frissesség" információ, amelyet a felhasználó többdimenziós jelentés formájában kap, a "Microcub". A mikrokububot csak a jelenlegi relációs adatbázisból kért információk alapján alakítják ki. A mikrokiszyával való együttműködés interaktív üzemmódban történik - az információrészek beszerzése és a mikrokuba belüli részletei azonnal elvégzik. Egy másik pozitív pont az, hogy a struktúra kialakítását és a mikrokuba töltését a felhasználó "a repülésen" végzi, az adatbázis-rendszergazda részvétele nélkül. A megközelítés azonban súlyos hiányosságokat szenved. A felhasználó nem látja az általános képet, és előzetesen meg kell határozni a kutatás irányával. Ellenkező esetben a megkeresett microcub lehet túl kicsi, és nem tartalmazzák az összes adatot az adatok, és a felhasználónak kell kérni az új microcub, majd az újat, majd szintén. A lekérdezés, majd az elemző megközelítés végrehajtja a BusinessObjects eszközt az azonos nevű társaság társaságának és szerszámok Platformok Contour CompanyIntersoft.Labor.

Amikor megközelíted az elemzést, akkor a lekérdezés, a többdimenziós adatbázisba betöltött adatok mennyisége meglehetősen nagy lehet, a kitöltést a rendeletek szerint kell végrehajtani, és sok időt vehet igénybe. Mindazonáltal mindezek a hátrányok után fizetnek le, amikor a felhasználó hozzáférést biztosít a szinte minden szükséges adattal bármilyen kombinációban. A relációs adatbázis forrásadataira vonatkozó fellebbezés csak akkor történik, ha szükséges, ha szükséges részletes információkPéldául egy adott számlát.

Egy többdimenziós adatbázis működésénél a felhasználók száma gyakorlatilag nem érinti. Csak a lekérdezéssel ellentétben elolvasták az adatokat, majd elemezzük a megközelítést, amelyben a korlátozó esetekben a mikrokubéinak száma ugyanolyan sebességgel növekedhet, mint a felhasználók száma.

Ezzel a megközelítéssel az informatikai szolgáltatások terhelése növekszik, amely más adatbázisok is kénytelenek szolgálni a relációs adatbázisokat is. Ezek a szolgáltatások, amelyek felelősek az adatok időszerű automatikus frissítéséért a többdimenziós adatbázisokban.

Az elemzés legszembetűnőbb képviselői, majd a lekérdezési megközelítés az Eszközök Powerplay és az impresszu cég Cognos.

A választás és a megközelítés, és a végrehajtás eszköze, először az összes célcéltól függően: mindig egyensúlyba kell hoznia a költségvetési megtakarítások és a végfelhasználók szolgáltatásának javítását. Emlékeztetni kell arra, hogy a stratégiai tervben az információs és analitikai rendszerek létrehozását a versenyelőny elérésének célja, és nem elkerüli az automatizálás költségeit. Például egy vállalati információs és elemző rendszer képes legyen a szükséges, naprakész és megbízható információkat a cég, amelynek közzétételét a potenciális befektetők számára biztosítja az átláthatóságot és kiszámíthatóságot ez a társaság, amely elkerülhetetlenül lesz a feltétele annak befektetési vonzerejét.

7. Alkalmazási kör OLAP-Technologies.

Az OLAP alkalmazandó, bárhol is van feladat a multifaktor adatok elemzésére. Általánosságban elmondható, hogy van egy táblázat az adatokkal, amelyben legalább egy leíró oszlop (mérés) és egy oszlop van számokkal (intézkedésekkel vagy tényekkel) OLAP eszközzel, szabályként a jelentések elemzésének és generálásának hatékony eszköze lesz .

Tekintsünk az OLAP technológiák egyes alkalmazását a valós életből.

1. Értékesítés.

Az értékesítési struktúra elemzése alapján a menedzsment döntések meghozatalához szükséges kérdésekre vonatkozó kérdések: az áruk, árak, záró és nyitó üzletek, fióktelepek, felmondás és aláírási szerződések kereteinek változása, vagy a hirdetési kampányok megszüntetése stb.

2. Beszerzés.

Feladat az ellenkező értékesítési elemzés. Számos vállalkozás vásárol alkatrészeket és anyagokat a beszállítóktól. Kereskedelmi vállalkozások vásárolnak árut újra. Lehetséges feladatok a beszerzési készlet elemzésénél, a múltbeli tapasztalatok alapján vezérlők a vezetők számáraSzállítók kiválasztása.

3. Árak.

A piaci árak elemzése a beszerzési elemzéssel zárva van. Ennek az elemzésnek a célja a költségek optimalizálása, a leginkább jövedelmező javaslatok kiválasztása.

4. Marketing.

Marketingelemzés alatt csak az ügyfélelemzés vagy a fogyasztói ügyfélszolgálatok területét szem előtt tartjuk. Ennek az elemzésnek a feladata az áruk helyes elhelyezése, a vevők csoportjainak azonosítása a cél reklámozáshoz, a tartomány optimalizálása. Az OLAP feladat ebben az esetben az, hogy a felhasználó gyors eszközt adjon, a gondolat sebessége, válaszok fogadása kérdésekre, intuitív módon előforduló adatelemzésre.

5. Raktár.

A raktárban lévő maradványok szerkezetének elemzése az áruk, raktárak, az áruk tárolásának elemzésében, a címzettek általi szállítás elemzése, és sok más fontos elemzési típus lehetséges, ha van raktárszámlázás.

6. Pénzmozgás.

Ez egy egész elemzési terület, amely sok iskolával és technikával rendelkezik. Az OLAP technológia eszközként szolgálhat a technikák megvalósításához vagy javításához, de nem helyettesítheti őket. A nem készpénz és készpénz pénzösszegei az R AZREZA üzleti tevékenységeiben, az ügyfelek, a devizák és az áramlások optimalizálására, a likviditás stb. A mérések összetétele erősen függ az üzleti, ipari, technikák sajátosságaitól.

7. Költségvetés.

Az OLAP technológiák egyik legtermékenyebb alkalmazása. Nem egy ajándék, a modern költségvetési rendszer nem tekinthető az OLAP-eszközök rendelkezésre állása nélkül a költségvetési elemzéshez. A legtöbb költségvetési jelentés könnyen épül az OLAP rendszerek alapján. Ugyanakkor a jelentések nagyon széles körű kérdésekre válaszolnak: a költségek és bevételek költségeinek elemzése, a különböző egységekből származó egyes cikkek költségeinek összehasonlítása, az egyes cikkek dinamikájának és tendenciáinak elemzése, a költségelemzés és a nyereség.

8. Számviteli fiókok.

A számlaszámból és a bejövő maradékanyagokból álló klasszikus mérlegjelentés, a fordulatszámok és a kimenő maradékok, amelyek tökéletesen elemezhetők az OLAP rendszerben. Ezenkívül az OLAP rendszer automatikusan és nagyon gyorsan kiszámítja a többfilikus szervezet konszolidált mérlegét, havonta, negyedévi és évi egyenlegeket, az aggregált egyensúlyi hierarchiák egyenlegeit, az analitikai egyenlegeket az analitikai jelek alapján.

9. Pénzügyi kimutatások.

A technikailag épített jelentési rendszernek nincs semmi olyan, mint egy olyan megnevezett mutatók, amelyek olyan értékeket tartalmaznak, amelyek a különböző csökkentésekre kell csoportosítani és összegezni, hogy konkrét jelentéseket kapjanak. Ha ez így van, a kijelző és a nyomtatási jelentések a legegyszerűbbek és olcsóak az OLAP rendszerekben. Mindenesetre a vállalkozás belső jelentési rendszere nem olyan konzervált, és újjáépíthető annak érdekében, hogy pénzt takarítson meg a technikai munkákról a jelentések megteremtéséről és a többdimenziós működési elemzés lehetőségeiről.

10. A webhely részvétele.

Az internetes szerver naplófájlja többdimenziós jellegű, ezért alkalmas OLAP elemzésre. A tények: látogatások száma, találatok száma, az oldalra fordított idő és a naplóban rendelkezésre álló egyéb információk.

11. Termelési volumen.

Ez egy másik példa a statisztikai elemzésre. Így elemezhető a termesztett burgonya mennyisége, az áruk által termelt acél mennyisége.

12. A fogyóeszközök fogyasztása.

Képzeld el, hogy több tucat üzletből álló növény, amelyben hűtés, mosófolyadékok, olajok, rongyok, csiszolópapír - több száz fogyóeszköz fogy. A pontos tervezés érdekében a költségoptimalizálás a fogyóeszközök tényleges fogyasztásának alapos elemzését igényli.

13. A helyiségek használata.

Egy másik típusú statisztikai elemzés. Példák: A tanulási közönségek munkaterhelésének elemzése, az épületek és helyiségek bérbeadása, konferenciákhoz stb.

14. Személyi folyékonyság a vállalkozásban.

Elemzése a személyzet áramlásának a vállalkozásban az ágak, osztályok, szakmák, az oktatás szintje, a nem, az életkor, az idő.

15. Személyforgalom.

A jegyek és összegek számának elemzése az évszakok, irányok, autók (osztályok), vonatok (repülőgép) kontextusában.

Ez a lista nem korlátozódik az alkalmazás terjedébeOLAP. - Technológia. Például, fontolja meg a technológiátOLAP. - Az értékesítés elemzése.

8. Példa a használatraOLAP. -A elemzés technológiái az értékesítés területén.

Többdimenziós adatok bemutatásaOLAP. "Az elemzés mérési kártya kialakításával kezdődik. Például az értékesítés elemzése során ajánlatos lehet a piac egyes részeinek (fejlesztő, stabil, nagy és kis fogyasztók, az új fogyasztók valószínűsége stb.), És értékesíti a termékek, területek, vevők, piaci szegmensek értékesítését , Értékesítési csatornák és megrendelésméretek. Ezek az irányok az értékesítés többdimenziós bemutatójának koordináta-hálózatát képezik - a mérések szerkezete.

Mivel bármely vállalat tevékenysége időben folytatódik, az első kérdés, amely az elemzés során előfordul, az üzleti fejlődés dinamikájának kérdése. Az idő tengelyének helyes szervezete lehetővé teszi, hogy minőségi válaszoljon erre a kérdésre. Általában az idő tengelye évekre, negyedekre és hónapokra oszlik. Talán még több zúzódás hetekben és napokon. Az ideiglenes mérési struktúra alakul ki, figyelembe véve az adatbevétel gyakoriságát; Azt is meghatározhatjuk, hogy az igényes információk gyakorisága.

A "árucsoport" mérését úgy fejlesztik ki, hogy maximalizálja az eladott termékek szerkezetének tükrözését. Ugyanakkor fontos, hogy megfeleljen egy bizonyos egyensúlynak, hogy egyrészt a túlzott részletek elkerülése érdekében (a csoportok száma előre láthatónak kell lennie), másrészt - nem hagyja ki a jelentős piaci szegmenst.

Az "ügyfelek" mérése tükrözi az értékesítés struktúráját a területi földrajzi alapon. Minden egyes dimenzióban ritkájú lehet, például ebben a mérésben lehet szerkezet: országok - régiók - Városok - ügyfelek.

Az egységek hatékonyságának elemzéséhez mérést kell létrehozni. Például a hierarchia két szintje megkülönböztethető: részlegek és részlegek, amelyekben szerepelnek a dimenziós dimenzióban.

Valójában a mérések "idő", "áruk", "ügyfelek" teljesen meghatározzák a téma területét.

Ezenkívül hasznos megszakítani ezt a helyet a feltételes területeken, figyelembe véve a számított jellemzőket alapul, például a tranzakciók tartománya értékben. Ezután az egész vállalkozás számos értékes tartományra osztható, amelyekben elvégzik. Ebben a példában a következő mutatókra korlátozható: áruk értékesítése, az eladott áruk száma, a jövedelem összege, a tranzakciók száma, az ügyfelek száma, a gyártók vásárlása mennyisége.

Az OLAP - kocka elemzésre kerül (2. ábra):


2. ábra.OLAP. - A kocka értékesítési elemzéshez

Ez az OLAP háromdimenziós tömbje, és ennek nevezik. Tény, hogy a szigorú matematika szempontjából egy ilyen tömb nem mindig: ebben a kuba, az elemek száma minden dimenziónak meg kell felelnie, és nincs ilyen korlátozások az OLAP kockákból. Az OLAP kocka nem feltétlenül háromdimenziósnak kell lennie. Két- és többdimenziós lehet - a megoldandó feladat függvényében. A súlyos OLAP termékeket a 20 sorrend méréseinek számára számítják ki. Az egyszerű asztali alkalmazások valahol 6 méréssel vannak ellátva.

Nem minden elemet kell kitölteni: Ha nincs információ az áruk értékesítéséről 2 kliens 3 A harmadik negyedévben a megfelelő cellában lévő érték egyszerűen nincs meghatározva.

A kocka azonban nem alkalmas elemzésre. Ha még mindig megfelelő módon nyújthat be vagy ábrázolhat háromdimenziós kockát, akkor hat- vagy hat- vagy nineteenimenal A helyzet sokkal rosszabb. Ezért a hagyományos kétdimenziós táblákat a multidimenzionális kocka használata előtt eltávolítják. Ezt a műveletet "vágás" kockára nevezik. Az elemző, mintha a Kuba mérései, és "csökkenti" az érdekeit. Ilyen módon az elemző kétdimenziós vágott kuba (jelentést) kap, és működik vele. A jelentésszerkezet a 3. ábrán látható.

3. ábra.Analitikai jelentés szerkezete

Vágjuk az OLAP CUBE-t, és megkapjuk a harmadik negyedévben értékesítési jelentést, a következő űrlap lesz (4. ábra).

4. ábra. Értékesítési jelentés harmadik negyedévre

Vághatsz egy kockát egy másik tengely mentén, és jelentést kaphat az áruk csoportjának értékesítéséről 2 az év során (5. ábra).

5. ábra.Negyedéves jelentés az áruk értékesítéséről 2

Hasonlóképpen elemezheti az ügyféllel való kapcsolatot, a kocka vágása ügyfélcímkével (6. ábra)

6. ábra. Jelentés az áruk ellátásáról az ügyfélnek 4

A jelentést hónapokról részletesen részletezi, vagy beszélhet az áruk kínálatáról egy bizonyos ügyfélfiókba.

adattárház az operatív adatbázisok azonnali időtartama alapján tájékoztatási rendszer És talán különböző külső források. Adatraktárakban, adatbázis-technológia, OLAP, mélységi elemzés, adatmegjelenítés használható.

Az adatraktárok fő jellemzői.

  • történelmi adatokat tartalmaz;
  • tárolja a részleteket, valamint részben és teljes mértékben általános adatokat;
  • az adatok főleg statikusak;
  • nem gyulladásmentes, strukturálatlan és heurisztikus adatfeldolgozási módszer;
  • közepes és alacsony tranzakciófeldolgozási intenzitás;
  • az adatok felhasználásának kiszámíthatatlan módszere;
  • elemzésre szánt;
  • Összpontosított tárgy területek;
  • a stratégiai döntések meghozatalának támogatása;
  • viszonylag kis számú magas rangú munkavállalót szolgál fel.

OLAP A kifejezés (on-line analitikai feldolgozás) az adatrekerációs modell leírására és az adatraktárak feldolgozási technológiájának leírására szolgál. Az OLAP az összesített adatok többdimenziós nézetét használja annak érdekében, hogy gyorsan hozzáférhessen a stratégiai szempontból fontos információkhoz a mélyreható elemzéshez. Az OLAP alkalmazásoknak a következő alapvető tulajdonságokkal kell rendelkezniük:

  • többdimenziós adatszolgáltatás;
  • Komplex számítások támogatása;
  • az idő tényezőjének megfelelő elszámolása.

OLAP előnyei:

  • emelés teljesítmény termelési személyzet, fejlesztők alkalmazott szoftver. Időszerű hozzáférés a stratégiai információkhoz.
  • elegendő lehetőséget biztosítva a felhasználók számára, hogy saját változásaikat tegyék a rendszerben.
  • az OLAP alkalmazások alapulnak adattárház és az OLTP rendszer, amely tényleges adatokat fogad, ami megőrzést ad az integritás ellenőrzése vállalati adatok.
  • csökkentett terhelés az OLTP rendszeren és adattárház.

OLAP és OLTP. Jellemzők és fő különbségek

OLAP. OLTP.
Adattároló Tartalmaznia kell mind a belső vállalati adatokat, mind a külső adatokat. az operatív adatbázisba érkező információk fő forrása a vállalat tevékenysége, és az adatelemzés megköveteli a külső információforrások vonzerejét (például statisztikai jelentések)
Az analitikai adatbázis térfogata legalább egy nagyságrenddel több, mint a működőképes. A megbízható elemzés és előrejelzés adattároló Szükség van információval a vállalat tevékenységéről és a piacról több éve Az operatív feldolgozáshoz adatokat igényel az elmúlt néhány hónapban
Adattároló Tartalmaznia kell egységesen bemutatott és következetes információkat, a működési adatbázisok legmegfelelőbb tartalmát. Az összetevő szükséges a különböző forrásokból származó információk kivonásához és "tisztításához". Számos nagyvállalatnál számos operatív IP-k van saját adatbázisukkal (történelmi okokból). A működési adatbázisok szemantikailag egyenértékű információkat tartalmazhatnak különböző formátumok, az érkezési idejének különböző jelzése, néha egyenletes
Az analitikus adatbázis iránti kérelem nem lehet megjósolni. adattárház A nem választott elemzők kéréseire való válaszadás érdekében vannak. Csak arra számíthat, hogy a kérelmek nem fognak túl gyakran áramlanak, és nagy mennyiségű információt érintenek. Az analitikai adatbázis dimenziói ösztönzik az aggregátumokkal (összeg, minimum, maximum, átlagos stb.) Az adatfeldolgozó rendszerek megoldásra kerülnek különleges feladatok. Az adatbázisból származó információk gyakran és kis részekben vannak kiválasztva. Általában az operatív adatbázisra vonatkozó kérelmek már ismertek
Az analitikai adatbázisok alacsony változékonyságával (csak az adatok betöltésekor) vannak ésszerű tömbök, gyorsabb indexelési módszerek a tömegmintákhoz, az előbevágott adatok tárolása Az adatfeldolgozó rendszerek nagyon változóak, amelyet figyelembe vesznek az alkalmazott DBMS-ben (az adatbázis normalizált szerkezete, a húrok rendezetlenek, B-fák indexeléshez, tranzakciósság)
Az analitikai adatbázis információi annyira kritikusak a vállalat számára, hogy nagy védelmi granulálást igényelnek (egyedi hozzáférési jogok bizonyos vonalakhoz és / vagy táblázatoszlopokhoz) Adatfeldolgozó rendszerekhez általában megragad információvédelem Az asztal szintjén

OLAP rendszerek kódkódja

1993-ban a Kódex megjelentette a munkát "OLAP az elemző felhasználóknak: Mit kell lennie." Vázolta a működési analitikus feldolgozás alapfogalmát, és 12 szabályt azonosított azoknak a termékekkel, amelyek lehetővé teszik a működési analitikai feldolgozás végrehajtásának képességét.

  1. Koncepcionális multidimenziós képviselet. Az OLAP modellnek többdimenziósnak kell lennie a bázisában. A többdimenziós fogalmi rendszer vagy az egyéni reprezentáció megkönnyíti a modellezést és az elemzést is, mint számításként.
  2. Átláthatóság. A felhasználó képes az OLAP-Mashina összes szükséges adatait elérni anélkül, hogy még gyanítaná, hogy honnan származnak. Függetlenül attól, hogy az OLAP termék része a felhasználó eszközeinek, vagy sem, ez a ténynek láthatatlannak kell lennie a felhasználó számára. Ha az OLAP-t az ügyfélszolgálat biztosítja, akkor ez a tény, ha lehetséges, láthatatlannak kell lennie a felhasználó számára. Az OLAP-t egy igazán nyitott architektúra keretében kell biztosítani, lehetővé téve a felhasználó számára, bárhol is kommunikáljon egy analitikai eszköz segítségével a szerverrel. Ezenkívül az átlátszást el kell érni, és az analitikai eszköz kölcsönhatásában homogén és heterogén adatbázis-környezetben.
  3. Elérhetőség. Az OLAP-nak meg kell adnia sajátját logikai rendszer Haterogén adatbázis-környezetben való hozzáféréshez és megfelelő konverziókhoz való hozzáféréshez, hogy adatokat szolgáltatjon a felhasználónak. Ezenkívül előre kell vigyázni arról, hogy hol és hogyan és milyen típusúak fizikai szervezet Az adatok valóban használhatók. Az OLAP Systema-t csak az adatok ténylegesen igényelheti, és nem alkalmazandó Általános elv "Konyhai tölcsér", amely felesleges bemenetet tartalmaz.
  4. Állandó teljesítmény Jelentések kidolgozásakor. Teljesítmény A jelentéseknek nem kell jelentősen csökkennek a mérések és az adatbázis méretének növekedésével.
  5. Ügyfél-kiszolgáló architektúra. Szükség van arra, hogy a termék nemcsak a szerverek, hanem azt is, hogy a kiszolgáló összetevője elég intelligens ahhoz, hogy különböző ügyfelek csatlakozzanak a minimális erőfeszítéshez és programozáshoz.
  6. Általános multidimenzionalitás. Minden mérésnek egyenértékűnek kell lennie, az egyes méréseknek egyenértékűnek kell lenniük mind a szerkezetben, mind az operatív képességekkel. Igaz, további operatív képességek megengedettek az egyes mérésekhez (nyilvánvalóan az idő implicit), de ilyen további funkciók Bármilyen méréshez kell biztosítani. Nem szabad, hogy az alapvető adatszerkezetekSzámítógépes vagy jelentési formátumok jellemzőek voltak valamelyik dimenzióra.
  7. Dinamikus kormányzás robbil mátrixok. Az OLAP rendszereknek automatikusan testreszabniuk kell fizikai áramköri mintájukat a modell típusától, az adatmennyiségtől és az adatbázis-távolságtól függően.
  8. Multiplayer támogatás. Az OLAP eszköznek lehetőséget kell biztosítania közös hozzáférés (Kérés és kiegészítések), integritás és biztonság.
  9. Korlátlan kereszt-műveletek. Minden típusú művelet megengedett bármilyen méréshez.
  10. Intuitív adatok manipuláció. Az adatkezelést a cellákon lévő közvetlen cselekvéseken keresztül végeztük a megtekintési módban a menü és a többszörös műveletek használata nélkül.
  11. Rugalmas vételi képességek. A méréseket a jelentésben kell közzétenni, mivel a felhasználó számára szükséges.
  12. Korlátlan

Bevezetés

Manapság szinte bármely szervezet, különösen azok körében, akik hagyományosan összpontosított kölcsönhatás az ügyfelekkel, nem munka korunkban nélkül adatbázis-kezelő rendszerek. Bankok biztosító társaságok, Légi- és egyéb közlekedési vállalatok, szupermarket láncok, telekommunikációs és marketing cégek, a szolgáltatási szektorban és mások által foglalkoztatott szervezetek - mindegyikük összegyűjti és tárolja az ügyfelek, termékek és szolgáltatások gigabájtjainak adatbázisaiban. Az ilyen információk értéke kétségtelen. Az ilyen adatbázisokat működési vagy tranzakciósnak nevezik, mivel ezeket nagyszámú kis tranzakciók, vagy olvasási műveletek jellemzik. Számítógépes rendszerekA műveletek számviteli és valójában a tranzakciós adatbázisokhoz való hozzáférés szokásos, hogy tranzakciós operációs rendszerek (OLTP - on-line tranzakciós feldolgozás) vagy számviteli rendszerek legyenek.

A számviteli rendszerek konfigurálódnak és optimalizálva vannak a tranzakciók maximális száma rövid időközönként. Általában az egyéni műveletek nagyon kicsiek, és nem kapcsolódnak egymáshoz. Mindazonáltal minden olyan adatrekord, amely az ügyféllel való kölcsönhatást jellemzi (a támogatási szolgáltatás, a készpénzes művelet, a katalógus, a vállalat honlapján stb.) a vállalat.

A számviteli rendszerekben lévő analitikai funkciókészlet általában nagyon korlátozott. Az OLTP-alkalmazásokban használt rendszerek megnehezítik az egyszerű jelentések létrehozását, mivel az adatokat leggyakrabban a beállított táblák fölé osztják, és összetett kombinált műveleteket kell végrehajtani az aggregációjukért. Rendszerként az átfogó jelentések megteremtésére irányuló kísérletek nagy számítási teljesítményt igényelnek, és a teljesítmény elvesztéséhez vezetnek.

Ezenkívül folyamatosan változó adatokat tárolnak a számviteli rendszerekben. Mivel a tranzakciók betakarítás, a teljes értékek nagyon gyorsan megváltoznak, így néhány percben végzett két elemzés különböző eredményeket adhat. Leggyakrabban az elemzés a jelentési időszak végén történik, különben a kép torzulhat. Ezenkívül az elemzéshez szükséges adatok több rendszerben tárolhatók.

Bizonyos típusú elemzések olyan strukturális változásokat igényelnek, amelyek érvénytelenek a jelenlegi működési környezetben. Például meg kell találnod, hogy mi történik, ha a cég új termékeket jelenít meg. Az ilyen kutatások elvégzésére élénk bázis lehetetlen. Következésképpen a hatékonyan elemzés ritkán lehetséges közvetlenül a számviteli rendszerben.

Megoldás Támogatás Systems általában megvannak az eszközei, hogy a felhasználó az összesített adatokat különböző mintákban a forrás halmaz egy kényelmes érzékelni és elemzés. Általában az ilyen aggregált funkciók többdimenziós (és tehát egy nem relációs) adatkészletet (gyakran úgynevezett hiperkubusznak vagy metakuchnak) alkotnak, amelyek tengelyei paramétereket és sejteket tartalmaznak - az összesített adatoktól függően - és a Az adatok tárolhatók relációs táblázatokban. Minden tengelyadat mentén egy hierarchia formájában szervezhető különböző szintek részletek. Ennek az adatmodellnek köszönhetően a felhasználók megfogalmazhatják komplex kérésekJelentések létrehozása az adatcsoportok beszerzéséhez.

Pontosan az OLAP (On-line analitikus feldolgozás, működési analitikai feldolgozás, operatív analitikai feldolgozás, operatív analitikai feldolgozás, operatív analitikai feldolgozás, operatív analitikai feldolgozás, operatív analízis), amely az OLTP rendszerek "ORE" -jét a kész "termékhez kapcsolja ", mely vezetők és elemzők közvetlenül használhatják. Ez a módszer lehetővé teszi az elemzők, a vezetők és a vezetők számára a felhalmozott adatok "belsejébe" gyors és összehangolt hozzáférést az információs képviseletek széles köréhez.

Célja lejáratú papírok Az OLAP technológia vizsgálata.

többdimenziós analitikus feldolgozás

Fő rész

1 Olap Alap információ

Az OLAP fogalmának alapja a többdimenziós adatok bemutatásának elve. 1993-ban az Olaped Edgar Codd kifejezés. Miután megvizsgálta a relációs modell hiányosságait, először azt jelezte, hogy a mérések sokféleségének "kombinálja, megtekintheti és elemezheti az adatokat, azaz a módszer a legegyszerűbb a vállalati elemzők számára", és az általános Az OLAP-rendszerekre vonatkozó követelmények, amelyek kiterjesztik a relációs DBMS funkcionalitását, és amelyek többdimenziós elemzést tartalmaznak az egyik jellemzőjeként.

Számos kiadványban az OLAP rövidítése nemcsak az adatok többdimenziós nézetét, hanem az adatok tárolását a többdimenziós adatbázisban is meg kell tárolni. Általánosságban elmondható, hogy helytelen, mivel a kód maga is megjegyzi, hogy a "relációs adatbázisok voltak, vannak a legmegfelelőbb technológia a vállalati adatok tárolására. A szükséglet nem létezik Új technológia DB, A, inkább a meglévő DBMS funkcióinak kiegészítő elemzési eszközeiben, és nagyon rugalmas az OLAP-ban rejlő különböző szellemi elemzés különböző típusainak biztosítása és automatizálása. Az ilyen zűrzavar olyan ellentétekhez vezet, mint az "OLAP vagy ROLAP", ami nem teljesen Helyes, mert a koncepcionális szinten a Rolap (relációs OLAP) támogatja a teljes termikus OLAP funkciót. Úgy tűnik, előnyösebben használható az OLAP használatához a speciális terminális molap többdimenziós DBMS-jén alapulva. Kóddal, többdimenziós koncepcionális ábrázolással (többdimenziós fogalmi nézet) Többszörös perspektíva, amely több független mérésből áll, amelyen bizonyos adatkészletek elemezhetők. A többszörös mérések egyidejű analízisét többdimenziós analízissel definiáljuk. Minden egyes mérés magában foglalja az adatkonszolidációs utasításokat, amelyek az egymást követő általános képletek sorozatából állnak, ahol mindegyik magasabb szint Az NY nagyobb mértékű aggregációnak felel meg a megfelelő méréshez. Tehát mérés.

Az előadó lehet meghatározni az irányt konszolidáció álló szintek általánosítás „Enterprise - Division - osztály - alkalmazottja.” A mérési idő két konszolidációs irányba is tartalmazhat - "Év-negyedév - egy hónapos nap" és "hétnap", mivel az idő és a hetek közötti idők összeegyeztethetetlenek. Ebben az esetben lehetővé válik, hogy önkényes választékot választsunk az egyes mérésekre vonatkozó információk részletezési szintjének. A leszállási művelet (fúrás) megfelel a legmagasabb konszolidációs lépésekből az alacsonyabb mozgáshoz; Éppen ellenkezőleg, az emelési művelet (gördülő) azt jelenti, hogy az alacsonyabb szintekről a legmagasabbra mozognak.

A CODD 12 szabályt határoz meg ahhoz, hogy megfeleljen szoftver OLAP osztály.

1.2 A működési analitikai feldolgozás eszközei

Többdimenziós koncepcionális adatok bemutatása (többdimenziós fogalmi nézet). Az adatmodell fogalmi ábrázolása az OLAP termékben többdimenziósnak kell lennie a természetben, vagyis lehetővé teszi az elemzők számára az intuitív műveletek elvégzését "elemzés (" szelet és kocka "), forgás (forgatható) és elhelyezés (pivot) konszolidáció irányok. Átláthatóság. A felhasználónak nem tudhatja, hogy milyen konkrét eszközöket használnak az adatok tárolására és feldolgozására, mivel az adatok szerveződnek és honnan származnak.

Megközelíthetőség. Az elemzőnek képesnek kell lennie az elemzés elvégzésére az átfogó koncepcionális rendszer keretében, de az adatok továbbra is a régi öröklésből maradt DBMS irányítása alatt maradhatnak, miközben a teljes analitikai modellhez kapcsolódnak. Vagyis az OLAP Toolkitnek a logikai rendszert kell alkalmaznia a fizikai adathordozókra, amely elvégzi az összes átalakítást, amely az egyetlen, következetes és holisztikus felhasználó oldalnézetének biztosításához szükséges.

Fenntartható teljesítmény (következetes jelentési teljesítmény). Az Analytics adatbázis mérésének és méreteinek növekedésével nem tapasztalhat semmilyen termelékenységet bármilyen csökkentéssel. A fenntartható teljesítmény szükséges a könnyű használat fenntartása és szabadságának fenntartása, amelyek az OLAP-t a végfelhasználóhoz kell hozniuk.

Ügyfélszerver architektúra (ügyfél-kiszolgáló architektúra). A működési analitikai feldolgozást igénylő adatok nagy részét a mainframe rendszerekben tárolják, és kivonják személyi számítógépek. Ezért az egyik követelmény az OLAP termékek képesek az ügyfél-kiszolgáló környezetben dolgozni. A fő ötlet az, hogy az OLAP eszközkiszolgáló komponensnek kellően intelligensnek kell lennie, és képesnek kell lennie arra, hogy közös koncepcionális rendszert építsen ki a vállalati adatbázisok különböző logikai és fizikai rendszereinek általánosítására és konszolidációjára, hogy biztosítsa az átláthatósági hatást.

Mérési egyenlőség (generikus dimenzionalitás). Minden adatmérésnek egyenlőnek kell lennie. További jellemzők különálló mérésekkel rendelkezhetnek, de mivel mindegyik szimmetrikus, ez a további funkcionalitás bármely dimenzióhoz adható. Az alapadatszerkezet, a képletek és a jelentési formátumok nem alapulhatnak valamilyen mérésen.

Rarefied mátrixok dinamikus feldolgozása (dinamikus sparse mátrixkezelés). Az OLAP eszköznek optimális feldolgozását kell biztosítania a sparse mátrixokról. A hozzáférési sebességet az adatsejtek helyétől függetlenül kell tárolni, és állandó értéke lehet a különböző számú méréssel és különböző adatokkal.

Multiplayer támogatás (többfelhasználós támogatás). Gyakran több elemzőnek van szükségük arra, hogy egyidejűleg egy analitikai modellt működjenek, vagy különböző modelleket hozzanak létre egyes vállalati adatok alapján. Az OLAP eszköznek versenyképes hozzáférést kell biztosítania, biztosítva az adatok integritását és védelmét.

Korlátlan keresztdimenziós műveletek támogatása (korlátlan keresztdimenziós műveletek). Számítások és adatok manipulálása bármely mérés szerint nem tilthatja vagy korlátozhatja az adatsejtek közötti kapcsolatokat. A tetszőleges meghatározást igénylő átalakításokat funkcionális teljes formában kell beállítani.

Intuitív adatkezelés (intuitív adat manipuláció). A konszolidációs irányok átirányítását, az adatokat oszlopokban és vonalakban, aggregációban és más manipulációkban, a konszolidációs irányok hierarchiájának szerkezetére jellemző, kényelmes, természetes és kényelmes felhasználói felületként kell végrehajtani.

Rugalmas jelentés generációs mechanizmus (rugalmas jelentések). Az adatmegjelenítés különböző módszereit meg kell tartani, vagyis a jelentéseket bármilyen lehetséges orientációban kell benyújtani.

Korlátlan mérési és aggregációs szintek (korlátlan méretek és aggregációs szintek). Erősen ajánlott feltételezés minden komoly OLAP eszköz legalább tizenöt, és jobb húsz, mérés az analitikai modellben.

2 komponens OLAP rendszerek

2.1 Szerver. Ügyfél. az internet

Az OLAP lehetővé teszi, hogy gyorsan és hatékonyan elemezze a nagy mennyiségű adatokat. Az adatokat többdimenziós formában tárolják, amely a leginkább tükrözi a valódi üzleti adatok természetes állapotát. Ezenkívül az OLAP gyorsabban és könnyebben fogadja az összefoglaló adatokat. Ezzel lehet, ha szükséges, hogy elmélyítse (fúrja le) az adatok tartalmába, hogy részletesebb információkat kapjon.

Az OLAP rendszer számos komponensből áll. A legmagasabb nézet szinten a rendszer tartalmaz adatforrást, OLAP kiszolgálót és ügyfelet. Az adatforrás olyan forrás, amelyről az adatokat elemezzük. A forrásból származó adatok átkerülnek vagy átmásolódnak az OLAP kiszolgálóra, ahol rendszeresen rendszereznek és előkészítik gyorsabban a kérelmekre adott válaszokat. Az ügyfél egy felhasználói felület az OLAP kiszolgálóhoz. A cikk ezen részének leírja az egyes komponensek funkcióit és az egész rendszer egészének értékét. Források. Az OLAP rendszerek forrása olyan kiszolgáló, amely adatokat szolgáltat az elemzéshez. Az OLAP termék felhasználási területétől függően a forrás adattárházként szolgálhat az általános adatokat tartalmazó adatraktárként, az általános adatokat tartalmazó táblázatok, amelyek kombinálják a pénzügyi adatokat vagy a felsorolt \u200b\u200bbármely kombinációt. Nagyon fontos az OLAP termék különböző forrásokból származó adatokkal való együttműködésre. Egyetlen formátum követelménye vagy egybázisúAmelyben a forrásadatok tárolódnak, nem megfelelő adatbázis-adminisztrátorok. Ezenkívül ez a megközelítés csökkenti az OLAP termék rugalmasságát és teljesítményét. Az adminisztrátorok és a felhasználók úgy vélik, hogy az OLAP termékek, amelyek az adatkivonást nemcsak a különböző, hanem több forrásból is biztosítják, akkor rugalmasabbak és hasznosak, mint azok, amelyek szigorúbb követelményekkel rendelkeznek.

Szerver. Az OLAP rendszer alkalmazása OLAP szerver. Ez az összetevő teljes munkát végez (a rendszermodelltől függően), és tárolja az összes olyan információt, amelyhez aktív hozzáférés biztosított. A szerver architektúra különböző fogalmakat kezel. Különösen az OLAP termék fő funkcionális jellemzője többdimenziós adatok (MMBD, MDDB) vagy relációs (RDB, RDB) adatbázis használata. Aggregált / előtagolt adatok

A gyors lekérdezés megvalósítása elengedhetetlen az OLAP számára. Ez az OLAP egyik alapelvei - az adatok intuitív manipulálási képessége az információ gyors kitermelését igényli. Általánosságban elmondható, hogy a több számítástechnika szükséges az információ töredékének előállításához, a lassabb a válasz. Ezért, hogy egy kis lekérdezési idő, az információs töredékek, a fellebbezés, amelyre általában leggyakrabban előfordul, de amelyek számításokat igényelnek, elő-aggregáció. Vagyis azokat az adatbázisban új adatokként kell tárolni. Egy olyan adattípus példájaként, amely megengedhető, hogy előre kiszámolható, összefoglaló adatok - például hónapok, negyedek vagy évek értékesítési mutatói, amelyekre a napi mutatókat ténylegesen beírják.

A különböző beszállítók betartják az elő-aggregációt igénylő paraméterek kiválasztásának különböző módszereit és az előre kiszámított értékek számát. Az aggregáció megközelítése befolyásolja az adatbázist és a kérelmek végrehajtása során. Ha több értéket számítanak ki, annak valószínűsége, hogy a felhasználó már kiszámított értéknövekedést kér, ezért a válaszidő csökken, mivel nem szükséges megkérdezni a kiszámításhoz szükséges kezdeti értéket. Ha azonban az összes lehetséges értéket kiszámítja - ez nem a legjobb megoldás - ebben az esetben az adatbázis mérete jelentősen növekszik, ami megnövekedett, és az aggregációs idő túl nagy lesz. Ezenkívül az adatbázishoz numerikus értékeket adnak hozzá, vagy ha változnak, ezeket az információkat az új adatoktól függően előre kiszámított értékekben kell tükrözni. Így az adatbázis-frissítés sok időt is igénybe vehet nagyszámú előre kiszámított érték esetén. Mivel általában az aggregáció során az adatbázis önállóan működik, kívánatos, hogy az aggregációs idő nem túl hosszú.

Ügyfél. Az ügyfél csak az adatbázisban szereplő adatok ábrázolására és manipulálására szolgál. Az ügyfél meglehetősen egyszerű lehet - olyan táblázat formájában, amely magában foglalja az ilyen OLAP képességeket, például az adatforgást (pivoting) és az adatok (fúrás), és specializálódott, de ugyanolyan egyszerűen a jelentések megtekintésének módja Vagy ugyanolyan hatékony eszköz, amint azt a létrehozott, az adatokkal kapcsolatos komplex manipulációkra tervezett alkalmazás megrendelésére. Az internet az ügyfél új formája. Ezenkívül új technológiák nyomtatását hordozza; Számos internetes megoldás jelentősen különbözik a képességeikben, mint az egész és az OLAP megoldás - különösen. Ez a rész az egyes ügyfelek különböző funkcionális tulajdonságait tárgyalja.

Annak ellenére, hogy a szerver olyan, mint egy "gerinc" OLAP megoldások, az ügyfél nem kevésbé fontos. A szerver szilárd alapot nyújthat az adatok manipulációinak megkönnyítéséhez, de ha az ügyfél bonyolult vagy kicsi, a felhasználó nem fogja használni az összes hatékony szerver előnyeit. Az ügyfél olyan fontos, hogy sok beszállító kizárólag az ügyfél fejlesztésére irányuljon erőfeszítéseikre. Az ilyen alkalmazásokban szereplő összes szabványos megjelenés az interfész, előre definiált funkciók és szerkezet, valamint a többé-kevésbé szabványos helyzetek gyors megoldásai. Például a pénzügyi csomagok népszerűek. Az előre létrehozott pénzügyi alkalmazások lehetővé teszik a szakemberek számára, hogy ismerős pénzügyi eszközöket használjanak anélkül, hogy adatbázis-struktúrát vagy általánosan elfogadott formákat és jelentéseket kellene tervezniük. Kérjen eszközöket / jelentési generátort. Az Eszközök vagy Jelentésgenerátor könnyű hozzáférést biztosít az OLAP adatokhoz. Könnyen használhatóak grafikus felület és lehetővé teszi a felhasználók számára, hogy jelentést készítsenek az objektumok mozgására a jelentésben a módszer szerint " húzza és. DROP ". Mivel a hagyományos jelentésgenerátor biztosítja a felhasználót, hogy gyorsan felszabadítsa a formázott jelentések gyors felszabadítását, az OLAP formanyomtatványt támogató generátorokat. A végtermék olyan jelentés, amelynek lehetősége van az adatokra, a részletek szintjére, a forgatáshoz (pivál ), támogató hierarchiák és dr. kiegészítők (kiegészítések) táblázatok.

Napjainkban számos üzleti területen a vállalati adatelemzés különböző formái táblázatkezelők segítségével készülnek. Bizonyos értelemben ez a tökéletes eszköz az adatok létrehozásához és az adatok megtekintéséhez. Az elemző létrehozhat makrókat a kiválasztott irányban dolgozó adatokkal, és a sablon úgy alakítható ki, hogy az adatok bemenetek esetén a képletek kiszámítják a megfelelő értékeket, kiküszöbölve az egyszerű számítások ismételt megszakításának szükségességét.

Mindazonáltal mindez "lapos" jelentést ad eredményeként, ami azt jelenti, hogy amint létrejött, nehéz meghatározni, hogy különböző szempontból. Például egy diagram egy időtartamra információt jelenít meg, mondjuk egy hónapra. És ha valaki napi mutatókat szeretne látni (egy hónapos adatokkal ellentétben), akkor szükség lesz egy teljesen új diagram létrehozására. Új adathalmaz meg kell határozni, új címkék a diagram, és még sok más, egyszerű, de munkaigényes változásokat. Ezenkívül vannak olyan területek, amelyekben hibák lehetnek, ami általában csökkenti a megbízhatóságot. Ha az OLAP-ot hozzáadja az asztalhoz, akkor egyetlen diagramot is létrehozhat, majd különböző manipulációknak kell alávetni annak érdekében, hogy a felhasználó rendelkezzen a szükséges információkkal anélkül, hogy minden lehetséges ábrázolást megteremtené. Internet, mint ügyfél. Az OLAP Client család új tagja az internet. Rengeteg előnye van az OLAP jelentések kialakításában az interneten keresztül. A legjelentősebb a szakosodott szoftverek szükségességének hiánya az információk eléréséhez. Ez egy csomó időt és pénzt takarít meg.

Minden internetes termék specifikus. Néhány egyszerűsíti a weboldalak létrehozását, de kevesebb rugalmasságot biztosít. Mások lehetővé teszik, hogy adatnézeteket hozzon létre, majd mentse őket statikus HTML fájlként. Mindez lehetővé teszi az adatok interneten keresztül történő megtekintését, de többé. Nem lehet aktívan manipulálni az adatokat a segítségükkel.

Van egy másik típusú termék - interaktív és dinamikus, így az ilyen termékeket teljes körű eszközökké alakítják. A felhasználók elmélyíthetik az adatokat, a forgathatóságot, a mérési határokat stb. Az internet végrehajtásának kiválasztása előtt fontos megérteni, hogy mely funkcionalitás szükséges a webes megoldásból, majd meghatározza, hogy melyik terméket kell meghatározni a legjobb mód megtestesíti ezt a funkciót.

Alkalmazások. Az alkalmazások olyan ügyféltípusok, amelyek OLAP adatbázisokat használnak. Ezek megegyeznek a fent leírt lekérdezési eszközökkel és jelentésgenerátorokkal, de továbbá hozzájárulnak a termék szélesebb körű funkcionalitásához. Az alkalmazás általában nagyobb teljesítményű, mint a kérés eszköz.

Fejlődés. Általában az OLAP szolgáltatók fejlesztési környezetet biztosítanak a saját konfigurált alkalmazások felhasználói számára. A fejlesztési környezet egésze egy olyan grafikus felület, amely támogatja az objektumorientált alkalmazási fejlesztést. Ezenkívül a legtöbb beszállító olyan API-kat biztosít, amely az OLAP adatbázisok más alkalmazással történő integrálására használható.

2.2 OLAP - ügyfelek

Az OLAP ügyfelek beépített OLAP-géprel vannak felszerelve a felhasználói számítógépeken. Nem igényelnek kiszolgálót a számítástechnika számára, és ezek a nulla adminisztráció. Az ilyen ügyfelek lehetővé teszik a felhasználó számára, hogy beállítsa az adatbázisokat; Rendszerint egy olyan szótárat hoz létre, amely elrejti az adatok fizikai struktúráját a témakör leírása, egy világos szakember számára. Ezt követően az OLAP kliens tetszőleges kéréseket végez, és eredményeik megjelenítik őket az OLAP asztalon. Ebben a táblázatban a felhasználó manipulálhatja az adatokat, és több százféle jelentést kap a képernyőn vagy papíron. Az RDBD-vel való együttműködésre tervezett OLAP-ügyfelek lehetővé teszik a vállalatban rendelkezésre álló adatok elemzését például az OLTP adatbázisban tárolt adatokat. A második hozzárendelésük azonban gyors és olcsó tárhelyek vagy adatbázisok létrehozása lehet - ebben az esetben a szervezet programozóknak csak a relációs adatbázisokban és az adatrakodási eljárásokban egy sor táblázatkészletet kell létrehozniuk. A munka leginkább fogyasztó része a felhasználói lekérdezések és jelentések számos lehetőségeinek megnyitása az OLAP kliensben szó szerint néhány órában valósul meg. Az ilyen program fejlesztésének végső felhasználója körülbelül 30 percet igényel. Az OLAP ügyfeleket az adatbázisfejlesztők maguk nyújtják, mind a többdimenziós, mind a relációs. Ez a SAS vállalati riporter, amely szinte hivatkozás a termék, az Oracle Discoverer, a MS Pivot Services és a Pivot asztal, stb. Számos program, amely az MS OLAP szolgáltatásokkal együttműködve az OLAP keretein belül kerül szállításra a tömegkampányban , amely Microsoft Corporation-t vezet. Általános szabályként javulnak a Pivot TABLE OPCIÓK, és az MS Office vagy webböngészőben való használatra készültek. Ezek a Matryx, Knosys cégek stb. Termékei, az egyszerűségnek, az olcsóságnak és a hatékonyságnak köszönhetően nagy népszerűséget szerzett Nyugaton.

3 OLAP termék besorolás

3.1 Többdimenziós OLAP

Jelenleg számos termék van jelen a piacon, amely különböző mértékben az OLAP funkcionalitást biztosítja. A felhasználói felület többdimenziós fogalmi képviseletének biztosítása a forrásbázishoz, az összes OLAP termék három osztályba sorolható a forrásbázis típusával.

1. Az első operatív analitikai feldolgozó rendszerek (például Essbase Arbor Software, Oracle Express Server Company) kapcsolódnak a molap osztályhoz, vagyis csak saját többdimenziós adatbázisokkal működhetnek. A multidimenziós DBMS védett technológiáin alapulnak, és a legdrágábbak. Ezek a rendszerek teljes OLAP feldolgozási ciklust biztosítanak. Vagy a szerverkomponens, a saját integrált ügyfélfelületen kívül, vagy a felhasználó kommunikálása. külső programok Dolgozzon táblázatokkal. Az ilyen rendszerek fenntartása érdekében különleges személyzetre van szükség a telepítéssel, a rendszerhez, a végfelhasználók számára az adatnézetek kialakulásával.

2. A relációs adatok (ROLAP) operatív analitikai feldolgozására szolgáló rendszerek (ROLAP) lehetővé teszik a relációs alapon tárolt adatokat többdimenziós formában, amely többdimenziós modellt biztosít a metaadatok köztes rétegén keresztül. Ez az osztály magában foglalja a MicroStrategy, a MetaCube Informix Company, a döntéshozatali információs előnyök és mások DSS-csomagját. Szoftver csomag Az Oroszországban kifejlesztett infovista, az Ivanovo Állami Energia Egyetemen is ez az osztály rendszere. A Rolap rendszerek jól illeszkednek a nagy tároláshoz való munkához. Mint a molap rendszerek, jelentős szolgáltatási költségeket igényelnek az informatikai szakemberek számára, és többjátékos működést biztosítanak.

3. Végül a hibrid rendszerek (Hybrid OLAP, HOLAP) célja az előnyök kombinálása és minimalizálása az előző osztályokban rejlő hiányosságok minimalizálása. A Speedware Media / MR tartalmazza ezt az osztályt. A fejlesztők szerint az analitikai rugalmasságot és molap válaszsebességet ötvözi, amely állandó hozzáférést biztosít a reál adatokhoz, amelyek a rolaphoz kapcsolódnak.

A felsorolt \u200b\u200balapok mellett van egy másik osztály - eszközök az asztali számítógépek kéréseinek és jelentéseinek létrehozására, az OLAP funkciók által kiegészített vagy a külső eszközökkel integrált külső eszközökkel. Ezek a jól fejlett rendszerek a forrásforrásokból származó adatok mintát hajtanak végre, átalakítják őket, és dinamikus multidimenziós adatbázisba helyezik az ügyfélvég-felhasználói állomáson. Ennek az osztálynak a fő képviselői a BusinessObjects a Társaság, a Brioquery Company Brio Technology és Powerplay Cognos társasága. Néhány OLAP termék áttekintése az alkalmazásban található.

A többdimenziós adatok bemutatásán alapuló speciális DBMS-ben az adatokat nem relációs táblázatok formájában szervezik, de rendezett többdimenziós tömbök formájában:

1) Hypercubes (az adatbázisban tárolt összes sejtnek azonos méretűnek kell lennie, azaz a maximális mérési alapon kell lennie) vagy

2) Policubes (minden egyes változó a saját mérési készletével van tárolva, és a feldolgozás összes összetettsége a rendszer belső mechanizmusaira kerül.).

A multidimenzionális adatbázisok használata a működési analitikai feldolgozás rendszereiben a következő előnyökkel jár.

1. A multidimenzionális DBMS használatának esetében az adatok keresése és mintavétele sokkal gyorsabban történik, mint a relációs adatbázis többdimenziós fogalmi megjelenésében, mivel a többdimenziós adatbázis denormalizált, előre aggregált mutatókat tartalmaz, és optimalizált hozzáférést biztosít a kért sejteket.

2. A többdimenziós DBMS-ek könnyedén megbirkózhatnak a különböző beépített funkciók információs modelljében történő befogadás feladataival, miközben objektíven meglévő korlátozások sQL nyelv Tegye meg ezeket a feladatokat a relációs DBMS-en alapulva, és néha lehetetlen.

Másrészt jelentős korlátozások vannak.

1. A többdimenziós DBMS-ek nem teszik lehetővé nagy adatbázisokkal való munkát. Ezenkívül a denormalizáció és az előválasztott aggregáció miatt a többdimenziós bázisban lévő adatok mennyisége általában megfelel (a kód értékelésével) 2,5-100 alkalommal a kisebb mennyiségű forrás részletes adatait.

2. A relációs módszerrel összehasonlítva a többdimenziós DBMS-eket nagyon nem hatékonyan használják külső memória. Az esetek túlnyomó többségében az információs hypercube erősen ritkább, és mivel az adatokat megrendelt formában tárolják, a bizonytalan értékeket csak az optimális válogatási sorrend kiválasztásával törli, amely lehetővé teszi az adatok megszervezését a maximális folyamatos csoportokba . De még ebben az esetben is a probléma csak részben oldódik meg. Ezenkívül a válogatási eljárás valószínűleg optimális a tárolás szempontjából, a válogatás sorrendje valószínűleg nem egyezik meg a leggyakrabban használt sorrendben. Ezért B. valódi rendszerek Meg kell keresnie a kompromisszumot az adatbázis által elfoglalt lemezterület sebességének és redundanciájának között.

Következésképpen a többdimenziós DBMS használata csak a következő feltételek mellett indokolt.

1. Az elemzésre vonatkozó forrásadatok mennyisége nem túl nagy (legfeljebb néhány gigabájt), azaz az adatgyűjtés szintje meglehetősen magas.

2. Az információs mérések sorozata stabil (mivel a szerkezetük bármely változása szinte mindig teljes hypercube-szerkezetátalakítást igényel).

3. A nem választott kérelmek rendszerének válaszideje a legkritikusabb paraméter.

(4) A komplex beágyazott funkciók széles körű használata a hypercuba sejtjei fölött kereszt-dimenziós számítások elvégzéséhez szükséges, beleértve a felhasználói funkciók írásának lehetőségét is.

A relációs adatbázisok közvetlen használata a működési analitikai feldolgozás rendszereiben a következő előnyökkel jár.

1. A legtöbb esetben a vállalati adatraktárokat relációs DBMS segítségével valósítják meg, és a Rolap eszközök lehetővé teszik, hogy közvetlenül a fölöttük elemzhetők legyenek. Ebben az esetben a tárolási méret nem olyan kritikus paraméter, mint a molap esetében.

(2) A feladat változó dimenziója esetén, amikor a mérési struktúra változásait gyakran meg kell tenni, a dinamikus dimenziós ábrázolással rendelkező ROLAP rendszer optimális megoldás, mivel ezek a módosítások nem igénylik az adatbázis fizikai átszervezését .

3. A relációs DBMS-ek jelentősen magasabb szintű adatvédelmet és jó hozzáférési jogot biztosítanak a határozathoz.

A rolap fő hátránya a multidimenzionális DBMS-hez képest kevesebb teljesítmény. A molaphoz hasonló teljesítmény biztosítása érdekében a relációs rendszerek alapos vizsgálatot igényelnek az adatbázis-diagram és az indexbeállítások, azaz nagy erőfeszítések az adatbázis-adminisztrátoroktól. Csak csillag alakú rendszerek használata esetén a jól konfigurált relációs rendszerek teljesítményét a többdimenziós adatbázisokon alapuló rendszerek teljesítményével lehet megközelíteni.

A Star Scheme (Star Schema) leírása és annak használatára vonatkozó ajánlások teljes mértékben foglalkoznak a munkához. Az ötlete, hogy vannak asztalok minden egyes méréshez, és az összes tényt egy táblázatba helyezzük, amelyet az egyes mérések kulcsából álló többszörös kulcs (A) függelék) indexelnek. A Csillag-rendszer minden egyes sugárzása a kódexkódexben, az adatok konszolidációjának iránya a megfelelő mérésre.

A többszintű mérésekkel rendelkező nehéz feladatokban érdemes a Star Scheme Extensions - Constellation Scheme (Tavill Constellation Schema) és a hópehely séma (hópehely séma) hivatkozni. Ezekben az esetekben egyedi tényezők jönnek létre a különböző mérések általánosításának lehetséges kombinációihoz (B. függelék). Ez lehetővé teszi, hogy jobb teljesítményt érjen el, de gyakran az adat redundanciájához és az adatbázis-struktúra jelentős szövődményeihez vezet, amelyben kiderül nagy mennyiség Tényes táblázatok.

A tények számának növelése az adatbázisban nemcsak a különböző mérések szintjének sokaságából származhat, hanem abból a tényből is, hogy általában a tények különböző mérési készletekkel rendelkeznek. Az egyes mérések kivételével a felhasználónak meg kell adnia a maximális teljes hypercube vetületét, és messze az indikátorok értékeiből az elemi összegzés eredménye. Így számos független méréssel támogatni kell több olyan ténytáblákat, amelyek megfelelnek a mérési kérelmek minden lehetséges kombinációjának, amely szintén a külső memória egyértelmű felhasználását eredményezi, az adatmeghatározási idő növekedése az adatbázisban A csillagdiagram külső forrásokból és adminisztrációs nehézségekből áll.

Részben oldja meg az SQL nyelvi bővítésének (Csoport a kockaüzemeltetők, a "Group by Rollup" és a "Csoport csoportosító készletek"); Ezenkívül kompromisszumos keresési mechanizmust kínál a redundancia és a sebesség között, és a ténytáblák létrehozása nem Minden lehetséges mérési kombináció., De csak azok számára, akiknek sejtjei nem érhetők el a tények teljes teljes tényeinek (B. függelék) későbbi összes aggregációjával.

Mindenesetre, ha a többdimenziós modell relációs adatbázisként valósul meg, hosszú és "keskeny" tényasztalokat és viszonylag kicsi és "széles" mérési táblákat kell létrehoznia. A ténytáblák tartalmazzák a hypercube-sejtek numerikus értékeit, és a fennmaradó táblázatok meghatározzák a többdimenziós alapot tartalmazó többdimenziós mérési alapot. Az információ egy részét az egyenletesen normalizált struktúrákkal elosztott dinamikus adatgyűjtéssel lehet elérni, bár emlékezni kell arra, hogy a lekérdezés magában foglalja az aggregációt egy erősen sérült BD struktúrával, nagyon lassan hajtható végre.

A csillag alakú relációs modellekkel rendelkező többdimenziós információk bemutatásának orientációja lehetővé teszi, hogy megszabaduljon a ritkált mátrixok tárolásának optimalizálásának problémájával, élesen többdimenziós DBMS (ahol a termékproblémát az áramkör különleges kiválasztásával oldják meg). Bár az egész bejegyzést az egyes cellák tárolására használják, amely maga az értékek mellett magában foglalja a másodlagos kulcsokat - a mérési táblákra való hivatkozások, a nem létező értékek egyszerűen nem szerepelnek a ténytáblában.

Következtetés

Miután megvizsgálta a munka és a technológia alkalmazása Olappered cégek felmerül kérdéseket, a válaszok, amelyek lehetővé teszik, hogy válasszon a termék legjobban megfelel a felhasználó igényeinek.

Ezek a következő kérdések:

Hogyan jönnek az adatok? - Az elemezni kívánt adatok különböző helyeken lehetnek. Lehetséges, hogy az OLAP adatbázis megkapja őket a vállalati adatraktárból vagy az OLTP rendszerből. Ha az OLAP termék már képes hozzáférni az adatok forrása, a kategorizálás és az adat tisztítási folyamatok csökken.

Milyen manipulációi a felhasználó elvégzi az adatokat? -
Amint a felhasználó hozzáférést kapott az adatbázishoz, és elkezdte elvégezni az elemzést, fontos, hogy képes legyen megfelelően működtetni az adatokat. A felhasználó igényeitől függően előfordulhat, hogy erőteljes jelentésgenerátorra van szükség, vagy a dinamikus weboldalak létrehozásának és elhelyezésének képessége. Ugyanakkor előnyösebb lehet, hogy egyszerű és gyors, hogy saját alkalmazásait hozza létre.

Mi az adat teljes összege? - Ez az OLAP adatbázis meghatározásának legfontosabb tényezője. A relációs OLAP termékek nagy mennyiségű adatban képesek működni, mint a többdimenziós. Ha az adatok mennyisége nem igényel a relációs bázis használatát, akkor a többdimenziós termék nem kevesebb sikert alkalmazhat.

Ki a felhasználó? - Az OLAP kliens meghatározásakor fontos a felhasználói képesítési szint szintje. Egyes felhasználók kényelmesebbek az OLAP integrálásához egy asztalhoz, míg mások speciális alkalmazást preferálnak. A felhasználó minősítésétől függően a képzés elvégzésének kérdése is megoldódott. A nagyvállalat a felhasználók számára képzéseket kíván fizetni, egy kisebb vállalat megtagadhatja őket. Az ügyfélnek olyannak kell lennie, hogy a felhasználók magabiztosak legyenek, és hatékonyan használják.

Ma a legtöbb globális vállalat az OLAP használatára költözött alaptechnika Tájékoztatást ad a döntéshozóknak. Ezért a meg kell határozni, hogy meg kell határozni, hogy ne alkalmazzák a táblázatokat, mint a jelentéstétel, a költségvetés és az előrejelzés fő platformját. A vállalatoknak meg kell kérdezniük magukat, hogy készen állnak-e arra, hogy elveszítsenek versenyképes előnyöket a pontatlan, irreleváns és hiányos információk felhasználásával, mielőtt érik és fontolják meg az alternatív technológiákat.

Ezenkívül meg kell jegyezni, hogy az OLAP technológiák analitikai képességei növelik az információk vállalati tárolásában tárolt adatok felhasználását, lehetővé téve a vállalat számára, hogy hatékonyabban kölcsönhatásba lépjen ügyfeleikkel.

Szójegyzék

Koncepció Meghatározás
1 BI eszközök Az információk eléréséhez használt eszközök és technológiák. Tartalmazza az OLAP technológiát, az adatbányást és az összetett elemzést; Az eszközök és eszközök megértése a nem választott kérelmek építéséhez, eszköztár a gazdasági tevékenység és a vállalati jelentési generátorok felügyeletére.
2 On-line analitic feldolgozás, OLAP (operatív analitikai feldolgozás) Az analitikai információ feldolgozásának valós idejű technológiája, beleértve a jelentések és dokumentumok összeállítását és dinamikus közzétételét.
3 Szelet és kocka (hosszirányú és keresztirányú szakaszok, szó szerint - "szeletek és kockák vágása") Az OLAP eszközök által biztosított adatok összetett elemzésének leírására használt kifejezés. A többdimenziós kocka adatai kiválasztása meghatározott értékekkel és adott kölcsönös mérési elrendezéssel.
4 Rotáció (adat) adatok (adatcsomag) A táblázat elforgatása adatokkal, azaz oszlopok átalakítása a karakterláncba és fordítva.
5 Számított tag Mérőelem, amelynek értékét más elemek (például matematikai vagy logikai alkalmazások) értéke határozza meg. A számított elem lehet az OLAP kiszolgáló része, vagy a felhasználó az interaktív munkamenet során leírható. A számított elem bármely olyan elem, amely nincs megadva, de kiszámítása.
6 Globális üzleti modellek (globális üzleti modellek) Az adatraktár típusa, amely hozzáférést biztosít a különböző vállalati rendszereken elosztott információkhoz, és különböző osztályok vagy részlegek irányítása alatt áll, különböző adatbázisokkal és adatmodellekkel. Az ilyen típusú adatraktárat nehéz felépíteni annak szükségessége miatt, hogy össze kell egyesíteni a különböző divíziók felhasználói erőfeszítéseit, hogy közös adatmodellt dolgozzanak ki a tárolóhoz.
7 Adatbányászat (adatbányászat) Technikai technikák, amelyek használatosak szoftvereszközökEgy ilyen felhasználó számára, amely általában nem mondhat előre, amely kifejezetten keres, és csak bizonyos mintákat és keresési utasításokat jelezhet.
8 Ügyfél / szerver (kliens / szerver) A technológiai megközelítés, amely a folyamat elválasztása, hogy elkülönítse a funkciókat. A kiszolgáló több funkciót hajt végre - kommunikációs menedzsment, adatbázis-szolgáltatás fenntartása stb. Az ügyfél egyedi felhasználói funkciókat hajt végre - megfelelő interfészeket biztosít, a képernyőn belüli navigáció végrehajtása, segítségnyújtási jellemzők (segítség), stb.
9 Többdimenziós, Sumbd (többdimenziós adatbázis, MDBS és MDBMS) Erőteljes adatbázis, amely lehetővé teszi a felhasználók számára a nagy adatmennyiségek elemzését. Adatbázis speciális tároló szervezet - kockák, amelyek nagy sebességet biztosítanak a tények, mérések és előre kiszámított aggregátumok formájában tárolt adatokkal.
10 Fúrja le (fúrja le) A teljes adatszint elemzéséhez használt részletes adatok tanulmányozásának módja. A "mélyülés" szintje attól függ, hogy az adat részletessége [rangsorban.
11 Központi raktár (központi raktár)

1. Adatbázisokat tartalmazó adatbázis operációs rendszer Szervezetek. Van egy olyan szerkezet, amely kényelmes az adatelemzéshez. Célja, hogy támogassa a döntéshozatalt és a vállalat egyetlen információs területének létrehozását.

2. Automatizálási módszer, amely az egyik helyről kezelt összes információs rendszert lefedi.

1 golitsin o.l., Maksimov N.V., Popov I.I. Adatbázis: Tutorial. - M.: Fórum: Infra-M, 2003. - 352 p.

2 dátum K. Bevezetés az adatbázisrendszerekhez. - M.: HUKA, 2005 - 246 p.

3 Elmanova N.V., Fedorov A.a. Bevezetés a Microsoft OLAP technológiához. - M.: MAFI párbeszédablak, 2004. - 312 p.

4 karpova ts Adatbázisok: modellek, fejlesztés, kivitelezés. - SPB.: Peter, 2006. - 304 p.

5 Korovkin S. D., Levenz I. A., Ratmanova I. D., Starykh V. A., Schowelev L. V. Az adatraktározási információk átfogó működési elemzésének problémája // DBMS. - 2005. - № 5-6. - 47-51 p.

6 Kchedov N., Ivanov P. Termékek a számítógépes-moszkvai adatok szellemi elemzéséhez. - 2003. - № 14-15. - 32-39 p.

7 Priyalkovsky v.v. A nagy mennyiségű adatok nehéz elemzése: Számítógépes // DBMS új perspektívái. - 2006. - № 4. - 71-83 p.

8 Sakharov A. A. Az információs rendszerek építésének és végrehajtásának fogalma orientált adatok // DBMS. - 2004. - № 4. - 55-70 p.

9 Ulman J. Az adatbázisrendszerek alapjai. - M.: Finanszírozás és statisztikák, 2003. - 312 c.

10 Hubbard J. Automatizált adatbázis-tervezés. - M.: Mir, 2007. - 294 p.


Korovkin S. D., Levenz I. A., Ratmanova I. D., Starykh V. A., Schowelev L. V. Az adatok raktározási információinak integrált működési elemzésének problémájának megoldása / / DBMS. - 2005. - № 5-6. - 47-51 p.

Ulman J. Az adatbázisrendszerek alapjai. - M.: Finanszírozás és statisztikák, 2003. - 312 c.

Barcegian A.a., Kupriyanov M.S. Adatelemzés Technológiák: Datamining, VisualMining, Textmining, OLAP. - SPB.: BHV-PETERSBURG, 2007. - 532 p.

Elmanova N.V., Fedorov A.a. Bevezetés a Microsoft OLAP technológiához. - M.: MAFI párbeszédablak, 2004. - 312 p.

K. Dátum. Bevezetés az adatbázisrendszerekhez. - M.: HUKA, 2005 - 246 p.

Golitina o.l., Maksimov N.V., Popov I.I. Adatbázisok: bemutató. - M.: Fórum: Infra-M, 2003. - 352c.

Sahars A. A. Az információs rendszerek építésének és végrehajtásának fogalma orientált adatelemzés // DBMS. - 2004. - № 4. - 55-70 p.

Pržylkovsky v.v. Az adatok nehéz elemzése Nagy mennyiség: Számítógépesítés // DBMS új perspektívái. - 2006. - № 4. - 71-83 p.

A többdimenziós adatelemzés fogalma szorosan kapcsolódik az OLAP rendszerek által végzett operatív analízishez.

OLAP (On-line analitikai feldolgozás) - Működési analitikai adatfeldolgozás technológiája módszerekkel és eszközökkel a többdimenziós adatok gyűjtésére, tárolására és elemzésére a döntéshozatali folyamatok támogatására.

Az OLAP rendszerek fő célja - Az analitikai tevékenységek támogatása, az elemzőhasználók önkényes (gyakran használják az AD-HOC kifejezést). Az OLAP elemzés célja, hogy ellenőrizze a feltörekvő hipotéziseket.

Az OLAP technológia forrásai a relációs megközelítés alapítója E. CODD. 1993-ban megjelent egy "OLAP az elemző felhasználóknak" című cikket, mit kell lennie. Ez a dokumentum bemutatja a működési analitikai feldolgozás fő fogalmát, és a következő 12 követelményt határozzák meg, amelyeknek meg kell felelniük az operatív analitikus feldolgozást lehetővé tevő termékekkel. Tokmakov g.p. Adatbázis. Adatbázisok fogalma, relációs adatmodell, SQL nyelvek. P. 51.

A Kódex és az OLAP meghatározása által meghatározott alábbi szabályok vannak felsorolva.

1. Multidimenzionalitás - Az OLAP rendszer a fogalmi szinten meg kell adnia az adatokat többdimenziós modell formájában, amely leegyszerűsíti az elemzési folyamatokat és az információ észlelését.

2. Átlátszóság - Az OLAP rendszernek el kell rejtenie a felhasználótól egy többdimenziós modell, a szervezet, a forrás, a feldolgozó és tárolási lehetőség.

3. Elérhetőség - Az OLAP rendszernek egyetlen, következetes és holisztikus adatmodellnek kell biztosítania a felhasználót, amely hozzáférést biztosít az adatokhoz, függetlenül attól, hogy hogyan és hol tárolódnak.

4. Állandó teljesítmény A jelentések fejlesztésekor - az OLAP rendszerek teljesítményét nem szabad jelentősen csökkenteni az elemzés elvégzésének méréseinek növelésével.

5. Ügyfélszerver architektúra - Az OLAP rendszernek képesnek kell lennie arra, hogy az "ügyfél-kiszolgáló" környezetben dolgozzon, mert A mai napig szükséges adatok többsége a működési analitikai feldolgozás alá esik, tárolva van elosztva. A fő ötlet az, hogy az OLAP eszközkiszolgáló komponensének kellően intelligensnek kell lennie, és lehetővé teszi számunkra, hogy általános koncepcionális rendszert építsünk fel a vállalati adatbázisok különböző logikai és fizikai rendszereinek általánosításának és konszolidációja alapján az átláthatósági hatás biztosítása érdekében.

6. Mérés Esélyegyenlőség - Az OLAP rendszernek támogatnia kell egy olyan többdimenziós modellt, amelyben minden mérés egyenlő. Ha szükséges további jellemzők Elkülöníthető külön mérésekkel, de ezt a lehetőséget bármilyen méretre kell biztosítani.

7. A ragadozott mátrixok dinamikus ellenőrzése - Az OLAP rendszernek biztosítania kell a ritka mátrixok optimális feldolgozását. A hozzáférési sebességet az adatsejtek helyétől függetlenül kell tárolni, és állandó értéke lehet a különböző számú mérésű modelleknél és eltérő adattermeléssel.

8. A multiplayer mód támogatása - Az OLAP rendszernek lehetőséget kell biztosítania arra, hogy több felhasználóra dolgozzon egy analitikus modellt, vagy hozzon létre különböző modelleket az egységes adatokból. Lehetőség van az olvasás és a felvételi adatok, így a rendszernek biztosítania kell az integritását és biztonságát.

9. Korlátlan kereszt-műveletek - Az OLAP rendszernek biztosítania kell a funkcionális kapcsolatok megőrzését a hypercube sejtjei között a hypercube sejtjei között, bármilyen vágási művelet, forgás, konszolidáció vagy részletes műveletek végrehajtása során. A rendszernek önállónak kell lennie (automatikusan) elvégeznie a beállított kapcsolat átalakítását, anélkül, hogy a felhasználónak újradefiniálnia kell őket.

10. Intuitív adatok manipuláció - Az OLAP rendszernek módosítani kell a vágott, forgatás, a konszolidáció és a részletes műveletek végrehajtására egy hyperkub felett, anélkül, hogy különböző műveleteket kellene tennie az interfészen. Az analitikai modellben meghatározott méréseknek tartalmazniuk kell a fenti műveletek végrehajtásához szükséges összes szükséges információt.

11. Rugalmas jelentési lehetőségek - Az OLAP rendszernek támogatnia kell az adatok megjelenítésének különböző módjait, azaz A jelentéseket bármilyen lehetséges orientációban kell benyújtani. A jelentési eszközöknek olyan szintetizált adatokat vagy információkat kell biztosítaniuk, amelyek az adatmodelltől a lehetséges orientációban vannak. Ez azt jelenti, hogy a húrokat, az oszlopokat vagy az oldalakat egyszerre kell megjeleníteni 0-tól N mérésekről, ahol n - a teljes analitikai modell méréseinek száma. Ezenkívül az egyik bejegyzésben, az oszlopban vagy az oldalon bemutatott tartalom minden mérése lehetővé teszi a dimenzióban lévő elemek (értékek) bármely részhalmazát bármilyen sorrendben.

12. Korlátlan dimenzió és az aggregációs szintek száma - Az analitikai modellben megkövetelt szükséges mérések lehetséges számának kutatása azt mutatta, hogy egyszerre akár 19 mérés is használható. Ez követi a végső ajánlást annak biztosítására, hogy az analitikai eszköz egyszerre legalább 15, előnyösen 20 mérést biztosítson. Ezenkívül a teljes méret mindegyikét nem szabad korlátozni az aggregációs szintek és a konszolidációs útvonalak felhasználó által meghatározott szintjének számával.

A kódex további szabályai.

Az OLAP de facto definíciójaként szolgáltak, gyakran különböző panaszokat okozzák, például az 1., 2., 3., 6. szabályok a követelmények, valamint a 10., 11. szabály - informális kívánság. Tokmakov g.p. Adatbázis. Adatbázisok fogalma, relációs adatmodell, SQL nyelvek. P. 68 Így a felsorolt \u200b\u200b12 kódkövetelmények nem teszik lehetővé az OLAP pontos meghatározását. 1995-ben a lista kódja hozzáadta a következő hat szabályt:

13. Batch kitermelés az értelmezés ellen - Az OLAP rendszernek ugyanolyan hatékonyan kell hozzáférést biztosítani mind a saját, mind a külső adataihoz.

14. Minden OLAP-analízis modell támogatása - Az OLAP rendszernek meg kell őriznie a kód által meghatározott négy adatelemzési modellt: kategorikus, tolmácsolás, spekulatív és sztereotipikus.

15. Az abnormalizált adatok feldolgozása - Az OLAP rendszernek abnormális adatforrásokkal kell integrálni. Az OLAP tápközegben végzett adatok módosítása nem vezethet a forrás külső rendszerekben tárolt adatok változásaihoz.

16. Az OLAP eredményeinek megmentése: A forrásadatokból külön tárolása - az olvasási módban működő OLAP rendszer, a forrásadatok módosítása után az eredményeket külön kell menteni. Más szóval, biztosítják a forrásadatok biztonságát.

17. A hiányzó értékek kizárása - OLAP-rendszer, bemutatva ezeket a felhasználónak, el kell dobnia az összes hiányzó értéket. Más szavakkal, a hiányzó értékek eltérnek a nulla értékektől.

18. A hiányzó értékek feldolgozása - Az OLAP rendszernek figyelmen kívül kell hagynia a hiányzó értékeket anélkül, hogy figyelembe venné a forrásukat. Ez a funkció a 17. szabályhoz kapcsolódik.

Ezenkívül a CODD megszakította a következő négy csoport mindegyikét, és felhívta őket. Ezek a csoportok nevet kaptak, S, R és D.

A főbb jellemzők (b) a következő szabályokat tartalmazzák:

Az adatok többdimenziós koncepcionális képviselete (1. szabály);

Intuitív adatkezelés (10. szabály);

Elérhetőség (3. szabály);

Tételes kitermelés értelmezéssel szemben (13. szabály);

Minden OLAP elemzési modell támogatása (14. szabály);

Építészet "Client-Server" (5. szabály);

Átláthatóság (2. szabály);

Multiplayer támogatás (8. szabály)

Különleges jellemzők (ek):

Abnormalizált adatok feldolgozása (15. szabály);

Az OLAP eredményeinek megmentése: a forrásadatoktól elkülönítve (16. szabály);

A hiányzó értékek megszüntetése (17. szabály);

A hiányzó értékek feldolgozása (18. szabály). Jelentések jellemzői (R):

Rugalmasság jelentése (11. szabály);

Standard jelentés teljesítménye (4. szabály);

A fizikai réteg automatikus konfigurálása (módosított eredeti 7. szabály).

Méréskezelés (D):

A mérések egyetemessége (6. szabály);

Korlátlan számú mérés és aggregációs szint (12. szabály);

Korlátlan műveletek a dimenziók között (9. szabály).

A magas verseny feltételei és a külső környezet növekvő dinamikája diktálja a vállalati menedzsment rendszerek fokozott követelményeit. A vezetés elméletének és gyakorlatának fejlesztését az új módszerek, technológiák és modellek kialakulása kísérte a tevékenység hatékonyságának javítására. Módszerek és modellek viszont hozzájárultak az analitikai rendszerek megjelenéséhez. Az oroszországi analitikai rendszerek iránti igény magas. Ezeknek a rendszereknek a legérdekesebbek a pénzügyi szektorban: bankok, biztosítási üzleti, befektetési társaságok. Az analitikai rendszerek munkájának eredményei elsősorban olyan embereknek kell előírniuk, amelyek döntései a vállalat fejlődésétől függnek: menedzserek, szakértők, elemzők. Az analitikai rendszerek lehetővé teszik a konszolidációs feladatok, a jelentések, az optimalizálás és az előrejelzés megoldását. A mai napig nem volt az analitikai rendszerek végleges besorolása, mivel nincsenek közös meghatározási rendszer az ebben az irányban. Az információs struktúra a vállalat is képviseli sorozata szinten, amelyek mindegyike jellemző a feldolgozás és információ menedzsment módszert, és megvan a saját szerepe a folyamatot. Így az analitikai rendszerek hierarchikusan helyezkednek el az infrastruktúra különböző szintjén.

A tranzakciós rendszerek szintje

Adatraktár szintje

Az adatok szintje

OLAP szint - rendszerek

Az analitikai alkalmazások szintje

OLAP - rendszerek - (online analitikai feldolgozás, analitikai kezelés a jelen idő alatt) - az átfogó többdimenziós adatelemzés technológiája. OLAP - rendszerek alkalmazhatók, ha a multifaktív adatok elemzésének feladata. A jelentések elemzésének és létrehozásának hatékony eszköze van. A fenti adatraktárok, az adatok bemutatása és az OLAP rendszerek az üzleti intelligencia rendszerekre (Business Intelligence, BI) vonatkoznak.

Nagyon gyakran a döntéshozó személyek közvetlen használatával létrehozott információs és analitikai rendszerek rendkívül egyszerűek, de mereven korlátozottak a funkcionalitásban. Az ilyen statikus rendszereket az irodalomban hívják. Információs rendszerek Fej (IPR) vagy végrehajtó információs rendszerek (EIS). Ezek tartalmaznak előre definiált többszöri kéréseket, és elegendő a mindennapi felülvizsgálathoz, nem tudnak válaszolni minden olyan kérdésre, amely a döntések meghozatalakor felmerülhet. Az ilyen rendszer eredménye, általában többoldalas jelentések, az alapos tanulmányozás után, amelyről az elemző megjelenik új sorozat kérdések. Azonban minden új kérés, előre nem látható az ilyen rendszer megtervezésekor hivatalosan írja le hivatalosan, egy programozó által kódolt és ezután végrehajtásra kerül. Várakozási idő ebben az esetben órák és napok, amelyek nem mindig elfogadhatóak. Így a statikus SPPR külső egyszerűsége, amelyre az információs és analitikai rendszerek többsége aktívan harcol, a rugalmasság katasztrofális veszteségét bekapcsolja.



A dinamikus SPPRS, éppen ellenkezőleg, az elemzők nem választott (ad hoc) feldolgozására összpontosítanak az adatokra. Az ilyen rendszerek legmélyebb követelményei az E. F. Codd-t a cikkben áttekintették, amely az OLAP fogalmának kezdetét írta ki. Az elemzők munkája ezekkel a rendszerekkel az interaktív sorrend a lekérdezés és az eredmények tanulmányozása.

De a dinamikus SPPRS nem csak a működési analitikai feldolgozás területén (OLAP) működhet; A felhalmozott adatokon alapuló menedzsment döntések támogatását három alapterületen lehet végrehajtani.

Részletes adatok gömbje. Ez a legtöbb rendszer, amelynek célja az információ megtalálása. A legtöbb esetben a relációs DBMS-ek tökéletesen kezelik az itt felmerülő feladatokat. A relációs adatok általánosan elfogadott manipulációs nyelv által elfogadott szabványos szabvány az SQL. Információs és keresőmotorok, amelyek a részletes információk keresési feladatainak végfelhasználói felületét biztosítják, kiegészíthetők mind külön tranzakciós rendszer adatbázisokon, mind a közös adattároláson keresztül.

Gövek aggregált mutatók. Az adatraktárban összegyűjtött információk átfogó pillantása, az általánosítás és az aggregáció, a hipercubikus ábrázolás és a többdimenziós elemzések a működési analitikai adatfeldolgozó rendszerek (OLAP) feladata. Itt speciális többdimenziós DBMS-re lehet, vagy a relációs technológiákon belül maradhat. A második esetben az előbevágott adatok gyűjthetők a csillagszerű típus adatbázisában, vagy az információs aggregáció a Relációs adatbázis részletes táblái szkennelésének folyamata során végezhető el.

A minták szférája. Az intelligens feldolgozást az intelligens adatelemzés (JAAD, Adatbányászat) módszerei végzik, amelyek fő feladata a funkcionális és logikai minták keresése a felhalmozott információkban, a modellek és a szabályok építése, amelyek megmagyarázzák a talált anomáliákat és / vagy előre jelzi néhány folyamat fejlődését.

Működési analitikai adatfeldolgozás

Az OLAP fogalmának alapja a többdimenziós adatok bemutatásának elve. 1993-ban az EF Codd cikk úgy vélte, hogy a relációs modell hiányosságai, elsősorban a mérések szorzásának szempontjából "kombinálják, megtekinthetik és elemezhetik az adatokat, azaz a vállalati elemzők legmegfelelőbbek az út ", és az OLAP-rendszerek általános követelményei kiterjesztik a relációs DBMS funkcionalitását, és magukban foglalják a többdimenziós elemzést, mint az egyik jellemzőjét.

Az OLAP termékek osztályozása az adatkijelző módszer szerint.

Jelenleg számos termék van jelen a piacon, amely különböző mértékben az OLAP funkcionalitást biztosítja. Körülbelül 30 leghíresebb szerepet tölt be a Review Web Server http://www.olapreport.com/ listájában. A felhasználói felület többdimenziós fogalmi képviseletének biztosítása a forrásbázishoz, az összes OLAP termék három osztályba sorolható a forrásbázis típusával.

A legtöbb első működési analitikai feldolgozó rendszerek (például az Essbase Arbor szoftver, az Oracle Oracle Express Server Company) a molap osztályhoz tartozott, vagyis csak saját többdimenziós adatbázisokkal működhet. A multidimenziós DBMS védett technológiáin alapulnak, és a legdrágábbak. Ezek a rendszerek teljes OLAP feldolgozási ciklust biztosítanak. Vagy a szerverkomponens mellett saját integrált ügyfélfelületüket használják, ha a felhasználói külső munkaprogramokkal való kommunikációt használják táblázatokkal. Az ilyen rendszerek fenntartása érdekében különleges személyzetre van szükség a telepítéssel, a rendszerhez, a végfelhasználók számára az adatnézetek kialakulásával.

A működési analitikai adatokat feldolgozó rendszerek (ROLAP) biztosítja a tárolt adatok a relációs bázis, a többdimenziós formában, biztosítva az átalakulás információt egy többdimenziós modell révén a közbenső réteg metaadatok. A Rolap rendszerek jól illeszkednek a nagy tároláshoz való munkához. Mint a molap rendszerek, jelentős szolgáltatási költségeket igényelnek az informatikai szakemberek számára, és többjátékos működést biztosítanak.

Végül a hibrid rendszerek (Hybrid OLAP, HOLAP) úgy vannak kialakítva, hogy kombinálják az előnyöket és minimalizálják az előző osztályokban rejlő hiányosságokat. A Speedware Media / MR tartalmazza ezt az osztályt. A fejlesztők szerint az analitikai rugalmasságot és molap válaszsebességet ötvözi, amely állandó hozzáférést biztosít a reál adatokhoz, amelyek a rolaphoz kapcsolódnak.

Többdimenziós OLAP (MOLAP)

A többdimenziós adatok bemutatásán alapuló speciális DBMS-ben az adatokat nem relációs táblázatok formájában szervezik, de rendezett többdimenziós tömbök formájában:

1) Hypercubes (az adatbázisban tárolt összes sejtnek azonos méretűnek kell lennie, azaz a maximális mérési alapon kell lennie) vagy

2) Policubes (minden egyes változó a saját mérési készletével van tárolva, és a feldolgozás összes összetettsége a rendszer belső mechanizmusaira kerül.).

A multidimenzionális adatbázisok használata a működési analitikai feldolgozás rendszereiben a következő előnyökkel jár.

Abban az esetben, használja többdimenziós adatbázis-kezelő rendszert, a keresés és a minta adatok végzik sokkal gyorsabb, mint egy többdimenziós fogalmi pillantást a relációs adatbázis, hiszen a többdimenziós adatbázis denormalizált tartalmaz előre összesített mutatók és biztosítja az optimális hozzáférést a kért sejtek .

Többdimenziós DBMS-ek könnyen megbirkózni a feladatokkal való felvétel információs modell különféle beépített funkciók, míg objektíven létező SQL nyelvi korlátozások, hogy ezeket a feladatokat alapuló relációs DBMS-meglehetősen bonyolult, és néha lehetetlen.

Másrészt jelentős korlátozások vannak.

A többdimenziós DBMS-ek nem teszik lehetővé nagy adatbázisokkal való munkát. Ezenkívül a denormalizáció és az előválasztott aggregáció miatt a többdimenziós bázisban lévő adatok mennyisége általában megfelel (a kód értékelésével) 2,5-100 alkalommal a kisebb mennyiségű forrás részletes adatait.

A többdimenziós DBMS-t a relációs módszerrel összehasonlítva nagyon nem hatékonyan használják külső memóriával. Az esetek túlnyomó többségében az információs hypercube erősen ritkább, és mivel az adatokat megrendelt formában tárolják, a bizonytalan értékeket csak az optimális válogatási sorrend kiválasztásával törli, amely lehetővé teszi az adatok megszervezését a maximális folyamatos csoportokba . De még ebben az esetben is a probléma csak részben oldódik meg. Ezenkívül a válogatási eljárás valószínűleg optimális a tárolás szempontjából, a válogatás sorrendje valószínűleg nem egyezik meg a leggyakrabban használt sorrendben. Ezért a valós rendszerekben kompromisszumot kell keresni az adatbázis által elfoglalt lemezterület sebességének és redundanciájának között.

Következésképpen a többdimenziós DBMS használata csak a következő feltételek mellett indokolt.

Az elemzésre vonatkozó forrásadatok mennyisége nem túl nagy (legfeljebb néhány gigabájt), azaz az adatgyűjtési szint meglehetősen magas.

Az információs mérések sorozata stabil (mivel a szerkezetük bármely változása szinte mindig teljes hypercube-szerkezetátalakítást igényel).

A nem választott kérelmek rendszerének válaszideje a legkritikusabb paraméter.

A komplex beépített funkciók széles használata szükséges a hypercube sejtjei feletti keresztdimenziós számítások elvégzéséhez, beleértve a felhasználói funkciók írásának lehetőségét.

Kapcsolat OLAP (ROLAP)

A relációs adatbázisok közvetlen használata a működési analitikai feldolgozás rendszereiben a következő előnyökkel jár.

A legtöbb esetben a vállalati adatraktárokat relációs DBMS segítségével hajtják végre, és a Rolap eszközök lehetővé teszik, hogy közvetlenül a fölöttük elemzhetők legyenek. Ebben az esetben a tárolási méret nem olyan kritikus paraméter, mint a molap esetében.

A feladat változó dimenziója esetén, ha a mérési struktúra változásait gyakran meg kell tenni, a dimenzió dinamikus ábrázolásával rendelkező Rolap rendszer a legjobb megoldás, mivel az ilyen módosítások nem igénylik az adatbázis fizikai átszervezését.

A relációs DBMS-ek jelentősen magasabb szintű adatvédelmet és jó hozzáférési jogokat biztosítanak az elhatároláshoz.

A rolap fő hátránya a multidimenzionális DBMS-hez képest kevesebb teljesítmény. A molaphoz hasonló teljesítmény biztosítása érdekében a relációs rendszerek alapos vizsgálatot igényelnek az adatbázis-diagram és az indexbeállítások, azaz nagy erőfeszítések az adatbázis-adminisztrátoroktól. Csak csillag alakú rendszerek használata esetén a jól konfigurált relációs rendszerek teljesítményét a többdimenziós adatbázisokon alapuló rendszerek teljesítményével lehet megközelíteni.