Menü
Ingyenes
bejegyzés
itthon  /  Firmware/ Olap programok. OLAP rendszerek

Olap programok. OLAP rendszerek

4. Az OLAP termékek osztályozása.

5. Az OLAP-kliensek működési elvei.

7. Az OLAP-technológiák alkalmazási körei.

8. Példa az OLAP-technológiák elemzésre az értékesítés területén.

1. Az OLAP helye a vállalat információs struktúrájában.

Az OLAP kifejezés elválaszthatatlanul kapcsolódik az Adattárház kifejezéshez.

A raktárban lévő adatok operációs rendszerekből (OLTP-rendszerekből) származnak, amelyeket az üzleti folyamatok automatizálására terveztek. Ezenkívül a raktár feltölthető külső forrásokkal, például statisztikai jelentésekkel.

A repository feladata, hogy egy helyen, egyszerű, érthető szerkezetben biztosítsa az elemzéshez szükséges "alapanyagot".

Van még egy ok, ami indokolja a különálló tárhely megjelenését - az operatív információk bonyolult elemző lekérdezése lassítja a vállalat aktuális munkáját, hosszú ideig blokkolja a táblákat és lefoglalja a szerver erőforrásait.

A tároló nem feltétlenül egy óriási adathalmozódás – a lényeg az, hogy kényelmes legyen az elemzéshez.

A központosítás és a kényelmes strukturálás nem minden, amire egy elemzőnek szüksége van. Még mindig szüksége van egy eszközre az információk megtekintésére és megjelenítésére. A hagyományos jelentések, még ha egyetlen adattárra épülnek is, egy dolog hiányzik: a rugalmasság. Nem csavarhatók, bővíthetők vagy összecsukhatók az adatok kívánt nézetének eléréséhez. Bárcsak lenne neki egy ilyen eszköze, amely lehetővé teszi az adatok egyszerű és kényelmes bővítését és összecsukását! Az OLAP ilyen eszközként működik.

Bár az OLAP nem szükséges attribútuma egy adattárházban, egyre gyakrabban használják az ebben a raktárban felhalmozott információk elemzésére.

Az OLAP helye a vállalat információs struktúrájában (1. ábra).

1. kép... Egy helyOLAP a vállalkozás információs struktúrájában

A működési adatokat különféle forrásokból gyűjtik, tisztítják, integrálják és relációs tárolóban tárolják. Sőt, már elérhetőek a különféle jelentéskészítő eszközökkel történő elemzéshez. Ezután az adatok (egészben vagy részben) előkészítésre kerülnek az OLAP elemzéshez. Betölthetők egy speciális OLAP adatbázisba, vagy relációs tárolóban hagyhatók. Legfontosabb eleme a metaadatok, vagyis az adatok szerkezetére, elhelyezésére és átalakítására vonatkozó információk. Ezeknek köszönhetően a különböző tárolóelemek hatékony interakciója biztosított.

Összefoglalva, az OLAP a raktárban felhalmozott többdimenziós adatelemző eszközök gyűjteményeként határozható meg.

2. Operatív analitikai adatfeldolgozás.

Az OLAP koncepció a többdimenziós adatmegjelenítés elvén alapul. E. F. Codd 1993-ban a relációs modell hiányosságait vette szemügyre, mindenekelőtt az adatok „többdimenziós, azaz a vállalati elemzők számára legérthetőbb kombinálásának, megtekintésének és elemzésének lehetetlenségére” mutatott rá. Általános követelmények olyan OLAP rendszerekre, amelyek kiterjesztik a relációs DBMS funkcionalitását, és egyik jellemzőjükként a többdimenziós elemzést is tartalmazzák.

Codd szerint a többdimenziós fogalmi nézet több független dimenzióból álló többszörös perspektíva, amely mentén meghatározott adathalmazok elemezhetők.

A több dimenzióra kiterjedő egyidejű elemzés többváltozós elemzésnek minősül. Minden dimenzió tartalmaz adatkonszolidációs irányokat, amelyek egymást követő összesítési szintek sorozatából állnak, ahol minden magasabb szint a megfelelő dimenzió nagyobb adatösszesítési fokának felel meg.

Így a Vállalkozó dimenziót a konszolidáció iránya határozhatja meg, amely a "vállalat - osztály - osztály - alkalmazott" általánosítási szintekből áll. Az Idő dimenzió akár két konszolidációs irányt is tartalmazhat - év - negyedév - hónap - nap és hét - nap, mivel a hónapok és a hét szerinti időszámlálás nem kompatibilis. Ebben az esetben lehetővé válik, hogy az egyes mérésekhez tetszőlegesen kiválassza a kívánt információs részletezési szintet.

A lefúrási művelet a konszolidáció magasabb szakaszaiból az alacsonyabbak felé történő elmozdulásnak felel meg; éppen ellenkezőleg, a felgöngyölítési művelet azt jelenti, hogy alacsonyabb szintekről magasabb szintre lépünk (2. ábra).


2. ábra.Az adatkonszolidáció mérései és irányai

3. Követelmények az on-line analitikai feldolgozás eszközeire.

A többdimenziós megközelítés a relációs megközelítéssel szinte egyidejűleg és párhuzamosan jelent meg. Azonban csak a kilencvenes évek közepe óta, vagy inkább azóta
1993, érdeklődés MSUBD kezdett általános jelleget szerezni. Ebben az évben jelent meg egy új programcikk a relációs megközelítés egyik megalapozójától E. Codda, amelyben 12 alapvető követelményt fogalmazott meg a megvalósítás eszközeivel szemben OLAP(Asztal 1).

Asztal 1.

Többdimenziós adatábrázolás

Az eszközöknek támogatniuk kell az adatok többdimenziós fogalmi nézetét.

Átláthatóság

A felhasználónak nem szabad tisztában lennie azzal, hogy milyen konkrét eszközöket használnak az adatok tárolására és feldolgozására, hogyan szerveződnek az adatok és honnan származnak.

Elérhetőség

Az eszközökön múlik, hogy kiválassza a legjobb adatforrást és kommunikáljon vele, hogy válaszoljon egy adott kérésre. Az eszközöknek képesnek kell lenniük arra, hogy saját logikájukat automatikusan leképezzék különféle heterogén adatforrásokra.

Egyenletes teljesítmény

A teljesítmény gyakorlatilag nem függhet a kérésben szereplő dimenziók számától.

Kliens-szerver architektúra támogatása

Az eszközöknek kliens-szerver architektúrában kell működniük.

Minden mérés egyenlősége

Egyik mérés sem lehet alap, mindegyik egyenlő (szimmetrikus).

Ritka mátrixok dinamikus feldolgozása

A meghatározatlan értékeket a leghatékonyabb módon kell tárolni és kezelni.

Támogatás a többfelhasználós adatkezelési módhoz

Az eszközöknek lehetővé kell tenniük, hogy egynél több felhasználó számára működjenek.

Támogatja a különféle méreteken alapuló műveleteket

Minden többdimenziós műveletet (pl. Összevonás) egységesen és következetesen kell alkalmazni tetszőleges számú dimenzióra.

Könnyű adatkezelés

Az eszközöknek a legkényelmesebb, legtermészetesebb és legkényelmesebb felhasználói felülettel kell rendelkezniük.

Speciális prezentációs eszközök

Az alapoknak támogatniuk kell különböző utak adatok megjelenítése (megjelenítése).

Korlátlan számú dimenzió és adatösszesítési szint

A támogatott dimenziók számát nem szabad korlátozni.

Az OLAP osztályba tartozó szoftvertermékek kiértékelésének szabályai

Ezeknek a követelményeknek az összessége, amely az OLAP de facto definíciójaként szolgált, tanácsadó jellegűnek tekintendő, és az egyes termékeket aszerint kell megítélni, hogy mennyire közel állnak ahhoz, hogy tökéletesen megfeleljenek minden követelménynek.

Később Codd definícióját felülvizsgálták az úgynevezett FASMI tesztre, amelyhez egy OLAP alkalmazásra van szükség, amely lehetővé teszi a megosztott többdimenziós információk gyors elemzését.

Codd 12 szabályára emlékezni túlságosan megterhelő a legtöbb ember számára. Kiderült, hogy az OLAP definíciót mindössze öt kulcsszóval lehet összefoglalni: Megosztott többdimenziós információk gyors elemzése - vagy röviden - FASMI (angolról fordítva:F ast A elemzése S nyúlt M ultidimenzionális én ninformáció).

Ezt a definíciót először 1995 elején fogalmazták meg, és azóta nem volt szükség felülvizsgálatra.

GYORS ( gyors) - azt jelenti, hogy a rendszernek körülbelül öt másodpercen belül képesnek kell lennie arra, hogy a legtöbb választ megadja a felhasználóknak. Ugyanakkor a legegyszerűbb kérések feldolgozása egy másodpercen belül megtörténik, és nagyon kevés - több mint 20 másodperc alatt. Kutatások kimutatták, hogy a végfelhasználók sikertelennek érzik a folyamatot, ha 30 másodpercen belül nem érkezik eredmény.

Első pillantásra meglepőnek tűnhet, hogy amikor egy perc alatt megkapja a jelentést, ami nem is olyan régen napokig telt, a felhasználó nagyon hamar megunja a várakozást, és a projekt sokkal kevésbé sikerül, mint egy azonnali válasz, még kevésbé részletes elemzés árán is.

ELEMZÉS (Elemzés)azt jelenti, hogy a rendszer képes kezelni bármilyen logikai és statisztikai elemzést ennek az alkalmazásnak, és biztosítja, hogy a végfelhasználó számára elérhető formában kerüljön mentésre.

Nem számít, hogy ezt az elemzést a gyártó saját eszköztárában vagy egy mellékelt külső szoftvertermékben, például táblázatban végzik-e el, csupán az összes szükséges elemzési funkciót intuitív módon kell biztosítania a végfelhasználók számára. Az elemző eszközök magukban foglalhatnak olyan speciális eljárásokat, mint az idősorelemzés, a költségelosztás, a devizaátutalások, a célkeresés, a többdimenziós szerkezetváltozások, a nem eljárási modellezés, a kivételészlelés, az adatkinyerés és egyéb alkalmazásfüggő műveletek. Az ilyen képességek termékenként igen eltérőek, a célorientációtól függően.

MEGOSZTOTT azt jelenti, hogy a rendszer teljesíti az összes adatvédelmi követelményt (esetleg a cella szintjéig), és ha többszörös írási hozzáférés szükséges, biztosítja a módosítások blokkolását a megfelelő szinten. Nem minden alkalmazásnak kell visszaírnia az adatokat. Az ilyen alkalmazások száma azonban egyre növekszik, és a rendszernek képesnek kell lennie a többszörös módosítások időbeni, biztonságos kezelésére.

TÖBBDIMENZIÓS - ez kulcsfontosságú követelmény. Ha egy szóval kellene meghatározni az OLAP-ot, akkor azt választanád. A rendszernek többdimenziós fogalmi képet kell nyújtania az adatokról, beleértve a hierarchiák és a többszörös hierarchiák teljes támogatását, mivel ez minden bizonnyal a leglogikusabb módja egy vállalkozás és szervezet elemzésének. Nincs meghatározva a feldolgozandó dimenziók minimális száma, mert az alkalmazásfüggő is, és a legtöbb OLAP-termék elegendő dimenzióval rendelkezik a megcélzott piacokhoz.

INFORMÁCIÓ - ez minden. A szükséges információkat ott kell beszerezni, ahol szükséges. Sok múlik azonban az alkalmazáson. A különféle termékek teljesítményét abban mérik, hogy mennyi bemenetet tudnak feldolgozni, de nem abban, hogy hány gigabájtot tudnak tárolni. A termékek teljesítménye nagyon változó – a legnagyobb OLAP termékek legalább ezerszer több adatot képesek kezelni, mint a legkisebbek. E tekintetben számos tényezőt figyelembe kell venni, beleértve az adatmásolatot, a szükséges RAM-ot, a lemezterület kihasználtságát, a teljesítményt, az adattárolás integrációját és még sok mást.

A FASMI teszt ésszerű és érthető definíciója azoknak a céloknak, amelyek elérésére az OLAP összpontosít.

4. OsztályozásOLAP-Termékek.

Tehát az OLAP lényege abból áll, hogy az elemzéshez szükséges kiindulási információkat egy többdimenziós kocka formájában mutatják be, és lehetőséget biztosítanak annak önkényes manipulálására és a szükséges információs szakaszok - jelentések - megszerzésére. Ebben az esetben a végfelhasználó a kockát többdimenziós dinamikus táblázatnak tekinti, amely automatikusan összegzi az adatokat (tényeket) különböző szakaszokban (dimenziókban), és lehetővé teszi a számítások és a jelentés űrlap interaktív vezérlését. Ezen műveletek végrehajtása biztosított OLAP -gép (vagy gép OLAP számítások).

A mai napig sok olyan terméket fejlesztettek ki a világon, amely megvalósítja OLAP -technológiák. A köztük való könnyebb eligazodás érdekében osztályozásokat használnak OLAP -termékek: elemzési célú adattárolás és hely szerint OLAP - autók. Nézzük meg közelebbről az egyes kategóriákat OLAP termékek.

Osztályozás tárolási mód szerint

A többdimenziós kockák forrás- és összesített adatok alapján épülnek fel. A kockákra vonatkozó nyers és összesített adatok egyaránt tárolhatók relációs és többdimenziós adatbázisokban. Ezért jelenleg három módszer létezik az adatok tárolására: MOLAP (többdimenziós OLAP), ROLAP (relációs OLAP) és HOLAP (hibrid OLAP) ). Illetőleg, OLAP -A termékek adattárolás szerint három hasonló kategóriába sorolhatók:

1. MOLAP esetén , a forrás és az összesített adatok többdimenziós adatbázisban vagy többdimenziós helyi kockában vannak tárolva.

2. A ROLAP-ban -termékek esetén a forrásadatok relációs adatbázisokban vagy egy fájlszerveren lévő lapos helyi táblákban tárolódnak. Az összesített adatok elhelyezhetők ugyanabban az adatbázisban lévő szolgáltatási táblákban. Az adatok relációs adatbázisból többdimenziós kockává konvertálása igény szerint megtörténik OLAP eszközök.

3. Használat esetén HOLAP architektúra, az eredeti adatok a relációs adatbázisban maradnak, az aggregátumok pedig a többdimenziósba kerülnek. Épület OLAP -kocka kérésre történik OLAP -Relációs és többdimenziós adatokon alapuló eszközök.

Helybesorolás OLAP- autók.

Ezen az alapon OLAP -termékek vannak osztva OLAP-kiszolgálók és OLAP-kliensek:

Szerver OLAP -az összesített adatok kiszámításának és tárolásának eszközeit egy külön folyamat - a szerver - végzi. Az ügyfélalkalmazás csak a szerveren tárolt többdimenziós kockákra vonatkozó lekérdezések eredményeit kapja meg. Néhány OLAP -szerverek csak relációs adatbázisokban támogatják az adattárolást, egyesek - csak többdimenziósban. Sok modern OLAP - A szerverek mindhárom adattárolási módot támogatnak:MOLAP, ROLAP és HOLAP.

MOLAP.

A MOLAP az Többdimenziós on-line analitikai feldolgozás, vagyis többdimenziós OLAP.Ez azt jelenti, hogy a szerver többdimenziós adatbázist (MDB) használ az adatok tárolására. Az MDB használatának értelme nyilvánvaló. Hatékonyan tud többdimenziós adatokat tárolni, így gyorsan kiszolgálja az adatbázis-lekérdezéseket. Az adatok egy adatforrásból egy többdimenziós adatbázisba kerülnek, majd az adatbázist összesítik. Az előkalkuláció az, ami gyorsabbá teszi az OLAP lekérdezéseket, mivel az összesítő adatok már ki vannak számítva. A kérési idő kizárólag annak az időnek a függvénye, amely egy adott adat eléréséhez és egy számítás elvégzéséhez szükséges. Ez a módszer alátámasztja azt az elképzelést, hogy a munkát egyszer elvégezzük, majd az eredményeket újra és újra felhasználják. A többdimenziós adatbázisok viszonylag új technológia. Az MDB használatának ugyanazok a hátrányai, mint a legtöbb új technológia. Ugyanis nem olyan stabilak, mint a relációs adatbázisok (RDB), és nem ugyanolyan mértékben optimalizáltak. Az MDB másik gyenge pontja, hogy a legtöbb többdimenziós adatbázist nem lehet felhasználni az adataggregáció során, így időbe telik, amíg új információk elérhetővé válnak az elemzéshez.

ROLAP.

A ROLAP az Relációs on-line analitikai feldolgozás, azaz Relációs OLAP.A ROLAP kifejezés azt jelenti, hogy az OLAP-kiszolgáló relációs adatbázison alapul. Az eredeti adatok egy relációs adatbázisba kerülnek, általában csillag vagy hópehely sémában, ami segít csökkenteni a visszakeresési időt. A szerver többdimenziós adatmodellt biztosít optimalizált SQL lekérdezések használatával.

Számos oka van annak, hogy a relációs adatbázist válasszuk a többdimenziós adatbázis helyett. Az RDB egy jól bevált technológia, számos optimalizálási lehetőséggel. A valós használat kidolgozottabb terméket eredményezett. Ezenkívül az RDB-k nagyobb adatmennyiséget támogatnak, mint az MDB-k. Csak ilyen kötetekre tervezték. Az RDB-k elleni fő érv a lekérdezések összetettsége, amelyek szükségesek ahhoz, hogy egy nagy adatbázisból SQL segítségével lehessen lekérni az információkat. Egy tapasztalatlan SQL-programozó könnyen megterhelheti az értékes rendszererőforrásokat, ha megpróbál végrehajtani valamilyen hasonló lekérdezést, amely MDB-ben sokkal könnyebben végrehajtható.

Összesített / Előre összesített adatok.

A gyors lekérdezés megvalósítása elengedhetetlen az OLAP számára. Ez az OLAP egyik alapelve – az adatok intuitív kezelésének képessége megköveteli az információ gyors visszakeresését. Általában minél több számítást igényel egy információ megszerzése, annál lassabb a válasz. Ezért a lekérdezések megvalósításához szükséges idő megtakarítása érdekében az általában leggyakrabban elért, de ugyanakkor számítást igénylő információkat előzetes összesítésnek vetjük alá. Vagyis megszámlálják, majd új adatként tárolják az adatbázisban. Az előre kiszámítható adattípusra példa az összefoglaló adatok – például az értékesítési adatok hónaponként, negyedévenként vagy évenként –, amelyekre a ténylegesen bevitt adatok napi adatok.

A különböző szállítók eltérő kiválasztási módszerekkel rendelkeznek az előzetes összesítést és számos előre kiszámított értéket igénylő paraméterekhez. Az aggregációs megközelítés mind az adatbázis, mind a lekérdezés végrehajtási idejét befolyásolja. Ha több értéket számítanak ki, megnő annak a valószínűsége, hogy a felhasználó egy már kiszámított értéket fog kérni, így a válaszidő is rövidebb lesz, mivel nem kell a kezdeti értéket kérni a számításhoz. Ha azonban az összes lehetséges érték kiszámítása nem a legjobb megoldás - ebben az esetben az adatbázis mérete jelentősen megnő, ami kezelhetetlenné teszi, és az összesítési idő túl hosszú lesz. Ezen túlmenően, ha számértékeket adnak hozzá az adatbázishoz, vagy ha azok megváltoznak, akkor ennek az információnak az előre kiszámított értékekben kell tükröződnie az új adatoktól függően. Így nagyszámú előre kalkulált érték esetén az adatbázis frissítése is elhúzódhat. Mivel az adatbázis általában offline állapotban van az aggregálás során, kívánatos, hogy az aggregálási idő ne legyen túl hosszú.

OLAP -az ügyfél másképp van elrendezve. Többdimenziós kocka építése és OLAP -a számításokat a kliens számítógép memóriájában hajtják végre.OLAP -kliensek is vannak osztva ROLAP és MOLAP.Néhányan támogathatják mindkét típusú adathozzáférést.

Mindegyik megközelítésnek megvannak a maga előnyei és hátrányai. Ellentétben azzal a közhiedelemmel, hogy a szervereszközök előnyei a kliensekkel szemben, számos esetben a OLAP - a kliens a felhasználók számára hatékonyabb és jövedelmezőbb lehet, mint a használat OLAP szerverek.

Az elemző alkalmazások fejlesztése OLAP kliens eszközökkel gyors folyamat, és nem igényel speciális képzést a vállalkozótól. Az adatbázis fizikai megvalósítását ismerő felhasználó önállóan, informatikus bevonása nélkül fejleszthet elemző alkalmazást.

OLAP-kiszolgáló használatakor 2 különböző rendszert kell tanulmányoznia, néha különböző gyártóktól - a kockák létrehozásához a szerveren és egy kliens alkalmazás fejlesztéséhez.

Az OLAP kliens egységes vizuális felületet biztosít a kockák leírásához és felhasználói felületük testreszabásához.

Tehát milyen esetekben lehet hatékonyabb és jövedelmezőbb egy OLAP-kliens a felhasználók számára, mint egy OLAP-kiszolgáló használata?

· Az alkalmazás gazdasági megvalósíthatósága OLAP -szerver akkor fordul elő, ha az adatmennyiség nagyon nagy és elviselhetetlen OLAP - az ügyfél, ellenkező esetben az utóbbi használata indokoltabb. Ebben az esetben OLAP - Az ügyfél a nagy teljesítményű jellemzőket alacsony költséggel kombinálja.

· Az erős elemző PC-k egy másik jó ok OLAP - ügyfelek. Jelentkezéskor OLAP -szerver, ezek a kapacitások nincsenek kihasználva.

Az OLAP kliensek előnyei a következők:

· Megvalósítási és karbantartási költségek OLAP - az ügyfél lényegesen alacsonyabb, mint a költség OLAP szerver.

· Használata OLAP - beépített géppel rendelkező kliens esetén a hálózaton keresztüli adatátvitel egyszer történik. Miközben csinálod OLAP - az új adatfolyamok műveletei nem jönnek létre.

5. A munka alapelvei OLAP- ügyfelek.

Nézzük meg az OLAP-alkalmazás klienseszköz segítségével történő létrehozásának folyamatát (1. ábra).

1. képHozzon létre egy OLAP alkalmazást a ROLAP Client Tool segítségével

A ROLAP kliensek működési elve annak a szemantikai rétegnek az előzetes leírása, amely mögött a kezdeti adatok fizikai szerkezete el van rejtve. Ebben az esetben az adatforrások lehetnek: helyi táblák, RDBMS. A támogatott adatforrások listája termékspecifikus. Ezt követően a felhasználó önállóan kezelheti az általa a tárgykör szempontjából értett objektumokat kockák és elemzési felületek létrehozása érdekében.

Az OLAP szerverkliens másként működik. Az OLAP szerverben a kockák létrehozásakor a felhasználó manipulálja az adatbázis fizikai leírását. Ez egyéni leírásokat hoz létre magában a kockában. Az OLAP Server ügyfél csak kockánként van konfigurálva.

A szemantikai réteg létrehozásakor az adatforrások - az Értékesítés és az Ügylet táblák - a végfelhasználó számára érthető kifejezésekkel kerülnek leírásra, és „Termékek” és „Ügyletek” kifejezésekké alakulnak. A „Termékek” táblázat „ID” mezője „Kód”-ra, a „Név” pedig „Termék”-re stb.

Ezután létrejön a Sales üzleti objektum. Az üzleti objektum egy lapos asztal, amelyből többdimenziós kockát alakítanak ki. Az üzleti objektum létrehozásakor a "Termékek" és az "Ügyletek" táblákat a termék "Kód" mezője kombinálja. Mivel a tábla összes mezőjét nem kötelező megjeleníteni a jelentésben, az üzleti objektum csak a "Cikk", "Dátum" és "Összeg" mezőket használja.

Példánkban az Értékesítés üzleti objektum alapján készítettünk egy jelentést az áruk értékesítéséről havi bontásban.

Amikor interaktív jelentéssel dolgozik, a felhasználó ugyanazokkal az egyszerű egérmozdulatokkal állíthatja be a szűrési és csoportosítási feltételeket. Ezen a ponton a ROLAP kliens hozzáfér a gyorsítótárban lévő adatokhoz. Másrészt az OLAP kiszolgáló kliens új lekérdezést generál a többdimenziós adatbázis ellen. Például az értékesítési jelentésben termék szerinti szűrő alkalmazásával jelentést kaphat a számunkra érdekes termékek értékesítéséről.

Az OLAP-alkalmazások összes beállítása tárolható egy dedikált metaadat-lerakatban, egy alkalmazásban vagy egy többdimenziós adatbázisrendszer-lerakatban.A megvalósítás az adott szoftverterméktől függ.

Minden, amit ezek az alkalmazások tartalmaznak, egy standard nézet az interfészre, az előre meghatározott funkciókra és szerkezetre, valamint gyors döntések többé-kevésbé standard helyzetekre. Például népszerűek a pénzügyi csomagok. Az előre elkészített pénzügyi alkalmazások lehetővé teszik a szakemberek számára, hogy ismert pénzügyi eszközöket használjanak anélkül, hogy adatbázis-struktúrát vagy általános űrlapokat és jelentéseket kellene kialakítaniuk.

Az internet az új formaügyfél. Emellett az új technológiák bélyegét is magán viseli; sok internetes megoldások jelentősen eltérnek képességeikben általában, és különösen az OLAP megoldások minőségében. Számos előnnyel jár az OLAP-jelentések interneten keresztüli létrehozása. A legjelentősebb a szakorvosi igény hiánya szoftver információkhoz jutni. Ezzel sok időt és pénzt takarít meg a cég.

6. OLAP alkalmazás architektúra kiválasztása.

Egy információs és elemző rendszer implementálásakor fontos, hogy ne tévedjünk az OLAP alkalmazásarchitektúra kiválasztásánál. Az On-Line Analytical Process kifejezés szó szerinti fordítását - "on-line analitikai feldolgozás" - gyakran szó szerint értelmezik abban az értelemben, hogy a rendszerbe belépő adatokat azonnal elemzik. Ez egy téveszme – az elemzés hatékonyságának semmi köze ehhez valós idő az adatok frissítése a rendszerben. Ez a jellemző az OLAP rendszer felhasználói kérésekre adott válaszidejére vonatkozik. Ugyanakkor az elemzett adatok gyakran „tegnap” információk pillanatképei, ha például a tárolókban lévő adatok naponta egyszer frissülnek.

Ebben az összefüggésben az OLAP "interaktív analitikai feldolgozásként" való fordítása pontosabb. Az adatok interaktív módban történő elemzésének képessége különbözteti meg az OLAP rendszereket a szabályozott jelentések készítésére szolgáló rendszerektől.

Az interaktív feldolgozás másik jellemzője az OLAP alapítójának, E. Coddnak a megfogalmazásában, hogy "több dimenzióból, vagyis a vállalati elemzők számára legérthetőbb módon kombinálhatja, megtekintheti és elemzi az adatokat". Maga Codd számára az OLAP kifejezés az adatok fogalmi szintű reprezentációjának kizárólag sajátos módját jelenti – többdimenziós. Fizikai szinten az adatok relációs adatbázisokban tárolhatók, de a valóságban az OLAP eszközök inkább többdimenziós adatbázisokkal dolgoznak, amelyekben az adatok hiperkockába rendeződnek (1. ábra).

1. kép OLAP- kocka (hiperkocka, metakocka)

Ezen túlmenően ezen adatok relevanciáját az határozza meg, hogy a hiperkocka új adatokkal töltődik fel.

Nyilvánvaló, hogy egy többdimenziós adatbázis létrejöttének ideje jelentősen függ a bele betöltött adatok mennyiségétől, ezért indokolt ezt a mennyiséget korlátozni. De hogyan lehet nem szűkíteni az elemzés lehetőségeit, és nem fosztani meg a felhasználót az összes érdeklő információhoz való hozzáféréstől? Két alternatív útvonal van: Elemzés, majd lekérdezés és Lekérdezés, majd elemzés.

Az első útvonal követői azt javasolják, hogy általánosított információkat töltsenek be egy többdimenziós adatbázisba, például az osztályok havi, negyedéves, éves összesítését. Ha pedig az adatok részletezése szükséges, akkor a felhasználó felkérést kap, hogy készítsen jelentést a relációs adatbázisról, amely tartalmazza a kívánt kijelölést, például egy adott részlegre vonatkozóan napi vagy hónapok és egy kiválasztott részleg alkalmazottai szerint.

A második mód támogatói éppen ellenkezőleg, azt ajánlják a felhasználónak, hogy döntse el az elemezni kívánt adatokat, és töltse be azokat egy mikrokockába - egy kis többdimenziós adatbázisba. Mindkét megközelítés fogalmilag különbözik, és megvannak a maga előnyei és hátrányai.

A második megközelítés előnyei közé tartozik az információ "frisssége", amelyet a felhasználó többdimenziós jelentés - egy "mikrokocka" - formájában kap. A mikrokocka az aktuális relációs adatbázisból éppen lekért információk alapján jön létre. A mikrokockával való munka interaktív módban történik - az információ szeleteinek megszerzése és a mikrokockán belüli részletezése azonnal megtörténik. További pozitívum, hogy a mikrokocka szerkezetének és kitöltésének tervezését a felhasználó "menet közben", az adatbázis-adminisztrátor közreműködése nélkül végzi el. A megközelítésnek azonban komoly hátrányai is vannak. A felhasználó nem látja az általános képet, és előzetesen meg kell határoznia kutatásának irányát. Ellenkező esetben előfordulhat, hogy a kért mikrokocka túl kicsi és nem tartalmazza az összes érdeklődő adatot, és a felhasználónak új mikrokockát kell kérnie, majd újat, majd újra és újra. A Query ezután elemző megközelítés megvalósítja az azonos nevű cég BusinessObjects eszközét és eszközöket Platformok Vállalat körvonalaIntersoft Labor.

Az Elemzés, majd lekérdezés megközelítéssel a többdimenziós adatbázisba betöltött adatok mennyisége meglehetősen nagy lehet, a kitöltést a szabályok szerint kell elvégezni, és sok időt vehet igénybe. Mindezek a hátrányok azonban később megtérülnek, amikor a felhasználó szinte minden szükséges adathoz bármilyen kombinációban hozzáfér. A relációs adatbázisban az eredeti adatokra való hivatkozás csak végső esetben, szükség esetén történik. részletes információk például egy adott fuvarlevélen.

Egyetlen többdimenziós adatbázis működését gyakorlatilag nem befolyásolja az azt elérő felhasználók száma. Csak az ott elérhető adatokat olvassák, ellentétben a Lekérdezés, majd elemzés megközelítéssel, amelyben a mikrokockák száma extrém esetben a felhasználók számával azonos ütemben nőhet.

Ez a megközelítés növeli az informatikai szolgáltatások terhelését, amelyek a relációs szolgáltatások mellett többdimenziós adatbázisokat is kénytelenek kiszolgálni.Ezek a szolgáltatások felelősek az időszerűségért automatikus frissítés adatok többdimenziós adatbázisokban.

Az „elemzés, majd lekérdezés” megközelítés legjelentősebb képviselői a Cognos PowerPlay és Impromptu eszközei.

Mind a megközelítés, mind az azt megvalósító eszköz kiválasztása elsősorban a kitűzött céltól függ: mindig egyensúlyozni kell a költségvetés megtakarítása és a végfelhasználói szolgáltatás minőségének javítása között. Nem szabad megfeledkezni arról, hogy stratégiailag az információs és elemző rendszerek létrehozása a versenyelőny megszerzését célozza meg, nem pedig az automatizálás költségeinek elkerülését. Például egy vállalati információs és elemző rendszer képes a szükséges, időszerű és megbízható információkkal szolgálni egy cégről, amelynek közzététele a potenciális befektetők számára biztosítja ennek a cégnek az átláthatóságát, kiszámíthatóságát, ami elkerülhetetlenül feltétele lesz befektetési vonzerejének.

7. Az OLAP-technológiák alkalmazási körei.

Az OLAP mindenhol alkalmazható, ahol többváltozós adatelemzési feladat van. Általánosságban elmondható, hogy ha van néhány adattáblázata, amelyben van legalább egy leíró oszlop (dimenzió) és egy oszlop számokkal (mérések vagy tények), akkor az OLAP eszköz általában hatékony eszköz a jelentések elemzéséhez és készítéséhez.

Nézzük meg az OLAP technológiák alkalmazási területeit a valós életből.

1. Értékesítés.

Az értékesítési struktúra elemzése alapján megoldódnak a vezetői döntések meghozatalához szükséges kérdések: az áruválaszték, az árak megváltoztatása, az üzletek, fiókok bezárása és megnyitása, a kereskedőkkel való szerződések felmondása és aláírása, reklámkampányok lebonyolítása vagy megszüntetése stb.

2. Vásárlások.

A feladat az értékesítési elemzés ellentéte. Sok vállalkozás beszállítóktól vásárol alkatrészeket és anyagokat. A kereskedők árukat vásárolnak viszonteladás céljából. A beszerzési elemzésben számos feladat lehetséges, a készpénz tervezésétől a múltbeli tapasztalatok alapján egészen a a vezetők feletti ellenőrzést szállítók kiválasztása.

3. Árak.

A vásárlások elemzése szorosan összefügg a piaci árak elemzésével. Az elemzés célja a költségek optimalizálása, a legelőnyösebb ajánlatok kiválasztása.

4. Marketing.

Marketingelemzés alatt csak a vevők vagy a vevők-fogyasztók elemzési területét értjük. Ennek az elemzésnek a feladata a termék helyes pozicionálása, a célzott reklámozáshoz vásárlói csoportok azonosítása, valamint a választék optimalizálása. Az OLAP feladata ebben az esetben, hogy olyan eszközt adjon a felhasználónak, amellyel gyorsan, gondolkodási sebességgel választ kaphat az adatok elemzése során intuitív módon felmerülő kérdésekre.

5. Raktár.

A raktári egyenlegek szerkezetének elemzése az árutípusok, raktárak összefüggésében, az áruk eltarthatóságának elemzése, a szállítmány címzett szerinti elemzése és sok más, a vállalat számára fontos elemzési típus akkor lehetséges, ha a szervezet rendelkezik raktári könyveléssel.

6. Pénzforgalom.

Ez az elemzés egész területe, sok iskolával és módszertannal. Az OLAP technológia eszközként szolgálhat ezen technikák megvalósításához vagy fejlesztéséhez, de semmiképpen sem helyettesítheti őket. Elemezi a nem készpénz és készpénz készpénzforgalmát az üzleti tranzakciók, a partnerek, a pénznemek és az idő függvényében az áramlások optimalizálása, a likviditás biztosítása stb. A mérések összetétele erősen függ az üzletág, az iparág sajátosságaitól és a módszertantól.

7. Költségvetés.

Az OLAP technológiák egyik legtermékenyebb alkalmazási területe. Nem véletlen, hogy egyetlen modern költségvetési rendszer sem tekinthető teljesnek anélkül, hogy összetételében ne jelennének meg OLAP-eszközök a költségvetés elemzéséhez. A legtöbb költségvetési jelentés könnyen elkészíthető az OLAP-rendszerek alapján. A jelentések ugyanakkor nagyon sokféle kérdésre választ adnak: a kiadások és bevételek szerkezetének elemzése, egyes tételek kiadásainak összehasonlítása a különböző részlegeknél, egyes tételeknél a kiadások dinamikájának és trendjeinek elemzése, költség és nyereség elemzése. .

8. Számlák.

A klasszikus, számlaszámból álló, bejövő egyenlegeket, forgalmakat és kimenő egyenlegeket tartalmazó mérleg tökéletesen elemezhető az OLAP rendszerben. Ezen kívül az OLAP rendszer automatikusan és nagyon gyorsan ki tudja számítani a többági szervezet összevont egyenlegeit, havi, negyedéves és éves egyenlegeit, a számlahierarchia szerinti összesített egyenlegeket, analitikai jellemzők alapján analitikus egyenlegeket.

9. Pénzügyi beszámolás.

A technológiailag fejlett jelentési rendszer nem más, mint nevesített mutatók összessége, dátum szerinti értékekkel, amelyeket csoportosítani és különböző szempontok szerint összegezni kell a konkrét jelentések elkészítéséhez. Ebben az esetben a jelentések megjelenítése és nyomtatása a legegyszerűbb és legolcsóbb megoldás az OLAP rendszerekben. Mindenesetre a vállalat belső jelentési rendszere nem annyira konzervatív, és átépíthető, hogy pénzt takarítsanak meg a riportok elkészítésével kapcsolatos technikai munkán, és megszerezzék a többdimenziós működési elemzés lehetőségeit.

10. Weboldal forgalma.

Az internetes szerver naplófájlja többdimenziós jellegű, ami azt jelenti, hogy alkalmas OLAP elemzésre. A tények a következők: a látogatások száma, a találatok száma, az oldalon eltöltött idő és a naplóban elérhető egyéb információk.

11. Termelési mennyiségek.

Ez egy másik példa a statisztikai elemzésre. Így elemezhető a termesztett burgonya, az acélolvasztott, a megtermelt áru mennyisége.

12. Fogyóeszközök fogyasztása.

Képzelj el egy üzemet, amely több tucat műhelyből áll, amelyek hűtést fogyasztanak, öblítő folyadékok, olajok, rongyok, csiszolópapír - több száz tétel Kellékek... A pontos tervezéshez és a költségoptimalizáláshoz a fogyóeszközök tényleges fogyasztásának alapos elemzése szükséges.

13. Helyiséghasználat.

A statisztikai elemzés másik fajtája. Példák: tantermek, bérelt épületek és helyiségek leterheltségének elemzése, konferenciatermek használata stb.

14. Munkavállalói fluktuáció a vállalkozásnál.

A vállalati személyzet fluktuációjának elemzése ágazatok, részlegek, szakmák, iskolai végzettség, nem, életkor, idő függvényében.

15. Személyforgalom.

Az eladott jegyek számának és mennyiségének elemzése évszakok, irányok, autótípusok (osztályok), vonattípusok (repülőgépek) összefüggésében.

Az alkalmazási kör nem korlátozódik erre a listára. OLAP - technológiák. Vegyük például a technológiát OLAP -elemzés az értékesítés területén.

8. Használati példa OLAP - Elemzési technológiák az értékesítés területén.

Többdimenziós adatábrázolás tervezése a OLAP -az elemzés a mérési térkép kialakításával kezdődik. Például az eladások elemzésekor célszerű lehet a piac egyes részeit (fejlődő, stabil, nagy- és kisfogyasztók, új fogyasztók megjelenésének valószínűsége stb.) elkülöníteni, és termékenként, területenként, vásárlónként értékelni az értékesítési volumeneket, piaci szegmensek, elosztási csatornák stb. a megrendelések nagysága. Ezek az irányok alkotják az értékesítés többdimenziós nézetének rácsát - dimenzióinak szerkezetét.

Mivel minden vállalkozás tevékenysége időben zajlik, az elemzés során az első kérdés az üzletfejlesztés dinamikájának kérdése. Az időtengely helyes szervezése minőségi választ ad erre a kérdésre. Az időtengely általában évekre, negyedévekre és hónapokra van felosztva. Még több hetekre és napokra bontás lehetséges. Az időbeli dimenzió szerkezete az adatfogadás gyakoriságának figyelembevételével kerül kialakításra; az információigény gyakoriságától is függhet.

A „termékcsoport” dimenziót úgy alakították ki, hogy a lehető legpontosabban tükrözze az értékesített termékek szerkezetét. Ugyanakkor fontos egy bizonyos egyensúly betartása annak érdekében, hogy egyrészt elkerüljük a túlzott részletezést (látható legyen a csoportok száma), másrészt ne hagyjuk ki a piac jelentős szegmensét .

A „Vásárlók” dimenzió az értékesítések földrajzi elhelyezkedés szerinti szerkezetét tükrözi. Minden dimenziónak lehetnek saját hierarchiái, például ebben a dimenzióban lehet egy struktúra: Országok - Régiók - Városok - Ügyfelek.

Az osztályok teljesítményének elemzéséhez létre kell hoznia saját dimenzióját. Például a hierarchia két szintjét különböztetheti meg: a részlegeket és azok alosztályait, amelyeknek tükröződniük kell a „Részlegek” dimenzióban.

Valójában az "Idő", "Termékek", "Vásárlók" dimenziók teljesen meghatározzák a tárgyterület terét.

Ezenkívül célszerű ezt a teret feltételes területekre osztani, alapul véve a számított jellemzőket, például a tranzakciók volumenének tartományait értékben. Ezután az egész üzletet fel lehet osztani számos értéktartományra, amelyekben azt végzik. Ebben a példában a következő mutatókra korlátozhatja magát: az áruk értékesítésének mennyisége, az eladott áruk száma, a bevétel összege, a tranzakciók száma, a vásárlók száma, a gyártóktól történő vásárlások mennyisége.

OLAP – az elemzéshez használt kocka így fog kinézni (2. ábra):


2. ábra.OLAP- egy kocka az eladások mennyiségének elemzéséhez

Pontosan egy ilyen háromdimenziós tömböt nevezünk OLAP kifejezéssel kockának. Valójában a szigorú matematika szempontjából egy ilyen tömb nem mindig lesz kocka: egy valódi kockának minden dimenzióban ugyanannyi elemet kell tartalmaznia, míg az OLAP kockáknak nincs ilyen korlátozása. Egy OLAP kockának egyáltalán nem kell 3D-snek lennie. Lehet két- és többdimenziós is – a megoldandó problémától függően. A komoly OLAP termékeket körülbelül 20 méretre tervezték, az egyszerűbb asztali alkalmazások pedig körülbelül 6 dimenziót támogatnak.

A kocka korántsem minden elemét ki kell tölteni: ha nincs információ a 2. termék értékesítéséről a 3. vevőnek a harmadik negyedévben, akkor a megfelelő cellában lévő érték egyszerűen nem kerül meghatározásra.

Maga a kocka azonban nem alkalmas elemzésre. Ha még lehetséges egy háromdimenziós kockát megfelelően ábrázolni vagy ábrázolni, akkor hat- ill. tizenkilenc dimenziós sokkal rosszabb a helyzet. Ezért használat előtt a közönséges kétdimenziós táblázatokat kivonják a többdimenziós kockából. Ezt a műveletet a kocka "szeletelésnek" nevezik. Az elemző úgymond veszi és "levágja" a kocka méreteit az érdeklődésre számot tartó címkék szerint. Ily módon az elemző vesz egy kétdimenziós szeletet a kockából (jelentés), és azzal dolgozik. A jelentés szerkezetét a 3. ábra mutatja.

3. ábra.Az elemző jelentés szerkezete

Vágjuk fel az OLAP - kockánkat, és kapjuk meg a harmadik negyedév értékesítési jelentését, ez így fog kinézni (4. ábra).

4. ábra.Harmadik negyedéves értékesítési jelentés

A kockát egy másik tengely mentén vághatja, és jelentést kaphat a 2. termékcsoport év közbeni értékesítéséről (5. ábra).

5. ábra.Termékértékesítési negyedéves jelentés 2

Hasonlóképpen elemezheti az ügyféllel fennálló kapcsolatot 4, a kocka levágásával a Kliensek címkénél(6. ábra)

6. ábra.Jelentés az áru ügyfélnek történő átadásáról 4

Havonta részletezheti a jelentést, vagy beszélhet az áruk szállításáról egy adott ügyfélfiókhoz.

adattárolás operatív adatbázisok pillanatképei alapján jönnek létre tájékoztatási rendszerés esetleg különféle külső források. Az adattárházak adatbázis-technológiákat, OLAP-ot, mély adatelemzést, adatvizualizációt használnak.

Az adattárházak főbb jellemzői.

  • történelmi adatokat tartalmaz;
  • részletes információkat, valamint részben és teljesen összesített adatokat tárol;
  • az adatok többnyire statikusak;
  • ad-hoc, strukturálatlan és heurisztikus adatfeldolgozási módszer;
  • közepes és alacsony intenzitású tranzakciófeldolgozás;
  • az adatok kiszámíthatatlan felhasználási módja;
  • elemzésre szánták;
  • összpontosított tématerületek;
  • stratégiai döntéshozatal támogatása;
  • viszonylag kis számú vezetőt szolgál ki.

Az OLAP (On-Line Analytical Processing) kifejezés az adatmegjelenítési modellt és ennek megfelelően az adattárházakban történő feldolgozásának technológiáját írja le. Az OLAP az összesített adatok többdimenziós nézetét használja, hogy gyors hozzáférést biztosítson a stratégiai információkhoz a mélyreható elemzéshez. Az OLAP alkalmazásoknak a következő alapvető tulajdonságokkal kell rendelkezniük:

  • többdimenziós adatok bemutatása;
  • komplex számítások támogatása;
  • az időtényező helyes figyelembevétele.

Az OLAP előnyei:

  • Az emelkedés termelékenység gyártó személyzet, fejlesztők alkalmazási programok... Időszerű hozzáférés a stratégiai információkhoz.
  • bőséges lehetőséget biztosítva a felhasználóknak, hogy saját maguk módosítsák a sémát.
  • OLAP alkalmazások támaszkodnak adattárolásés OLTP rendszerek, naprakész adatok fogadása tőlük, ami lehetővé teszi a mentést integritás ellenőrzése vállalati adatok.
  • az OLTP rendszerek terhelésének csökkentése és adattárolás.

OLAP és OLTP. Jellemzők és főbb különbségek

OLAP OLTP
Adattár belső vállalati és külső adatokat is tartalmaznia kell az üzemi adatbázisba kerülő információ fő forrása a társaság tevékenysége, az adatok elemzéséhez külső információforrások (pl. statisztikai jelentések) bevonása szükséges.
Az elemző adatbázisok mennyisége legalább egy nagyságrenddel nagyobb, mint a működőké. a megbízható elemzéshez és előrejelzéshez adattár több éves információval kell rendelkeznie a társaság tevékenységéről és a piac helyzetéről Az operatív feldolgozáshoz az elmúlt hónapok adataira van szükség
Adattár egységesen bemutatott és egyeztetett információkat kell tartalmaznia, amelyek a legjobban illeszkednek az operatív adatbázisok tartalmához. A különböző forrásokból származó információk kinyeréséhez és "megtisztításához" egy komponensre van szükség. Sok nagyvállalat egyidejűleg több működő IS-vel rendelkezik saját adatbázissal (történelmi okokból). Az operatív adatbázisok szemantikailag egyenértékű információkat tartalmazhatnak különböző formátumok, kézhezvételének időpontjának eltérő, esetenként ellentmondásos megjelölésével
Az analitikai adatbázis lekérdezések halmaza lehetetlen megjósolni. adattárolás léteznek, hogy válaszoljanak az ad hoc elemzői kérésekre. Csak arra számíthat, hogy a kérések nem érkeznek túl gyakran, és nagy mennyiségű információt tartalmaznak. Az analitikai adatbázis mérete ösztönzi a lekérdezések használatát aggregátumokkal (összeg, minimum, maximum, átlagos stb.) Az adatfeldolgozó rendszerek a megoldást szem előtt tartva jönnek létre konkrét feladatokat... Az adatbázisból az információkat gyakran és kis részletekben választják ki. Általában az operatív adatbázis lekérdezésének halmaza már a tervezés során ismert.
Az analitikai adatbázisok alacsony variabilitása mellett (csak adatok betöltésekor) a tömbök rendezése ésszerű, gyorsabb indexelési módszernek bizonyul tömeges mintavételre, előre összesített adatok tárolására. Az adatfeldolgozó rendszerek természetüknél fogva erősen illékonyak, amit a használt DBMS-ben figyelembe vesznek (normalizált adatbázis-struktúra, a karakterláncok rendezetlen tárolása, B-fák az indexeléshez, tranzakciós)
Az analitikus adatbázis-információk annyira kritikusak egy vállalat számára, hogy a védelem nagymértékű granulátumára van szükség (egyéni hozzáférési jogok a táblázat egyes soraihoz és/vagy oszlopaihoz) Adatfeldolgozó rendszerek esetében általában elég információvédelem az asztal szintjén

Codd-szabályok OLAP-rendszerekhez

1993-ban Codd kiadott egy munkát OLAP for Analytic Users: The Way It Should Be címmel. Ebben felvázolta az online analitikus feldolgozás alapfogalmait, és 12 szabályt azonosított, amelyeknek meg kell felelniük az online analitikus feldolgozást lehetővé tevő termékeknek.

  1. Fogalmi többdimenziós nézet. Az OLAP-modellnek magjában többdimenziósnak kell lennie. A többdimenziós fogalmi diagram vagy egyéni nézet megkönnyíti a modellezést és elemzést, valamint a számítást.
  2. Átláthatóság. A felhasználó az összes szükséges adatot megkaphatja az OLAP gépről anélkül, hogy tudná, honnan származnak. Függetlenül attól, hogy az OLAP termék része a felhasználó eszközeinek, vagy sem, ennek a ténynek láthatatlannak kell lennie a felhasználó számára. Ha az OLAP-ot kliens-szerver oldali számítástechnika biztosítja, akkor ennek a ténynek is, ha lehetséges, láthatatlannak kell lennie a felhasználó számára. Az OLAP-ot egy valóban nyitott architektúra kontextusában kell bemutatni, amely lehetővé teszi a felhasználó számára, hogy bárhol is legyen, egy elemző eszköz segítségével kommunikáljon a szerverrel. Ezen túlmenően az átláthatóságot is biztosítani kell, amikor az elemző eszköz homogén és heterogén adatbázis-környezetekkel kölcsönhatásba lép.
  3. Elérhetőség. Az OLAP-nak biztosítania kell a sajátját logikai diagram heterogén adatbázis-környezetben való hozzáféréshez, és megfelelő átalakításokat hajt végre a felhasználó adatszolgáltatása érdekében. Sőt, előre ügyelni kell arra, hogy hol és hogyan, milyen típusok fizikai szervezettség adatok ténylegesen felhasználásra kerülnek. Az OLAP rendszernek csak a ténylegesen szükséges adatokhoz kell hozzáférnie, nem kell alkalmaznia általános elv"konyhai tölcsér", ami szükségtelen bevitelt von maga után.
  4. Állandó teljesítmény jelentések elkészítésekor. Teljesítmény A jelentéskészítés nem csökkenhet jelentősen a dimenziók számának és az adatbázis méretének növekedésével.
  5. Kliens-szerver architektúra. A terméknek nemcsak kliensnek/szervernek kell lennie, hanem a szerverkomponensnek is kellően intelligensnek kell lennie ahhoz, hogy a különböző kliensek minimális erőfeszítéssel és programozással kapcsolódjanak.
  6. Általános többdimenziósság. Minden méretnek egyenlőnek kell lennie, minden méretnek egyenértékűnek kell lennie mind felépítésében, mind működési képességeiben. Igaz, az egyedi mérésekhez további működési lehetőségek megengedettek (nyilván az időről van szó), de ilyen további funkciókat bármely dimenzióhoz meg kell adni. Ennek nem kellene olyan alapvetőnek lennie adatstruktúrák, a számítási vagy jelentési formátumok bármely dimenzióra jellemzőbbek voltak.
  7. Dinamikus vezérlés ritka mátrixok... Az OLAP rendszereknek automatikusan módosítaniuk kell fizikai sémájukat a modell típusa, az adatmennyiség és az adatbázis ritkasága alapján.
  8. Többjátékos támogatás. Az OLAP eszköznek képességeket kell biztosítania megosztás(kérés és kiegészítés), integritás és biztonság.
  9. Korlátlan számú crossover. Mindenféle mérést engedélyezni kell.
  10. Intuitív adatkezelés. Az adatok manipulálása a cellákon végrehajtott közvetlen műveletekkel történt nézet módban menük és több művelet nélkül.
  11. Rugalmas jelentési lehetőségek. A méréseket úgy kell elhelyezni a jelentésben, ahogyan a felhasználó igényli.
  12. Korlátlan

Bevezetés

Korunkban szinte egyetlen szervezet sem nélkülözheti az adatbázis-kezelő rendszereket, különösen azok közül, amelyek hagyományosan az ügyfelekkel való interakcióra összpontosítanak. Bankok, biztosítótársaságok, légitársaságok és egyéb közlekedési társaságok, szupermarket-láncok, távközlési és marketingcégek, szolgáltató szervezetek és mások – mind gigabájtnyi adatot gyűjtenek és tárolnak adatbázisaikban az ügyfelekről, termékekről és szolgáltatásokról. Az ilyen információk értéke kétségtelen. Az ilyen adatbázisokat operatívnak vagy tranzakciósnak nevezzük, mert nagyszámú kis tranzakció vagy írási-olvasási műveletek jellemzik őket. Számítógépes rendszerek A tranzakciók elszámolását és a tranzakciós alapokhoz való tényleges hozzáférést általában online tranzakciófeldolgozó rendszerek (OLTP - On-Line Tranzakciófeldolgozás) vagy számviteli rendszerek hívják.

A számviteli rendszereket úgy hangolják és optimalizálják, hogy a lehető legtöbb tranzakciót hajtsák végre rövid időn belül. Általában az egyes műveletek nagyon kicsik és nem kapcsolódnak egymáshoz. Azonban minden olyan adatrekord, amely az ügyféllel való interakciót jellemzi (támogatási hívás, készpénzes tranzakció, katalógusrendelés, a cég honlapjának látogatása stb.) felhasználható minőségileg új információk megszerzésére, nevezetesen riportok készítésére, ill. elemzi a cég tevékenységét...

A számviteli rendszerekben az elemző funkciók köre általában nagyon korlátozott. Az OLTP-alkalmazásokban használt sémák megnehezítik az egyszerű riportok készítését is, mivel az adatok legtöbbször több táblára oszlanak el, és az összesítésükhöz összetett összekapcsolásokat kell végrehajtani. Az összetett jelentések létrehozására tett kísérletek általában számításigényesek, és teljesítménycsökkenést okoznak.

Emellett a számviteli rendszerek folyamatosan változó adatokat tárolnak. A tranzakciók összegyűjtése során a végösszegek nagyon gyorsan változnak, így két, több perces időközönként végzett elemzés eltérő eredményt adhat. Az elemzést leggyakrabban a jelentési időszak végén végzik el, ellenkező esetben a kép torzulhat. Emellett az elemzéshez szükséges adatok több rendszerben is tárolhatók.

Egyes elemzések olyan szerkezeti változtatásokat igényelnek, amelyek a jelenlegi működési környezetben elfogadhatatlanok. Például ki kell találnia, mi történik, ha a vállalatnak új termékei vannak. Ilyen kutatásokat élő alapon nem lehet végezni. Következésképpen a hatékony elemzés ritkán történik közvetlenül a számviteli rendszerben.

A döntéstámogató rendszerek általában rendelkeznek olyan eszközökkel, amelyek a kezdeti halmaz különböző mintáihoz aggregált adatokat biztosítanak a felhasználónak olyan formában, amely kényelmes az észleléshez és elemzéshez. Általános szabály, hogy ilyen összesített függvények többdimenziós (és ezért nem relációs) adathalmazt alkotnak (gyakran hiperkockának vagy metakockának nevezik), amelynek tengelyei paramétereket, a cellák pedig - az ezektől függő összesített adatok - tartalmaznak, és az ilyen adatok relációs rendszerben is tárolhatók. táblázatok. Az egyes tengelyek mentén az adatok egy reprezentatív hierarchiába rendezhetők különböző szinteken azok adatait. Ezzel az adatmodellel a felhasználók megfogalmazhatnak összetett lekérdezések, jelentéseket generál, adatok részhalmazait kapja meg.

Pontosan ez vezette az érdeklődést a döntéstámogató rendszerek iránt, amelyek az OLAP (On-Line Analytical Processing, on-line analitikus feldolgozás, on-line adatelemzés) fő alkalmazási területévé váltak, ami megfordítja az „ércet”. Az OLTP-rendszereket egy kész „termékké”, amelyet a menedzserek és az elemzők közvetlenül használhatnak. Ez a módszer lehetővé teszi az elemzők, vezetők és vezetők számára, hogy a felhalmozott adatok "mélyére kerüljenek" az információs nézetek széles skálájához való gyors és következetes hozzáférés révén.

A cél lejáratú papírok az OLAP technológia figyelembevétele.

többdimenziós analitikai adatfeldolgozás

Fő rész

1 Az OLAP értelmezése

Az OLAP koncepció a többdimenziós adatmegjelenítés elvén alapul. 1993-ban az OLAP kifejezést Edgar Codd alkotta meg. A relációs modell hiányosságait mérlegelve mindenekelőtt az adatok „többdimenziós, azaz a vállalati elemzők számára legérthetőbb kombinálásának, szemlélésének és elemzésének lehetetlenségére” mutatott rá, és meghatározta a Az OLAP-rendszerekre vonatkozó általános követelmények, amelyek kiterjesztik a relációs DBMS funkcionalitását, és egyik jellemzőjeként a többdimenziós elemzést is tartalmazzák.

Számos publikációban az OLAP rövidítés nemcsak az adatok többdimenziós nézetét jelöli, hanem magának az adatnak a többdimenziós adatbázisban való tárolását is. Általánosságban elmondható, hogy ez nem igaz, mivel Codd maga is megjegyzi, hogy „A relációs adatbázisok voltak, vannak és lesznek a legalkalmasabb technológia a vállalati adatok tárolására. új technológia DB, hanem olyan elemző eszközökben, amelyek kiegészítik a meglévő DBMS funkcióit, és elég rugalmasak ahhoz, hogy előre jelezzék és automatizálják különböző típusok az OLAP-ban rejlő intellektuális elemzés. „Ez a zűrzavar olyan ellentétekhez vezet, mint az „OLAP vagy ROLAP”, ami nem teljesen helytálló, mivel a ROLAP (relációs OLAP) koncepcionálisan támogatja az OLAP kifejezés által meghatározott összes funkciót. a többdimenziós DBMS-en alapuló speciális kifejezés MOLAP.Codd szerint a többdimenziós fogalmi nézet több független dimenzióból álló több perspektíva, amely mentén meghatározott adathalmazok elemezhetők.A több dimenzióra kiterjedő szimultán elemzést többváltozós elemzésnek nevezzük. az adatkonszolidáció irányai, amelyek egymást követő általánosítási szintek sorozatából állnak, ahol minden magasabb szint a megfelelő dimenzióhoz tartozó nagyobb fokú adataggregációnak felel meg.

Az előadót a konszolidáció iránya határozhatja meg, amely a „vállalkozás – részleg – osztály – alkalmazott” általánosítási szintekből áll. Az Idő dimenzió akár két konszolidációs irányt is tartalmazhat - év - negyedév - hónap - nap és hét - nap, mivel a hónapok és a hét szerinti időszámlálás nem kompatibilis. Ebben az esetben lehetővé válik, hogy az egyes mérésekhez tetszőlegesen kiválassza a kívánt információs részletezési szintet. A lefúrási művelet a konszolidáció magasabb szakaszaiból az alacsonyabbak felé történő elmozdulásnak felel meg; éppen ellenkezőleg, a felgöngyölítési művelet azt jelenti, hogy alacsonyabb szintekről magasabb szintre lépünk.

A Codd 12 szabályt határoz meg, amelyeket be kell tartani szoftver OLAP osztály.

1.2 Az online analitikai feldolgozó eszközökre vonatkozó követelmények

Többdimenziós fogalmi nézet. Az adatmodell fogalmi ábrázolásának egy OLAP-termékben többdimenziósnak kell lennie, azaz lehetővé kell tennie az elemzők számára a konszolidációs irányok intuitív szeletelési, forgatási és elforgatási műveleteit. Átláthatóság A felhasználónak nem szabad tisztában lennie azzal, hogy milyen konkrét eszközöket használnak az adatok tárolására és feldolgozására, hogyan szerveződnek az adatok és honnan származnak.

Megközelíthetőség. Az elemzőnek képesnek kell lennie arra, hogy közös koncepcionális keretek között végezzen elemzést, ugyanakkor az adatok az DBMS fennmaradó örökségének ellenőrzése alatt maradjanak, miközben az általános analitikai modellhez kötődve. Ez azt jelenti, hogy az OLAP eszközkészletnek a logikai sémáját rá kell helyeznie a fizikai adatkészletekre, végrehajtva az összes szükséges átalakítást ahhoz, hogy egységes, következetes és holisztikus képet adjon a felhasználóról az információkról.

Következetes jelentési teljesítmény A dimenziók számának és az adatbázis méretének növekedésével az elemzők nem tapasztalhatnak teljesítményromlást. A tartós teljesítmény elengedhetetlen a könnyű használat és az OLAP végfelhasználóhoz való eljuttatásához szükséges bonyolultságtól való megszabaduláshoz.

Kliens - szerver architektúra (Client-Server Architecture). Az on-line analitikai feldolgozást igénylő adatok nagy részét nagyszámítógépes rendszerekben tárolják, és a személyi számítógépek... Ezért az egyik követelmény az, hogy az OLAP termékek működjenek kliens-szerver környezetben. A fő gondolat itt az, hogy az OLAP eszköz szerverkomponensének kellően intelligensnek kell lennie, és képesnek kell lennie egy általános fogalmi diagram felépítésére a különféle logikai és fizikai vállalati adatbázissémák általánosítása és konszolidációja alapján, hogy átlátható hatást biztosítson.

Általános dimenzionalitás Minden adatmérésnek egyenlőnek kell lennie. Az egyes méretekhez további jellemzők biztosíthatók, de mivel mindegyik szimmetrikus, ez a kiegészítő funkcionalitás bármely mérethez biztosítható. Az alapul szolgáló adatstruktúra, képletek és jelentésformátumok nem támaszkodhatnak egyetlen dimenzióra sem.

Dinamikus ritka mátrixkezelés. Az OLAP eszköznek képesnek kell lennie a ritka mátrixok optimális kezelésére. A hozzáférési sebességet az adatcellák helyétől függetlenül fenn kell tartani, és állandónak kell lennie a különböző dimenziószámú és eltérő adatritkaságú modelleknél.

Többfelhasználós mód támogatása (Multi-User Support). Gyakran több elemzőnek kell egyszerre dolgoznia ugyanazzal az elemzési modellel, vagy különböző modelleket kell létrehoznia ugyanazon vállalati adatok alapján. Az OLAP eszköznek egyidejű hozzáférést, adatintegritást és védelmet kell biztosítania számukra.

Korlátlan keresztdimenziós műveletek. Az adatok tetszőleges számú dimenzióban történő kiszámítása és manipulálása nem tilthat vagy korlátozhat semmilyen kapcsolatot az adatcellák között. A tetszőleges definíciót igénylő transzformációkat funkcionálisan teljes formulanyelven kell megadni.

Intuitív adatkezelés. A konszolidációs irányok átirányítását, az adatok oszlopokban és sorokban való részletezését, az összesítést és a konszolidációs irányok hierarchiájának szerkezetében rejlő egyéb manipulációkat a legkényelmesebb, természetes és kényelmes felhasználói felületen kell végrehajtani.

Rugalmas jelentési mechanizmus (Flexible Reporting). Támogatni kell az adatmegjelenítés különböző módjait, vagyis a jelentéseket tetszőleges orientációban kell bemutatni.

Korlátlan méretek és összesítési szintek. Erősen ajánlott legalább tizenöt, de lehetőleg húsz dimenziót feltételezni az analitikai modellben minden komoly OLAP eszközben.

2 OLAP rendszerek összetevői

2.1 Szerver. Vevő. Internet

Az OLAP lehetővé teszi nagy mennyiségű adat gyors és hatékony elemzését. Az adatok tárolása többdimenziós formában történik, amely a legjobban tükrözi a valós üzleti adatok természetes állapotát. Ezenkívül az OLAP lehetővé teszi a felhasználók számára az összefoglaló adatok gyorsabb és egyszerűbb lekérését. Segítségével elmélyülhetnek ezen adatok tartalmában, ha szükséges részletesebb információkhoz.

Az OLAP rendszer sok összetevőből áll. A bemutatás legmagasabb szintjén a rendszer egy adatforrást, egy OLAP szervert és egy klienst tartalmaz. Az adatforrás egy olyan forrás, amelyből az adatok elemzésre kerülnek. A forrásból származó adatok átvitelre vagy másolásra kerülnek az OLAP-kiszolgálóra, ahol rendszerezi és előkészíti a lekérdezésekre adott válaszok gyorsabb későbbi generálására. Az ügyfél az OLAP-kiszolgáló felhasználói felülete. A cikk ezen része az egyes összetevők funkcióit és az egész rendszer egészének jelentőségét írja le. Források. Az OLAP rendszerekben a forrás az a szerver, amely az adatokat szolgáltatja az elemzéshez. Az OLAP termék hatókörétől függően a forrás lehet adattárház, általános adatokat tartalmazó örökölt adatbázis, pénzügyi adatokat kombináló táblakészlet vagy a fentiek bármilyen kombinációja. Nagyon fontos, hogy az OLAP-termékek különböző forrásokból származó adatokkal tudjanak dolgozni. Egységes formátumot igénylő ill egyetlen alap amely az összes eredeti adatot tárolná, nem alkalmas adatbázis-adminisztrátorok számára. Ezenkívül ez a megközelítés csökkenti az OLAP termék rugalmasságát és teljesítményét. A rendszergazdák és a felhasználók egyaránt úgy gondolják, hogy azok az OLAP-termékek, amelyek nemcsak különböző, hanem több forrásból is kinyerik az adatokat, rugalmasabbak és hasznosabbak, mint a szigorúbb követelményeket támasztó termékek.

Szerver. Az OLAP-kiszolgáló az OLAP-rendszer alkalmazott része. Ez az összetevő elvégzi az összes munkát (a rendszermodelltől függően), és magában tárolja az összes olyan információt, amelyhez aktív hozzáférést biztosít. A szerver architektúrát különféle koncepciók szabályozzák. Az OLAP-termékek fő funkcionális jellemzője egy többdimenziós (MMDB, MDDB) vagy relációs (RDB, RDB) adatbázis használata adattárolásra. Összesített / Előre összesített adatok

A gyors lekérdezés megvalósítása elengedhetetlen az OLAP számára. Ez az OLAP egyik alapelve – az adatok intuitív kezelésének képessége megköveteli az információ gyors visszakeresését. Általában minél több számítást igényel egy információ megszerzése, annál lassabb a válasz. Ezért a lekérdezések megvalósításához szükséges idő megtakarítása érdekében az általában leggyakrabban elért, de ugyanakkor számítást igénylő információkat előzetes összesítésnek vetjük alá. Vagyis megszámlálják, majd új adatként tárolják az adatbázisban. Az előre kiszámítható adattípusra példa az összefoglaló adatok – például az értékesítési adatok hónaponként, negyedévenként vagy évenként –, amelyekre a ténylegesen bevitt adatok napi adatok.

A különböző szállítók eltérő kiválasztási módszerekkel rendelkeznek az előzetes összesítést és számos előre kiszámított értéket igénylő paraméterekhez. Az aggregációs megközelítés mind az adatbázis, mind a lekérdezés végrehajtási idejét befolyásolja. Ha több értéket számítanak ki, megnő annak a valószínűsége, hogy a felhasználó egy már kiszámított értéket fog kérni, így a válaszidő is rövidebb lesz, mivel nem kell a kezdeti értéket kérni a számításhoz. Ha azonban az összes lehetséges érték kiszámítása nem a legjobb megoldás - ebben az esetben az adatbázis mérete jelentősen megnő, ami kezelhetetlenné teszi, és az összesítési idő túl hosszú lesz. Ezen túlmenően, ha számértékeket adnak hozzá az adatbázishoz, vagy ha azok megváltoznak, akkor ennek az információnak az előre kiszámított értékekben kell tükröződnie az új adatoktól függően. Így nagyszámú előre kalkulált érték esetén az adatbázis frissítése is elhúzódhat. Mivel az adatbázis általában offline állapotban van az aggregálás során, kívánatos, hogy az aggregálási idő ne legyen túl hosszú.

Vevő. A kliens az adatbázisban lévő adatok megjelenítésére és kezelésére szolgál. A kliens lehet egészen egyszerű - táblázat formájában, melyben olyan OLAP lehetőségek vannak, mint például az adatrotáció (pivoting) és az adatmélyítés (drilling), és lehet egy speciális, de ugyanolyan egyszerű riportnézegető ill. Legyen olyan erős, mint egy egyedi tervezésű, összetett adatkezelésre tervezett alkalmazás. Az internet a kliens új formája. Emellett az új technológiák bélyegét is magán viseli; sok internetes megoldás jelentősen különbözik általában a képességeiben és különösen az OLAP megoldások minőségében. Ez a rész az egyes klienstípusok különféle funkcionális tulajdonságait tárgyalja.

Míg a szerver az OLAP-megoldások gerince, az ügyfél ugyanolyan fontos. A szerver szilárd alapot biztosíthat az adatkezelés megkönnyítéséhez, de ha a kliens összetett vagy nem túl működőképes, a felhasználó nem tudja teljes mértékben kihasználni a nagy teljesítményű szerver előnyeit. Az ügyfél annyira fontos, hogy sok szállító kizárólag az ügyfelek fejlesztésére összpontosítja erőfeszítéseit. Minden, amit ezek az alkalmazások tartalmaznak, az egy szabványos felület, előre meghatározott funkciók és struktúra, valamint gyors megoldások többé-kevésbé szabványos helyzetekre. Például népszerűek a pénzügyi csomagok. Az előre elkészített pénzügyi alkalmazások lehetővé teszik a szakemberek számára, hogy ismert pénzügyi eszközöket használjanak anélkül, hogy adatbázis-struktúrát vagy általános űrlapokat és jelentéseket kellene kialakítaniuk. Lekérdező eszköz / Jelentésgenerátor. Egy lekérdező eszköz vagy jelentéskészítő egyszerű hozzáférést biztosít az OLAP adatokhoz. Könnyen használhatóak grafikus felületés lehetővé teszi a felhasználók számára, hogy jelentéseket készítsenek úgy, hogy objektumokat helyeznek át egy jelentésbe a " húzza és"Míg a hagyományos jelentéskészítő lehetővé teszi a felhasználó számára, hogy gyorsan kiadja a formázott jelentéseket, az OLAP-képes jelentéskészítők naprakész jelentéseket készítenek. A végtermék egy olyan jelentés, amely képes részletezni az adatokat szint, forgatás (pivot) jelentések, támogatás hierarchiák és stb. Add-In (kiegészítések) a táblázatokhoz.

Manapság számos üzletágban a vállalati adatok különféle elemzési formáit végzik táblázatok segítségével. Bizonyos értelemben ideális jelentés- és adatmegjelenítő. Az elemző létrehozhat olyan makrókat, amelyek egy kiválasztott irányban manipulálják az adatokat, a sablon pedig úgy alakítható ki, hogy az adatok megadásakor a képletek kiszámítsák a helyes értékeket, így nincs szükség egyszerű számítások újrabevitelére.

Mindez azonban egy "lapos" jelentést eredményez, ami azt jelenti, hogy miután elkészült, nehéz különböző szögekből megnézni. Például egy diagram egy bizonyos időszakra, például egy hónapra vonatkozó információkat jelenít meg. Ha pedig valaki a nap adatait szeretné látni (a havi adatokkal ellentétben), akkor teljesen új diagramot kell készítenie. Új adatkészleteket kell meghatározni, új címkéket kell hozzáadni a diagramhoz, és sok más egyszerű, de fárasztó változtatást kell végrehajtani. Ezen kívül számos területen előfordulhatnak hibák, ami általában csökkenti a megbízhatóságot. Amikor az OLAP-ot hozzáadjuk egy táblázathoz, lehetővé válik egyetlen diagram létrehozása, majd azt különféle manipulációknak vetjük alá annak érdekében, hogy a felhasználó megkapja a szükséges információkat anélkül, hogy megterhelné magát az összes lehetséges nézet létrehozásával. Internet ügyfélként. Az internet az OLAP klienscsalád új tagja. Számos előnnyel jár az OLAP-jelentések interneten keresztüli létrehozása. A legjelentősebb az, hogy nincs szükség speciális szoftverre az információhoz való hozzáféréshez. Ezzel sok időt és pénzt takarít meg a cég.

Minden internetes termék egyedi. Néhányan megkönnyítik a weblapok létrehozását, de kevésbé rugalmasak. Mások lehetővé teszik az adatok nézeteinek létrehozását, majd azok statikus HTML-fájlként történő mentését. Mindez lehetővé teszi az adatok megtekintését az interneten keresztül, de semmi több. Segítségükkel lehetetlen aktívan manipulálni az adatokat.

Létezik egy másik típusú termék, az interaktív és dinamikus, amely az ilyen termékeket teljes funkcionalitású eszközökké alakítja. A felhasználók részletezhetik az adatokat, elforgathatják, korlátozhatják a dimenziókat stb. Mielőtt internetes implementációs eszközt választana, fontos megértenie, hogy milyen funkcionalitás szükséges egy webes megoldástól, majd meghatározza, melyik termék. a legjobb mód megtestesíti ezt a funkciót.

Alkalmazások. Az alkalmazások OLAP-adatbázisokat használó klienstípusok. Ezek megegyeznek a fent leírt lekérdező eszközökkel és jelentéskészítőkkel, de további funkciókat is adnak a termékhez. Az alkalmazás általában erősebb, mint a lekérdező eszköz.

Fejlődés. Az OLAP-szolgáltatók jellemzően fejlesztői környezetet biztosítanak a felhasználók számára saját, testreszabott alkalmazásaik létrehozásához. A fejlesztői környezet egésze egy grafikus felület, amely támogatja az objektumorientált alkalmazásfejlesztést. Ezenkívül a legtöbb szállító olyan API-t biztosít, amely felhasználható az OLAP-adatbázisok más alkalmazásokkal való integrálására.

2.2 OLAP kliensek

A beágyazott OLAP-géppel rendelkező OLAP-kliensek telepítve vannak a felhasználók számítógépére. Számításukhoz nincs szükség szerverre, és nulla adminisztrációjuk. Ezek az ügyfelek lehetővé teszik a felhasználó számára, hogy ráhangolódjon meglévő adatbázisaira; ez általában egy olyan szótárt hoz létre, amely a tárgyleírása mögé rejti az adatok fizikai szerkezetét, amely a szakember számára érthető. Az OLAP-ügyfél ezután tetszőleges lekérdezéseket futtat, és az eredményeket egy OLAP-táblázatban jeleníti meg. Ebben a táblázatban viszont a felhasználó manipulálhatja az adatokat, és több száz különféle jelentést kaphat képernyőn vagy papíron. Az RDBMS-rendszerrel való együttműködésre tervezett OLAP-kliensek lehetővé teszik a vállalatnál már elérhető adatok elemzését, például az OLTP-adatbázisban tárolt adatokat. Második céljuk azonban az adattárházak vagy adatpiacok gyors és olcsó létrehozása lehet – ebben az esetben a szervezet programozóinak csak csillagtáblázat-gyűjteményeket kell létrehozniuk relációs adatbázisokban és adatbetöltési eljárásokban. A munka legidőigényesebb része - az egyéni lekérdezések és jelentések számtalan lehetőségével rendelkező felületek írása - néhány óra alatt megvalósul az OLAP kliensben. A végfelhasználónak viszont körülbelül 30 percet vesz igénybe egy ilyen program elsajátítása. Az OLAP klienseket maguk az adatbázis-fejlesztők biztosítják, többdimenziós és relációs formában egyaránt. Ezek a SAS Corporate Reporter, amely a kényelem és szépség tekintetében szinte benchmark termék, az Oracle Discoverer, az MS Pivot Services és a Pivot Table programok stb. OLAP kampány, amelyet a Microsoft Corporation bonyolított le. Ezek általában a Pivot Table továbbfejlesztett változatai, és MS Office-ban vagy webböngészőben való használatra készültek. Ezek a Matryx, Knosys stb. termékek, amelyek egyszerűségük, alacsony költségük és hatékonyságuk miatt hatalmas népszerűségre tettek szert Nyugaton.

3 OLAP termékek osztályozása

3.1 Többdimenziós OLAP

Jelenleg nagyszámú termék van a piacon, amelyek valamilyen szinten biztosítják az OLAP funkcionalitását. Azáltal, hogy a felhasználói felülettől a forrásadatbázisig többdimenziós elvi nézetet biztosít, minden OLAP-termék három osztályba van osztva, hasonlóan a forrásadatbázishoz.

1. A legkorábbi online analitikai feldolgozó rendszerek (például az Arbor Software-től az Essbase, az Oracle-től az Oracle Express Server) a MOLAP osztályba tartoztak, azaz csak saját többdimenziós adatbázisukkal tudtak dolgozni. Szabadalmazott többdimenziós DBMS-technológiákon alapulnak, és a legdrágábbak. Ezek a rendszerek az OLAP feldolgozás teljes ciklusát biztosítják. A szerverkomponensen kívül magukban foglalják a saját integrált kliens interfészt, vagy a felhasználóval való kommunikációra használják külső programok táblázatokkal dolgozni. Az ilyen rendszerek karbantartásához speciális alkalmazottakra van szükség a rendszer telepítéséhez, karbantartásához és a végfelhasználók számára adatábrázolások kialakításához.

2. A relációs adatok online analitikus feldolgozó rendszerei (ROLAP) lehetővé teszik a relációs adatbázisban tárolt adatok többdimenziós formában történő megjelenítését, biztosítva az információk multidimenzionális modellé történő átalakítását egy közbenső metaadatrétegen keresztül. Ebbe az osztályba tartozik a MicroStrategy DSS Suite, az Informix MetaCube, az Information Advantage DecisionSuite és mások. Szoftver csomag Az InfoVisor, amelyet Oroszországban, az Ivanovo Állami Energetikai Egyetemen fejlesztettek ki, szintén ebbe az osztályba tartozik. A ROLAP rendszerek kiválóan alkalmasak nagy tárolóhelyiségekkel való munkavégzésre. A MOLAP rendszerekhez hasonlóan jelentős karbantartási költségeket igényelnek szakembertől információs technológiaés többfelhasználós üzemmódot biztosítanak.

3. Végül a hibrid rendszereket (Hybrid OLAP, HOLAP) úgy tervezték, hogy egyesítsék az előző osztályokban rejlő előnyöket és minimalizálják a hátrányokat. Ebbe az osztályba tartozik a Speedware's Media / MR. A fejlesztők szerint ez egyesíti a MOLAP analitikai rugalmasságát és reagálóképességét a ROLAP-ban rejlő valós adatokhoz való folyamatos hozzáféréssel.

Ezen eszközökön kívül van még egy osztály - asztali lekérdező és jelentéskészítő eszközök, kiegészítve OLAP-funkciókkal, vagy integrálva az ilyen funkciókat ellátó külső eszközökkel. Ezek a jól kidolgozott rendszerek eredeti forrásból nyerik ki az adatokat, alakítják át, és a végfelhasználó kliensállomásán futó dinamikus többdimenziós adatbázisba helyezik. Ennek az osztálynak a fő képviselői az azonos nevű cég BusinessObjects-ei, a Brio Technology-tól a BrioQuery és a Cognos-tól a PowerPlay. Néhány OLAP termék áttekintése a függelékben található.

A többdimenziós adatábrázoláson alapuló speciális DBMS-ekben az adatok nem relációs táblák, hanem rendezett többdimenziós tömbök formájában vannak rendezve:

1) hiperkockák (az adatbázisban tárolt összes cellának azonos méretűnek kell lennie, azaz a legteljesebb mérési alapon kell lennie) ill.

2) polikockák (mindegyik változó saját mérési sorozattal kerül tárolásra, és minden kapcsolódó feldolgozási nehézség a rendszer belső mechanizmusaira tolódik át).

A többdimenziós adatbázisok online analitikai feldolgozó rendszerekben való felhasználása a következő előnyökkel jár.

1. Többdimenziós DBMS használata esetén az adatok visszakeresése és visszakeresése sokkal gyorsabb, mint egy relációs adatbázis többdimenziós fogalmi nézeténél, mivel a többdimenziós adatbázis denormalizált, előre összesített indikátorokat tartalmaz és optimalizált hozzáférést biztosít a kért cellákhoz.

2. A többdimenziós DBMS könnyen megbirkózik a beillesztés feladataival információs modell különféle beépített funkciók, miközben objektíven léteznek korlátozások SQL nyelv megnehezítik és néha lehetetlenné teszik ezeknek a feladatoknak a relációs DBMS-ek alapján történő végrehajtását.

Másrészt jelentős korlátok vannak.

1. A többdimenziós DBMS nem teszi lehetővé a nagy adatbázisokkal való munkát. Ezenkívül a denormalizálás és az előzetes összesítés miatt a többdimenziós adatbázisban lévő adatok mennyisége általában (Codd szerint) 2,5-100-szor kisebb, mint az eredeti részletes adatok mennyisége.

2. A többdimenziós DBMS-eket a relációs rendszerekhez képest nagyon nem hatékonyan használják. külső memória... Az esetek túlnyomó többségében az információs hiperkocka erősen ritka, és mivel az adatok rendezett formában tárolódnak, a nem meghatározott értékek csak az optimális rendezési sorrend kiválasztásával távolíthatók el, amely lehetővé teszi az adatok legnagyobb összefüggő csoportokba rendezését. De még ebben az esetben is csak részben oldódik meg a probléma. Ezenkívül a ritka adatok tárolására optimális rendezési sorrend valószínűleg eltér a lekérdezéseknél leggyakrabban használt sorrendtől. Ezért a valós rendszerekben meg kell találni a kompromisszumot a teljesítmény és az adatbázis által elfoglalt lemezterület redundanciája között.

Ezért a többdimenziós DBMS használata csak az alábbi feltételek mellett indokolt.

1. Az elemzéshez szükséges kiindulási adatok mennyisége nem túl nagy (legfeljebb néhány gigabájt), vagyis az adataggregáció szintje meglehetősen magas.

2. Az információdimenziók halmaza stabil (mivel szerkezetük bármilyen változása szinte mindig megköveteli a hiperkocka teljes átstrukturálását).

3. A rendszer válaszideje az ad hoc kérésekre a legkritikusabb paraméter.

4. A hiperkocka celláin végzett keresztdimenziós számítások elvégzéséhez összetett beépített függvények széleskörű használata szükséges, beleértve az egyéni függvények írásának lehetőségét is.

A relációs adatbázisok közvetlen felhasználása online analitikai feldolgozó rendszerekben a következő előnyökkel jár.

1. A legtöbb esetben a vállalati adattárházakat relációs DBMS-sel valósítják meg, és a ROLAP eszközök lehetővé teszik az elemzést közvetlenül azokon. Ugyanakkor a tárhely mérete nem olyan kritikus paraméter, mint a MOLAP esetében.

2. A probléma változó dimenziója esetén, amikor a mérési struktúrában gyakran kell változtatásokat végrehajtani, a dinamikus dimenzióábrázolású ROLAP rendszerek jelentik az optimális megoldást, mivel ezekben az ilyen módosításokhoz nincs szükség fizikailag. az adatbázis átszervezése.

3. A relációs DBMS lényegesen magasabb szintű adatvédelmet és jó lehetőségeket biztosít a hozzáférési jogok megkülönböztetésére.

A ROLAP fő hátránya a többdimenziós DBMS-hez képest az alacsonyabb teljesítmény. A relációs rendszerek gondos adatbázisséma és indexhangolást igényelnek a MOLAP-hoz hasonló teljesítmény elérése érdekében, ami sok erőfeszítést jelent a DBA-k részéről. Csak csillagsémák használatával lehet a jól hangolt relációs rendszerek teljesítménye megközelíteni a többdimenziós adatbázisokon alapuló rendszerek teljesítményét.

A csillagséma leírása és a használatára vonatkozó ajánlások teljes mértékben a munkának vannak szentelve. Elképzelése az, hogy minden dimenzióhoz vannak táblázatok, és minden tény egy táblázatban van elhelyezve, az egyes dimenziók kulcsaiból álló többszörös kulccsal indexelve (A melléklet). A csillagséma minden egyes sugara – Codd terminológiája szerint – meghatározza az adatkonszolidáció irányát a megfelelő dimenzió mentén.

A többszintű dimenziókkal kapcsolatos összetett problémák esetén érdemes megvizsgálni a csillagséma kiterjesztését - a ténykonstellációs sémát és a hópehely sémát. Ezekben az esetekben külön ténytáblázatok készülnek a különböző dimenziójú összesítő szintek lehetséges kombinációihoz (B. melléklet). Ez jobb teljesítményt tesz lehetővé, de gyakran adatredundanciához és jelentős bonyodalmakhoz vezet az adatbázis szerkezetében, amelyben a nagy mennyiség ténytáblázatok.

Az adatbázisban található ténytáblázatok számának növekedése nemcsak a különböző dimenziójú szintek sokaságából fakadhat, hanem abból is, hogy a tények általában eltérő dimenziókészlettel rendelkeznek. Az egyes mérésektől elvonatkoztatva a felhasználónak a legteljesebb hiperkocka vetületét kell kapnia, és semmi esetre sem kell a benne lévő mutatók értéke egy elemi összegzés eredménye. Így nagyszámú független dimenzió esetén sok ténytáblát kell karbantartani, amelyek megfelelnek a lekérdezésben kiválasztott dimenziók minden lehetséges kombinációjának, ami szintén a külső memória pazarló használatához, az adatok betöltési idejének növekedéséhez vezet. star séma adatbázis külső forrásokból, és az adminisztrációs bonyolultság.

Az SQL nyelv kiterjesztései (GROUP BY CUBE "," GROUP BY ROLLUP "és" GROUP BY GROUPING SETS "operátorok részben megoldják ezt a problémát; emellett javasolt a redundancia és a teljesítmény közötti kompromisszum megtalálására szolgáló mechanizmus, amely ténytáblázatok létrehozását javasolja. nem minden lehetséges dimenziókombinációra, hanem csak azokra, amelyek cellaértékei nem szerezhetők meg teljesebb ténytáblázatok utólagos összesítésével (B. függelék).

Mindenesetre, ha a többdimenziós modellt relációs adatbázisként valósítjuk meg, akkor hosszú és "keskeny" ténytáblákat, valamint viszonylag kis és "széles" dimenziótáblákat kell létrehozni. A ténytáblák a hiperkocka celláinak számértékeit tartalmazzák, a többi táblázat pedig a dimenziók többdimenziós alapját határozza meg. Az információk egy része megszerezhető a nem csillagszerű normalizált struktúrák között elosztott adatok dinamikus összesítésével, bár nem szabad elfelejteni, hogy a nagymértékben normalizált adatbázis-struktúrával végzett összesítéssel járó lekérdezések meglehetősen lassúak lehetnek.

A többdimenziós információk csillag alakú relációs modellekkel történő bemutatására összpontosítva megszabadulhat a ritka mátrixok tárolásának optimalizálásának problémájától, amely a többdimenziós DBMS-ek esetében akut (ahol a ritkaság problémáját a séma speciális megválasztása oldja meg) . Bár egy teljes rekordot használnak az egyes cellák tárolására, amelyek magukon az értékeken kívül másodlagos kulcsokat is tartalmaznak - a dimenziótáblákra való hivatkozások, a nem létező értékek egyszerűen nem szerepelnek a ténytáblázatban.

Következtetés

Az OLAP technológia működésének és alkalmazásának kérdéseit mérlegelve a cégeknek olyan kérdések merülnek fel, amelyek megválaszolása lehetővé teszi a felhasználó igényeinek leginkább megfelelő termék kiválasztását.

Ezek a következő kérdések:

Honnan származnak az adatok? - Az elemezni kívánt adatok különböző helyeken helyezkedhetnek el. Lehetséges, hogy az OLAP adatbázis egy vállalati adattárházból vagy egy OLTP rendszerből fogja megkapni azokat. Ha az OLAP termék már képes hozzáférni egy adatforráshoz, a kategorizálási és adattisztítási folyamatok csökkennek.

Milyen manipulációkat hajt végre a felhasználó az adatokkal? -
Miután a felhasználó hozzáfért az adatbázishoz és elkezdte az elemzést, fontos, hogy megfelelően tudja kezelni az adatokat. A felhasználó igényeitől függően előfordulhat, hogy szüksége van egy hatékony jelentéskészítőre vagy dinamikus weboldalak létrehozására és tárolására. Előnyös lehet azonban, ha a felhasználó rendelkezésére áll olyan eszköz, amellyel egyszerűen és gyorsan létrehozhatja saját alkalmazásait.

Mennyi az összes adatmennyiség? - Ez a legfontosabb tényező az OLAP adatbázis meghatározásakor. A relációs OLAP termékek jobban képesek kezelni nagy mennyiségű adatot, mint a többdimenziós termékek. Ha az adatmennyiség nem igényli relációs adatbázis használatát, akkor a többdimenziós termék is ugyanolyan sikerrel használható.

Ki a felhasználó? - Az OLAP rendszerkliens definiálásakor fontos a felhasználó képzettségi szintje. Egyes felhasználók kényelmesebbnek találják az OLAP-ot egy táblázatkezelővel integrálni, míg mások egy speciális alkalmazást részesítenek előnyben. A felhasználó képzettségétől függően a képzés lebonyolításának kérdése is eldől. Nagy cég esetleg fizetni kíván a felhasználói képzésért, egy kisebb cég lemondhat. Az ügyfélnek olyannak kell lennie, hogy a felhasználók magabiztosnak érezzék magukat, és hatékonyan tudják használni.

Mára a világ legtöbb vállalata átállt az OLAP as használatára alapvető technológia tájékoztatást adni a döntéshozóknak. Ezért az alapvető kérdés nem az, hogy továbbra is a táblázatokat kell-e használni a jelentéskészítés, a költségvetés és az előrejelzés elsődleges platformjaként. A vállalatoknak fel kell tenniük a kérdést, hogy készek-e elveszíteni versenyelőnyüket pontatlan, irreleváns és hiányos információk felhasználásával, mielőtt kiforrnak és alternatív technológiákat fontolgatnak.

Végezetül azt is meg kell jegyezni, hogy az OLAP technológiák elemzési képességei növelik a vállalati információs raktárban tárolt adatok hasznosságát, lehetővé téve a vállalat számára, hogy hatékonyabban kommunikáljon ügyfeleivel.

Szójegyzék

Koncepció Meghatározás
1 BI eszközök Az információhoz való hozzáféréshez használt eszközök és technológiák. Tartalmazza az OLAP technológiákat, az adatbányászatot és a komplex elemzést; végfelhasználói eszközök és ad-hoc lekérdezésépítő eszközök, üzleti megfigyelő irányítópultok és vállalati jelentéskészítők.
2 On-line Analitic Processing, OLAP Az információk valós idejű analitikus feldolgozására szolgáló technológia, beleértve a jelentések és dokumentumok elkészítését és dinamikus közzétételét.
3 Szelet és Kocka Az OLAP-eszközök által biztosított kifinomult adatelemzési funkciók leírására használt kifejezés. Adatok lekérése egy többdimenziós kockából meghatározott értékekkel és a méretek meghatározott relatív helyzetével.
4 Data Pivot Az adattáblázat elforgatásának folyamata, vagyis az oszlopok sorokká konvertálása és fordítva.
5 Számított tag Olyan dimenzióelem, amelynek értékét más elemek (például matematikai vagy logikai alkalmazások) értékei határozzák meg. A kiszámított elem lehet az OLAP-kiszolgáló része, vagy a felhasználó leírhatja egy interaktív munkamenet során. Számított tétel minden olyan tétel, amelyet nem adnak meg, hanem kiszámítanak.
6 Globális üzleti modellek Olyan típusú adattárház, amely hozzáférést biztosít a vállalat különböző rendszerei között elosztott információkhoz, és különböző részlegek vagy osztályok irányítása alatt áll, különböző adatbázisokkal és adatmodellekkel. Ezt a fajta adattárházat nehéz felépíteni, mivel a fejlesztés érdekében össze kell vonni a különböző részlegek felhasználóinak erőfeszítéseit. általános modell adatok a Tárhely számára.
7 Adatbányászat Használó technikák szoftver eszközök Olyan felhasználó számára készült, aki általában nem tudja előre megmondani, hogy mit is keres, de csak bizonyos mintákat és keresési irányokat tud jelezni.
8 Kliens / Szerver Technológiai megközelítés, amely abból áll, hogy a folyamatot külön funkciókra osztják. A szerver több funkciót lát el - kommunikáció menedzsment, adatbázis karbantartás stb.. A kliens egyéni felhasználói funkciókat lát el - megfelelő interfészek biztosítása, képernyők közötti navigáció végrehajtása, súgó funkciók biztosítása stb.
9 Többdimenziós adatbázis, MDBS és MDBMS Hatékony adatbázis, amely lehetővé teszi a felhasználók számára nagy mennyiségű adat elemzését. Speciális tárolási szervezettel rendelkező adatbázis - kockák, amelyek nagy sebességű munkát biztosítanak tények, méretek és előre kiszámított aggregátumok gyűjteményeként tárolt adatokkal.
10 Drill Down Az összesített adatszint elemzéséhez használt részletes adatbányászati ​​módszer. A „mélyítési” szintek a [tárhelyben található adatok részletességétől függenek.
11 Központi raktár

1. Adatbázis, amelyből gyűjtött adatokat tartalmaz operációs rendszer szervezetek. Olyan szerkezettel rendelkezik, amely kényelmes az adatok elemzéséhez. Úgy tervezték, hogy támogassa a döntéshozatalt és egységes információs teret hozzon létre a vállalat számára.

2. Az automatizálás módja, amely lefedi az összes egy helyről vezérelt információs rendszert.

1 Golitsina O.L., Maksimov N.V., Popov I.I. Adatbázis: Oktatóanyag... - M .: FÓRUM: INFRA-M, 2003 .-- 352 p.

2 Dátum K. Bevezetés az adatbázis-rendszerekbe. - M .: Nauka, 2005 - 246 p.

3 Elmanova N.V., Fedorov A.A. Bevezetés a Microsoft OLAP technológiákba. - M.: Dialog-MEPhI, 2004 .-- 312 p.

4 Karpova T.S. Adatbázisok: modellek, fejlesztés, megvalósítás. - SPb .: Péter, 2006 .-- 304 p.

5 Korovkin S. D., Levenets I. A., Ratmanova I. D., Starykh V. A., Shchavelev L. V. Az információ komplex operatív elemzésének problémájának megoldása adattárházakban // DBMS. - 2005. - 5-6. - 47-51 p.

6 Krechetov N., Ivanov P. Termékek adatbányászathoz ComputerWeek-Moszkva. - 2003. - 14-15. - 32-39 p.

7 Przhiyalkovsky V.V. Nagy adatok komplex elemzése: a számítógépesítés új perspektívái // DBMS. - 2006. - 4. sz. - 71-83 p.

8 Sakharov A.A. Az adatelemzésre összpontosító információs rendszerek felépítésének és megvalósításának koncepciója // DBMS. - 2004. - 4. sz. - 55-70 p.

9 Ullman J. Az adatbázis-rendszerek alapjai. - M .: Pénzügy és statisztika, 2003. - 312 p.

10 Hubbard J. Adatbázisok számítógéppel segített tervezése. - M .: Mir, 2007 .-- 294 p.


Korovkin S. D., Levenets I. A., Ratmanova I. D., Starykh V. A., Shchavelev L. V. Az információ komplex operatív elemzésének problémájának megoldása adattárházakban // DBMS. - 2005. - 5-6. - 47-51 p.

Ullman J. Az adatbázis-rendszerek alapjai. - M .: Pénzügy és statisztika, 2003. - 312 p.

Barsegyan A.A., Kupriyanov M.S. Adatelemzési technológiák: DataMining, VisualMining, TextMining, Olap. - SPb .: BHV-Pétervár, 2007 .-- 532 p.

Elmanova N.V., Fedorov A.A. Bevezetés a Microsoft OLAP technológiákba. - M.: Dialog-MEPhI, 2004 .-- 312 p.

Dátum K. Bevezetés az adatbázis-rendszerekbe. - M .: Nauka, 2005 - 246 p.

Golicina O.L., Maksimov N.V., Popov I.I. Adatbázisok: Tutorial. - M .: FÓRUM: INFRA-M, 2003 .-- 352s.

Sakharov A.A. Az adatelemzésre összpontosító információs rendszerek felépítésének és megvalósításának koncepciója // DBMS. - 2004. - 4. sz. - 55-70 p.

Przhiyalkovskiy V.V. Nagy adatok komplex elemzése: a számítógépesítés új perspektívái // DBMS. - 2006. - 4. sz. - 71-83 p.

A többváltozós adatelemzés koncepciója szorosan összefügg az operatív elemzéssel, amelyet OLAP rendszerek segítségével hajtanak végre.

Az OLAP (On-Line Analytical Processing) egy olyan on-line analitikai adatfeldolgozási technológia, amely módszereket és eszközöket használ többdimenziós adatok gyűjtésére, tárolására és elemzésére a döntéshozatali folyamatok támogatása érdekében.

Az OLAP rendszerek fő célja az analitikai tevékenységek támogatása, a felhasználó-elemzők tetszőleges (gyakran ad-hoc kifejezéssel használt) lekérdezései. Az OLAP elemzés célja a felmerülő hipotézisek tesztelése.

Az OLAP technológia eredete a relációs megközelítés megalapítója, E. Codd. 1993-ban publikált egy cikket "OLAP analitikus felhasználóknak: minek lennie kell" címmel. Ez a cikk felvázolja az online analitikai feldolgozás alapfogalmait, és azonosítja a következő 12 követelményt, amelyeknek meg kell felelniük az online analitikai feldolgozást lehetővé tevő termékeknek. Tokmakov G.P. Adatbázis. Adatbázis koncepció, relációs adatmodell, SQL nyelvek. 51. o

Az alábbiakban a Codd által felvázolt 12 szabály található, amelyek meghatározzák az OLAP-ot.

1. Többdimenziósság - Az OLAP-rendszer fogalmi szinten többdimenziós modell formájában jelenítse meg az adatokat, ami leegyszerűsíti az információelemzés és -érzékelés folyamatait.

2. Átláthatóság - Az OLAP-rendszernek el kell rejtenie a felhasználó elől a többdimenziós modell valós megvalósítását, a szervezés módját, a forrásokat, a feldolgozási és tárolási lehetőségeket.

3. Elérhetőség – Az OLAP-rendszernek egyetlen, konzisztens és teljes adatmodellt kell biztosítania a felhasználó számára, hozzáférést biztosítva az adatokhoz, függetlenül azok tárolási módjától és helyétől.

4. Következetes teljesítmény jelentések készítésekor – Az OLAP-rendszerek teljesítménye nem csökkenhet jelentősen az elemzett dimenziók számának növekedésével.

5. Kliens-szerver architektúra - Az OLAP-rendszernek képesnek kell lennie arra, hogy kliens-szerver környezetben működjön, mert a ma online analitikai feldolgozásra szoruló adatok nagy része elosztott módon kerül tárolásra. A fő gondolat itt az, hogy az OLAP eszköz szerverkomponensének elég okosnak kell lennie ahhoz, hogy a vállalati adatbázisok különféle logikai és fizikai sémáinak általánosításán és konszolidálásán alapuló általános koncepcionális sémát építsen fel az átláthatóság hatásának biztosítására.

6. Méretek egyenlősége – Az OLAP rendszernek támogatnia kell egy többdimenziós modellt, amelyben minden dimenzió egyenlő. Ha szükséges további jellemzők megadható az egyes méretekhez, de ezt a képességet bármely dimenzióhoz meg kell adni.

7. Ritka mátrixok dinamikus kezelése - Az OLAP-rendszernek biztosítania kell a ritka mátrixok optimális feldolgozását. A hozzáférési sebességet az adatcellák helyétől függetlenül fenn kell tartani, és állandónak kell lennie a különböző dimenziószámú és különböző fokú adatritkulással rendelkező modelleknél.

8. Többfelhasználós mód támogatása - Az OLAP-rendszernek lehetővé kell tennie több felhasználó együttdolgozását egy analitikai modellel, vagy különböző modellek létrehozását számukra egyetlen adatból. Ebben az esetben az adatok olvasása és írása is lehetséges, ezért a rendszernek biztosítania kell azok integritását és biztonságát.

9. Korlátlan keresztműveletek - Az OLAP-rendszernek biztosítania kell a bizonyos formális nyelven leírt funkcionális kapcsolatok megőrzését a hiperkocka cellái között a szeletelés, forgatás, konszolidáció vagy részletezés műveletei során. A rendszernek önállóan (automatikusan) végre kell hajtania a kialakított relációk átalakítását anélkül, hogy a felhasználónak újra definiálnia kellene azokat.

10. Intuitív adatkezelés – Az OLAP rendszernek lehetőséget kell biztosítania a szeletelési, forgatási, összevonási és fúrási műveletek elvégzésére egy hiperkockán anélkül, hogy a felhasználónak sok interfész-műveletet kellene végrehajtania. Az analitikai modellben meghatározott méréseknek tartalmazniuk kell minden szükséges információt a fenti műveletek elvégzéséhez.

11. Rugalmas riportfogadási lehetőségek - Az OLAP-rendszernek támogatnia kell az adatok megjelenítésének különféle módjait, pl. a jelentéseket bármilyen lehetséges orientációban kell bemutatni. A jelentéskészítő eszközöknek szintetizált adatokat vagy az adatmodellből származó információkat kell képviselniük bármilyen lehetséges orientációban. Ez azt jelenti, hogy a soroknak, oszlopoknak vagy oldalaknak egyidejűleg 0-tól N méretig kell megjelenniük, ahol N a dimenziók száma a teljes analitikai modellben. Ezenkívül az egyetlen rekordban, oszlopban vagy oldalon megjelenő minden tartalomdimenziónak képesnek kell lennie a dimenzióban található elemek (értékek) bármely részhalmazának megjelenítésére, tetszőleges sorrendben.

12. Korlátlan dimenzió és az aggregációs szintek száma – Az analitikus modellben szükséges szükséges méretek lehetséges számát vizsgáló tanulmány kimutatta, hogy akár 19 dimenzió is használható egyidejűleg. Ezért határozottan javasoljuk, hogy az analitikai eszköz egyidejűleg legalább 15, de lehetőleg 20 mérést végezzen. Ezenkívül az egyes általános dimenziókat nem korlátozhatja a felhasználó által analitikus, felhasználó által meghatározott összesítési szintek és konszolidációs útvonalak száma.

További Codd-szabályok.

Ezeknek a követelményeknek az összessége, amely az OLAP de facto definíciójaként szolgált, meglehetősen gyakran okoz különféle panaszokat, például az 1., 2., 3., 6. szabály követelmény, a 10., 11. szabály pedig nem formalizált kívánság. Tokmakov G.P. Adatbázis. Adatbázis koncepció, relációs adatmodell, SQL nyelvek. P. 68 Így a Codd felsorolt ​​12 követelménye nem teszi lehetővé az OLAP pontos meghatározását. 1995-ben Codd a következő hat szabállyal egészítette ki ezt a listát:

13. Kötegelt kinyerés versus értelmezés – Az OLAP rendszernek egyformán hatékonyan kell hozzáférést biztosítania a natív és a külső adatokhoz.

14. Az összes OLAP elemzési modell támogatása – Az OLAP rendszernek támogatnia kell mind a négy Codd által meghatározott adatelemzési modellt: kategorikus, értelmező, spekulatív és sztereotip.

15. Normalizálatlan adatok feldolgozása - Az OLAP-rendszert integrálni kell a nem normalizált adatforrásokkal. Az OLAP környezetben végzett adatmódosítások nem változtathatják meg az eredeti külső rendszerekben tárolt adatokat.

16. OLAP eredmények mentése: az eredeti adatoktól elkülönített tárolás - írás-olvasás módban működő OLAP rendszer az eredeti adatok módosítása után külön mentse az eredményeket. Vagyis az eredeti adatok biztonsága biztosított.

17. Távolítsa el a hiányzó értékeket - Az OLAP rendszernek, amikor adatokat mutat be a felhasználónak, el kell dobnia minden hiányzó értéket. Más szóval, a hiányzó értékeknek különbözniük kell a nullától.

18. Hiányzó értékek kezelése – Az OLAP rendszernek figyelmen kívül kell hagynia minden hiányzó értéket, függetlenül azok forrásától. Ez a funkció a 17. szabályhoz kapcsolódik.

Ezenkívül Codd mind a 18 szabályt a következő négy csoportba osztotta, jellemzőknek nevezve őket. Ezeknek a csoportoknak a neve B, S, R és D.

A főbb jellemzők (B) a következő szabályokat tartalmazzák:

Az adatok többdimenziós fogalmi ábrázolása (1. szabály);

Intuitív adatkezelés (10. szabály);

Elérhetőség (3. szabály);

A kötegelt kivonás kontra értelmezés (13. szabály);

Az összes OLAP elemzési modell támogatása (14. szabály);

kliens-szerver architektúra (5. szabály);

Átláthatóság (2. szabály);

Többjátékos támogatás (8. szabály)

Különleges jellemzők (S):

Normalizálatlan adatok feldolgozása (15. szabály);

OLAP eredmények mentése: elkülönítve az eredeti adatoktól (16. szabály);

A hiányzó értékek kiküszöbölése (17. szabály);

Hiányzó értékek kezelése (18. szabály). Jelentési funkciók (R):

Rugalmasság a jelentések létrehozásában (11. szabály);

Standard jelentési teljesítmény (4. szabály);

Automatikus fizikai réteg konfiguráció (módosított eredeti 7. szabály).

Mérésvezérlés (D):

A mérések sokoldalúsága (6. szabály);

Korlátlan számú dimenzió és összesítési szint (12. szabály);

Korlátlan műveletek a dimenziók között (9. szabály).

A nagy verseny feltételei és a külső környezet növekvő dinamikája fokozott követelményeket támaszt a vállalatirányítási rendszerekkel szemben. A vezetéselmélet és -gyakorlat fejlődését a tevékenységek hatékonyságának javítását célzó új módszerek, technológiák, modellek megjelenése kísérte. A módszerek és modellek pedig hozzájárultak az analitikai rendszerek megjelenéséhez. Oroszországban nagy a kereslet az analitikai rendszerek iránt. Ezek a rendszerek a legérdekesebbek a pénzügyi szektorban való alkalmazás szempontjából: bankok, biztosítási üzletág, befektetési társaságok. Az elemző rendszerek munkájának eredményei elsősorban azoknak az embereknek szükségesek, akiknek döntéseitől a vállalat fejlődése múlik: vezetők, szakértők, elemzők. Az elemző rendszerek lehetővé teszik a konszolidáció, a jelentéskészítés, az optimalizálás és az előrejelzés problémáinak megoldását. Az analitikai rendszereknek ez idáig nem volt végleges osztályozása, valamint nincs általános definíciórendszer sem az ebben az irányban használt fogalmakban. Egy vállalkozás információs struktúrája szintek sorozatával reprezentálható, amelyek mindegyikét a saját információfeldolgozási és -kezelési mód jellemzi, és megvan a maga funkciója az irányítási folyamatban. Így az analitikai rendszerek az infrastruktúra különböző szintjein hierarchikusan helyezkednek el.

Tranzakciós rendszerek réteg

Adattárház szint

Data mart réteg

OLAP szint - rendszerek

Analitikai alkalmazási réteg

Az OLAP - rendszerek (OnLine Analytical Processing, valós idejű analitikai feldolgozás) - komplex többdimenziós adatelemzési technológia. OLAP - rendszerek ott alkalmazhatók, ahol többtényezős adatok elemzésére van szükség. Önmaguk hatékony gyógymód elemzés és jelentéskészítés. A fent tárgyalt adattárházak, adatpiacok és OLAP-rendszerek Business Intelligence (BI) rendszerek közé tartoznak.

Nagyon gyakran a döntéshozók közvetlen használatának elvárásával létrehozott információs és elemző rendszerek rendkívül könnyen használhatóak, de funkcionalitásuk erősen korlátozott. Az ilyen statikus rendszereket a szakirodalom nevezi Információs rendszerek vezető (EIS), vagy Vezetői Információs Rendszerek (EIS). Előre meghatározott lekérdezéseket tartalmaznak, és mivel elegendőek a napi áttekintéshez, nem képesek megválaszolni a rendelkezésre álló adatokkal kapcsolatos minden olyan kérdést, amely a döntések meghozatalakor felmerülhet. Egy ilyen rendszer munkájának eredménye általában többoldalas jelentések, amelyek alapos tanulmányozása után megjelenik az elemző új sorozat kérdéseket. Azonban minden olyan új kérést, amelyet egy ilyen rendszer tervezése nem tartalmazott, először formálisan le kell írni, kódolni kell a programozónak, és csak ezután kell végrehajtani. A várakozási idő ebben az esetben órák és napok is lehet, ami nem mindig elfogadható. Így a statikus DSS-ek külső egyszerűsége, amelyért az információelemző rendszerek legtöbb ügyfele aktívan küzd, a rugalmasság katasztrofális elvesztéséhez vezet.



A dinamikus DSS ezzel szemben az ad hoc elemzői adatkérések feldolgozására összpontosít. Az ilyen rendszerekkel szemben támasztott legmélyebb követelményekkel E. F. Codd foglalkozott abban a cikkben, amely lefektette az OLAP koncepcióját. Az elemzők ezekkel a rendszerekkel interaktív folyamatban dolgoznak a lekérdezések kialakítása és eredményeik tanulmányozása során.

A dinamikus DSS-ek azonban nem csak az online analitikai feldolgozás (OLAP) területén működhetnek; a felhalmozott adatokon alapuló vezetői döntések meghozatalának támogatása három alapvető területen valósítható meg.

Részletes adatkör. Ez a legtöbb információkereső rendszer tartománya. A legtöbb esetben a relációs DBMS-ek kiváló munkát végeznek az itt felmerülő feladatokkal. A relációs adatkezelés nyelvének általánosan elfogadott szabványa az SQL. Az információkereső rendszerek, amelyek végfelhasználói felületet biztosítanak a részletes információk keresésének feladataiban, kiegészítésként használhatók a tranzakciós rendszerek különálló adatbázisain és egy közös adattárházon keresztül.

Az aggregátumok köre. Az adattárházban gyűjtött információk átfogó áttekintése, általánosítása és aggregálása, hiperkocka ábrázolása és többdimenziós elemzése az online analitikus adatfeldolgozó (OLAP) rendszerek feladata. Itt vagy a speciális többdimenziós DBMS-ekre összpontosíthat, vagy a relációs technológiák keretein belül maradhat. A második esetben az előre összesített adatok gyűjthetők egy csillag alakú adatbázisba, vagy az információk menet közben összesíthetők egy relációs adatbázis részletes táblázatainak szkennelése közben.

A törvényszerűségek szférája. Az intellektuális feldolgozás adatbányászati ​​módszerekkel (IAD, Data Mining) történik, melynek fő feladatai a felhalmozott információban a funkcionális és logikai minták keresése, a talált anomáliákat magyarázó és/vagy előrejelző modellek és szabályok felépítése. egyes folyamatok fejlődése.

Gyors analitikai adatfeldolgozás

Az OLAP koncepció a többdimenziós adatmegjelenítés elvén alapul. Az EF Codd 1993-as cikkében a relációs modell hiányosságait vizsgálta, mindenekelőtt arra mutatott rá, hogy lehetetlen "az adatokat több dimenzióban, vagyis a vállalati elemzők számára legérthetőbb módon kombinálni, megtekinteni és elemezni". , és azonosította az OLAP-rendszerek általános követelményeit, amelyek kiterjesztik a relációs DBMS funkcionalitását, és egyik jellemzőjeként többváltozós elemzést is tartalmaznak.

Az OLAP termékek osztályozása az adatok bemutatásának módja szerint.

Jelenleg nagyszámú termék van a piacon, amelyek valamilyen szinten biztosítják az OLAP funkcionalitását. A legismertebbek közül körülbelül 30 szerepel a felmérés webszerverén: http://www.olapreport.com/. Azáltal, hogy a felhasználói felülettől a forrásadatbázisig többdimenziós elvi nézetet biztosít, minden OLAP-termék három osztályba van osztva, hasonlóan a forrásadatbázishoz.

A legkorábbi online analitikai feldolgozó rendszerek (például az Arbor Software-től az Essbase, az Oracle-től az Oracle Express Server) a MOLAP osztályba tartoztak, vagyis csak saját többdimenziós adatbázisukkal tudtak dolgozni. Szabadalmazott többdimenziós DBMS-technológiákon alapulnak, és a legdrágábbak. Ezek a rendszerek az OLAP feldolgozás teljes ciklusát biztosítják. Ezek vagy a szerverkomponensen kívül tartalmaznak saját integrált kliens felületet, vagy külső táblázatkezelő programokat használnak a felhasználóval való kommunikációhoz. Az ilyen rendszerek karbantartásához speciális alkalmazottakra van szükség a rendszer telepítéséhez, karbantartásához és a végfelhasználók számára adatábrázolások kialakításához.

A relációs online analitikai feldolgozó (ROLAP) rendszerek lehetővé teszik a relációs adatbázisban tárolt adatok többdimenziós formában történő megjelenítését, amely egy köztes metaadatrétegen keresztül többdimenziós modellné alakítja az információkat. A ROLAP rendszerek kiválóan alkalmasak nagy tárolóhelyiségekkel való munkavégzésre. A MOLAP rendszerekhez hasonlóan jelentős informatikai karbantartást igényelnek, és többfelhasználósak.

Végül a hibrid rendszereket (Hybrid OLAP, HOLAP) úgy tervezték, hogy egyesítsék az előző osztályokban rejlő előnyöket és minimalizálják a hátrányokat. Ebbe az osztályba tartozik a Speedware's Media / MR. A fejlesztők szerint ez egyesíti a MOLAP analitikai rugalmasságát és reagálóképességét a ROLAP-ban rejlő valós adatokhoz való folyamatos hozzáféréssel.

Többdimenziós OLAP (MOLAP)

A többdimenziós adatábrázoláson alapuló speciális DBMS-ekben az adatok nem relációs táblák, hanem rendezett többdimenziós tömbök formájában vannak rendezve:

1) hiperkockák (az adatbázisban tárolt összes cellának azonos méretűnek kell lennie, azaz a legteljesebb mérési alapon kell lennie) ill.

2) polikockák (mindegyik változó saját mérési sorozattal kerül tárolásra, és minden kapcsolódó feldolgozási nehézség a rendszer belső mechanizmusaira tolódik át).

A többdimenziós adatbázisok online analitikai feldolgozó rendszerekben való felhasználása a következő előnyökkel jár.

Többdimenziós DBMS használata esetén az adatok keresése és kiválasztása sokkal gyorsabb, mint egy relációs adatbázis többdimenziós fogalmi nézeténél, mivel a többdimenziós adatbázis denormalizált, előre összesített indikátorokat tartalmaz és optimalizált hozzáférést biztosít a kért cellákhoz.

A többdimenziós DBMS-ek könnyen megbirkóznak azzal a feladattal, hogy különféle beépített funkciókat foglaljanak bele az információs modellbe, míg az SQL nyelv objektíven fennálló korlátai meglehetősen megnehezítik, esetenként lehetetlenné teszik ezen feladatok relációs DBMS-ek alapján történő végrehajtását.

Másrészt jelentős korlátok vannak.

A többdimenziós DBMS-ek nem teszik lehetővé a nagy adatbázisokkal való munkát. Ezenkívül a denormalizálás és az előzetes összesítés miatt a többdimenziós adatbázisban lévő adatok mennyisége általában (Codd szerint) 2,5-100-szor kisebb, mint az eredeti részletes adatok mennyisége.

A többdimenziós DBMS-ek nagyon nem hatékonyan használják a külső memóriát a relációs rendszerekhez képest. Az esetek túlnyomó többségében az információs hiperkocka erősen ritka, és mivel az adatok rendezett formában tárolódnak, a nem meghatározott értékek csak az optimális rendezési sorrend kiválasztásával távolíthatók el, amely lehetővé teszi az adatok legnagyobb összefüggő csoportokba rendezését. De még ebben az esetben is csak részben oldódik meg a probléma. Ezenkívül a ritka adatok tárolására optimális rendezési sorrend valószínűleg eltér a lekérdezéseknél leggyakrabban használt sorrendtől. Ezért a valós rendszerekben meg kell találni a kompromisszumot a teljesítmény és az adatbázis által elfoglalt lemezterület redundanciája között.

Ezért a többdimenziós DBMS használata csak az alábbi feltételek mellett indokolt.

Az elemzéshez szükséges kiindulási adatok mennyisége nem túl nagy (legfeljebb néhány gigabájt), vagyis az adataggregáció szintje meglehetősen magas.

Az információdimenziók halmaza stabil (mivel szerkezetük bármilyen változása szinte mindig megköveteli a hiperkocka teljes átstrukturálását).

A rendszer ad hoc kérésekre adott válaszideje a legkritikusabb paraméter.

A hiperkocka celláin végzett keresztdimenziós számítások elvégzéséhez összetett beépített függvények széleskörű használata szükséges, beleértve az egyéni függvények írásának lehetőségét is.

Relációs OLAP (ROLAP)

A relációs adatbázisok közvetlen felhasználása online analitikai feldolgozó rendszerekben a következő előnyökkel jár.

A legtöbb esetben a vállalati adattárházak relációs DBMS-eszközökkel valósulnak meg, és a ROLAP-eszközök lehetővé teszik, hogy közvetlenül rajtuk végezzen elemzést. Ugyanakkor a tárhely mérete nem olyan kritikus paraméter, mint a MOLAP esetében.

A probléma változó dimenziója esetén, amikor a mérési struktúrában gyakran kell változtatni, a dinamikus dimenzióábrázolású ROLAP rendszerek jelentik az optimális megoldást, mivel ezekben az ilyen módosítások nem igényelnek fizikai átszervezést. az adatbázist.

A relációs DBMS-ek lényegesen magasabb szintű adatvédelmet és jó lehetőségeket biztosítanak a hozzáférési jogok megkülönböztetésére.

A ROLAP fő hátránya a többdimenziós DBMS-hez képest az alacsonyabb teljesítmény. A relációs rendszerek gondos adatbázisséma és indexhangolást igényelnek a MOLAP-hoz hasonló teljesítmény elérése érdekében, ami sok erőfeszítést jelent a DBA-k részéről. Csak csillagsémák használatával lehet a jól hangolt relációs rendszerek teljesítménye megközelíteni a többdimenziós adatbázisokon alapuló rendszerek teljesítményét.