Menü
Ingyenes
becsekkolás
a fő  /  Telepítés és beállítás / Az OLAP technológiát működtető alapvető fogalmak. OLAP technológia

Az OLAP technológiát működtető alapvető fogalmak. OLAP technológia

A magas verseny feltételei és a külső környezet növekvő dinamikája diktálja a vállalati menedzsment rendszerek fokozott követelményeit. Az elmélet fejlődését és a menedzsment gyakorlatát az új módszerek, technológiák és modellek kialakulása kísérte, amelyek a tevékenység hatékonyságának javítására összpontosítottak. Módszerek és modellek viszont hozzájárultak az analitikai rendszerek megjelenéséhez. Az oroszországi analitikai rendszerek iránti igény magas. Ezeknek a rendszereknek a legérdekesebbek a pénzügyi szektorban: bankok, biztosítási üzleti, befektetési társaságok. Az analitikai rendszerek munkájának eredményei elsősorban olyan embereknek kell előírniuk, amelyek döntései a vállalat fejlődésétől függnek: menedzserek, szakértők, elemzők. Az analitikai rendszerek lehetővé teszik a konszolidációs feladatok, a jelentések, az optimalizálás és az előrejelzés megoldását. A mai napig nem volt az analitikai rendszerek végső osztályozása, mivel nem közös rendszer Definíciók ebben az irányban. A vállalkozás információs struktúráját szintsorozhatsz, amelyek mindegyikét a feldolgozási és információs menedzsment módszere jellemzi, és saját funkciója van a menedzsment folyamatban. Így az analitikai rendszerek hierarchikusan helyezkednek el az infrastruktúra különböző szintjén.

A tranzakciós rendszerek szintje

Adatraktár szintje

Az adatok szintje

OLAP szint - rendszerek

Az analitikai alkalmazások szintje

OLAP - rendszerek - (online analitikai feldolgozás, analitikai kezelés a jelen idő alatt) - az átfogó többdimenziós adatelemzés technológiája. OLAP - rendszerek alkalmazhatók, ha a multifaktív adatok elemzésének feladata. A jelentések elemzésének és létrehozásának hatékony eszköze van. A fenti adatraktárok, az adatok bemutatása és az OLAP rendszerek az üzleti intelligencia rendszerekre (Business Intelligence, BI) vonatkoznak.

Nagyon gyakran a döntéshozó személyek közvetlen használatával létrehozott információs és analitikai rendszerek rendkívül egyszerűek, de mereven korlátozottak a funkcionalitásban. Az ilyen statikus rendszereket a menedzser (IPR) vagy végrehajtó információs rendszerek (EIS) információs rendszereinek (EIS) irodalmában hívják. Ezek tartalmaznak előre definiált többszöri kéréseket, és elegendő a mindennapi felülvizsgálathoz, nem tudnak válaszolni minden olyan kérdésre, amely a döntések meghozatalakor felmerülhet. Az ilyen rendszer eredménye, általában többoldalas jelentések, az alapos tanulmányozás után, amelyről az elemző megjelenik új sorozat kérdések. Azonban minden új kérés, előre nem látható az ilyen rendszer megtervezésekor hivatalosan írja le hivatalosan, egy programozó által kódolt és ezután végrehajtásra kerül. Várakozási idő ebben az esetben órák és napok, amelyek nem mindig elfogadhatóak. Így a statikus SPPR külső egyszerűsége, amelyre az információs és analitikai rendszerek többsége aktívan harcol, a rugalmasság katasztrofális veszteségét bekapcsolja.



A dinamikus SPPRS, éppen ellenkezőleg, az elemzők nem választott (ad hoc) feldolgozására összpontosítanak az adatokra. Az ilyen rendszerek legmélyebb követelményei az E. F. Codd-t a cikkben áttekintették, amely az OLAP fogalmának kezdetét írta ki. Az elemzők munkája ezekkel a rendszerekkel az interaktív sorrend a lekérdezés és az eredmények tanulmányozása.

De a dinamikus SPPRS nem csak a működési analitikai feldolgozás területén (OLAP) működhet; A felhalmozott adatokon alapuló menedzsment döntések támogatását három alapterületen lehet végrehajtani.

Részletes adatok gömbje. Ez a legtöbb rendszer, amelynek célja az információ megtalálása. A legtöbb esetben a relációs DBMS-ek tökéletesen kezelik az itt felmerülő feladatokat. A relációs adatok általánosan elfogadott manipulációs nyelv által elfogadott szabványos szabvány az SQL. Információs és keresőmotorok, amelyek a részletes információk keresési feladatainak végfelhasználói felületét biztosítják, kiegészíthetők mind külön tranzakciós rendszer adatbázisokon, mind a közös adattároláson keresztül.

Gövek aggregált mutatók. Egy átfogó pillantást az összegyűjtött információkat az adattárház, az általánosítás és csoportosítását, hypercubic képviselet és többdimenziós elemzés feladatai operatív elemzési adatfeldolgozó rendszerek (OLAP). Itt speciális többdimenziós DBMS-re lehet, vagy a relációs technológiákon belül maradhat. A második esetben az előbevágott adatok gyűjthetők a csillagszerű típus adatbázisában, vagy az információs aggregáció a Relációs adatbázis részletes táblái szkennelésének folyamata során végezhető el.

A minták szférája. Az intelligens feldolgozást az intelligens adatelemzés (JAAD, Adatbányászat) módszerei végzik, amelyek fő feladata a funkcionális és logikai minták keresése a felhalmozott információkban, a modellek és a szabályok építése, amelyek megmagyarázzák a talált anomáliákat és / vagy előre jelzi néhány folyamat fejlődését.

Működési analitikai adatfeldolgozás

Az OLAP fogalmának alapja a többdimenziós adatok bemutatásának elve. 1993-ban az EF Codd cikk úgy vélte, hogy a relációs modell hiányosságai, elsősorban a mérések szorzásának szempontjából "kombinálják, megtekinthetik és elemezhetik az adatokat" az út ", és az OLAP-rendszerek általános követelményei kiterjesztik a relációs DBMS funkcionalitását, és magukban foglalják a többdimenziós elemzést, mint az egyik jellemzőjét.

Az OLAP termékek osztályozása az adatkijelző módszer szerint.

Jelenleg számos termék van jelen a piacon, amely különböző mértékben az OLAP funkcionalitást biztosítja. Körülbelül 30 leghíresebb szerepet tölt be a Review Web Server http://www.olapreport.com/ listájában. Többdimenziós koncepcionális képviselet biztosítása felhasználói felület A forrásadatbázishoz az összes OLAP termék három osztályra oszlik a forrásadatbázis típusával.

A legtöbb első működési analitikai feldolgozó rendszerek (például az Essbase Arbor szoftver, az Oracle Oracle Express Server Company) a molap osztályhoz tartozott, vagyis csak saját többdimenziós adatbázisokkal működhet. A multidimenziós DBMS védett technológiáin alapulnak, és a legdrágábbak. Ezek a rendszerek teljes OLAP feldolgozási ciklust biztosítanak. Vagy a szerverkomponens, a saját integrált ügyfélfelületen kívül, vagy a felhasználó kommunikálása. külső programok Dolgozzon táblázatokkal. Az ilyen rendszerek fenntartása érdekében különleges személyzetre van szükség a telepítéssel, a rendszerhez, a végfelhasználók számára az adatnézetek kialakulásával.

A működési analitikai adatfeldolgozó rendszerek (ROLAP) a relációs bázisban tárolt adatokat többdimenziós formában adják meg, biztosítva az információk transzformálását többdimenziós modellbe a metaadatok köztes rétegén keresztül. A Rolap rendszerek jól illeszkednek a nagy tároláshoz való munkához. Mint a molap rendszerek, jelentős szolgáltatási költségeket igényelnek az informatikai szakemberek számára, és többjátékos működést biztosítanak.

Végül a hibrid rendszerek (Hybrid OLAP, HOLAP) úgy vannak kialakítva, hogy kombinálják az előnyöket és minimalizálják az előző osztályokban rejlő hiányosságokat. A Speedware Media / MR tartalmazza ezt az osztályt. A fejlesztők szerint az analitikai rugalmasságot és molap válaszsebességet ötvözi, amely állandó hozzáférést biztosít a reál adatokhoz, amelyek a rolaphoz kapcsolódnak.

Többdimenziós OLAP (MOLAP)

A többdimenziós adatok bemutatásán alapuló speciális DBMS-ben az adatokat nem relációs táblázatok formájában szervezik, de rendezett többdimenziós tömbök formájában:

1) Hypercubes (az adatbázisban tárolt összes sejtnek azonos méretűnek kell lennie, azaz a maximális mérési alapon kell lennie) vagy

2) Policubes (minden egyes változó a saját mérési készletével van tárolva, és a feldolgozás összes összetettsége a rendszer belső mechanizmusaira kerül.).

A multidimenzionális adatbázisok használata a működési analitikai feldolgozás rendszereiben a következő előnyökkel jár.

Abban az esetben, használja többdimenziós adatbázis-kezelő rendszert, a keresés és a minta adatok végzik sokkal gyorsabb, mint egy többdimenziós fogalmi pillantást a relációs adatbázis, hiszen a többdimenziós adatbázis denormalizált tartalmaz előre összesített mutatók és biztosítja az optimális hozzáférést a kért sejtek .

A többdimenziós DBMS könnyen megbirkózik a felvételi feladatokkal információs modell változatos beépített funkciók, míg objektíven meglévő korlátozások sQL nyelv Tegye meg ezeket a feladatokat a relációs DBMS-en alapulva, és néha lehetetlen.

Másrészt jelentős korlátozások vannak.

A többdimenziós DBMS-ek nem teszik lehetővé nagy adatbázisokkal való munkát. Ezenkívül a denormalizáció és az előválasztott aggregáció miatt a többdimenziós bázisban lévő adatok mennyisége általában megfelel (a kód értékelésével) 2,5-100 alkalommal a kisebb mennyiségű forrás részletes adatait.

A többdimenziós DBMS-t a relációs viszonylagosan nagyon hatékonyan használják külső memória. Az esetek túlnyomó többségében az információs hypercube erősen ritkább, és mivel az adatokat megrendelt formában tárolják, a bizonytalan értékeket csak az optimális válogatási sorrend kiválasztásával törli, amely lehetővé teszi az adatok megszervezését a maximális folyamatos csoportokba . De még ebben az esetben is a probléma csak részben oldódik meg. Ezenkívül a válogatási eljárás valószínűleg optimális a tárolás szempontjából, a válogatás sorrendje valószínűleg nem egyezik meg a leggyakrabban használt sorrendben. Ezért B. valódi rendszerek Meg kell keresnie a kompromisszumot az adatbázis által elfoglalt lemezterület sebességének és redundanciájának között.

Következésképpen a többdimenziós DBMS használata csak a következő feltételek mellett indokolt.

Az elemzésre vonatkozó forrásadatok mennyisége nem túl nagy (legfeljebb néhány gigabájt), azaz az adatgyűjtési szint meglehetősen magas.

Az információs mérések sorozata stabil (mivel a szerkezetük bármely változása szinte mindig teljes hypercube-szerkezetátalakítást igényel).

A nem választott kérelmek rendszerének válaszideje a legkritikusabb paraméter.

A komplex beépített funkciók széles használata szükséges a hypercube sejtjei feletti keresztdimenziós számítások elvégzéséhez, beleértve a felhasználói funkciók írásának lehetőségét.

Kapcsolat OLAP (ROLAP)

A relációs adatbázisok közvetlen használata a működési analitikai feldolgozás rendszereiben a következő előnyökkel jár.

A legtöbb esetben a vállalati adatraktárokat relációs DBMS segítségével hajtják végre, és a Rolap eszközök lehetővé teszik, hogy közvetlenül a fölöttük elemzhetők legyenek. Ebben az esetben a tárolási méret nem olyan kritikus paraméter, mint a molap esetében.

A feladat változó dimenziója esetén, ha a mérési struktúra változásait gyakran meg kell tenni, r OLAP rendszerek A dinamikus dinamikus ábrázolással optimális megoldás, mivel az ilyen módosítások nem igénylik az adatbázis fizikai átszervezését.

A relációs DBMS jelentősen magasabb adatvédelmet biztosít és jó lehetőségek A hozzáférési jogok díjazása.

A rolap fő hátránya a multidimenzionális DBMS-hez képest kevesebb teljesítmény. A molaphoz hasonló teljesítmény biztosítása érdekében a relációs rendszerek alapos vizsgálatot igényelnek az adatbázis-diagram és az indexbeállítások, azaz nagy erőfeszítések az adatbázis-adminisztrátoroktól. Csak csillag alakú rendszerek használata esetén a jól konfigurált relációs rendszerek teljesítményét a többdimenziós adatbázisokon alapuló rendszerek teljesítményével lehet megközelíteni.

Az OLAP technológia fogalmát az Edgar Codd 1993-ban fogalmazta meg.

Ez a technológia a többdimenziós adatkészletek építésén alapul - az úgynevezett OLAP kockák (nem feltétlenül háromdimenziós, mivel a definícióból lezárható). Az OLAP technológiák alkalmazásának célja az adatok elemzése és az elemzés bemutatása, amely alkalmas az irányító személyzet kezelésére és az ezeken alapuló megoldások elfogadására.

A többdimenziós elemzésre vonatkozó alkalmazások alapvető követelményei:

  • - biztosítja a felhasználónak az elemzés eredményeit elfogadható időre (legfeljebb 5 p.);
  • - multiplayer adat hozzáférés;
  • - többdimenziós adatok bemutatása;
  • - a tárolási és térfogat helyétől függetlenül bármilyen információra való hivatkozás.

Az OLAP rendszereszközök biztosítják a megadott feltételek sorrendjét és kiválasztását. Különböző minőségi és mennyiségi feltételek állhatnak be.

A számos adatban használt adatok fő modellje szerszámokaz adatbázisok létrehozása és támogatása - A DBMS relációs modell. Az adatbevitelt kulcsfontosságú mezők által összekapcsolt kétdimenziós asztali kapcsolatok formájában mutatják be. A duplikáció kiküszöbölése, ellentmondásos, a munkaerőköltségek csökkentése az adatbázisok fenntartásához, a táblázatok normalizálásának formális berendezése. A kérelme azonban az adatbázisok iránti kérelmekre adott válaszok kialakítására fordított kiegészítő idővel jár, bár a memória erőforrásai mentésre kerülnek.

A többdimenziós adatmodell a vizsgálat alatt álló objektumot többdimenziós kocka formájában mutatja be, gyakrabban használnak háromdimenziós modellt. A kocka tengelyein vagy szélén a méréseket vagy a részleteket elhalasztják. Az igények - a bázisok kitöltik a kubai sejteket. A többdimenziós kocka lehet bemutatni kombinációja háromdimenziós kocka megkönnyítése érdekében az észlelés és bemutatása a kialakulását jelentési és elemzési dokumentumok és multimédiás prezentációk alapján elemző munka a döntési rendszer.

Az OLAP technológiák részeként az a tény, hogy az adatok többdimenziós ábrázolása relációs DBMS-ek, így többdimenziós szakosodott szerek, különbséget tesz háromféle többdimenziós OLAP rendszerek megkülönböztetése:

  • - többdimenziós (többdimenziós) OLAP-molap;
  • - relációs (reláció) OLAP-ROLAP;
  • - vegyes vagy hibrid (hibrid) OLAP-Holap.

A többdimenziós adatbázis-kezelő rendszert, az adatok rendezett nem formájában relációs táblák, de formájában rendezett többdimenziós tömbök formájában hiperkockákra, amikor az összes tárolt adat legyen azonos méretű, ami azt jelenti, hogy szükség van, hogy létrehozzák a legátfogóbb mérések alapul. Adatokat lehet rendezni formájában polycubes ebben a megvalósításban, az értékek az egyes mutatók tárolt saját mérési sorozat adatfeldolgozó végzi a saját rendszerét eszköz. Ebben az esetben a tároló szerkezete egyszerűsödik, mert Nincs szükség többdimenziós vagy objektumorientált formában tárolási területre. A hatalmas munkaerőköltségek csökkentek, hogy modellek és adatátalakítási rendszerek hozzanak létre a relációs modellt az objektumhoz.

A molap előnyei:

  • - gyorsabb, mint a rolap, amelyre válaszokat kap a kérésekre - egy vagy két, kevesebb;
  • - Az SQL korlátozások miatt sok beépített funkció megvalósítása nehéz.

A molap korlátozások a következők:

  • - viszonylag kis adatbázisméretek;
  • - A denormalizáció és az előzetes aggregáció következtében a többdimenziós tömböket 2,5-100-szor több memória, mint a kezdeti adatok (a mérések számának növekedése az exponenciális jog szerint növekszik);
  • - nincsenek szabványok az adatok manipulációjának felületén és eszközeiről;
  • - Az adatok betöltésekor korlátozások vannak.

A munkaerőköltségek a multidimenziós adatok megteremtéséhez drámaian növekednek, mert Gyakorlatilag hiányzik ebben a helyzetben, speciális eszközök az információ tárolásában található adatok relációs modelljének objektiválására. A válaszadási idő gyakran nem felel meg az OLAP rendszerekre vonatkozó követelményeknek.

A ROLAP rendszerek előnyei:

  • - az adattárolásban közvetlenül foglalt működési elemzés lehetősége, mivel A forrásbázisok többsége - relációs típus;
  • - A probléma változó dimenziója, mert Ro Lap, mert Az adatbázis fizikai átszervezése szükséges;
  • - A ROLAP rendszerek kevésbé hatékony ügyfélállomást és szervereket használhatnak, és a komplex SQL lekérdezések feldolgozásának fő terhelése a szerverekhez esik;
  • - A védelmi szint az információs és elhatárolása hozzáférési jogok relációs adatbázis-kezelő rendszert összehasonlíthatatlanul nagyobb, mint a többdimenziós.

A rolap rendszerek hátránya kevésbé termelékenység, az adatbázis-rendszerek alapos tanulmányozásának szükségessége, az indexek különleges beállítása, a lekérdezési statisztikák elemzése és az elemzési következtetések elszámolása az adatbázis-sémák javításában, ami jelentős további munkaerőköltséget eredményez.

Ezeknek a feltételeknek a végrehajtása lehetővé teszi az ROLAP-rendszerek használatát, hogy hasonlóan elérjék a molap-rendszereket a hozzáférési idővel kapcsolatban, és felülmúlja a memória megtakarítását is.

A hibrid OLAP rendszerek a relációs és többdimenziós adatmodell végrehajtására szolgáló eszközök kombinációja. Ez lehetővé teszi, hogy drasztikusan csökkentse az erőforrások költségeit egy ilyen modell létrehozásához és fenntartásához, válaszidőre a kérésekre.

Ezzel a megközelítéssel az első két megközelítés előnyeit használják, és hátrányaik kompenzálódnak. A kinevezés legfejlettebb szoftvertermékeiben ezt a konkrét elvet hajtják végre.

Az OLAP-Systems hibrid architektúrájának használata a leginkább elfogadható módja annak, hogy megoldja a szoftver instrumentális eszközök használatával kapcsolatos problémákat a többdimenziós elemzésben.

A minták azonosítási módja szellemi adatfeldolgozáson alapul. A fő feladat itt a minták azonosítása a vizsgált folyamatok, kapcsolatok és kölcsönös befolyása különböző tényezők, a keresés a nagy "szokatlan" eltérések, a különböző anyagi folyamatok menetének előrejelzése. Ez a terület intelligens elemzésre utal (adatbányászat).

Küldje el a jó munkát a tudásbázisban egyszerű. Használja az alábbi űrlapot

A diákok, egyetemi hallgatók, fiatal kutatók, akik a tudásbázist a tanulásban és a munka nagyon hálás lesz neked.

általa megosztva http://www.allbest.ru/

Tanfolyam

fegyelem szerint: adatbázisok

Tantárgy: TechnológiaOLAP.

Teljesített:

Chizhikov Alexander Alexandrovich

Bevezetés

1. OLAP termékek besorolása

2. OLAP kliens - OLAP Server: "for" és "ellen"

3. Core OLAP rendszer

3.1 Az építési alapelvek

Következtetés

A használt források listája

Alkalmazások

BAN BENkarbantartás

Nehéz megtalálni a számítógépes világban lévő személyt, aki legalább intuitív szinten nem értette, hogy milyen adatbázisok vannak és miért szükségesek. A hagyományos relációs DBMS-vel ellentétben az OLAP fogalma nem olyan széles körben ismert, bár a "Kuba Olap" titokzatos kifejezés, valószínűleg szinte minden. Mi az online analitikus feldolgozás?

Az OLAP nem külön szoftvertermék, nem programozási nyelv, és még egy speciális technológia sem. Ha megpróbálja lefedni az OLAP-t minden megnyilvánulása során, akkor ez a fogalmak, elvek és követelmények alapul szolgáló szoftverek, amelyek megkönnyítik az elemzők hozzáférését az adatokhoz. Annak ellenére, hogy az ilyen definíció valószínűtlen, hogy bárki nem ért egyet, kétséges, hogy legalábbis az IOTA-tájékoztató nem szakemberek megérteni a témát. Ezért az OLAP ismerete iránti vágya jobb, ha más módja van. Először meg kell találnod, hogy az elemzők miért kell valahogy megkönnyíteniük az adatokhoz való hozzáférést.

Az a tény, hogy az elemzők a vállalati információk különleges fogyasztói. Az Analytics feladata a nagy adatgyűjtők rendszerességének megtalálása. Ezért az elemző nem fog figyelmet fordítani egy külön tényre, szüksége van több száz és több ezer eseményre. By the way, az egyik alapvető pillanat, ami az OLAP - teljesítmény és hatékonyság megjelenéséhez vezetett. Képzeld el, mi történik, ha az elemzőnek tájékoztatást kell kapnia, és nincsenek OLAP eszköz a vállalkozásnál. Az elemző önállóan (ami valószínűtlen) vagy a programozó használata teszi lehetővé a megfelelő SQL lekérdezést, és megkapja az érdeklődésre számot tartó adatokat a jelentésben, vagy exportálja őket a táblázatba. A problémák nagyszerűen felmerülnek. Először is, az elemző arra kényszerül, hogy ne dolgozzon munkájával (SQL programozás), vagy várjon a feladatot, a programozók elvégeznek - mindez alaposan befolyásolja a munkaerő termelékenységét, az infarktus és a löket szint emelkedését . Másodszor, egyetlen jelentés vagy táblázat, mint általában, nem mentheti meg az orosz elemzés gondolatai és atyáinak óriásait - és a teljes eljárást újra meg kell ismételni. Harmadszor, ahogy már kiderült, az elemzők a trifles nem kérdeznek - szükségük van mindenre azonnal. Ez azt jelenti, hogy (bár a technika és a hét mérföldes lépésekkel tovább halad), hogy a vállalati relációs DBMS kiszolgálója, amelyhez az elemző felhívja, mélyen és hosszú ideig gondolkodik, blokkolja a többi tranzakciót.

Az OLAP koncepciója kifejezetten megoldott az ilyen problémák megoldására. Kuba OLAP lényegében meta-jelentések. A meta-jelentések csökkentése (Kuba, azaz) a mérésekhez, az elemző valójában a "rendes" kétdimenziós jelentések, amelyek érdekeit érdekli (ez nem feltétlenül jelent meg a szokásos megértés ezen kifejezés - az adatokról beszélünk szerkezetek azonos funkciókkal). A kockák előnyei nyilvánvalóak - az adatokat csak egyszer kell kérni a relációs DBMS-től - egy kocka építése során. Mivel az elemzők általában nem működnek olyan információkkal, amelyek kiegészítik és megváltoztatják a "Repülési", a kocka által létrehozott kocka kellő hosszú ideig releváns. Ennek következtében nemcsak kizárja a relációs DBMS-kiszolgáló működésének megszakítását (a több ezer és több ezer válaszjelzések nem tartalmaznak kérdéseket), hanem élesen növeli az elemző adatához való hozzáférés sebességét is. Ezenkívül, amint azt már megjegyeztük, a teljesítmény növeli és a hierarchiák és más aggregált értékek köztes összegeit számolva a kocka építésének időpontjában.

Természetesen a teljesítmény módjának növelése érdekében meg kell fizetni. Néha azt mondják, hogy az adatszerkezet egyszerűen "felrobban" - az OLAP Cube több tucatban foglalhat, és akár több százszor több helyet foglal el, mint a forrásadatok.

Most, amikor egy kicsit elrendeztük, hogy az OLAP működik, még mindig megéri, még mindig némileg formalizálja ismereteinket, és az OLAP kritériumokat adjon anélkül, hogy egyidejűleg fordítaná a szokásos emberi nyelvet. Ezeket a kritériumokat (összesen 12) 1993-ban fogalmazták meg E.f. A kód a relációs DBMS és a részmunkaidős, az OLAP koncepciójának alkotója. Nem tekintjük őket közvetlenül, hiszen később átdolgozták az úgynevezett FASMI tesztet, amely meghatározza az OLAP termékek követelményeit. A Fasmi egy rövidítés az egyes vizsgálati pontok nevétől:

Gyors. Ez a tulajdonság azt jelenti, hogy a rendszernek átlagosan öt másodpercig válaszolnia kell a felhasználó kérésére; Ugyanakkor a legtöbb kérést egy másodpercen belül feldolgozzák, és a legösszetettebb kéréseket húsz másodpercen belül kell feldolgozni. A legújabb tanulmányok kimutatták, hogy a felhasználó kétségbe vonja a kérelem sikerét, ha több mint harminc másodpercig tart.

Elemzés (analitikai). A rendszernek megbirkóznia kell az üzleti alkalmazásokra jellemző logikai és statisztikai elemzéssel, és biztosítja az eredmények megőrzését a végfelhasználó számára elérhető formában. Az elemzési eszközök magukban foglalhatják az idősorok, a költségeloszlás, a devizaátalakítás, a szervezeti struktúrák és mások modellezési változásainak elemzésére szolgáló eljárásokat.

Megosztott (megosztott). A rendszernek bőséges lehetőséget kell biztosítania az adatokhoz való hozzáférés és a sok felhasználó egyidejű munkájának megkülönböztetésére.

Többdimenziós (multiserry). A rendszernek koncepcionálisan többdimenziós adatokat kell szolgáltatnia, beleértve teljes támogatás Több hierarchia.

Információ. A különböző szoftver termékek erejét a bemeneti feldolgozott adatok száma jellemzi. A különböző OLAP rendszerek különböző hatalommal rendelkeznek: a fejlett OLAP megoldások legalább ezer alkalommal működhetnek nagy mennyiségű adatokkal a legmagasabb teljesítményhez képest. Amikor kiválaszt egy OLAP eszköz, számos tényezőt kell figyelembe venni, beleértve a párhuzamos adatok által megkövetelt RAM, a lemezterület használata, működési mutatók, az integráció az információs tárolók, stb

1. OLAP termékek besorolása

Tehát a lényege OLAP, hogy az információforrás elemzés formájában mutatják be a többdimenziós kocka, és lehetőség van arra, hogy önkényesen manipulálják, és megkapja a szükséges információkat vágások - jelentéseket. Ebben az esetben a végfelhasználó többdimenziós dinamikus táblázatként látja a kockát, amely automatikusan összefoglalja az adatokat (tények) különböző vágásokban (mérések), és lehetővé teszi, hogy interaktív módon kezelje a számításokat és a jelentési űrlapot. E műveletek végrehajtását OLAP gép (vagy OLAP-számítástechnikai gép) biztosítja.

A mai napig számos olyan terméket fejlesztettek ki, amelyek az OLAP technológiákat fejlesztették ki a világon. Annak érdekében, hogy könnyebben navigáljon közöttük, használja az OLAP-termékek osztályozását: Az elemelemzési adat tárolási módja és az OLAP gép elhelyezkedése szerint. Tekintsük az OLAP termékek minden kategóriáját.

Az adattároló módszerrel kezdem az osztályozással. Hadd emlékeztessem Önt, hogy a többdimenziós kockák a forrás és az összesített adatok alapján épülnek fel. Mind a kockák forrását, mind az összesített adatait relációs és többdimenziós adatbázisokban tárolhatják. Ezért jelenleg három adattárolási módszert alkalmaznak: molap (multidimenzionális OLAP), Rolap (relazális OLAP) és Holap (hibrid OLAP). Ennek megfelelően az OLAP termékek tárolási módszerrel három hasonló kategóriára oszthatók:

1. A molap esetében a kezdeti és összesített adatokat többdimenziós adatbázisban vagy többdimenziós helyi kubában tárolják.

2. A ROLAP termékek esetében a forrásadatokat relációs adatbázisokban vagy lapos helyi táblázatokban tárolják a fájlkiszolgálón. Az összesített adatokat ugyanabban az adatbázisban helyezhetjük el a szerviz táblákba. A relációs adatbázisból származó adatok többdimenziós kockákra történő átalakítása az OLAP kérésére következik be.

3. A Holap Architecture használatának esetében a kezdeti adatok a relációs bázisban maradnak, és az egységek többdimenziós kerülnek elhelyezve. Az OLAP kocka építése az OLAP-Tools kérésére a relációs és többdimenziós adatok alapján történik.

Következő osztályozás - az OLAP autó elhelyezésének helyén. Ennek megfelelően az OLAP termékek OLAP-kiszolgálókra és OLAP-ügyfelekre oszthatók:

A kiszolgáló OLAP Tools-ban az összesített adatok kiszámítása és tárolása különálló folyamat-kiszolgálóval történik. Az ügyfélalkalmazás csak a lekérdezések eredményeit kapja a szerveren tárolt többdimenziós kockákra. Néhány OLAP szerver csak relációs alapokon támogatja az adattárolót, egyesek csak többdimenziós. Sok modern OLAP szerver támogatja mind a három adattárolási módszert: molap, rolap és holap.

Az OLAP klienst másképp tervezték. A multidimenzionális kocka és az OLAP számítások kiépítése az ügyfélszámítógép memóriájában történik. Az OLAP ügyfelek szintén rolapra és molapra vannak osztva. És egyesek támogathatják mindkét adat-hozzáférési lehetőséget.

Mindezek a megközelítések, vannak "profik" és "mínusz". Ellentétben a kiszolgálói eszközök előnyeinek közös véleményével az ügyfél előtt, számos esetben az OLAP kliens alkalmazása a felhasználók számára hatékonyabbá és jövedelmezőbbé válhat az OLAP kiszolgáló használatához.

2. OLAP kliens - OLAP Server: "for" és "ellen"

Építéskor tájékoztatási rendszer Az OLAP funkcionalitás megvalósítható mind a kiszolgáló, mind az ügyfélolapok. A gyakorlatban a választás a teljesítménymutatók és a szoftver költségeinek kompromisszumának eredménye.

Az adatok mennyisége a következő jellemzőkkel van meghatározva: a rekordok száma, a mérések száma, a mérési elemek száma, a mérések hossza és a tények száma. Ismeretes, hogy az OLAP kiszolgáló nagy mennyiségű adatot tud feldolgozni, mint az OLAP kliens, amely a számítógép egyenlő erejével rendelkezik. Ezt azzal magyarázza, hogy az OLAP kiszolgáló bolt merevlemezek Egy előre kiszámított kockákat tartalmazó többdimenziós adatbázis.

Ügyfélprogramok az OLAP műveletek végrehajtásának időpontjában az SQL-szerű nyelvre vonatkozó kéréseket végeznek, nem pedig az egész kockát, és megjelenített töredékeit. Az OLAP kliens a munka idején kell lennie véletlen hozzáférési memória Minden kocka A rolap architektúra esetében előfeszítésre van szükség a memóriában, hogy a kocka kiszámításához használt adathordozó. Ezenkívül a mérések számának növekedésével, a tények vagy a mérések mérése, az aggregátumok száma növekszik a geometriai progresszióban. Így az OLAP kliens által feldolgozott adatok mennyisége közvetlenül függ a felhasználó RAM hatókörétől.

Megjegyezzük azonban, hogy a legtöbb OLAP ügyfelek elosztott számítást biztosítanak. Ezért a feldolgozott rekordok száma, amelyek korlátozzák az ügyfél OLAP eszközeinek munkáját, nem értjük a vállalati adatbázis elsődleges adatainak összegét, de az összesített minta méretét. Az OLAP kliens kérést hoz létre egy DBMS-nek, amely leírja a szűrési körülményeket és az algoritmust az elsődleges adatok előcsoportosításához. A kiszolgáló megtalálja a rekordokat, és egy kompakt mintát ad vissza további OLAP számításokhoz. A minta mérete több tízben és több százszor lehet kevesebb, mint az elsődleges, nem aggregált rekordok mennyisége. Következésképpen jelentősen csökken az ilyen OLAP kliens szükségessége PC-forrásokban.

Ezenkívül a mérések száma korlátozza az emberi észlelés lehetőségét. Ismeretes, hogy az átlagos személy egyszerre 3-4-es, maximális méréseket működtethet. A dinamikus táblázatban több méréssel az információ észlelése jelentősen nehéz. Ezt a tényezőt figyelembe kell venni, ha az OLAP kliens előzetes kiszámítása, amelyet az OLAP kliens igényelhet.

A mérési hossza az OLAP kocka kiszámításával elfoglalt címtéri OLAP-eszközök méretét is befolyásolja. Minél hosszabb a mérés, annál több erőforrás szükséges a többdimenziós tömb előzetes válogatásának elvégzéséhez, és fordítva. A forrásadatokban csak rövid mérések egy másik érv az OLAP kliens javára.

Ezt a jellemzőt a fenti két tényező határozza meg: a feldolgozott adatok mennyisége és a számítógépek ereje. A mennyiség növekedése, például a mérések, az összes OLAP alap teljesítménye csökken az egységek számának jelentős növekedése miatt, de a csökkenés mértéke eltérő. Megmutatjuk ezt a függőséget a diagramon.

1. séma 1. Az ügyfél és a kiszolgáló OLAP-alapok teljesítményének függvénye az adatok mennyiségének növekedéséből

Az OLAP szerver sebesség jellemzői kevésbé érzékenyek az adatok mennyiségének növekedésére. Ez az OLAP Server és az OLAP kliens felhasználói igényeinek különböző technológiáinak köszönhető. Például, ha az OLAP kiszolgáló, az OLAP kiszolgáló a tárolt adatokra és a "Branch" adatokra vonatkozik. Az OLAP kliens kiszámítja az egységek teljes készletét a betöltéskor. Azonban egy bizonyos mennyiségű adat, a kiszolgáló és az ügyfél teljesítménye összehasonlítható. Az elosztott számításokat támogató OLAP-ügyfelek esetében a teljesítmény összehasonlíthatóságát az OLAP elemzés igényeire kiterjedő adatok mennyiségére oszthatjuk hatalmas szám felhasználók. Ezt megerősíti az MS OLAP Server és OLAP Client "Contour Standard" belső tesztelésének eredményei. A vizsgálat az IBM PC PC Pentium Celeron 400 MHz-es PC-jén történik, 256 Mb egy minta 1 millió egyedi (azaz aggregált) rekordot tartalmazó, 7 méréssel, amely 10-70 tagot tartalmaz. A kocka betöltési ideje mindkét esetben nem haladja meg az 1 másodpercet, és a különböző OLAP műveletek végrehajtása (fúrás, fúrás, mozgatás, szűrő, stb.) Egy második század esetében történik.

Ha a minta mérete meghaladja a RAM mennyiségét, az Exchange (csere) a lemezzel kezdődik, és az OLAP kliens teljesítménye élesen csökken. Csak ebben a pillanatban beszélhetünk az OLAP szerver előnyeiről.

Emlékeztetni kell arra, hogy a "törés" pont meghatározza az OLAP megoldások árának éles emelkedésének határát. Mindenki feladatai számára specifikus felhasználó Ezt a pontot az OLAP kliens teljesítmény tesztjei könnyen meghatározzák. Az ilyen teszteket a fejlesztő cégéből lehet beszerezni.

Ezenkívül a kiszolgáló OLAP megoldások költsége növekszik a felhasználók számával. Az a tény, hogy az OLAP kiszolgáló kiszámításokat végez az összes felhasználó számára. Ennek megfelelően minél többet a felhasználók száma, annál nagyobb a RAM és a processzor teljesítménye. Így, ha a mennyiség a feldolgozott adatok hazugság területén a hasonló teljesítményű szerver és kliens rendszerek, akkor az összes többi tényező, a használata az OLAP kliens lesz nyereséges.

Az OLAP kiszolgáló használata a "Klasszikus" ideológia előírja, hogy ezeket a relációs DBMS többdimenziós adatbázisba kerüljön. A kirakodás egy bizonyos időszakra történik, így az OLAP Server adatok jelenleg nem tükrözik az államot. Ezt a hiányt csak azoknak az OLAP-kiszolgálóknak tekintik, amelyek támogatják az ROLAP módot.

Hasonlóképpen, számos OLAP kliens lehetővé teszi, hogy az ROLAP és az asztali építészet közvetlen hozzáférést biztosítson az adatbázishoz. Ez a forrásadatok elemzését biztosítja az on-line módban.

Az OLAP kiszolgáló a kliens terminálok erejére vonatkozó minimumkövetelményeket helyezi el. Objektíven, az OLAP kliens igényei magasabbak, mert Számításokat tesz a PC-felhasználó RAM-ban. Egy adott szervezet hardvereszközeinek parkja a legfontosabb mutató, amelyet az OLAP kiválasztásakor meg kell tenni. De itt vannak "profik" és "mínusz". Az OLAP szerver nem használ hatalmas számítási erőt a modern személyi számítógépek. Abban az esetben, ha a szervezet már rendelkezik modern PC-k parkjával, akkor ez hatékonyan alkalmazza őket csak megjelenítő terminálokként, és ugyanakkor többletköltséget tesz a központi szerver számára.

Ha a felhasználók számítógépeinek ereje sok kívánni fogja ", az OLAP kliens lassan fog működni, vagy egyáltalán nem lesz képes dolgozni. Egy erőteljes kiszolgáló megvásárlása olcsóbb lehet, mint az összes PC-k frissítése.

Hasznos, hogy figyelembe vegye a hardverfejlesztés trendjeit. Mivel az elemzésre vonatkozó adatok mennyisége szinte állandó, akkor a PC-teljesítmény stabil teljesítménynövekedése az OLAP kliens képességeinek és az OLEP-kiszolgálóknak a nagyon nagy adatbázisok szegmenséhez való kiterjesztéséhez vezet.

Az OLAP kiszolgáló hálózatán keresztül történő használata esetén csak az ügyfélszámítógépre kerül a megjelenítéshez, míg az OLAP kliens megkapja az elsődleges mintaadatok teljes mennyiségét.

Ezért, ahol az OLAP ügyfél érvényes, a hálózati forgalom magasabb lesz.

De, ha a felhasználó működését OLAP szerver, például, részletezve, ezáltal új lekérdezéseket a többdimenziós adatbázis és ez azt jelenti, egy új adatátviteli. Az OLAP műveletek OLAP kliens végrehajtása RAM-ban történik, és ennek megfelelően nem okoz új adatfolyamokat a hálózaton.

Azt is meg kell jegyezni, hogy a modern hálózat hardver Magas sávszélességet biztosít.

Ezért az esetek túlnyomó többségében az OLAP kliens segítségével az "Medium" méretű adatbázis elemzése nem lassítja a felhasználót.

Az OLAP szerver költsége elég magas. Ezt meg kell kezdenie a kiemelt számítógép költségeit és a többdimenziós bázis adminisztrációjának folyamatos költségeit. Ezenkívül az OLAP kiszolgáló végrehajtása és karbantartása kellően magas képzettségi személyzetet igényel.

Az OLAP kliens költsége nagyságrendje alacsonyabb, mint az OLAP kiszolgáló költsége. A kiszolgáló alatt történő adminisztráció és további műszaki berendezések nem szükségesek. A magas igények OLAP-ügyfelének megvalósításában szereplő személyzet képesítését nem mutatják be. Az OLAP kliens sokkal gyorsabban megvalósítható, mint az OLAP kiszolgáló.

Az elemző alkalmazások fejlesztése az ügyfél OLAP alapok használatával - a folyamat gyors, és nem igényel különleges előkészítést a vállalkozónak. A felhasználó, aki ismeri az adatbázis fizikai megvalósítását, az informatikai szakember vonzereje nélkül analitikus alkalmazást fejleszthet ki. Az OLAP kiszolgáló használata esetén meg kell tanulnia 2 különböző rendszerekNéha különböző beszállítókból, - kockák létrehozása a kiszolgálón, és az ügyfélalkalmazás fejlesztése. Az OLAP kliens egyetlen vizuális felületet biztosít a kockák leírásához és a felhasználói felületek beállításához.

Tekintsük az OLAP alkalmazás létrehozásának folyamatát egy ügyfél instrumentális eszközzel.

2. séma 2. OLAP alkalmazás létrehozása ügyfél-rolap használatával

A ROLAP-ügyfelek működésének elve a szemantikai réteg előzetes leírása, amely elrejti a forrásadatok fizikai struktúráját. Ebben az esetben az adatforrások lehetnek: helyi asztalok, rdbd. A támogatott adatforrások listáját egy adott szoftver termék határozza meg. Ezt követően a felhasználó önállóan manipulálhatja az objektumokat, amelyek érthetőek a téma területén, hogy kockákat és analitikai interfészeket hozzanak létre.

Az OLAP kiszolgáló működésének elvét eltérő. Az OLAP kiszolgálóban, a kockák létrehozásakor a felhasználó manipulálja az adatbázis fizikai leírását.

Ugyanakkor az egyéni leírások jönnek létre a Kubában. Az OLAP Server kliens csak a kockára van konfigurálva.

Magyarázd el a ROLAP kliens működésének elvét a dinamikus értékesítési jelentés létrehozásának példáján (lásd a 2. reakcióvázlatot). Hagyja, hogy a kezdeti elemzési adatok két táblázatban vannak tárolva: értékesítés és üzlet.

A szemantikai réteg létrehozásakor adatforrások - az értékesítési és foglalkozási táblákat érthető végfelhasználói feltételek írják le, és "termékek" és "tranzakciók". A "termékek" táblázatból származó "ID" mező átnevezi a "Kód" és a "Név" - a "termék" stb.

Ezután létrejön egy üzleti objektum "Értékesítés". Az üzleti objektum egy lapos asztal, multidimenzionális kocka alapján. A "Termékek" és a "Tranzakciók" táblázat létrehozásakor kombinálja a "Kód" mezőt. Mivel a jelentésben megjelenik, az asztalok összes területe szükséges - az üzleti objektum csak a "termék" mezőket használja, a "dátum" és az "összeg".

Ezután az üzleti objektum alapján létrehoz egy OLAP-jelentést. A felhasználó kiválasztja az üzleti objektumot, és húzza attribútumait az oszlop területen vagy a jelentés táblázat sorában. Példánkban az értékesítési üzleti objektum alapján létrejött az áruk értékesítéséről szóló jelentést.

Az interaktív jelentéssel való együttműködésnél a felhasználó beállíthatja a szűrést és csoportosítási körülményeket ugyanazokkal az egyszerű mozgásokkal "egér". Ezen a ponton az ROLAP ügyfél a gyorsítótárban szereplő adatokat vonja maga után. Az OLAP kiszolgáló ügyfele új kérést generál egy többdimenziós adatbázisba. Például egy értékesítési szűrő értékesítési beszámoló alkalmazásában jelentést kaphat az érdeklődő áruk értékesítéséről.

Minden OLAP alkalmazás beállítása egy dedikált metaadat-tárolóban, egy alkalmazásban vagy többdimenziós adatbázis-rendszer tárolóban tárolható. A megvalósítás az adott szoftverterméktől függ.

Tehát, milyen esetekben az OLAP kliens alkalmazása a felhasználók számára hatékonyabb és jövedelmezőbb lehet az OLAP kiszolgáló használatához?

Az OLAP szerver alkalmazásának gazdasági megvalósíthatósága akkor fordul elő, ha az adatok mennyisége nagyon magas és elviselhetetlen az OLAP kliens számára, különben az utóbbi használata igazoltabb. Ebben az esetben az OLAP kliens ötvözi a nagy teljesítményt és az alacsony költségeket.

Az erőteljes PC-elemzők egy másik érv az OLAP ügyfelek javára. Az OLAP kiszolgáló alkalmazásakor ezeket a teljesítményt nem használják. Az OLAP ügyfelek előnyei között a következőknek is nevezhetők:

Az OLAP kliens megvalósításának és fenntartásának költsége jelentősen alacsonyabb, mint az OLAP kiszolgáló költsége.

Ha OLAP klienst használ, beépített adatátviteli sebességváltóval a hálózaton keresztül, akkor egyszer történik. Az OLAP műveletek végrehajtásakor az új adatfolyamokat nem generálják.

A Rolap ügyfelek beállítása egyszerűsödött a közbülső kapcsolat megszüntetésével - többdimenziós adatbázis létrehozása.

3. Core OLAP rendszer

3.1 Az építési alapelvek

alkalmazás kliens rendszermag adatai

A már azt mondta, nyilvánvaló, hogy az OLAP mechanizmus ma az egyik népszerű adatelemzési módszer. A feladat megoldásához két fő megközelítés létezik. Az elsőnek többdimenziós OLAP (MOLAP) - a mechanizmus megvalósítása a szerver oldalán többdimenziós adatbázis használatával, valamint a második relációs OLAP (ROLAP) - építési kockák "a repülésen" SQL kérések relációs DBMS-hez. Mindegyik megközelítés előnyei és hátránya. Összehasonlító elemzése meghaladja ezt a munkát. Itt csak az asztali rolap modul rendszermagjának megvalósítása lesz leírva.

Az ilyen feladatot a Rolap rendszer alkalmazása után felmerült a Borland Delphi-t alkotó döntési kocka komponensek alapján. Sajnos a készlet komponens használata alacsony teljesítményt mutatott nagy mennyiségű adatokon. A probléma súlyossága csökkenthető azzal, hogy a lehető legtöbb adatot le kell vágni, mielőtt a kockákat táplálná. De ez nem mindig elég megtörténik.

Az interneten és a sajtóban sok információt találhat az OLAP rendszerekrõl, de szinte sehol sem szerepel arról, hogy hogyan van elrendezve.

Munka rendszere:

Az asztali OLAP rendszer munkájának általános rendszere a következőképpen jeleníthető meg:

3. séma 3. Munkaasztal OLAP rendszer

A munka algoritmusa a következő:

1. Számítsa ki az adatokat lapos asztal formájában, vagy az SQL kérés végrehajtásának eredménye.

2. Készpénzadat, és átalakítja őket többdimenziós kuba-ra.

3. A konstrukció kubai képe kereszttáblával vagy diagrammal stb. Az általános esetben tetszőleges számú leképezés csatlakoztatható egy kubahoz.

Fontolja meg, hogyan hasonló rendszer Lehet elrendezni belül. Kezdjük ezt az oldalról, amit láthatsz és érezhetsz, azaz a leképezésekkel. Az OLAP rendszerekben használt kijelző, leggyakrabban két típus - kereszt-táblák és diagramok találhatók. Tekintsünk egy kereszttáblát, amely a kubai megjelenítésének fő és leggyakoribb módja.

Az alábbi ábrán az összesített eredményeket tartalmazó árak és oszlopok jelennek meg, a sejteket világos szürke sejtekkel jelölik, amelyekben a tények és a sötétszürke sejtek tartalmazzák a méreteket.

Így a táblázat a következő elemekre osztható, amellyel a jövőben dolgozunk:

A mátrix kitöltése tényekkel, a következőképpen kell eljárnunk:

A mérési adatok alapján határozza meg a mátrixban lévő hozzáadott elem koordinátáit.

Meghatározza az oszlopok koordinátáit és eredményeit, amelyekre a hozzáadott elem érintett.

Adjon hozzá elemet a mátrixhoz és a megfelelő oszlopokhoz és az eredménysorokhoz.

Meg kell jegyezni, hogy az így kapott mátrix erősen ritka, hogy a szervezet kétdimenziós tömb formájában (a felszínen fekvő opció) nemcsak irracionális, hanem valószínűleg, és a nagy valószínűséggel nem lehetséges A mátrix dimenziója, amely nem biztosítja a RAM-ot. Például, ha a kocka tartalmaz értékesítési adatokat egy év alatt, és ha csak 3 mérés benne - az ügyfelek (250), termékek (500) és a dátum (365), akkor mi lesz a mátrix a következő méretekben: szám Elemek \u003d 250 x 500 x 365 \u003d 45,262,000. És ez annak ellenére, hogy a mátrix töltött elemei csak több ezer lehetnek. Ráadásul minél nagyobb a mérések mennyisége, annál ritkább a mátrix lesz.

Ezért a munkát ebben a mátrixban kell alkalmazni a különleges mechanizmusokat dolgoznak ritkított mátrixok. A ritkált mátrix szervezésének különböző lehetősége lehetséges. Nagyon jól ismertek a programozó irodalomban, például a klasszikus könyv első kötetében a "programozás művészete" Donald Knuta.

Fontolja meg most, hogyan tudja meghatározni a gyári koordinátákat, ismeri a megfelelő méréseket. Ehhez fontolja meg részletesebben a fejlécszerkezetét:

Ebben az esetben könnyedén megtalálhatja a megfelelő sejtek számának meghatározását és az eredményeket. Itt számos megközelítést kínálhat. Az egyikük egy fa használata a megfelelő sejtek kereséséhez. Ez a fa a minta áthaladásakor épülhet fel. Ezenkívül könnyen meghatározhatja az analitikai visszatérő képletet a kívánt koordináták kiszámításához.

A táblázatban tárolt adatoknak át kell alakítani őket. Tehát, annak érdekében, hogy növelje a termelékenységet a hiperkuba kialakításában, kívánatos, hogy olyan egyedi elemeket találjunk, amelyek a kockát mérő oszlopokban tárolják. Ezenkívül a tények előzetes összevonása az azonos méretű bejegyzésekre. Amint azt fent említettük, a mérési területeken rendelkezésre álló egyedi értékek fontosak. Ezután a tároláshoz a következő struktúrát kínálja:

4. séma 4. Az egyedi értékek tárolási struktúrája

Ha ilyen struktúrát használunk, akkor jelentősen csökkentjük a memória szükségességét. Ami elég fontos, mert A működési sebesség növelése érdekében ajánlatos adatokat tárolni a RAM-ban. Ezenkívül csak egy tömböt tárolhat, és értékeit kirakodják a lemezre, mivel csak akkor szükségesek, ha a kereszttáblázat származik.

A fent leírt ötleteket a CubeBase Component Library létrehozásakor tartották fenn.

5. reakcióvázlat CubeBase Component Library Struktúra

A Tsubesource teszi a gyorsítótárazást és az adatok átalakítását a belső formátumba, valamint az adatok előgyűjtését. A TsubeenGine komponens a hypercube és a műveletek kiszámítását végzi vele. Valójában ez egy OLAP gép, amely egy lapos asztalt egy többdimenziós adatkészletbe alakítja át. A TCUBEGRID komponens végrehajtja a kereszteződést és a HyperCube kijelzővezérlést. A Tsubechart lehetővé teszi, hogy a hypercube grafikonok formájában lássa, és a Tsubepivote komponens vezérli a Cube mag munkáját.

Tehát az OLAP gép építésére használható alkatrészek építészetét és kölcsönhatását tekintettem. Most részletesebben fontolja meg az alkatrészek belső szerkezetét.

A rendszer működésének első lépése az adatok betöltése, és átalakítja őket a belső formátumba. A kérdés az lesz, természetes - és miért van szükség, mert egyszerűen használható adatokat egy sima asztalt keres rajta, ha létrehozunk egy kocka vágás. A kérdés megválaszolásához vegye figyelembe az asztal szerkezetét az OLAP gép szempontjából. Az OLAP esetében az asztali oszloprendszer lehet tények vagy mérések. Ebben az esetben az ilyen oszlopokkal való munkavégzés logikája eltérő lesz. A Hypercube mérésekben valójában tengelyek, és a mérési értékek ezek a tengelyek koordinátái. Ugyanakkor a kocka teljesen egyenetlen lesz - a koordináták kombinációja lesz, hogy nincsenek bejegyzések, és olyan kombinációk lesznek, amelyek megfelelnek a forrás táblázatban több bejegyzésnek, és az első helyzet gyakrabban találkozik A kocka hasonló lesz az univerzumhoz - üres tér, külön helyeken, amelyek ösztönzik a pontokat (tények). Így, ha a kezdeti adatfeldolgozásnál az adat előkészítést fogunk tenni, azaz olyan rekordokat kombinálunk, amelyek ugyanazokkal a mérési értékekkel rendelkeznek, miközben kiszámítjuk a tények előzetes összesített tényeit, akkor a jövőben a Kisebb számú rekord, amely növeli a sebességet, és csökkenti a RAM térfogatának követelményeit.

Hypercube-szakaszok létrehozásához a következő funkciókra van szükségünk - a koordináták (valójában mérési értékek) meghatározása a táblázatbejegyzésekhez, valamint a konkrét koordinátákkal rendelkező nyilvántartások meghatározásával (mérési értékek). Fontolja meg, hogy ezek a lehetőségek hogyan lehet megvalósítani. A hiperkubák tárolása, a belső formátum adatbázisának legegyszerűbb módja a legegyszerűbb.

A vázlatosan átalakítás a következőképpen jeleníthető meg:

6. reakcióvázlat 6. A belső formátum adatbázisának átalakítása normalizált adatbázisba

Ez egy asztal helyett normalizált adatbázist kaptunk. Tény, hogy a normalizálás csökkenti a rendszer sebességét, azt mondhatják, hogy az adatbázis szakemberei, és ebben az esetben igaza van, abban az esetben, ha értékeket kell kapnunk a szótárak elemeihez (esetünkben, mérési értékek) . De a dolog az, hogy ezek az értékek nem igénylik ezeket az értékeket az építési szakaszban. Amint fentebb említettük, csak a hypercub-on tartjuk a koordinátákat, így meghatározzuk a mérési értékek koordinátáit. A legegyszerűbb az elemek értékeinek számításához. Annak érdekében, hogy egy mérési számozáson belül a számozás egyértelmű volt, előzetesen rendezze a mérési értékek listáját (szótárak, az adatbázis feltételeinek kifejezését) ábécé sorrendben. Ezenkívül elvégezzük a tényeket, és a tények előmágnesesek. A következő rendszert kapjuk:

7. reakcióvázlat. Sugárzás normalizált adatbázis a mérési értékek koordinátáinak meghatározásához

Most csak a különböző táblázatok elemeinek összekapcsolása maguk között. A relációs adatbázisok elméletében ezt speciális közbenső táblákkal végzik. Elégnek rendelkezünk a mérési táblázatok minden egyes bejegyzéséhez, amelynek megfelelõen a tények tényei, amikor ezeket a méréseket alkalmaztuk (vagyis annak meghatározására, hogy az összes leírt koordinátaérték ezzel a méréssel). A tények, illetve az egyes belépési fel megfelelően a koordináta értékeket, amelyben található a hypercube. A jövőben mindenhol a Hypercube bejegyzésének koordinátái alatt mindenhol a mérési értékek megfelelő bejegyzéseinek számával értendők. Ezután hipotetikus példánkra szerezzük a következő készletet, amely meghatározza a hiperkuga belső ábrázolását:

8. séma 8. A Hypercuba belső ábrázolása

Ez lesz a hypercuba belső ábrázolása. Mivel nem a relációs adatbázisra nem teszünk, egyszerűen a változó hosszúságú területeket használják a kommunikációs területekként (RBDS, hogy nem lenne lehetséges, mivel számos asztali oszlop van előre).

Lehetséges, hogy megpróbálhat egy ideiglenes táblázatot használni a hypercube megvalósításához, de ez a módszer túl alacsony sebességet biztosít (például - a döntési kocka komponenskészlete), így a tárolási struktúrákat fogjuk használni.

A hypercube megvalósításához olyan adatstruktúrákat kell használnunk, amelyek biztosítják a maximális sebességet és a minimális RAM költségeket. Nyilvánvaló, hogy a szótárak és a gyári tények tárolására szolgáló fő struktúrákat kapjuk. Tekintsük a szótár feladatait a maximális sebességgel:

a szótárban lévő elem jelenlétének ellenőrzése;

elem hozzáadása a szótárhoz;

a konkrét koordinátaértékű rekordszámok keresése;

keresse meg a mérési érték koordinátáit;

a mérési értékek keresése a koordinátájával.

A követelmények végrehajtásához használhatja különböző típusok és adatszerkezetek. Például használhatja a struktúrák tömbjeit. A REAL esetében ezek a tömbök további indexelési mechanizmusokat igényelnek, amelyek növelik az adatok letöltésének sebességét és információt kapnak.

A hypercube munkájának optimalizálása érdekében meg kell határozni, hogy milyen feladatokat kell eldönteni a prioritásról, és milyen kritériumokra van szükségünk a munka minőségének eléréséhez. A legfontosabb dolog, hogy növeljük a program sebességét, miközben kívánatos, hogy nem szükséges nagyon nagy mennyiségű RAM. Megnövelt teljesítmény lehetséges a további adat-hozzáférési mechanizmusok bevezetése miatt, például az indexelés bevezetése miatt. Sajnos javítja a RAM-ot. Ezért meghatározzuk, hogy milyen műveletekre van szükségünk a legmagasabb sebességgel. Ehhez fontolja meg az egyes alkatrészeket, amelyek hypercubes-et hajtanak végre. Ezeknek az összetevőknek két fő típusa van - a mérés és a tények táblázata. A tipikus feladat méréséhez:

Új érték hozzáadása;

a mérési érték koordinátáinak meghatározása;

meghatározza a koordináta értékét.

Új elemérték hozzáadásával ellenőrizni kell, hogy van-e ilyen értékünk, és ha van, akkor nem kerül hozzáadásra az újhoz, hanem a meglévő koordináta használatához, különben új elemet kell hozzáadnia, és meghatározza annak koordinátáját. Ez egy módot igényel gyors keresés A kívánt elem jelenléte (ezenkívül ilyen feladat merül fel, és az elem értékének koordinátájának meghatározásakor). Ehhez a hashing használata optimális lesz. Ebben az esetben az optimális szerkezet a hash fák használata lesz, amelyben az elemekre hivatkozásokat tárolunk. Ugyanakkor az elemek lesznek a mérési szótár sorai. Ezután a mérési érték szerkezete a következőképpen jeleníthető meg:

PFTFLINK \u003d ^ TFFTLINK;

Tactlink \u003d rekord

TALKNO: INTEGER; // tényindex az asztalon

TDimensionRecord \u003d rekord.

Érték: string; // Mérési érték

Index: egész szám; // koordináta érték

Factlink: pfatilink; // mutató az elemek listájának kezdetére

És a hash fán tároljuk az egyedi elemekre való hivatkozásokat. Ezenkívül meg kell oldanunk a konverziós feladatot - a koordinátát a mérési érték meghatározásához. Szolgáltatni maximális teljesítmény Közvetlen címzést kell használnia. Ezért használhat egy másik tömböt, amelynek indexe a koordináta mérés, és az érték a megfelelő bejegyzésre való hivatkozás a szótárban. Azonban megkönnyíthető (és menteni a memóriát), ha az elemek tömbje ennek megfelelően elrendezhető, hogy az elemindex koordinátája legyen.

A tömb szervezése, amely végrehajtja a tények listáját, nem nyújt speciális problémákat az egyszerű szerkezetének köszönhetően. Az egyetlen megjegyzés olyan lesz, hogy kívánatos kiszámítani az összes szükséges aggregáció módját, és amelyek kiszámíthatók növekményes (például az összeg).

Tehát leírtuk, hogyan tárolhatunk adatokat hypercube formájában. Lehetővé teszi, hogy az adatraktárban lévő információk alapján többdimenziós helyet képezzen. Annak érdekében, hogy egy személy képes legyen dolgozni ezekkel az adatokkal, azokat a feldolgozáshoz kényelmes formában kell benyújtani. Ugyanakkor összefoglaló táblázatot és grafikákat használnak az adatmegjelenítés fő típusainak. Ráadásul mindkét módszer valójában a hypercube előrejelzéseit képviseli. Az építési reprezentációk maximális hatékonyságának biztosítása érdekében visszaszorítjuk ezeket a vetületeket. Elkezdjük figyelembe venni a konszolidált táblázat, mint a legfontosabb adatelemzés.

Keresse meg az ilyen struktúra megvalósításának módját. Kiválaszthat három alkatrész, ahonnan az összefoglaló táblázat a következőkből áll: Ezek a húrok, az oszlopfejlécek és az összesített tények tényleges táblázata. A legtöbb. egyszerű út Ábrázolások ténytáblára lesz egy két dimenziós tömb, amelynek itt a mérete lehet meghatározni épület címoldalára. Sajnos a legegyszerűbb módja lesz a leghatékonyabb, mert az asztal erősen ritkán lesz, és a memória rendkívül nem hatékony lesz, ennek eredményeképpen csak nagyon kicsi kockák épülnek fel, mivel egyébként a memória nem elég. Így azt kell választanunk, hogy olyan adatszerkezetet tárolnunk kell, amely biztosítja az új elem maximális keresési / hozzáadását, ugyanakkor a minimális frekvenciaveszezést. Ez a szerkezet az úgynevezett sparse mátrixok, amelyek részletesebben olvashatók a ostorban. A mátrix szervezésének különböző módjai lehetségesek. Annak érdekében, hogy kiválassza az általunk megfelelő opciót, fontolja meg az asztali cím kezdeti szerkezetét.

A címsorok világos hierarchikus struktúrával rendelkeznek, így természetesen feltételezhető, hogy használja a fát, hogy használja őket. Ugyanakkor a fa csomópont vázlatos szerkezete a következőképpen ábrázolható:

C. függelék

Ugyanakkor, mint a mérési érték, logikus, hogy a többdimenziós kocka mérési táblázat megfelelő elemére való hivatkozást tároljon. Ez csökkenti a vágás tárolására szolgáló memória költségeket, és felgyorsítja a munkát. A linkeket szülő és leányvállalatoként is használják.

Elem hozzáadása egy fa számára, meg kell adnia a hypercub helyét. Ilyen információként a mérési értékekben tárolt koordinátát kell használni. Tekintsük a tétel hozzáadása egy elemet a konszolidált asztal fejlécéhez. Ugyanakkor forrásinformációként használja a mérési koordináta értékeket. A sorrendet, amelyben ezeket a méréseket felsorolják, az aggregáció szükséges módszere határozza meg, és egybeesik a címsorok szintjének hierarchiájának szintjével. Ennek eredményeképpen meg kell szerezni a konszolidált táblázat oszlopainak vagy sorának listáját, amelyben egy elem hozzáadására van szükség.

AlkalmazásD.

Mint forrásadatok, hogy meghatározzák ezt a struktúrát, használja a mérések koordinátáit. Ezenkívül feltételezzük, hogy azt feltételezzük, hogy meghatározzuk az oszlopot nekünk a mátrixban (mivel meghatározzuk a karakterláncot egy kicsit később, mivel kényelmesebb az egyéb adatstruktúrák alkalmazása, ennek a választásnak az oka szintén alul van). Koordinátákként vegyen be egész számokat - a fent leírt módon meghatározható mérési értékek számát.

Tehát az eljárás végrehajtása után kapunk egy sor hivatkozást egy ritka mátrix oszlopaira. Most végre kell hajtania az összes szükséges intézkedést sorokkal. Ehhez minden oszlopon belül meg kell találni a kívánt elemet, és hozzá kell adni a megfelelő értéket. A gyűjtemény minden mérésére vonatkozóan meg kell ismerni az egyedi értékek számát és az ezen értékek tényleges készletét.

Most fontolja meg, hogy milyen formában kell az oszlopok belsejében lévő értékeket ábrázolni - azaz a kívánt karakterlánc meghatározásához. Ehhez több megközelítést használhat. Ez lenne a legegyszerűbb bemutatni minden oszlopot vektor formájában, de mivel erősen romlott, a memória rendkívül nem hatékony lesz. Ennek elkerülése érdekében alkalmazzuk az adatstruktúrákat, amelyek nagyobb hatékonyságot biztosítanak a ritkált egydimenziós tömbök (vektorok) ábrázolásával. A legegyszerűbbek lesznek a szokásos lista, egy- vagy kettős, azonban nem védett az elemekhez való hozzáférés szempontjából. Ezért használunk egy olyan fát, amely többet biztosít gyors hozzáférés Elemekre.

Például pontosan ugyanazt a fát is használhatja, mint az oszlopok, de akkor meg kell tenned a saját fát minden oszlopra, ami jelentős felső memória hangszórókhoz és feldolgozási időhez vezetne. Egy kis ravaszságot fogok csinálni - egy fát fogunk keresni, hogy tárolja az összes olyan mérési kombinációt, amely a sorokban megegyezik a fent leírtakkal, de elemei nem jelzik a vonalakat (ami nem olyan, mint például, és azok) Az indexek és az indexértékek maguk nem érdekelnek minket, és csak egyedi kulcsokként használják. Ezután ezeket a kulcsokat használják az oszlop belsejében lévő kívánt elem kereséséhez. Az oszlopok maguk a legegyszerűbbek elképzelni egy hagyományos bináris fa formájában. A grafikailag kapott szerkezet a következőképpen ábrázolható:

9. reakcióvázlat A konszolidált asztal képe bináris fa formájában

A megfelelő sorszámok meghatározásához ugyanazt az eljárást használhatja, mint a konszolidált táblázat oszlopainak meghatározására szolgáló eljárást. Ugyanakkor a sorok száma egyedülálló ugyanazon az összefoglaló táblázatban, és azonosítja az elemek elemeit, amelyek a pivot asztal oszlopai. A számok létrehozásának legegyszerűbb módja lesz a számláló karbantartása és egy egységenkénti növekedés, amikor új elemet ad hozzá a fa fejlécében. Ezek a vektoroszlopok maguk a legegyszerűbbek a bináris fák formájában tárolhatók, ahol a sorszámot a kulcsként használják. Ezenkívül a hash táblák használata is lehetséges. Mivel a fákkal való munkavégzésre vonatkozó eljárások részletesen megfogalmazódnak más forrásokban, nem fogunk abbahagyni ezt, és fontolja meg Általános rendszer Adjon hozzá elemet az oszlophoz.

Általánosságban elmondható, hogy a mátrixhoz való elemet a mátrixhoz való hozzáadásra szolgáló intézkedések sorozata a következőképpen írható le:

1. A sorok számai, amelyekben az elemeket hozzáadják.

2. Fontolja meg az oszlopok készletét, amelyekben az elemeket hozzáadják.

3. Minden oszlophoz az elemek megtalálásához a megfelelő számok Sorok és hozzáadjuk az aktuális elemet (az adagolás magában foglalja a kívánt számok összekapcsolását és az aggregális értékek kiszámítását).

Az algoritmus végrehajtása után egy mátrixot kapunk, amely egy konszolidált asztal, amelyet meg kell építeni.

Most egy pár szó a szűrésről, amikor vágott egy vágás. A legegyszerűbb végrehajtani csak a mátrix építésének színpadán, mivel ebben a szakaszban hozzáférhet az összes szükséges mezőhöz, és továbbá az értékek aggregációját elvégzik. Ugyanakkor a gyorsítótárból való felvétel beérkezése során a szűrési feltételeknek való megfelelést ellenőrizzük, és nem megfelelőség esetén a rekordot eldobják.

Mivel a fent leírt szerkezet teljesen leírja a konszolidált táblázatot, a vizualizáció feladata triviális lesz. Ebben az esetben használhatja a táblázat szabványos alkatrészeit, amelyek szinte minden programozó eszközben kaphatók a Windows alatt.

Az OLAP kéréseket végző első termék Express (IRI). Az OLAP kifejezést azonban az Edgarododod, a "Relációs BD apja" javasolta. És a kódot a kód finanszírozta Arbor, a cég kiadott saját OLAP termék - Essbase (később vásárolt Hyperion, amely 2007-ben beolvadt Oracle) - egy évvel korábban. Egyéb jól ismert OLAP termékek közé tartozik a Microsoft Analysis Services (korábban Olap Services, Rész SQL Server), az Oracle OLAP opció, a DB2 OLAP kiszolgáló az IBM-től (Tény, hogy Essbase az IBM-től), SAP BW, BRIO, BUSINESSOBECTS termékek, Cognos , MicroStrategy és más gyártók.

Technikai szempontból a piacon bemutatott termékek "fizikai OLAP" és "virtuális". Az első esetben van egy olyan program, amely az aggregátumok előzetes kiszámítását végzi, amelyeket egy speciális többdimenziós adatbázisban tárolnak, amely gyors extrakciót biztosít. Az ilyen termékek példái a Microsoft elemző szolgáltatások, az Oracle OLAP opció, az Oracle / Hyperion Essbase, a Cognos Powerplay. A második esetben az adatokat relációs DBMS-ben tárolják, és az egységek egyáltalán nem léteznek, vagy az első kérésre az elemző szoftver DBMS-ben vagy gyorsítótárában lehet létrehozni. Ilyen termékek példái - SAP BW, BusinessObjects, MicroStrategy. A "fizikai olap" alapja stabil legjobb idő Válasz a kérésekre, mint a "virtuális OLAP" rendszerek. A virtuális OLAP rendszer beszállítói a termékek nagyobb méretezhetőségét mutatják a nagyon nagy mennyiségű adatok támogatása szempontjából.

Ebben a tanulmányban szeretném megvizsgálni a cég baseGroup labs - deductor termékét.

A levonó egy analitikai platform, azaz A készteremtés alapja alkalmazott megoldások. A deductor technológiában megvalósított egyaránt egyetlen architektúra alapján lehetővé teszik az analitikai rendszer megépítésének összes szakaszát: Adattárház létrehozása a modellek automatikus kiválasztásához és a kapott eredmények megjelenítéséhez.

A rendszer összetétele:

A Deductor Stúdió a levonó platform analitikai magja. A DEDUCTOR STUDIO teljes készlete mechanizmusok, amely lehetővé teszi, hogy információkat szerezzen egy tetszőleges adatforrás, töltik a teljes feldolgozási ciklus (takarítás, adatok átalakítása, építése modellek), megjeleníti a kapott eredmények a legkényelmesebb módja (OLAP, táblázatok, diagramok, fák, megoldások ...) és export eredmények.

A Deductor Viewer egy végfelhasználói célállomás. A program lehetővé teszi a személyzeti követelmények minimalizálását, mert Az összes szükséges művelet automatikusan végrehajtásra kerül a korábban előállított feldolgozási forgatókönyvek használatával, nincs szükség az adatok és feldolgozó mechanizmusok megszerzésének módjára. A Dentustor néző felhasználója csak a jelentés kiválasztásához szükséges.

A Deductor Warehouse egy többdimenziós kereszt-platform adattároló, amely felhalmozza a tárgyterület elemzéséhez szükséges összes információt. Egyetlen tároló használata lehetővé teszi, hogy kényelmes hozzáférést, nagyfeldolgozási sebességet, információt, a teljes adatelemzési folyamat központosított tárolását és automatikus támogatását biztosítsa.

4. Ügyfélszerver

A DEDUCTOR SERVER a távoli analitikai feldolgozáshoz készült. Ez biztosítja, hogy mindegyike automatikusan "meghajtó" adatokat a meglévő forgatókönyvek révén a kiszolgálón, és a meglévő modelleket újra bekapcsolja. A Deductor kiszolgáló használata lehetővé teszi, hogy teljes körű háromcsillagos architektúrát hajtson végre, amelyben végrehajtja az alkalmazáskiszolgáló funkcióját. A kiszolgálóhoz való hozzáférést a Deductor Client segítségével felügyelik.

Munkaügyi elvek:

1. Adatimportok

A levonóban lévő bármely információ elemzése az adatok importjával kezdődik. Az importálás eredményeképpen az adatokat a programban elérhető összes mechanizmus alkalmazásával megfelelő formában adják meg. Az adatok természete, formátum, dbms és egyéb nem számít, mert Munka mechanizmusok minden egyesített.

2. Adatkivitel

A jelenléte export mechanizmusok segítségével továbbítják az eredményeket a harmadik féltől származó alkalmazások, például, hogy át az értékesítési előrejelzések szerint a rendszernek a megrendelést, vagy tegyen egy előkészített jelentést a vállalati webhely.

3. Adatfeldolgozás

A deductor feldolgozása alatt bármely adatátalakításhoz kapcsolódó bármely művelet, például szűrés, modell, tisztítás, és így tovább. Valójában ebben a blokkban, és az elemzés szempontjából a legfontosabbak a legfontosabbak. A deduktorban végrehajtott feldolgozási mechanizmusok legjelentősebb jellemzője, hogy a feldolgozás eredményeként kapott adatok feldolgozhatók a rendelkezésre álló módszerek bármelyikével. Így önkényesen összetett feldolgozási forgatókönyvek készítése lehetséges.

4. Vizualizáció

Az adatokat a Deductor Studio (Viewer) bármely szakaszában vizualizálhatja. A rendszer önállóan határozza meg, hogyan lehet ezt megtenni, például ha képzett neurális hálózat, A táblázatok és diagramok mellett megtekintheti a neurális hálózat grafikonját. A felhasználónak választania kell szükség van A listából és több paraméter konfigurálása.

5. Integrációs mechanizmusok

A levonó nem biztosítja az adatbeviteli eszközöket - a platform kizárólag analitikai feldolgozásra irányul. Rugalmas import-export mechanizmusokat biztosítanak a heterogén rendszerekben tárolt információk felhasználására. Az interakció szervezhető a kötegelt kivitelezéssel, az OLE kiszolgáló üzemeltetésével és a levonható kiszolgálóhoz való hozzáféréssel.

6. A tudás kezelése

A levonó lehetővé teszi, hogy bármely elemzési rendszer egyik legfontosabb funkcióját - támogatja a tudás-replikáció folyamatát, azaz A munkavállalók számára, akik nem értik az elemzési módszereket és módszereket az adott eredmény megszerzésére, válaszolnak a szakértő által készített modellek alapján.

Z.akció

Ebben a papírban egy ilyen modern régió információs technológiákAdatelemző rendszerekként. Elemezte az analitikai információfeldolgozás fő eszközét - OLAP - technológia. Ez részletesen ismerteti az OLAP fogalmának lényegét és az OLAP rendszerek értékét a modern üzleti folyamatban. A ROLAP kiszolgáló működésének szerkezetét és folyamatát részletesen ismertetjük. Az OLAP adatok megvalósításának példájaként a levonó analitikai platformot adják meg. A bemutatott dokumentációt kidolgozták és megfelelnek a követelményeknek.

Az OLAP technológia egy erőteljes adatfeldolgozó eszköz valós időben. Az OLAP kiszolgáló lehetővé teszi az adatok megszervezését és benyújtását a különböző analitikai irányok szakaszában, és bekapcsolja az adatokat értékes információamely segít a vállalatok számára, hogy tájékozottabb döntéseket hozzanak.

Az OLAP rendszerek használata következetesen magas szintű teljesítményt és skálázhatóságot biztosít, több gigabájt adatmennyiségének fenntartása, amely több ezer felhasználóhoz férhet hozzá. Az OLAP technológiák segítségével az információhoz való hozzáférést valós időben, azaz A kérés feldolgozása már nem lassítja az elemzési folyamatot, biztosítva hatékonyságát és hatékonyságát. A vizuális adminisztrációs eszközök lehetővé teszik a legösszetettebb analitikai alkalmazások fejlesztését és megvalósítását, így ezt a folyamatot egyszerűen és gyorsan.

Hasonló dokumentumok

    Az alapja az OLAP fogalma (on-line Analytical Processing) - operatív elemzési adatok feldolgozása, a funkciók használatát a kliens és a szerver. Az OLAP rendszerek alapvető követelményeinek általános jellemzői, valamint az adatok tárolási módszerei.

    absztrakt, hozzáadva 10/12/2010

    OLAP: Általános jellemzők, cél, célok, feladatok. OLAP termékek osztályozása. Az OLAP rendszer, a Cubebase Component Library elvei. Az ügyfél és a kiszolgáló OLAP pénzeszközeinek teljesítményét az adatok mennyiségének növekedéséből.

    a kurzus munka, 25/25/2013

    Az adatok örök tárolása. Az OLAP lényege és értéke (on-line analitikai feldolgozás). Alapok és adatraktárak, jellemzőik. Szerkezet, adattároló architektúra, beszállítók. Számos tipp az Olap-Cubes teljesítményének javításához.

    vizsgálat, hozzáadva 10/23/2010

    Adatelemző rendszerek építése. Az OLAP Cube Design algoritmusok építése és a beépített táblázathoz való kérés megteremtése. OLAP technológia Multidimenziós adatelemzés. A felhasználók tájékoztatása az irányítási döntések meghozatalához.

    a kurzus munka, hozzátette 19.09.2008

    Alapvető információk az OLAP-ról. Működési analitikai adatfeldolgozás. OLAP termékek osztályozása. A működési analitikai feldolgozás eszközeire vonatkozó követelmények. Többdimenziós adatbázisok használata operatív analitikai feldolgozás rendszerében, előnyei.

    a kurzus munka, hozzáadta 10.06.06.2011

    Az alrendszerek fejlesztése egy weboldal elemzéséhez a Microsoft használata. Hozzáférési és OLAP technológiák. Az adatelemzési alrendszer fejlesztésének elméleti vonatkozásai a zenei portál információs rendszerében. OLAP technológia az elemző objektumelemző alrendszerben.

    a tanfolyam, 2009.06.11.

    Az OLAP alapok megfontolása: A bemutatók és az információs raktárak besorolása, az adatkocka koncepciója. Döntéshozatali rendszer architektúra. Az "Abitura" rendszer szoftverének megvalósítása. Webes jelentés létrehozása a jelentési szolgáltatások technológiájával.

    tANULMÁNYOK, Hozzáadva: 05.12.2012

    Adatraktár, a szervezet elvei. Adatmunkák. OLAP szerkezete, az adatok többdimenziós tárolási technikai vonatkozásai. Integrációs szolgáltatások, töltés tárolási és adatbázisok. A Microsoft technológiákkal rendelkező rendszerek lehetősége.

    tANULMÁNYOK, Hozzáadva: 05.12.2012

    Egy kereskedelmi vállalkozás adattároló áramkörének kialakítása. A tároló kapcsolati áramkörök leírása. Termékinformációk megjelenítése. OLAP kocka létrehozása további információelemzéshez. A szupermarket hatékonyságának értékelésére irányuló kérelmek fejlesztése.

    vizsgálat, hozzáadva 12/19/2015

    Adattárházak hozzárendelése. SAP BW architektúra. Építési analitikai jelentés az OLAP kockák alapján az SAP BW rendszerben. Az adattárolás és az OLTP rendszer közötti fő különbségek. A Bex funkcionális szférák áttekintése. Lekérdezés létrehozása Bex lekérdezési tervezőben.

Célja lejáratú papírok Az OLAP technológia tanulmányozása, végrehajtása és szerkezete koncepciója.

BAN BEN modern világ számítógépes hálózatok A számítástechnikai rendszerek lehetővé teszik a nagy adatgyűjtő elemek elemzését és feldolgozását.

A nagy mennyiségű információ nagymértékben bonyolítja a megoldások keresését, de lehetővé teszi, hogy sokkal pontosabb számításokat és elemzést kapjon. Az ilyen probléma megoldásához az elemző információs rendszerek teljes osztálya van. Az ilyen rendszereket döntéshozatali támogatási rendszereknek nevezzük (DSS, döntéshozatali rendszer).

Az SPPR elemzésének elvégzéséhez az információnak bemeneti és tárolási eszközzel kell felhalmozni. Három fő feladatot oszthat meg SPPR-ben:

· bemenő adat;

· adattárolás;

· adatelemzés.

Az SPPR adatainak beírása automatikusan elvégzi a közeg vagy folyamat állapotát, vagy az emberi üzemeltetőt.

Ha az adatbevitel automatikusan végrehajtásra kerül az érzékelőkből, az adatokat egy készenléti jelzéssel halmozzuk fel, amely az információ megjelenésekor vagy ciklikus felmérés esetén történik. Ha a bemenetet egy személy végzi, akkor a felhasználóknak kényelmes eszközökkel kell rendelkezniük az adatok megadásához, amelyek ellenőrzik őket a bemenet helyességéről, valamint elvégezhetik a szükséges számításokat.

Ha egyidejűleg több üzemeltető, akkor az ugyanazon adatok módosításának és párhuzamos hozzáférésének problémáit meg kell oldani.

Az SPPR elemző adatokat szolgáltat jelentések, táblázatok, grafikonok formájában, a tanulmányozás és elemzés céljából, ezért az ilyen rendszerek biztosítják a döntési támogatási funkciók végrehajtását.

Az adatbeviteli alrendszerekben, az úgynevezett OLTP (LinaTransactionProcessing), az adatok végrehajtásra kerülnek. Használja őket, használjon hagyományos adatbáziskezelő rendszereket (DBMS).

Az elemzési alrendszer a következők alapján állítható be:

· A relációs DBMS és a statikus lekérdezések alapján az SQL használatával kapcsolatos információ-visszakeresési elemzés alrendszerei;

· Működési elemzési alrendszerek. Az ilyen alrendszerek végrehajtása érdekében az OLAP-adatok működési analitikai feldolgozásának technológiáját alkalmazzák, amely a többdimenziós adatmegjelenítés fogalmát használja;

· Szellemi elemzési alrendszerek. Ez az alrendszer végrehajtja az adatminősítési módszereket és az algoritmusokat.

A felhasználó szempontjából az OLAP rendszer az információk rugalmas megtekintésének eszközeit képviseli különböző szakaszokban, automatikus átvétel Aggregált adatok, analitikai műveletek, részletek, összehasonlítás idővel. Mindezek köszönhetően az OLAP rendszerek olyan megoldás, amely nagy előnyökkel jár az összes olyan üzleti jelentéstípusra vonatkozó adatok előkészítésében, amelyek a különböző vágások és különböző hierarchia különböző szintjei, például az értékesítési jelentések, a költségvetések különböző formái és más formái. Az OLAP rendszernek nagy előadása van az adatelemzés más formáiban, beleértve a megjósolást is.

1.2 Meghatározás OLAP.-Systems

Az integrált többdimenziós adatelemzés technológiáját Olapnak nevezték el. Az OLAP a HD szervezet kulcsfontosságú eleme.

Az OLAP funkcionalitás különböző módon valósítható meg, mind a legegyszerűbb, például az irodai alkalmazásokban, valamint a kiszolgálótermékeken alapuló bonyolultabb elosztott analitikai rendszerek elemzését.

OLAP (on-lineanaalyticalprocessing) - Működési analitikai adatfeldolgozás technológiája a többdimenziós adatok gyűjtésére, tárolására és elemzésére szolgáló eszközök és módszerek felhasználásával és a döntéshozatali folyamatok támogatására.

Az OLAP rendszerek fő célja az analitikai tevékenységek támogatása, az elemző felhasználók önkényes lekérdezése. Az OLAP elemzés célja, hogy ellenőrizze a feltörekvő hipotéziseket.

1993-ban az alapító a relációs megközelítés szerint az adatbázis Edgar Codd partnerekkel (Edgar Codd, matematika és Scholant IBM), megjelentetett egy cikket által kezdeményezett Arbor szoftver (ma a legismertebb cég „Hyperion Solutions”) „című OLAP rendelkezés (Működési analitikai feldolgozás) az elemző felhasználók számára ", amelyben az OLAP technológia 12 jellemzője van megfogalmazva, amelyet később hat többet egészítettek ki. Ezek a rendelkezések az új és nagyon ígéretes technológia fő tartalma lettek.

A technológia főbb jellemzői OLAP (BASIC):

  • az adatok többdimenziós fogalmi képviselete;
  • intuitív adatok manipuláció;
  • elérhetőség és adat adatai;
  • csomag az adatok kitermelése az értelmezés ellen;
  • OLAP elemzési modellek;
  • Ügyfél-kiszolgáló architektúra (OLAP elérhető az asztalon);
  • átláthatóság (átlátható hozzáférés a külső adatokhoz);
  • multiplayer támogatás.

Különleges képességek (Különleges):

  • informális adatok feldolgozása;
  • az OLAP eredményeinek mentése: a forrásadatoktól külön tárolják őket;
  • a hiányzó értékek megszüntetése;
  • hiányzó értékek feldolgozása.

A jelentések benyújtásának jellemzői (Jelentés):

  • rugalmasság jelentése;
  • standard jelentés teljesítménye;
  • az adatkivonás fizikai szintjének automatikus konfigurálása.

Méréskezelés (Dimenzió):

  • a mérések egyetemessége;
  • korlátlan számú mérés és aggregációs szint;
  • korlátlan számú művelet a méretek között.

Történelmileg, ma, hogy ma az "OLAP" kifejezés nemcsak a végfelhasználó adatai többdimenziós nézetét jelenti, hanem az adatok többdimenziós bemutatását is a célbázisba. Ez a független kifejezésnek köszönhető "Relációs olap" (Rolap) és "Több OLAP" (Molap).

Az OLAP SSERVIS egy eszköz a nagy mennyiségű adat valós idejű elemzéséhez. Az OLAP rendszerrel való kölcsönhatás, a Felhasználó képes lesz az információk rugalmas megtekintésére, tetszőleges adatszakaszok megszerzésére, és részletes, konvolúciós műveleteket végez az eloszlás, az időbeli összehasonlítások egyidejűleg sok paraméterben. Az OLAP-val végzett munka a téma területén fordul elő, és lehetővé teszi, hogy statisztikailag megalapozott üzleti helyzeteket építsen.

OLAP szoftvereszközök - ez egy operatív elemző eszköza tárolóban található. A fő jellem az, hogy ezek az alapok arra összpontosítanak, hogy nem az informatika területén, nem statisztikai szakértő, hanem az alkalmazási terület, az osztály, az osztály, az osztály, és végül igazgatói szakembere. Az eszközöket az analitika kommunikálása célja problémával, és nem számítógéppel. Ábrán. 6.14 egy elemi OLAP -Kub, amely lehetővé teszi az adatok becsléseinek előállítását három dimenzióra.

A többdimenziós OLAP -Kub és a megfelelő matematikai statisztikai feldolgozási algoritmus rendszere lehetővé teszi bármely összetettség adatai bármely időintervallumban történő elemzését.


Ábra. 6.14.

Az adatok és a vizuális kijelző manipulálására szolgáló rugalmas mechanizmusok (6.15. Ábra, 6.16. Ábra), a kezelő először különböző oldalaktól származó adatokat tartja be, amelyek lehetnek (és nem lehetnek) a probléma megoldásához kapcsolódnak.

Ezután összehasonlítja a különböző üzleti mutatókat egymás között, megpróbálta azonosítani a rejtett kapcsolatokat; Az adatokat szorosabban megfontolhatja, részletesen részletezve, például az idő, a régiók vagy az ügyfelek általi összegekbe, vagy éppen ellenkezőleg, hogy további összefoglalja az információ bemutatását a zavaró részletek eltávolításához. Ezt követően a modullal statisztikai becslés és szimulációs modellezés Az események fejlesztéséhez számos lehetőség van kialakítva, és a leginkább elfogadható opció van kiválasztva.


Ábra. 6.15.

Az alapkezelő társaság például olyan hipotézissel születhet, hogy a vállalat különböző ágazataiban lévő eszköznövekedés terjedése a technikai és gazdasági oktatású szakemberek arányától függ. A hipotézis ellenőrzése érdekében a menedzser kérheti az adattáratól, és megmutathatja kapcsolatait az ágazatok számára, amelyek a jelenlegi negyedévben az eszközök növekedése a tavalyi évhez képest több mint 10% -kal csökkent, és azok számára, akik több mint tovább nőttek 25%. Lehetővé kell tenni, hogy egyszerű választást használjon a javasolt menüből. Ha a kapott eredmények jelentősen szétesnek két releváns csoportba, akkor ez ösztönzést kell biztosítani a hipotézis további ellenőrzésére.

Jelenleg a gyors fejlődés egy irányt hívott dinamikus modellezés (Dinamikus szimuláció), teljes mértékben végrehajtva a fenti elv FASMI-t.

A dinamikus modellezés, az elemző épít egy modellt az üzleti helyzet kialakulásának időben, néhány forgatókönyv. Ebben az esetben az ilyen modellezés eredménye lehet több új üzleti helyzet, amely termel egy fát lehetséges megoldások Az egyes valószínűségi értékeléssel és kilátásokkal.


Ábra. 6.16.

6.3. Táblázat Összehasonlító jellemzők statikus és dinamikus elemzés.

6.3. Táblázat.
Jellegzetes Statikus elemzés Dinamikus elemzés
A kérdések típusai Ki! Mit? Mennyi? Hogyan? Mikor? Hol? Miért van az, hogy? Mi történne, ha ...? Mi van ha…?
Válaszidő Nem szabályozott Másodperc
Az adatokkal kapcsolatos tipikus műveletek Szabályozott jelentés, diagram, táblázat, rajz Interaktív jelentések, diagramok, képernyőformák sorrendje. Dinamikus változás az aggregáció és az adatszakaszok szintjén
Az analitikai követelmények szintje Középső Magas
A képernyőformák típusa Főleg előre meghatározott, szabályozott Felhasználó által definiált, vannak testreszabási funkciók
Adat-aggregációs szint Részletes és teljes A felhasználó által meghatározott
"Életkor" adatok Történelmi és jelenlegi Történelmi, aktuális és tervezett
A kérelmek típusai Leginkább kiszámítható Kiszámíthatatlan - alkalomra alkalomra
Célja Szabályozott analitikai feldolgozás Többcélú elemzés, modellezési és építési előrejelzések

Majdnem mindig a multidimenziós adatelemzés analitikai rendszerének kiépítésének feladata az építés feladata egységes, elfogadott, működőképes információs rendszer, inhomogénen alapulva szoftver és megoldások. És már a vizsgálati időszak végrehajtására szolgáló pénzeszközök kiválasztása rendkívül nehéz feladat lesz. Számos tényezőt kell figyelembe venni, beleértve a különféle kölcsönös kompatibilitásokat is szoftverösszetevők , A fejlesztés, a felhasználás és az integráció, a működés, a stabilitás, valamint a különböző gyártók vállalatainak szintje és potenciális ígéretes kapcsolatainak hatékonysága.

Az OLAP alkalmazandó, bárhol is van feladat a multifaktor adatok elemzésére. Általánosságban elmondható, hogy bizonyos táblázattal rendelkeznek az adatokkal, amelyekben legalább egy leíró oszlop és egy oszlop van, az OLAP folyamat hatékony eszköz Jelentések elemzése és generálása. Az OLAP technológia alkalmazásának példájaként fontolja meg az értékesítési folyamat eredményeinek tanulmányozását.

Kulcsfontosságú kérdések: "Hány eladott?", "Milyen összeget értékesítenek?" Bővíti üzleti szövődményként és a történelmi adatok felhalmozódását egy bizonyos tényezőkhöz, vagy csökkenti: ".. Szentpéterváron, Moszkvában, az Urálban, Szibériában ...". ".. Az elmúlt negyedévben az aktuális "", "..A szállító, és összehasonlítva a Szállító B ..." és így tovább.

Az ilyen kérdésekre adott válaszok a menedzsment döntések meghozatalához szükségesek: a tárolók, ágak, az ágazatok, a felmondás és a kereskedőkkel való kapcsolattartás és a hirdetési kampányok felmondása, stb.

Ha megpróbálja kiemelni a főbb számokat (tények) és vágásokat (mérési argumentumokat), amely manipulálja az elemzőt, megpróbálja bővíteni vagy optimalizálni a vállalat üzleti tevékenységét, akkor a táblázat egy olyan táblázat lesz, amely alkalmas az értékesítési elemzéshez, mint a megfelelő kiigazítást igénylő sablonként minden egyes vállalkozás számára.

Idő. Rendszerint ezek több időszak: év, negyed, hónap, évtized, hét, nap. Számos OLAP-nyomtatás automatikusan kiszámítja a régebbi időszakokat a dátumtól és kiszámítja az eredményeket.

Áruk kategóriája. A kategóriák lehetnek több, különböznek minden egyes üzleti típus esetében: fajta, modell, csomagolási típus stb. Ha csak egy terméket értékesítenek, vagy a tartomány nagyon kicsi, akkor a kategória nem szükséges.

Termék. Néha az áruk (vagy szolgáltatások) nevét alkalmazzák, kódja vagy cikke. Azokban az esetekben, amikor a tartomány nagyon nagy (és egyes vállalkozásoknak több tízezer pozíciója van az árlistájában), a kezdeti elemzés minden típusú termékre nem végezhető el, hanem kommunikálni egyes elfogadott kategóriákkal.

Vidék. A vállalkozás globális szintjétől függően lehetséges, hogy szem előtt tartsuk a kontinenst, az ország, az ország, a terület, a város, a kerület, az utcán, az utcán. Természetesen, ha csak egy bevásárlási pont van, akkor ez a dimenzió hiányzik.

Eladó. Ez a mérés az üzleti struktúrától és méretétől is függ. Itt lehet: ág, üzlet, kereskedő, értékesítési menedzser. Bizonyos esetekben a dimenzió hiányzik, például amikor az eladó nem érinti az értékesítési mennyiséget, a bolt csak egy és így tovább.

Vevő. Bizonyos esetekben például a kiskereskedelemben a vevő személytelen, és nincs dimenzió, más esetekben is van információ a vevőről, és fontos az értékesítés szempontjából. Ez a mérés tartalmazhat a vevő cégének nevét vagy az ügyfelek számos csoportját és jellemzőit: az ipar, az Enterprise Group, a tulajdonos és így az értékesítési struktúra elemzése, hogy azonosítsa a legfontosabb összetevőket a szakasz keretében. Ehhez kényelmes használni például egy "pite" diagramot nehéz esetekben, amikor 3 mérést tanulmányoznak egyszerre - "oszlopok". Például a számítógépes technológia tárolására a számítógépek értékesítési tartománya 100 000 dollár, fényképészeti berendezés - $ 10,000, fogyóeszközök - $ 4500. Következtetés: A bolt forgalma nagymértékben függ a számítógépek értékesítéséből (valójában, talán a fogyóeszközök szükségesek a számítógépek értékesítéséhez, de ez már a belső függőségek elemzése).

Dinamika elemzés ( regresszió analízis - Trendek kimutatása). A trendek észlelése, szezonális oszcilláció. Vezéri dinamika Megjeleníti a vonal típusát. Például az Intel termékek értékesítési volumenei az év során csökkentek, és a Microsoft értékesítése nőtt. Talán javította az átlagos vevő jólétét, vagy a bolt képét megváltoztatta, és vele a vásárlók összetétele. A tartomány beállítása szükséges. Egy másik példa: 3 éve télen csökken a videokamerák értékesítése.

A függőségek elemzése (Korrelációs analízis). A különböző áruk értékesítési volumenének összehasonlítása a szükséges tartomány - "kosarak" azonosításához. Ehhez kényelmes egy "vonal" grafikon használatára is. Például, amikor eltávolítja a tartományban nyomtatók során az első két hónap, egy csepp az értékesítés por patron fedezték fel.