Menü
Bedava
giriş
ana  /  Kurulum ve kurulum / OLAP teknolojisini işleten temel kavramlar. OLAP teknolojisi

OLAP teknolojisini işleten temel kavramlar. OLAP teknolojisi

Yüksek rekabet koşulları ve dış ortamın artan dinamikleri, kurumsal yönetim sistemleri için artan gereksinimleri belirler. Yönetimin teorisinin ve uygulamasının gelişimi, faaliyetin verimliliğini arttırmaya odaklanan yeni yöntemler, teknolojilerin ve modellerin ortaya çıkmasıyla eşlik etti. Sıradaki yöntemler ve modeller analitik sistemlerin ortaya çıkmasına katkıda bulunmuştur. Rusya'daki analitik sistemlere olan talep yüksektir. Bu sistemlerin finans sektöründe uygulanması açısından en ilginç: bankalar, sigorta işleri, yatırım şirketleri. Analitik sistemlerin çalışmalarının sonuçları, öncelikle kararları şirketin geliştirilmesine bağlı olan kişilere gereklidir: yöneticiler, uzmanlar, analistler. Analitik sistemler, konsolidasyon görevlerini, raporlama, optimizasyon ve tahmini çözmenize izin verir. Bugüne kadar, analitik sistemlerin nihai sınıflandırması olmadı. ortak sistem Bu yönde kullanılan açıdan tanımlar. İşletmenin bilgi yapısı, her biri işlem ve bilgi yönetimi yöntemi ile karakterize edilen ve yönetim sürecinde kendi işlevine sahip olan bir seviye dizisi ile temsil edilebilir. Böylece, analitik sistemler bu altyapının farklı seviyelerinde hiyerarşik olarak yerleştirilecektir.

İşlem Sistemleri Seviyesi

Veri Ambarı Seviyesi

Veri sergilemesi seviyesi

OLAP Seviyesi - Sistemler

Analitik Uygulamaların Seviyesi

OLAP - Sistemler - (çevrimiçi analitik işlem, şu anda analitik tedavi) - kapsamlı çok boyutlu veri analizinin teknolojisidir. OLAP - Multifactor verileri analiz etme görevinin olduğu yerlerde uygulanabilir. Raporları analiz etmenin ve üretmenin etkili bir yolu vardır. Yukarıdaki veri depoları, veri showcases ve OLAP sistemleri, iş zekası sistemlerine (iş zekası, bi) anlamına gelir.

Çok sık, karar vermelerinin doğrudan kullanımı konusunda yaratılan bilgi ve analitik sistemler kullanımda son derece basittir, ancak işlevsellikte sağlam bir şekilde sınırlıdır. Bu tür statik sistemler, Yöneticinin (IPR) veya İcra Bilgi Sistemleri (EIS) bilgi sistemlerinin literatüründe çağrılır. Önceden tanımlanmış çoklu istekleri içeriyorlar ve günlük inceleme için yeterli olan, karar verirken ortaya çıkabilecek tüm sorulara cevap veremiyor. Bu tür bir sistemin kuralı olarak, analistin göründüğü kapsamlı bir çalışmanın ardından çok sayfalı raporlardır. yeni seri sorular. Bununla birlikte, böyle bir sistemi tasarlarken öngörülemeyen her yeni istek, resmen bir programcı tarafından kodlanmış ve daha sonra yürütülmesi gerekir. Bu durumda bekleme süresi, her zaman kabul edilebilir olmayan saatler ve günler yapabilir. Böylece, bilginin ve analitik sistemlerin müşterilerinin çoğunun aktif olarak savaştığı, statik SPPR'nin dış sadeliği, felaket esneklik kaybını açar.



Aksine, dinamik SPPRS, seçilmemiş (geçici) analistlerin verilere uygulanmasına odaklanmıştır. Bu tür sistemlerin en derin şartları, OLAP kavramının başlangıcını yayınlayan makalede E. F. CODD'yi gözden geçirdi. Bu sistemlerle analistlerin çalışmaları, sonuçlarını sorgulamanın ve incelemelerin etkileşimi sırasıdır.

Ancak dinamik SPPRS sadece operasyonel analitik işleme (OLAP) alanında değil; Birikmiş verilere dayanan yönetim kararlarını yapmak için destek üç temel alanda gerçekleştirilebilir.

Detaylı veri küresi. Bu, bilgi bulmayı amaçlayan çoğu sistemin etkisi alanıdır. Çoğu durumda, ilişkisel DBMS'ler burada ortaya çıkan görevlerle mükemmel bir şekilde başa çıkmaktadır. Genel olarak kabul edilen manipülasyon dili ile ilişkisel verilerle birlikte SQL'dir. Son kullanıcı arayüzünü sağlayan bilgi ve arama motorları, detaylı bilgilerin arama görevlerinde, hem ayrı işlem sistemi veritabanları üzerinde hem de ortak veri depolaması üzerinde eklenti olarak kullanılabilir.

Toplu göstergelerin küresi. Veri ambarında toplanan bilgilere, genelleme ve toplanması, hipercubik gösterimi ve çok boyutlu analizlere kapsamlı bir bakış, operasyonel analitik veri işleme sistemlerinin (OLAP) görevleridir. Burada özel çok boyutlu DBMS'ye veya ilişkisel teknolojilerde kalabilirsiniz. İkinci durumda, önceden toplanmış veriler, yıldız benzeri bir tür veri tabanında toplanabilir veya bilgi toplama, ilişkisel veritabanının ayrıntılı tablolarını tarama işleminde anında gerçekleştirilebilir.

Desen küresi. Akıllı işleme, ana görevler, birikmiş bilgilerdeki fonksiyonel ve mantıksal desenler, görülen anomalileri açıklayan modellerin ve kuralların inşası olan ana görevleri olan akıllı veri analizi yöntemleri (JAAD, Veri Madenciliği) ile yapılır. Bazı süreçlerin gelişmesini tahmin et.

Operasyonel Analitik Veri İşleme

OLAP kavramının temeli, çok boyutlu veri sunumunun ilkesidir. 1993 yılında, EF CODD makalesi, ilişkisel modelin eksikliklerini, her şeyden önce "verileri çok sayıda ölçümlerin birleştirilmemesi, görüntüleme ve analiz edememesi, bu, kurumsal analistler için en anlaşılır olan Yolu, "ve OLAP sistemleri için genel gereksinimleri, ilişkisel DBM'lerin işlevselliğini genişletiyor ve özelliklerinden biri olarak çok boyutlu analiz içerir.

Olap ürünlerinin veri temsil yöntemine göre sınıflandırılması.

Halen, pazarda çok sayıda ürün bulunur, bu da değişen derecelerde OLAP işlevselliği sağlar. En ünlü yaklaşık 30, yorum web sunucusunun listesinde listelenmiştir http://www.olapreport.com/. Tarafından çok boyutlu bir kavramsal gösterimi sağlamak kullanıcı arayüzü Kaynak veritabanına, tüm OLAP ürünleri, kaynak veritabanının türüne göre üç sınıfa ayrılır.

En ilk operasyonel analitik işleme sistemleri (örneğin, Essbase Arbor yazılımı, Oracle'ın Oracle Express Sunucu Şirketi) Molap sınıfına aittir, yani sadece kendi çok boyutlu veritabanlarıyla çalışabilirler. Çok boyutlu DBMS için tescilli teknolojilere dayanırlar ve en pahalıdır. Bu sistemler eksiksiz bir OLAP işlemcisi sağlar. Ayrıca, sunucu bileşenine ek olarak, kendi entegre istemci arayüzüne ek olarak veya kullanıcı ile iletişim kurmak için kullanılır. dış Programlar Elektronik tablolarla çalışın. Bu tür sistemleri korumak için, sistemin eşliğinde, son kullanıcılar için veri görünümlerinin oluşumu kurarak özel bir personel gereklidir.

Operasyonel Analitik Veri İşleme Sistemleri (Rolap), ilişkisel tabanda, çok boyutlu formda depolanan verileri, bilgilerin orta ölçekli bir modele dönüştürülmesini sağlar. ROLAP sistemleri, büyük depolama ile çalışmak için iyi uyarlanmıştır. Molap sistemleri gibi, bilgi teknolojisi profesyonelleri için önemli hizmet maliyetleri gerektirir ve çok oyunculu çalışma sağlarlar.

Son olarak, hibrit sistemler (hibrit OLAP, Holap), avantajları birleştirmek ve önceki sınıflarda doğal olan eksiklikleri en aza indirmek için tasarlanmıştır. Speedware Media / MR bu sınıfı içerir. Geliştiricilere göre, analitik esneklik ve molap yanıt hızını, ROLAP'a özgü gerçek verilere sürekli erişim ile birleştirir.

Çok boyutlu OLAP (Molap)

Çok boyutlu veri sunumuna dayanan özel DBMS'de, veriler ilişkisel tablolar şeklinde düzenlenmez, ancak sipariş edilen çok boyutlu diziler biçiminde:

1) Hipercubes (Veritabanında depolanan tüm hücreler aynı boyuta sahip olmalı, yani maksimum tam ölçüm bazında) veya

2) Pycubes (her değişken kendi ölçümler kümesiyle depolanır ve ilişkili tüm işleme karmaşıklığı sistemin iç mekanizmalarına kaydırılır).

Operasyonel analitik işlem sistemlerinde çok boyutlu veritabanlarının kullanımı aşağıdaki avantajlara sahiptir.

Çok boyutlu DBMS kullanılması durumunda, verilerin arama ve numunesi, çok boyutlu veri tabanında çok boyutlu bir kavramsal görünümden çok daha hızlı gerçekleştirilir, çünkü çok boyutlu veritabanı önemsizdir, önceden toplanmış göstergeler içeriyor ve istenen hücrelere optimize edilmiş erişim sağlar .

Çok boyutlu DBMS, dahil etme görevleriyle kolayca başa çıkabilir. bilgi modeli çeşitli yerleşik fonksiyonlar, nesnel olarak mevcut kısıtlamalar sQL Dili Bu görevleri ilişkisel DBMS'ye göre oldukça karmaşık ve bazen imkansız hale getirin.

Öte yandan, önemli sınırlamalar vardır.

Çok boyutlu DBMSS, büyük veritabanları ile çalışmaya izin vermiyor. Ek olarak, denormalleşme ve önceden gerçekleştirilen toplamlık nedeniyle, çok boyutlu bir bazdaki veri miktarı, bir kural olarak (kodu değerlendirerek), daha az kaynak ayrıntılı verilerinin 2,5-100 katı olan 2,5-100 katında (kodu değerlendirerek) karşılık gelir.

İlişkisel ile karşılaştırıldığında çok boyutlu DBMS'ler çok verimsizdir harici hafıza. Olguların ezici çoğunluğunda, bilgi hipercube güçlü bir şekilde rariye edilir ve veriler sipariş edilen bir formda depolandığından, belirsiz değerler yalnızca maksimum sürekli gruplara veri düzenlemenizi sağlayan en uygun sıralama sırasını seçerek silinir. . Ancak bu durumda bile, sorun sadece kısmen çözülür. Ek olarak, sıralama prosedürü, depolama açısından en uygun olanıdır, sıralama sırası büyük olasılıkla sorgularda en sık kullanılan sırayla çakışmaz. Bu nedenle B. gerçek sistemler Veritabanının işgal ettiği disk alanının hızı ve fazlalığı arasında bir uzlaşmayı aramanız gerekir.

Sonuç olarak, çok boyutlu DBM'lerin kullanımı yalnızca aşağıdaki koşullar altında haklı çıkarılır.

Analiz için kaynak verilerinin miktarı çok büyük değildir (birkaç gigabayttan fazla), yani veri toplama seviyesi oldukça yüksektir.

Bilgi ölçümleri kümesi stabildir (yapılarındaki herhangi bir değişiklik hemen hemen her zaman tam bir hipercube yeniden yapılandırması gerektirir).

Sistemin seçilen talepler için yanıt süresi en kritik parametredir.

Kullanıcı işlevlerini yazma olasılığı da dahil olmak üzere, hipercube hücrelerinin üzerinde çapraz boyutsal hesaplamaları gerçekleştirmek için karmaşık yerleşik fonksiyonların geniş kullanımı gerekir.

Olap ilişkisi (ROLAP)

Operasyonel analitik işlem sistemlerinde ilişkisel veritabanlarının doğrudan kullanımı aşağıdaki avantajlara sahiptir.

Çoğu durumda, kurumsal veri depoları ilişkisel DBMS vasıtasıyla uygulanır ve ROLAP araçları doğrudan üst üste analiz etmeyi mümkün kılar. Bu durumda, depolama boyutu, molap durumunda olduğu gibi böyle bir kritik parametre değildir.

Görevin değişken bir boyutu durumunda, ölçüm yapısındaki değişiklikler oldukça sık yapılmalıdır, r OLAP SİSTEMLERİ Boyutların dinamik bir gösterimi ile optimum bir çözümdür, çünkü bu tür değişiklikler veritabanının fiziksel yeniden düzenlemesini gerektirmez.

İlişkisel DBMS, önemli ölçüde daha yüksek bir veri koruma düzeyi sağlar ve İyi fırsatlar Erişim haklarının ücretlendirilmesi.

Çok boyutlu DBMS'ye kıyasla Rolap'ın ana dezavantajı daha az performans. Molap ile karşılaştırılabilir performansı sağlamak için, ilişkisel sistemler, veritabanı yöneticilerinden büyük çaba gösteren veritabanı diyagramı ve dizin ayarlarının kapsamlı bir çalışmasını gerektirir. Yalnızca yıldız şeklindeki şemaları kullanırken, iyi yapılandırılmış ilişkisel sistemlerin performansı, çok boyutlu veritabanlarına dayanan sistemlerin performansı ile yaklaşılabilir.

OLAP teknolojisi kavramı 1993 yılında Edgar CODD tarafından formüle edilmiştir.

Bu teknoloji, çok boyutlu veri kümelerinin yapımına dayanmaktadır - sözde OLAP küpleri (mutlaka üç boyutlu değil, tanımdan sonuçlanabileceği için mutlaka üç boyutlu değildir). OLAP teknolojilerini kullanmanın amacı, veri analizi ve bu analizin formda, personelin yönetme algısı ve bunlara dayanarak çözümlerin kabul edilmesine uygundur.

Çok boyutlu analiz uygulamaları için temel gereksinimler:

  • - Kullanıcının kabul edilebilir bir süre için analizin sonuçlarına sağlanması (5 s'den fazla değil);
  • - Çok oyunculu veri erişimi;
  • - Çok boyutlu veri sunumu;
  • - Depolama ve hacim yerini ne olursa olsun herhangi bir bilgiyi ifade etme yeteneği.

OLAP sistemi araçları, belirtilen koşullardaki verileri sıralama ve seçme yeteneği sağlar. Çeşitli nitel ve kantitatif koşullar ayarlanabilir.

Sayısız kullanılan verilerin ana modeli araçlaraH Veritabanlarını oluşturmak ve desteklemek - DBMS ilişkisel bir modeldir. İçindeki veriler, anahtar alanlarla bağlı iki boyutlu masa ilişkisi olarak sunulur. Çoğaltma, çelişkili, işçilik maliyetlerinin azaltılmasını ortadan kaldırmak için, veritabanlarını korumak için işgücü maliyetlerinin azaltılması, tablo kuruluşlarının normalleşmesinin resmi bir tertibatı uygulanır. Bununla birlikte, uygulaması, bellek kaynakları kaydedilmesine rağmen, veritabanlarının taleplerine verilen cevapların oluşumu için harcanan ek süre ile ilişkilidir.

Çok boyutlu veri modeli, çalışma altındaki nesneyi çok boyutlu bir küp şeklinde temsil eder, daha sık üç boyutlu bir model kullanır. Küpün eksenleri veya kenarlarında, ölçümler veya detaylar ertelenir. İstenilenler - bazlar Küba'nın hücrelerini doldurur. Çok boyutlu küp, karar alma sisteminde raporlama ve analitik belgelerin oluşumunda ve multimedya sunumlarında algı ve sunumun oluşumunda algı ve sunumun oluşumunu kolaylaştırmak için üç boyutlu küplerin bir kombinasyonu ile sunulabilir.

Olap teknolojilerinin bir parçası olarak, verilerin çok boyutlu bir temsilinin ilişkili bir DBMS'lerin bir aracı olarak düzenlenebileceği gerçeğine dayanarak, çok boyutlu özel ajanlar, üç tür çok boyutlu OLAP sistemini ayırt eder:

  • - Çok boyutlu (çok boyutlu) olap-molap;
  • - ilişkisel (ilişki) olap-rolap;
  • - Karışık veya hibrit (hibrid) olap-holap.

Çok boyutlu DBMS'de, veriler ilişkisel tablolar biçiminde değil, tüm depolanan veriler aynı boyuta sahip olması gerektiğinde, hiperkubeler şeklinde sıralanmış çok boyutlu diziler şeklinde düzenlenir, bu da en kapsamlı ölçümü oluşturma ihtiyacı anlamına gelir. temeli. Veriler, polikubeler şeklinde düzenlenebilir, bu düzenlemede, her göstergenin değerleri kendi ölçümler kümesiyle depolanır, veri işleme kendi sistem aracı tarafından gerçekleştirilir. Bu durumda depo yapısı basitleştirilmiştir, çünkü Çok boyutlu veya nesneye yönelik bir biçimde bir depolama alanına gerek yoktur. Büyük işçilik maliyetleri, ilişkisel modelden nesneye model ve veri dönüşüm sistemleri oluşturmak için azaltılır.

Molap avantajları şunlardır:

  • - Rolap'tan daha hızlı, isteklere verilen yanıtları alma, bir ya da iki, daha az;
  • - SQL kısıtlamaları nedeniyle, birçok yerleşik fonksiyonun uygulanması zordur.

Molap kısıtlamaları şunlardır:

  • - Nispeten küçük veritabanı boyutları;
  • - Denormallaştırma ve ön toplama nedeniyle, çok boyutlu diziler, ilk verilerden 2,5-100 kat daha fazla bellek kullanılıyor (ölçüm sayısındaki artışa sahip bellek tüketimi, üstel yasaya göre büyüyor);
  • - Arayüz ve veri manipülasyon aracında standart yoktur;
  • - Verileri yüklerken sınırlamalar vardır.

Çok boyutlu veri yaratmak için işgücü maliyetleri çarpıcı bir şekilde artar, çünkü Pratik olarak bu durumda, bilgi deposunda yer alan verilerin ilişkisel modelini hedefleyen uzmanlaşmış araçlar. Taleplerin tepki süresi genellikle OLAP sistemleri için gereklilikler çerçevesini karşılayamaz.

Rolap sistemlerinin avantajları şunlardır:

  • - Doğrudan veri deposunda yer alan operasyonel analiz olasılığı, çünkü Kaynak veritabanlarının çoğu - ilişkisel tip;
  • - Sorunun değişken bir boyutu ile ro turu kazandı, çünkü Veritabanının fiziksel yeniden düzenlenmesi gerekmez;
  • - ROLAP sistemleri daha az güçlü müşteri istasyonları ve sunucuları kullanabilir ve karmaşık SQL sorgularının işlenmesinde ana yük sunuculara düşer;
  • - Bilginin korunması ve ilişkisel DBM'lerde erişim haklarının sınırlandırılması ve çok boyutlu olduğundan daha yüksektir.

Rolap sistemlerinin dezavantajı, veritabanı şemalarının, özel endekslerin özel ayarlanması, sorgu istatistiklerinin analizi ve analiz sonuçlarının analizi, önemli ek işçilik maliyetlerine yol açan veritabanı şemalarının iyileştirilmesinde analiz sonuçlarının analizi.

Bu koşulların uygulanması, Rolap sistemleri kullanırken, erişim süresi ile ilgili olarak göstergelerin molap sistemleriyle benzer ve ayrıca bellek tasarruflarında geçmenizi sağlar.

Hybrid OLAP sistemleri, ilişkisel ve çok boyutlu veri modeli uygulayan araçların bir kombinasyonudur. Bu, böyle bir modeli oluşturmak ve sürdürmek için kaynakların maliyetlerini büyük ölçüde azaltmanıza izin verir.

Bu yaklaşımla, ilk iki yaklaşımın avantajları kullanılır ve dezavantajları telafi edilir. Bu randevunun en gelişmiş yazılım ürünlerinde, bu özel ilke uygulanır.

OLAP-Systems'deki hibrit mimarisinin kullanımı, yazılım enstrümantal araçlarının kullanımı ile ilgili problemleri çok boyutlu analizde çözmenin en kabul edilebilir yoludur.

Desenlerin tanımlama modu, entelektüel veri işleme dayanmaktadır. Buradaki ana görev, incelenen süreçlerdeki kalıpların belirlenmesi, çeşitli faktörlerin ilişkilerinin ve karşılıklı etkilerinin, büyük "sıradışı" sapmaların aranması, çeşitli önemli süreçlerin tahminidir. Bu alan akıllı analizleri ifade eder (veri madenciliği).

Bilgi tabanında iyi çalışmanızı göndermeniz basittir. Aşağıdaki formu kullanın

Öğrenciler, lisansüstü öğrenciler, bilgi tabanını çalışmalarında kullanan genç bilim adamları ve çalışmaları size minnettar olacak.

tarafından gönderildi http://www.allbest.ru/

Ders çalışması

disiplin ile: Veritabanları

Konu: TeknolojiOlap.

Yapıldı:

Chizhikov Alexander Alexandrovich

Giriş

1. OLAP ürünlerinin sınıflandırılması

2. OLAP istemcisi - OLAP sunucusu: "için" ve "karşı"

3. Çekirdek OLAP sistemi

3.1 İnşaat İlkeleri

Sonuç

Kullanılan kaynakların listesi

Başvurular

İÇİNDEbakım

En azından sezgisel bir düzeyde, hangi veritabanlarının ve neden ihtiyaç duyulduklarını anlamadığı bilgisayar dünyasında bir insan bulmak zordur. Geleneksel ilişkisel DBM'lerin aksine, OLAP kavramı bu kadar yaygın değildir, ancak muhtemelen neredeyse hepsi "Küba OLAP" duyulur. Çevrimiçi analitik işlem nedir?

OLAP, ayrı bir yazılım ürünü değil, programlama dili değil, belirli bir teknolojiyi bile değil. Olap'ı tüm tezahürlerinde karşılamaya çalışırsanız, bu nedenle bu kavramlar, ilke ve gereksinimlerin altındaki yazılım ürünlerinin verilerine erişimini kolaylaştırır. Böyle bir tanımın olası olmadığı gerçeğine rağmen, hiç kimse aynı fikirde olmayacak, en azından iota brifing olmayan uzman olmayanların konuyu anlamak için şüphelidir. Bu nedenle, OLAP bilgisi için arzusunda farklı şekillerde gitmek daha iyidir. Öncelikle, analistlerin neden bir şekilde verilere erişimi kolaylaştırması gerektiğini öğrenmeniz gerekir.

Gerçek şu ki, analistlerin özel tüketicilerin kurumsal bilgilerin tüketicileridir. Analitik görevi, büyük veri dizilerindeki düzenlilikleri bulmaktır. Bu nedenle, analist ayrı bir gerçeğe dikkat etmeyecek, yüzlerce ve binlerce etkinlik hakkında bilgi gerekiyor. Bu arada, olap görünümüne yol açan temel anlardan biri - performans ve verimlilik. Analistin bilgi alması gerektiğinde ne olduğunu hayal edin ve işletmede OLAP aletleri yoktur. Bağımsız bir analist (muhtemel değildir) veya programcıyı kullanmak, ilgili SQL sorgusunu yapar ve rapordaki ilginin verilerini alır ve bunları elektronik tabloya verir. Sorunlar harika bir set ortaya çıkar. Birincisi, analist çalışmaları (SQL programlaması) ile çalışmamaya zorlanır (SQL programlama) veya bunun için görevi beklemeye zorlanır, programcılar performans gösterecek - tüm bunlar işçiliğin verimliliğini, enfarktüs ve inme seviyesi artar ve böylece . İkincisi, bir kural olarak, tek bir rapor veya tablo, Rus analizinin düşünce ve babalarının devlerini kaydetmez - ve tüm prosedürün tekrar tekrar tekrarlanması gerekecektir. Üçüncüsü, zaten bulunduğumuz gibi, önemsizlerdeki analistler sormazlar - hemen her şeye ihtiyaçları var. Bu, analistin çizdiği kurumsal ilişkisel DBM'lerin sunucusunun, diğer işlemleri engelleyen kurumsal ilişkisel DBM'lerin sunucusunun, diğer işlemleri engelleyebilmesi anlamına geldiği anlamına gelir (tekniğin ve yedi mil adımlarla ilerlemesine rağmen) anlamına gelir.

OLAP kavramı, bu tür sorunları çözmek için özel olarak ortaya çıktı. Küba OLAP, esasen meta-raporlardır. Meta raporlarını (yani Küba, yani) ölçümler için, analist, aslında, "sıradan" olan iki boyutlu raporları alır (bu, bu terimin olağan anlayışında mutlaka raporlar değildir - veriler hakkında konuşuyoruz - aynı fonksiyonlara sahip yapılar). Küplerin avantajları açıktır - veriler yalnızca bir küp oluştururken ilişkisel DBMS'den talep edilmelidir. Analistler, kural olarak, "Anında" tamamlanan ve değişen bilgilerle çalışmayın, oluşturulan küp yeterince uzun süre alakalıdır. Bundan dolayı, yalnızca ilişkisel DBMS sunucusunun çalışmasında kesintileri hariçtir (binlerce ve milyonlarca cevap hattında sorgu yoktur), ancak aynı zamanda analistin kendisi için veri erişiminin hızını da arttırır. Buna ek olarak, önceden belirtildiği gibi, performans artar ve bir küp oluştururken hiyerarşilerin ve diğer toplu değerleri ve diğer toplu değerleri sayarak artar.

Tabii ki, bu performans tarzındaki artış için ödeme yapmak gerekir. Bazen, yalnızca "patlar" veri yapısının - OLAP küpünün, kaynak verilerinden düzinelerce ve hatta yüzlerce kat daha fazla yer kaplayabileceğini söylüyorlar.

Şimdi, OLAP'in nasıl çalıştığından biraz daha fazla ayrıldığımızda, hala buna değer, yine de, bir şekilde bilgimizi resmileştirin ve oluk kriterlerini eşzamanlı olarak her zamanki insan diline çevirmeden verir. Bu kriterler (toplam 12), 1993 yılında E.F tarafından formüle edilmiştir. Kod, ilişkisel DBMS ve yarı zamanlı, olap kavramının yaratıcısıdır. Onları doğrudan düşünmeyeceğiz, çünkü daha sonra, OLAP ürünlerinin gerekliliklerini belirleyen FASMI testi denilen FASMI testi içinde elden geçirildiler. Fasmi, her test noktasının adından bir kısaltmadır:

Hızlı. Bu özellik, sistemin kullanıcının isteğine ortalama beş saniye boyunca bir cevap vermesi gerektiği anlamına gelir; Aynı zamanda, çoğu talep bir saniye içinde işlenir ve en karmaşık talepler yirmi saniye içinde işlenmelidir. Son çalışmalar, otuz saniyeden fazla sürerse, kullanıcının isteğin başarısından şüphe etmeye başladığını göstermiştir.

Analiz (analitik). Sistem, herhangi bir mantıksal ve istatistiksel analiz, iş uygulamalarının özelliği ile başa çıkmalı ve son kullanıcı için mevcut olan formdaki sonuçların korunmasını sağlar. Analiz Araçları, zaman serilerini, maliyet dağıtımını, para birimi dönüşümünü, organizasyonel yapılarda ve bazılarında modelleme değişikliklerini analiz etme prosedürlerini içerebilir.

Paylaşılan (paylaşılan). Sistem, birçok kullanıcının verilerine erişim ve eşzamanlı çalışmalar arasında ayrım yapmak için yeterli fırsatlar sağlamalıdır.

Çok boyutlu (multiserry). Sistem, dahil olmak üzere, kavramsal olarak çok boyutlu bir sunum sağlamalıdır. tam destek çoklu hiyerarşiler.

Bilgi. Çeşitli yazılım ürünlerinin gücü, girdi işlenmiş verilerin sayısı ile karakterizedir. Farklı OLAP sistemleri farklı Gücü var: Gelişmiş OLAP Çözümleri, en düşük güce kıyasla en az miktarda veri ile en az bin kez çalışabilir. Bir OLAP aracı seçerken, RAM tarafından istenen verilerin çoğaltılması, disk alanı, operasyonel göstergeler, bilgi depolama tesisleriyle entegrasyon, vb.

1. OLAP ürünlerinin sınıflandırılması

Böylece, OLAP'in özü, analiz için bilgi kaynağının çok boyutlu bir küp şeklinde sunulmasıdır ve keyfi olarak manipüle etmek ve gerekli bilgi kesimlerini almak mümkündür. Bu durumda, son kullanıcı bir küpü, çeşitli kesimlerde (ölçümler) verileri (gerçekler) otomatik olarak özetleyen çok boyutlu bir dinamik tablo olarak görür ve hesaplamaları ve rapor formunu etkileşimde bir şekilde yönetmenize olanak sağlar. Bu işlemlerin yürütülmesi bir OLAP makinesi (veya OLAP-bilgisayar makinesi) tarafından sağlanır.

Bugüne kadar, OLAP teknolojilerini uygulayan birçok ürün dünyada geliştirilmiştir. Aralarında gezinmeyi kolaylaştırmak için, OLAP-ürün sınıflandırmalarını kullanın: Analiz ve OLAP makinesinin yeri için veri depolama yöntemine göre. OLAP ürünlerinin her kategorisini düşünün.

Veri depolama yöntemiyle sınıflandırma ile başlayacağım. Size, çok boyutlu küplerin kaynak ve toplu veriler temelinde inşa edildiğini hatırlatayım. Küplerin hem kaynak hem de toplam veri, hem ilişkisel hem de çok boyutlu veritabanlarında depolanabilir. Bu nedenle, şu anda üç veri depolama yöntemi uygulanır: Molap (Çok boyutlu OLAP), Rolap (Relasal OLAP) ve Holap (Hibrit OLAP). Buna göre, saklama yöntemine göre OLAP ürünleri üçe bölünmüştür:

1. Molap durumunda, ilk ve toplam veriler çok boyutlu bir veritabanında veya çok boyutlu bir yerel Küba'da depolanır.

2. ROLAP ürünlerinde, kaynak verileri ilişkisel veritabanlarında veya dosya sunucusundaki düz yerel tablolarda saklanır. Toplam veri aynı veritabanındaki servis tablolarına yerleştirilebilir. Verileri ilişkisel veritabanından çok boyutlu küplere dönüştürme, OLAP'in talebinde oluşur.

3. Holap mimarisinin kullanılması durumunda, ilk veri ilişkisel bazda kalır ve üniteler çok boyutlu olarak yerleştirilir. OLAP Küpünün yapımı, ilişkisel ve çok boyutlu verilere dayanan OLAP-Aletlerin talebi üzerine yapılır.

Sonraki sınıflandırma - OLAP arabasının yerleşimi yerine. Bu özelliğe göre, OLAP ürünleri OLAP sunucularına ve OLAP müşterilerine ayrılmıştır:

Sunucu OLAP araçlarında, agrega verilerin hesaplanması ve depolanması ayrı bir işlem - sunucu tarafından gerçekleştirilir. İstemci uygulaması yalnızca sunucuda depolanan çok boyutlu küplere sorgu sonuçlarını alır. Bazı OLAP sunucuları, yalnızca ilişkisel bazlarda veri depolamasını desteklemektedir, bazıları sadece çok boyutludur. Birçok modern OLAP sunucusu üç veri depolama yönteminin tamamını da destekler: Molap, Rolap ve Holap.

OLAP istemcisi farklı şekilde tasarlanmıştır. Müşteri bilgisayarın hafızasında çok boyutlu bir küp ve OLAP hesaplamaları oluşturulur. OLAP istemcileri de Rolap ve Molap'a bölünmüştür. Bazıları her iki veri erişim seçeneğini de destekleyebilir.

Bu yaklaşımların her biri, "Artılar" ve "eksi" var. Sunucu araçlarının müşterinin önündeki avantajları hakkındaki ortak bir görüşün aksine, bir dizi vakada, OLAP istemcisinin kullanıcılar için uygulanması, OLAP sunucusunu kullanmak için daha verimli ve daha karlı olarak ortaya çıkabilir.

2. OLAP istemcisi - OLAP sunucusu: "için" ve "karşı"

Yaparken bilgi sistemi OLAP işlevselliği hem sunucu hem de müşteri olukları uygulanabilir. Uygulamada, seçim performans göstergelerinin uzlaşmasından ve yazılımın maliyetinin sonucudur.

Verilerin miktarı, aşağıdaki özellikler kümesiyle belirlenir: kayıt sayısı, ölçüm sayısı, ölçüm elemanlarının sayısı, ölçümlerin uzunluğu ve gerçeklerin sayısı. OLAP sunucusunun, olap istemcisinden çok miktarda veriyi bilgisayarın eşit gücü ile işleyebileceği bilinmektedir. Bu, OLAP sunucusunun depolanması gerçeği ile açıklanmaktadır. sabit diskler Önceden hesaplanmış küpleri içeren çok boyutlu bir veritabanı.

OLAP işlemlerinin yürütüldüğü zaman istemci programları, SQL benzeri bir dil için istekleri gerçekleştirir, tüm küpü ve görüntülenen parçalarını alır. Çalışma anında OLAP istemcisi olmalı rasgele erişim belleği Tüm küp Rolap mimarisi durumunda, küpü hesaplamak için kullanılan tüm veri dizisini belleğe yüklemek için gereklidir. Ek olarak, ölçümlerin sayısında bir artış, gerçekler veya ölçüm ölçümleri ile, agrega sayısı geometrik ilerlemede büyüyor. Böylece, OLAP istemcisi tarafından işlenen veri miktarı, kullanıcının RAM'in kapsamına doğrudan bağlıdır.

Ancak, çoğu OLAP istemcilerinin dağıtılmış bilgi işlem sağladığını not ediyoruz. Bu nedenle, istemci OLAP aletlerinin çalışmalarını sınırlayan, işlenen kayıtların sayısı altında, kurumsal veritabanının birincil verilerinin miktarını değil, toplu bir numunenin boyutunu değil. OLAP istemcisi, ön plana çıkan birincil veriler için filtreleme koşullarını ve algoritmayı tanımlayan bir DBMS'ye bir istek oluşturur. Sunucu kayıtları bulur ve daha fazla OLAP hesaplamaları için kompakt bir örnek döndürür. Bu numunenin boyutu, birincil, toplu olmayan kayıtların hacminden onlarca yüzlerce kat daha az olabilir. Sonuç olarak, PC kaynaklarındaki böyle bir OLAP istemcisinin ihtiyaç önemli ölçüde azalır.

Ek olarak, ölçüm sayısı, insan algısı olasılığına ilişkin kısıtlamalar getirmiştir. Ortalama kişinin eşzamanlı olarak 3-4, maksimum ölçümlerin çalışabileceği bilinmektedir. Dinamik tabloda daha fazla ölçümle, bilgi algısı önemli ölçüde zordur. OLAP istemcisi tarafından istenebilecek önceden hesaplanan RAM önceden hesaplanmadığında bu faktör dikkate alınmalıdır.

Ölçüm uzunluğu ayrıca, OLAP Küpünü hesaplayarak işgal altındaki adres alanının boyutunu da etkiler. Ölçüm ne kadar uzun olursa, çok boyutlu bir dizinin ön sıralamasını yapmak için daha fazla kaynak gerekir ve bunun tersi de geçerlidir. Kaynak verilerindeki yalnızca kısa ölçümler, OLAP istemcisinin lehine başka bir argümandır.

Bu özellik, yukarıda tartışılan iki faktör tarafından belirlenir: işlenen verilerin hacmi ve bilgisayarların gücü. Miktarın bir artışı olduğu için, örneğin ölçümler, tüm OLAP fonlarının performansı, birim sayısındaki önemli bir artış nedeniyle azalır, ancak düşüş oranı farklıdır. Bu bağımlılığı grafikte göstereceğiz.

Şema 1. Müşteri ve sunucu OLAP fonlarının performansının, veri miktarındaki artıştan bağımlılığı

OLAP sunucusunun hız özellikleri, veri miktarındaki artışa daha az duyarlıdır. Bu, kullanıcı istekleri OLAP sunucusu ve OLAP istemcisini işlemek için çeşitli teknolojilerden kaynaklanmaktadır. Örneğin, OLAP sunucusu, OLAP sunucusu depolanan verileri ifade eder ve bu "şubeden" verileri "çeker". OLAP istemcisi, yükleme sırasında tüm birim kümesini hesaplar. Ancak, belirli bir miktarda veri, sunucu ve müşteri performansı karşılaştırılabilir. Dağıtılmış hesaplamaları destekleyen OLAP müşterileri için, performans karşılaştırılabilirliği, OLAP analizindeki ihtiyaçları kapsayan veri miktarına dağıtılabilir. büyük sayı kullanıcılar. Bu, dahili test MS OLAP sunucusu ve OLAP istemcisi "kontur standardının" sonuçları ile onaylanır. Test, IBM PC PC PTentium Celeron 400 MHz PC'de yapılır, 10 ila 70 üyeden oluşan 7 ölçüm içeren 1 milyon benzersiz (yani toplu) kayıtlar için 256 MB. Her iki durumda da küp yükleme süresi 1 saniyeyi geçmez ve çeşitli OLAP işlemlerinin (delinmesi, delinmesi, hareket ettirilmesi, filtre vb.) Yürütülmesi bir saniyelik yüzlerce gerçekleştirilir.

Numune boyutu RAM miktarını aştığında, değişim (takas) diskle başlar ve OLAP istemcisinin performansı keskin bir şekilde düşer. Sadece bu andan itibaren, OLAP sunucusunun avantajı hakkında konuşabiliriz.

"Kırılma" noktasının, OLAP çözümleri fiyatlarındaki keskin yükselişin sınırını belirlediği unutulmamalıdır. Herkesin görevleri için Özel Kullanıcı Bu nokta, OLAP istemci performans testleri tarafından kolayca belirlenir. Bu tür testler, geliştiricinin şirketinden elde edilebilir.

Ek olarak, Sunucu OLAP çözümlerinin maliyeti artan kullanıcı sayısıyla artar. Gerçek şu ki, OLAP sunucusunun bir bilgisayardaki tüm kullanıcılar için hesaplamaları gerçekleştirmesidir. Buna göre, daha fazla kullanıcı sayısı, RAM ve işlemci gücü arttırır. Böylece, işlenen verilerin hacimleri, sunucu ve istemci sistemlerinin karşılaştırılabilir performansı alanında uzanırsa, diğer tüm şeyler eşittir, OLAP istemcisinin kullanımı daha karlı olacaktır.

"Klasik" ideolojisinde bir OLAP sunucusu kullanılması, bu ilişkisel DBMS'nin çok boyutlu bir veritabanına boşaltılmasını sağlar. Boşaltma belirli bir süre için yapılır, bu nedenle OLAP sunucusu verileri şu anda durumu yansıtmaz. Bu eksiklik, sadece Rolap modunu destekleyen OLAP sunucularından yoksundur.

Benzer şekilde, bir dizi OLAP müşterisi, veritabanına doğrudan erişim ile ROLAP ve masaüstü mimarisini uygulamanıza olanak sağlar. Bu, çevrimiçi modda kaynak verilerin bir analizini sağlar.

OLAP sunucusu, müşteri terminallerinin gücü için minimum gereklilikleri yerleştirir. Objektif olarak, OLAP istemcisinin gereklilikleri daha yüksektir, çünkü PC kullanıcısının RAM'sinde hesaplamalar yapar. Belirli bir kuruluşun donanım araçlarının parkının durumu, OLAP seçerken alınması gereken en önemli göstergedir. Ama burada "Artılar" ve "eksi" var. OLAP sunucusu, modernin büyük bir bilgi işlem gücü kullanmıyor kişisel bilgisayarlar. Kuruluşun zaten modern PC'lerin bir parkına sahip olması durumunda, onları yalnızca terminalleri görüntülemek ve aynı zamanda merkezi sunucu için ek maliyetler yapmak etkisizdir.

Kullanıcıların bilgisayarlarının gücü "arzu edilecek çok şey bırakır" ise, OLAP istemcisi yavaşça çalışacak veya hiç çalışamayacak. Güçlü bir sunucu satın almak, tüm PC'lerin yükseltilmesinden daha ucuz olabilir.

Donanımın geliştirilmesindeki eğilimleri dikkate almak faydalıdır. Analiz için veri miktarı neredeyse bir sabit olduğundan, PC gücündeki sabit güç artışı OLAP istemcisi yeteneklerinin ve OLEP sunucularının çok büyük veritabanlarının segmentine genişlemesine yol açacaktır.

OLAP sunucusunu ağ üzerinden kullanırken, yalnızca veri istemci PC'ye iletilirken, OLAP istemcisi birincil örnek verilerin tüm hacmini alır.

Bu nedenle, OLAP istemcisinin uygulandığı durumlarda, ağ trafiği daha yüksek olacaktır.

Ancak, Kullanıcı İşlemi OLAP sunucusunu kullanırken, örneğin detaylandırma, çok boyutlu veritabanına yeni sorgular oluşturun ve yeni bir veri aktarımı anlamına gelir. OLAP Operasyonları OLAP istemcisinin yürütülmesi RAM'de yapılır ve buna göre, ağda yeni veri akışlarına neden olmaz.

Ayrıca modern ağın da belirtilmelidir. donanım Yüksek seviyede bant genişliği sağlar.

Bu nedenle, vakaların ezici çoğunluğunda, OLAP istemcisini kullanan "orta" boyutlarının analizi, kullanıcıyı yavaşlamaz.

OLAP sunucusunun maliyeti yeterince yüksek. Bu, vurgulanan bir bilgisayarın maliyetine ve çok boyutlu tabanın uygulanmasının sabit maliyetleri de başlamalıdır. Ek olarak, OLAP sunucusunun uygulanması ve bakımı, yeterince yüksek niteliksel personel gerektirir.

OLAP istemcisinin maliyeti, OLAP sunucusunun maliyetinden daha düşük bir büyüklük sırasıdır. Yönetim ve sunucunun altındaki ek teknik ekipman gerekli değildir. OLAP istemcisinin yüksek taleplerin uygulanmasında personelin nitelikleri sunulmamaktadır. OLAP istemcisi, OLAP sunucusundan çok daha hızlı şekilde uygulanabilir.

Müşteri OLAP Fonlarını Kullanarak Analitik Uygulamaların Gelişimi - İşlem Hızlı ve Yüklenicinin Özel Hazırlanması Gerekiyor. Veritabanının fiziksel olarak uygulanmasını bilen kullanıcı, bir BT uzmanının cazibesi olmadan bağımsız bir şekilde analitik bir uygulama geliştirebilir. OLAP sunucusunu kullanırken, 2 öğrenmelisiniz. farklı sistemlerBazen çeşitli tedarikçilerden, - sunucuya küpler oluşturmak ve bir istemci uygulaması geliştirmek. OLAP istemcisi, küpleri tanımlamak ve kullanıcı arayüzlerini ayarlamak için tek bir görsel arayüz sağlar.

Bir istemci enstrümantal aracı kullanarak bir OLAP uygulaması oluşturma işlemini düşünün.

Şema 2. Bir istemci rolap kullanarak bir OLAP uygulaması oluşturma

ROLAP istemcilerinin çalışma prensibi, kaynak verilerin fiziksel yapısını gizleyen anlamsal katmanın ön açıklamasıdır. Bu durumda, veri kaynakları olabilir: yerel tablolar, RDBD. Desteklenen veri kaynaklarının listesi belirli bir yazılım ürünü tarafından tanımlanır. Bundan sonra, kullanıcı bağımsız olarak, küpler ve analitik arayüzler oluşturmak için konu alanı açısından anlayabilecek nesneleri manipüle edebilir.

OLAP sunucusunun çalışma prensibi farklıdır. OLAP sunucusunda, küpler oluştururken, kullanıcı veritabanının fiziksel açıklamalarını değiştirir.

Aynı zamanda, Küba'nın kendisinde özel açıklamalar oluşturulur. OLAP sunucusu istemcisi yalnızca küp için yapılandırılmıştır.

ROLAP istemcisinin çalışma ilkesini dinamik bir satış raporu oluşturma örneğinde açıklayalım (bkz. Şema 2). İlk analiz verilerinin iki tabloda saklanmasına izin verin: Satış ve Anlaşma.

Bir anlamsal katman oluştururken, veri kaynakları - satışlar ve anlaşma tabloları anlaşılabilir son kullanıcı terimleri ile tanımlanır ve "Ürünler" ve "İşlemler" dönüşür. "Ürünler" tablosundan gelen "ID" alanı "Kod" ve "İsim" ile yeniden değiştirilir - "Ürün", vb.

Sonra bir iş nesnesi "satış" oluşturulur. İş nesnesi, çok boyutlu bir küpe dayanan düz bir tablodır. Bir iş nesnesi "Ürünler" ve "İşlemler" tablosu oluştururken, "Kod" alanını birleştirin. Raporda gösterildiğinden beri, tabloların tüm alanları gereklidir - iş nesnesi yalnızca "Ürün" alanlarını, "tarihi" ve "Tutar" kullanır.

Daha sonra, iş nesnesi temelinde, bir OLAP raporu oluşturulur. Kullanıcı bir iş nesnesi seçer ve özniteliklerini sütun alanına veya rapor satırlarına sürükler. Örneğimize göre, satış iş nesnesi temelinde, aylara göre mal satışları hakkında bir rapor oluşturulmuştur.

Etkileşimli bir raporla çalışırken, kullanıcı filtreleme ve gruplama koşullarını "fare" aynı basit hareketlerle ayarlayabilir. Bu noktada, ROLAP istemcisi önbellekteki verilere hitap eder. OLAP sunucusunun istemcisi, çok boyutlu bir veritabanına yeni bir istek oluşturur. Örneğin, satış raporunda bir satış filtresi uygulayarak, ilgilendiğiniz malların satışları hakkında bir rapor alabilirsiniz.

Tüm OLAP uygulamaları ayarları, bir uygulamada veya çok boyutlu bir veritabanı sistem deposunda özel bir meta veri deposunda saklanabilir. Uygulama, belirli yazılım ürününe bağlıdır.

Bu nedenle, hangi durumlarda, OLAP istemcisinin kullanıcılar için uygulanması, OLAP sunucusunu kullanmak için daha verimli ve daha karlı olabilir mi?

OLAP sunucusunun uygulanmasının ekonomik fizibilitesi, OLAP istemcisi için veri miktarı çok yüksek ve dayanılmaz olduğunda, aksi takdirde ikincisinin kullanımı daha haklıdır. Bu durumda, OLAP istemcisi yüksek performanslı özellikleri ve düşük maliyetleri birleştirir.

Güçlü PC analistleri, OLAP müşterileri lehine başka bir argümandır. OLAP sunucusunu uygularken, bu güç kullanılmaz. OLAP müşterilerinin avantajları arasında aşağıdakiler de arasındadır:

Bir OLAP istemcisini uygulama ve sürdürme maliyeti, OLAP sunucusunun maliyetinden önemli ölçüde düşüktür.

Ağ üzerinden yerleşik bir veri iletim iletimiyle bir OLAP istemcisi kullanırken, bir kez yapılır. OLAP işlemlerini gerçekleştirirken, yeni veri akışları oluşturulmaz.

ROLAP istemcilerinin ayarlanması, çok boyutlu bir veritabanı oluşturma - ara bağlantıyı ortadan kaldırarak basitleştirilmiştir.

3. Çekirdek OLAP sistemi

3.1 İnşaat İlkeleri

uygulama istemcisi çekirdeği verileri

Zaten şöyle dedi ki, OLAP mekanizmasının bugün popüler veri analizi yöntemlerinden biri olduğu açıktır. Bu görevi çözmek için iki ana yaklaşım var. Birincisi, çok boyutlu OLAP (MAILAP) denir - mekanizmanın sunucu tarafında çok boyutlu bir veritabanı kullanarak uygulanması ve ikinci ilişkisel OLAP (Rolap) - Bina Küpleri " SQL istekleri ilişkisel DBMS'ye. Bu yaklaşımların her birinin artıları ve eksileri vardır. Karşılaştırmalı analizleri bu çalışmanın ötesine geçiyor. Burada sadece masaüstü Rolap modülünün çekirdeğinin uygulanması açıklanacaktır.

Böyle bir görev, Borland Delphi'yi oluşturan karar küp bileşenlerine dayanan bir ROAP sistemi uyguladıktan sonra ortaya çıktı. Ne yazık ki, bu set bileşeninin kullanımı, büyük miktarda veri üzerinde düşük performans göstermiştir. Bu sorunun ciddiyeti, küpleri inşa etmek için beslemeden önce mümkün olduğunca fazla veri kesmeye çalışarak azaltılabilir. Ancak bu her zaman yeterince olmaz.

İnternette ve basın, OLAP sistemleri hakkında birçok bilgi bulabilirsiniz, ancak neredeyse hiçbir yerde içeride nasıl düzenlendiği hakkında belirtilir.

İşin Şeması:

Masaüstü OLAP sisteminin çalışmasının genel şeması aşağıdaki gibi gösterilebilir:

Şema 3. Çalışma Masaüstü OLAP Sistemi

Çalışma algoritması aşağıdaki gibidir:

1. Düz bir tablo formundaki verileri veya SQL isteğinin yürütülmesinin sonucu olarak hesaplayın.

2. Nakit verileri ve bunları çok boyutlu Küba'ya dönüştürün.

3. Çapraz tablo veya grafik kullanarak inşa edilmiş Küba'nın görüntüsü vb. Genel durumda, bir Küba'ya rastgele sayıda eşleme bağlanabilir.

Nasıl olduğunu düşünün benzer bir sistem İçeride düzenlenebilir. Bunu görebileceğiniz ve hissetebileceğiniz taraftan başlayalım, bu, eşlemelerle. OLAP sistemlerinde kullanılan ekran, çoğu zaman iki tür - çapraz tablolar ve grafikler vardır. Küba'yı göstermenin ana ve en yaygın yolu olan bir çapraz tabloyu düşünün.

Aşağıdaki şekilde, toplanmış sonuçlar içeren oranlar ve sütunlar görüntülenir, hücreler, gerçeklerin ve koyu gri hücrelerin boyutları içerdiği açık gri hücrelerle işaretlenir.

Böylece, tablo gelecekte çalışacağımız aşağıdaki unsurlara ayrılabilir:

Bir matrisin gerçeklerle doldurulması, aşağıdaki gibi davranmalıyız:

Ölçüm verilerine dayanarak, eklenen elemanın koordinatlarını matrisdeki koordinatlarını belirleyin.

Eklenen elemanın etkilendiği sütunların ve sonuçların çizgilerinin koordinatlarını belirler.

Matris'e ve karşılık gelen sütunlara ve sonuç satırlarına öğe ekleyin.

Elde edilen matrisin güçlü bir şekilde seyredileceği, neden örgütü iki boyutlu bir dizi (yüzey üzerinde yatan seçeneği) sadece irrasyonel değil, büyük olasılıkla ve büyük olması nedeniyle mümkün olmadığı belirtilmelidir. Bu matrisin boyutu, bu miktarda RAM olmaz. Örneğin, küpümüz bir yıl içinde satış bilgileri içeriyorsa ve içinde sadece 3 ölçüm varsa - müşteriler (250), ürünler (500) ve tarih (365), sonra aşağıdaki boyutların matrisini alacağız: numara unsurlar \u003d 250 x 500 x 365 \u003d 45,262.000. Ve bu, matrisdeki doldurulmuş elemanların sadece birkaç bin olabileceği gerçeğine rağmen. Ayrıca, ölçümlerin miktarı arttıkça, matris daha nadir görecek.

Bu nedenle, bu matris ile çalışmak için, rared matrislerle çalışmak için özel mekanizmalar uygulamanız gerekir. Rarefed bir matris düzenlemek için çeşitli seçenekler mümkündür. Programlama edebiyatında, örneğin, "Programlama Sanatı" klasik kitabının ilk hacminde oldukça iyi tarif edilir. Donald Knuta.

Şimdi, karşılık gelen ölçümleri bilerek fabrika koordinatlarını nasıl belirleyebileceğinizi düşünün. Bunu yapmak için, başlık yapısı daha ayrıntılı olarak düşünün:

Bu durumda, karşılık gelen hücrenin sayısını ve düştüğü sonuçları belirlemenin bir yolunu kolayca bulabilirsiniz. Burada birkaç yaklaşım sunabilirsiniz. Bunlardan biri, karşılık gelen hücreleri aramak için bir ağacın kullanımıdır. Bu ağaç numuneyi geçerken inşa edilebilir. Ek olarak, istenen koordinatları hesaplamak için analitik tekrarlayan formülü kolayca belirleyebilirsiniz.

Tabloda depolanan veriler bunları kullanmak için dönüştürülmelidir. Bu nedenle, bir hipercuba inşa etmede üretkenliği arttırmak için, küpü ölçen sütunlarda depolanan benzersiz elemanların bulunması arzu edilir. Ek olarak, aynı boyutlara sahip girişler için gerçeklerin önceden toplanmasına neden olabilirsiniz. Yukarıda belirtildiği gibi, ölçüm alanlarında bulunan benzersiz değerler önemlidir. Ardından, depolama için aşağıdaki yapıyı sunabilirsiniz:

Şema 4. Eşsiz değerlerin depolama yapısı

Böyle bir yapıyı kullanırken, hafıza ihtiyacını önemli ölçüde azaltıyoruz. Oldukça alakalı, çünkü Çalışma hızını artırmak için, RAM'deki verilerin saklanması önerilir. Ek olarak, yalnızca bir dizi öğe depolayabilirsiniz ve değerleri, yalnızca çapraz tablo türetildiğinde gerekli olacak şekilde diske boşaltılabilir.

Yukarıda açıklanan fikirler, bir Cubebase bileşeni kütüphanesi oluştururken korunmuştur.

Şema 5. Cubebase Bileşen Kütüphanesi Yapısı

Tsubesource, verileri önbelleğe alma ve dönüştürme, verilerin öngörülmesinin yanı sıra verileri de oluşturur. TSUBEENGINE bileşeni, hypercube ve operasyonların hesaplanmasını gerçekleştirir. Aslında, düz bir masayı çok boyutlu bir veri setine dönüştüren bir OLAP makinesidir. TCubegrid bileşeni çapraz tablo ekranı ve hipercube ekran kontrolünü gerçekleştirir. TsubechArt, hipercube'yi grafikler biçiminde görmenizi sağlar ve Tsubeptivote bileşeni küp çekirdeğinin çalışmasını kontrol eder.

Böylece, bir OLAP makinesi oluşturmak için kullanılabilecek bileşenlerin mimarlığını ve etkileşimini düşündüm. Şimdi bileşenlerin iç yapısını daha ayrıntılı olarak düşünün.

Sistemin çalışmasının ilk adımı veri yüklenecek ve bunları dahili biçime dönüştürecek. Soru doğal olacak - ve neden gerekli olduğunu, çünkü bir küp kesimi yaparken ona bakarak düz bir masadan veri kullanabilirsiniz. Bu soruyu cevaplamak için, Tablonun yapısını OLAP makinesinin bakış açısından düşünün. OLAP için, masa sütun sistemi gerçekler veya ölçümler olabilir. Bu durumda, bu sütunlarla çalışma mantığı farklı olacaktır. Hypercube ölçümlerinde aslında eksenlerdir ve ölçüm değerleri bu eksenlerde koordinatlardır. Aynı zamanda, küp oldukça düzensiz doldurulacak - hiçbir girişin yapılandırılmayacağı ve kaynak tablodaki birkaç girişe karşılık gelen kombinasyonlar olacak koordinatların bir kombinasyonu olacak ve ilk durum daha sık karşılaşacak , küp, puanı teşvik eden ayrı yerlerde (gerçekler) evrene benzer olacaktır. Böylece, ilk veri yükleniyorsa, ön hazırlık yapacağız, yani aynı ölçüm değerlerine sahip olan kayıtları birleştirirken, önceden toplanmış gerçeklerin gerçeklerini hesaplarken, sonra gelecekte çalışmak zorunda kalacağız. Hızı artıracak ve gereklilikleri RAM hacmine azaltacak daha az sayıda kayıt.

Bir hypercube bölümünü oluşturmak için, aşağıdaki özelliklere ihtiyacımız var - tablo girişleri için koordinatların (aslında ölçüm değerleri) tanımı ve ayrıca belirli koordinatlar (ölçüm değerleri) olan kayıtların tanımıdır. Bu olasılıkların nasıl gerçekleştirilebileceğini düşünün. Hypercubeleri saklamak için, iç formatınızın veritabanını kullanmanın en kolay yolu en kolay olanıdır.

Şematik dönüşüm aşağıdaki gibi gösterilebilir:

Şema 6. Dahili format veritabanının normalleştirilmiş bir veritabanına dönüştürülmesi

Yani, bir tablo yerine normalize bir veritabanı aldık. Aslında, normalleşme sistemin hızını azaltır, veritabanı uzmanlarını söyleyebilirler ve bu konuda sözlük unsurları için değerler almamız gerektiğinde kesinlikle doğru olacaklar (bizim durumumuzda, ölçüm değerleri) . Ancak şey, bu değerlerin inşaat aşamasında bu değerlere ihtiyaç duymamasıdır. Yukarıda bahsedildiği gibi, yalnızca hipercubumuzdaki koordinatlarla ilgileniyoruz, bu nedenle ölçüm değerleri için koordinatları tanımlarız. Elementlerin değerlerini yeniden numaralandırmak için en basit. Bir ölçüm numaralandırması için, numaralandırma açıktı, ölçüm değerlerinin listelerini önceden sıralaydı (veritabanının şartlarını ifade eden sözlükler) alfabetik sırayla. Buna ek olarak, gerçekleri gerçekleştiriyoruz ve gerçekler önceden belirlendi. Aşağıdaki şemayı alıyoruz:

Şema 7. Ölçüm değerlerinin koordinatlarını belirlemek için radyasyon normalize edilmiş veritabanı

Şimdi sadece farklı masaların unsurlarını kendi aralarında bağlamak için kalır. İlişkisel veritabanları teorisinde, bu özel ara tablolar kullanılarak gerçekleştirilir. Bu ölçümlerin kullanıldığı (yani, açıklanan aynı koordinat değerine sahip tüm gerçekleri belirlemek için, listesine göre, ölçüm tablolarındaki her giriş için yeterince sahibiz. bu ölçüme göre). Sırasıyla, her bir giriş, hipercube'de bulunduğu koordinat değerlerine uygun olarak bulunur. Gelecekte, Hypercube'daki girişin koordinatları altındaki her yerde, ölçüm değerlerinin tablolarındaki karşılık gelen girişlerin sayısı ile anlaşılacaktır. Sonra varsayımsal örneğimiz için, bir sonraki seti, hipercuba'nın iç gösterimini belirleyen bir sonraki seti elde ediyoruz:

Şema 8. Hypercuba'nın iç temsili

Hypercuba'nın iç temsilimiz olacak. İlişkisel veritabanı için yapmadığımızdan bu yana, basitçe değişken uzunluk alanları iletişim alanları olarak kullanılır (RBDS bunu yapmak mümkün olmaz, çünkü önceden bir dizi masa sütunu var çünkü).

Hypercube'u uygulamak için geçici bir tablo kullanmaya çalışmak mümkün olacaktır, ancak bu yöntem çok düşük hız sağlayacaktır (örnek küp bileşeninin bir dizi), bu nedenle depolama yapılarınızı kullanacağız.

Hypercube'yi uygulamak için, maksimum hız ve minimum RAM maliyetini sağlayacak veri yapıları kullanmamız gerekiyor. Açıkçası, sözlükleri ve fabrika gerçeklerini saklamak için ana yapılara sahip olacağız. Sözlüğün maksimum hızda gerçekleştirmesi gereken görevleri göz önünde bulundurun:

sözlükteki bir öğenin varlığını kontrol etmek;

sözlüğe bir öğe eklemek;

belirli bir koordinat değerine sahip kayıt numaralarını aramak;

Ölçüm değerinin koordinatlarını arayın;

koordinatına göre ölçüm değerlerini arayın.

Bu gereksinimleri uygulamak için kullanabilirsiniz farklı şekiller ve veri yapıları. Örneğin, yapılar dizilerini kullanabilirsiniz. Gerçek durumda, bu diziler, veri indirme ve bilgi edinme hızını artıracak ek indeksleme mekanizmalarını gerektirir.

Hypercube'nin çalışmalarını optimize etmek için, önceliğe karar vermek için hangi görevlerin gerekli olduğunu belirlemek gerekir ve hangi kriterlerin iyileştirilmiş iş kalitesi elde etmemiz gerektiğini belirlemek gerekir. Bizim için ana şey programın hızını arttırmak, çok fazla sayıda RAM gerekli olmadığı zaman arzu edilir. Ek veri erişim mekanizmalarının tanıtılması nedeniyle, örneğin indeksleme tanıtımı nedeniyle artan performans mümkündür. Ne yazık ki, RAM ek yükünü arttırır. Bu nedenle, en yüksek hızda gerçekleştirmemiz gereken operasyonları tanımlarız. Bunu yapmak için, hipercubeleri uygulayan bireysel bileşenleri göz önünde bulundurun. Bu bileşenlerin iki ana türü vardır - ölçüm ve gerçekler tablosu. Tipik bir görevi ölçmek için:

yeni bir değer eklemek;

Ölçüm değeri için koordinatların belirlenmesi;

koordinatın değerini belirleme.

Yeni bir öğe değeri eklerken, zaten böyle bir değere sahip olup olmadığını kontrol etmeliyiz ve varsa, yeni olana eklenmez, ancak mevcut koordinatı kullanmak için, aksi takdirde yeni bir öğe eklemeniz gerekir ve koordinatını belirler. Bu bir yol gerektirir hızlı arama İstenilen öğenin varlığı (ek olarak, böyle bir görev, elemanın değerindeki koordinatı belirlerken ortaya çıkar). Bunu yapmak için, karma kullanımı en uygun olacaktır. Bu durumda, optimum yapı, referansları elemanlara saklayacağımız karma ağaçlarının kullanımı olacaktır. Aynı zamanda, elemanlar ölçüm sözlüğünün çizgileri olacaktır. Daha sonra ölçüm değerinin yapısı aşağıdaki gibi gösterilebilir:

Pfactlink \u003d ^ tfactlink;

Tfactlink \u003d kayıt

FactNo: Tamsayı; // tablodaki gerçek endeksi

TdimensionRecord \u003d kayıt.

Değer: Dize; // Ölçüm değeri

Endeks: Tamsayı; // Koordinat değeri

FactLink: pfatilink; // gerçek tablonun unsurlarının listesinin başlangıcına işaretçi

Ve karacıyla eşsiz elementlere referansları saklayacağız. Ek olarak, dönüşüm görevini - ölçüm değerini belirlemek için koordinatla çözmemiz gerekir. Sağlamak maksimum performans Doğrudan adresleme kullanmanız gerekir. Bu nedenle, başka bir dizi, koordinat ölçümü olan indeks kullanabilirsiniz ve değer sözlükteki uygun girişe referanstır. Bununla birlikte, eğer eleman dizisi buna göre düzenlenebilirse, eleman endeksinin koordinatı olması durumunda, daha kolay (ve hafızaya kaydetme) yapmak mümkündür.

Gerçeklerin listesini uygulayan dizinin organizasyonu, basit yapısı nedeniyle özel sorunlar sunmaz. Tek açıklama, ihtiyaç duyulabilecek ve artan (örneğin, miktar) hesaplanabilen tüm toplanma yöntemlerini hesaplamak istenecektir.

Böylece, verilerin bir hipercuba biçiminde nasıl saklanacağını açıkladık. Veri ambarındaki bilgilere dayanarak çok boyutlu alanda bir dizi nokta oluşturmanıza olanak tanır. Bir kişinin bu verilerle çalışabilmesi için, işleme için uygun olan formda sunulmaları gerekir. Aynı zamanda, ana veri sunumu türleri olarak bir özet tablo ve grafikler kullanılır. Ayrıca, bu yöntemlerin her ikisi de aslında hipercuba projeksiyonlarını temsil eder. Bina temsillerinde maksimum verimliliği sağlamak için, bu projeksiyonların ne olduğudan itibaren geçirileceğiz. En önemli veri analizinde olduğu gibi konsolide tabloyu dikkate almaya başlayalım.

Böyle bir yapıyı uygulamanın yollarını bulun. Özet tablonun oluştuğu üç parçayı seçebilirsiniz: Bunlar, dizelerin, sütun başlıklarının ve gerçekleşen gerçeklerin gerçek tablosunun başlıklarıdır. Çoğu. basit yol Gerçek tablosunun temsili, boyut başlıkları yaparak belirlenebilecek olan iki boyutlu bir dizi kullanılacaktır. Ne yazık ki, en kolay yol en verimsiz olacaktır, çünkü tablo güçlü bir şekilde seyrek olacaktır ve hafıza sonucu verimsiz olacaktır, sonuç olarak, yalnızca çok küçük küpler yapılabilir, çünkü aksi takdirde bellek yeterli olmayabilir. Böylece, bu tür bir veri yapısını, yeni öğenin maksimum arama / ekleme hızını ve aynı anda minimum frekans tüketimi sağlayacak bilgileri saklamayı seçmemiz gerekir. Bu yapı, kırbaçta daha ayrıntılı olarak okunabilen sözde seyrek matrisler olacaktır. Matrisin düzenlenmesinin çeşitli yolları mümkündür. Bize uygun olan seçeneği seçmek için, tablonun başlığının ilk yapısını düşünün.

Başlıkların açık bir hiyerarşik yapıya sahiptir, bu yüzden doğal olarak onları kullanmak için odun kullandığı varsayılacaktır. Aynı zamanda, ağaç düğümünün şematik yapısı aşağıdaki gibi tasvir edilebilir:

Ek C.

Aynı zamanda, ölçüm değeri olarak, çok boyutlu bir küp ölçüm tablosunun ilgili elemanına bir referansın depolanması mantıklıdır. Bu, bir kesim depolamak ve işi hızlandırmak için bellek maliyetlerini düşürür. Bağlantılar ayrıca ebeveyni ve bağlı ortaklıklar olarak da kullanılır.

Bir ağacı bir ağaç eklemek için, Hypercub'teki konumu hakkında bilgi sahibi olmalısınız. Bu bilgiler olarak, ölçüm değerlerinde depolanan koordinatını kullanmak gerekir. Konsolide tablonun başlık ağacına bir öğe ekleme diyagramını düşünün. Aynı zamanda, kaynak bilgisi olarak, ölçüm koordinat değerlerini kullanın. Bu ölçümlerin listelendiği sıra, gerekli toplanma yöntemi ile belirlenir ve başlıkların seviye hiyerarşisi seviyelerine denk geliyor. Sonuç olarak, bir eleman eklemek için gerekli olduğu konsolide tablonun sütunlarının veya satırlarının bir listesini elde etmek gerekir.

uygulamaD.

Bu yapıyı belirlemek için kaynak verileri olarak, ölçümlerin koordinatlarını kullanın. Buna ek olarak, kesinlikle, bizim için ilgi sütununu Matris'te tanımladığımızı varsayıyoruz (dize biraz daha sonra düşünülecektir, çünkü orada başka veri yapılarını uygulamak daha uygundur, çünkü bu seçimin nedeni ayrıca aşağıda). Koordinatlar olarak, tamsayılar alın - yukarıda açıklandığı gibi tanımlanabilecek ölçüm değerlerinin sayısı.

Bu nedenle, bu prosedürü yaptıktan sonra, rarefied bir matrisin sütunlarına bir dizi referans alıyoruz. Şimdi tüm gerekli işlemleri satırlarla yapmanız gerekir. Bunu yapmak için, her sütunun içinde istediğiniz öğeyi bulmak ve ilgili değeri orada eklemek gerekir. Koleksiyondaki ölçümlerin her biri için, benzersiz değerlerin sayısını ve bu değerlerin gerçek kümesini bilmek gerekir.

Şimdi, hangi formun, sütunların içindeki değerleri temsil etmek için gerekli olduğunu düşünün - yani istenen dizenin nasıl belirleneceğidir. Bunu yapmak için birkaç yaklaşım kullanabilirsiniz. Her sütunu bir vektör biçiminde sunmak en kolay olur, ancak güçlü bir şekilde narerleşeceği için hafıza son derece yetersiz tüketilecektir. Bundan kaçınmak için, RareFied Tek Boyutlu Dizilerin (Vektörler) temsilinin daha fazla etkinliği sağlayacak veri yapılarını uygulayacağız. En basitinin, her zamanki listesi olacak, bir veya ikili olacaktır, ancak, öğelere erişim açısından korunmaz. Bu nedenle, daha fazlasını sağlayacak bir ağaç kullanacağız. hızlı erişim Elemanlara.

Örneğin, tam olarak aynı ağacı sütunlar için kullanabilirsiniz, ancak daha sonra her sütun için kendi ağacınızı yapmak zorunda kalacak, bu da önemli miktarda bellek hoparlörlerine ve işlem süresine yol açacaktır. Biraz kurnazlık yapacağım - sıralarda kullanılan tüm ölçüm kombinasyonlarını depolamak için bir ağaç kazanacağız, bu da yukarıda tarif edilenlerle aynı olacaktır, ancak elemanları (bu şekilde değil) çizgileri göstermez. Endeksler ve endeks değerleri kendileri bizi ilgilendirmez ve yalnızca benzersiz tuşlar olarak kullanılır. Daha sonra bu tuşlar, sütun içindeki istenen öğeyi aramak için kullanılacaktır. Sütunların kendileri, geleneksel bir ikili ağaç biçiminde hayal etmek en kolay. Grafik olarak elde edilen yapı aşağıdaki gibi gösterilebilir:

Şema 9. Bir ikili ağaç şeklinde bir konsolide tablonun görüntüsü

Uygun satır numaralarını belirlemek için, aynı prosedürü, konsolide tablonun sütunlarını belirleme prosedürü yukarıda açıklanan prosedür olarak kullanabilirsiniz. Aynı zamanda, satır sayıları aynı özet tablosunda benzersizdir ve pivot tablosunun sütunları olan vektörlerde elemanları tanımlar. Bu sayıları oluşturmanın en kolay yolu, ağaç başlığı ağacında yeni bir öğe eklerken, tezgahın bakımı ve birim başına artış olacaktır. Bu vektör sütunlarının kendileri, satır numarasının anahtar olarak kullanıldığı ikili ağaçlar biçiminde saklamak için en kolaydır. Ek olarak, hash tablolarının kullanımı da mümkündür. Bu ağaçlarla çalışmak için prosedürler diğer kaynaklarda detaylı olarak değerlendirildiğinden, bu konuda durmayacağız ve düşünmeyiz. genel şema Sütuna öğe ekle.

Genel olarak, matris'e bir öğe eklemek için eylemlerin sırası aşağıdaki gibi tanımlanabilir:

1. Elemanların eklendiği satırların sayıları olacaktır.

2. Öğelerin eklendiği sütun kümesini düşünün.

3. Tüm sütunlar için öğeleri bulmak için doğru sayılar Sıralar ve geçerli öğeyi onlara ekleyin (ilavesi, istenen sayıda gerçeklerin bağlanmasını ve artımlı olarak belirlenebilecek toplu değerlerin hesaplanmasını içerir).

Bu algoritmayı yaptıktan sonra, inşa etmemiz gereken konsolide bir tablo olan bir matris elde ediyoruz.

Şimdi bir kesim yaparken filtreleme hakkında birkaç kelime. Sadece bir matris oluşturma aşamasında uygulamak en kolaydır, çünkü bu aşamada tüm gerekli alanlara erişim var ve ayrıca, toplama değerleri gerçekleştirilir. Aynı zamanda, önbellekten kayıt yapılması sırasında, filtreleme koşullarına uygunluğu kontrol edilir ve uyumsuzluk durumunda, kayıt atılır.

Yukarıda açıklanan yapı tamamen bir konsolide tabloyu tarif ettiğinden, görselleştirmesinin görevi önemsiz olacaktır. Bu durumda, Windows'un hemen tüm programlama araçlarında bulunan tablonun standart bileşenlerini kullanabilirsiniz.

OLAP istekleri gerçekleştiren ilk ürün ekspres (IRI) idi. Bununla birlikte, OLAP terimi, "ilişkisel BD'nin babası" olan Edgarododod tarafından önerildi. Kodun kodu, Kendi OLAP ürününü veren şirket olan Arbor tarafından finanse edildi (daha sonra 2007 yılında Oracle tarafından emildi) - bir yıl önce. Diğer tanınmış olan OLAP ürünleri, Microsoft Analysis Services (daha önce OLAP Services, Part SQL Server), Oracle OLAP seçeneği, IBM'den DB2 OLAP sunucusu (aslında, ESSBase, IBM'den eklentiler), SAP BW, Brio, BusinessObjects Ürünler, Cognos , Mikrosektrataj ve diğer üreticiler.

Teknik açıdan, piyasada sunulan ürünler "fiziksel olap" ve "sanal" e bölünmüştür. İlk durumda, agregaların ön hesaplamasını gerçekleştiren bir program var ve daha sonra hızlı bir şekilde çıkarma sağlayan özel bir çok boyutlu veritabanında depolanan bir program var. Bu tür ürünlerin örnekleri, Microsoft Analysis Services, Oracle OLAP seçeneği, Oracle / Hyperion Essbase, Cognos PowerPlay. İkinci durumda, veriler ilişkisel DBMS'de depolanır ve üniteler hiç olmayabilir veya Analitik Yazılımın DBMS veya önbelleğinde ilk talepte oluşturulabilir. Bu tür ürünlerin örnekleri - SAP BW, BusinessObjects, MicroStrategy. "Fiziksel OLAP" temeli olan sistemler sabit sağlar en iyi zaman İsteklere "Sanal OLAP" sistemlerinden daha yanıt. Sanal OLAP sistemi tedarikçileri, çok miktarda veri destekleme açısından ürünlerinin daha fazla ölçeklenebilirliğini ilan eder.

Bu yazıda, BaseGroup Labs - Deductor şirketinin ürününü göz önünde bulundurmak istiyorum.

Deductor analitik bir platformdur, yani. bitmiş yaratmanın temeli uygulamalı çözümler. Deductor teknolojisinde uygulanan tek bir mimari temelinde, analitik bir sistem oluşturmanın tüm aşamalarını tamamlamak için tek bir mimarlığın temelinde: Modelleri otomatik olarak seçmek ve elde edilen sonuçları görselleştirmek için bir veri ambarı oluşturma.

Sistemin bileşimi:

Deductor Studio, kesinti platformunun analitik çekirdeğidir. Deductor Studio, keyfi bir veri kaynağından bilgi edinmenize izin veren eksiksiz bir mekanizma seti içerir, tüm işlem döngüsünü (temizlik, veri dönüşümü, oluşturma modelleri) harcamak, en uygun şekilde elde edilen sonuçları (OLAP, Tablolar, Grafikler, ağaçlar, çözümler ...) ve ihracat sonuçları.

Deductor Viewer, son kullanıcı bir iş hedefidir. Program personel gereksinimlerini en aza indirmenize izin verir, çünkü Gerekli tüm işlemler, daha önce hazırlanan işleme senaryolarını kullanarak otomatik olarak gerçekleştirilir, veri ve işleme mekanizmalarının elde etme yöntemi hakkında düşünmeniz gerekmez. Düştorak görüntüleyici kullanıcısı yalnızca raporu seçmek için ihtiyaç duyar.

Deductor Depo, konu alanını analiz etmek için gereken tüm bilgileri biriktiren çok boyutlu bir platformlu veri depolama alanıdır. Tek bir depo kullanımı, uygun erişim, yüksek işlem hızı, bilgi tutarlılığı, bilgi tutarlılığı, merkezi depolama ve tüm veri analizi sürecinin otomatik olarak destek vermenizi sağlar.

4. Müşteri sunucusu

Deductor sunucusu uzaktan analitik işlem için tasarlanmıştır. Sunucudaki mevcut senaryolardan hem otomatik olarak "verileri" sürüş "hem de mevcut modelleri yeniden yourta yeteneğini sağlar. Deductor sunucusu kullanarak, uygulama sunucusunun işlevini gerçekleştirdiği tam teşekküllü bir üç yıldızlı mimariyi uygulamanıza olanak sağlar. Sunucuya erişim, deductor istemcisi kullanılarak denetlenir.

Çalışma prensipleri:

1. Veri İthalatı

Dedişördeki herhangi bir bilginin analizi, veri içe aktarma ile başlar. İthalatın bir sonucu olarak, veriler programdaki tüm mekanizmaları kullanarak sonraki analiz için uygun olan forma verilir. Veri, format, dbms ve diğerlerinin doğası önemli değil, çünkü Tüm birleşik olan çalışma mekanizmaları.

2. Veri İhracatı

İhracat mekanizmalarının varlığı, örneğin üçüncü taraf uygulamalardaki sonuçları, satış tahminlerini sistem için bir satınalma siparişi oluşturmak veya Kurumsal Web sitesinde hazırlanmış bir rapor yerleştirmenize izin verir.

3. Veri İşleme

Dedişörde işleme altında, bazı veri dönüşümü, örneğin filtreleme, bir model, temizleme vb. İle ilişkili herhangi bir işlem anlamına gelir. Aslında bu blokta ve analiz açısından en önemlisi üretti. Dedişörde uygulanan işlem mekanizmalarının en önemli özelliği, işlemin bir sonucu olarak elde edilen verilerin mevcut yöntemlerden herhangi biri işlenebilmesidir. Böylece keyfi olarak karmaşık işleme senaryoları inşa etmek mümkündür.

4. Görselleştirme

Deductor Studio'daki (Görüntüleyici) verileri herhangi bir işlemden herhangi bir aşamada görselleştirebilirsiniz. Sistem bağımsız olarak, örneğin eğitilmişse, nasıl yapabileceğini belirler. sinir ağı, Tablolar ve Diyagramlara ek olarak, sinir ağının grafiğini görüntüleyebilirsiniz. Kullanıcının seçmesi gerekiyor seçenek gerekir Listeden ve birkaç parametreyi yapılandırın.

5. Entegrasyon mekanizmaları

Deductor veri giriş araçları için sağlamaz - platform yalnızca analitik işleme için yönlendirilir. Heterojen sistemlerde depolanan bilgilerin kullanımı için esnek ithalat-ihracat mekanizmaları sağlanmıştır. Etkileşim, toplu yürütme, OLE sunucusunda çalıştırma ve indirgeme sunucusuna erişim kullanılarak düzenlenebilir.

6. Bilginin Tedavisi

Deductor, herhangi bir analitik sistemin en önemli işlevlerinden birini uygulamanıza olanak sağlar - Bilgi Çoğaltma işlemi için destek, yani. Belirli bir sonuç elde etmek için analiz ve yöntem yöntemlerini anlamayan çalışanlara olan fırsatın sağlanması, uzman tarafından hazırlanan modeller temelinde bir cevap alır.

Z.aksiyon

Bu yazıda, böyle bir modern bölge bilişim TeknolojileriVeri analizi sistemleri olarak. Analitik Bilgi İşleme - OLAP - Teknoloji için ana aracı analiz etti. OLAP kavramının özü ve modern iş sürecinde OLAP sistemlerinin değeri ayrıntılı olarak açıklanmaktadır. ROLAP sunucusu çalışmasının yapısı ve işlemi ayrıntılı olarak açıklanmaktadır. OLAP verilerinin uygulanmasına bir örnek olarak, kesinti analitik platformu verilir. Sunulan dokümantasyon geliştirildi ve gereksinimlere uyuldu.

OLAP teknolojisi gerçek zamanlı olarak güçlü bir veri işleme aracıdır. OLAP Server, çeşitli analitik yönlerin bölümünde veri düzenlemenizi ve göndermenizi sağlar ve verileri çevirir. degerli bilgiHangi şirketlerin daha bilinçli kararlar vermelerine yardımcı olur.

OLAP sistemlerini kullanmak, binlerce kullanıcıya erişebilen çeşitli gigabaytların veri hacimlerini koruyarak, sürekli olarak yüksek düzeyde bir performans ve ölçeklenebilirlik sağlar. OLAP teknolojilerinin yardımıyla, bilgiye erişim gerçek zamanlı olarak gerçek zamanlı olarak gerçekleştirilir. İstek işlemi artık, verimliliğini ve verimliliğini sağlayan analiz işlemini yavaşlatmaz. Görsel yönetim araçları, en karmaşık analitik uygulamaları bile geliştirmenize ve uygulamanıza, bu süreci basit ve hızlı bir şekilde yapmanıza olanak tanır.

Benzer belgeler

    OLAP konseptinin temeli (çevrimiçi analitik işleme) - Operasyonel analitik veri işleme, istemcide ve sunucuda kullanımının özellikleri. OLAP sistemleri için temel gereksinimlerin genel özelliklerinin yanı sıra veri depolama yöntemlerinin yanı sıra.

    Özet, Eklendi 10/12/2010

    OLAP: genel özellikleri, amaç, hedefler, görevler. OLAP ürünlerinin sınıflandırılması. Olap Sisteminin Yapılması Prensipleri, Cubebase Bileşen Kütüphanesi. Müşteri ve sunucu OLAP fonlarının performansının, veri miktarındaki artıştan bağımlılığı.

    dersin işi, 12/25/2013

    Verilerin ebedi depolanması. OLAP'nin özü ve değeri (çevrimiçi analitik işlem). Bazlar ve veri depoları, özellikleri. Yapı, veri depolama mimarisi, tedarikçileri. OLAP Küplerinin performansını geliştirmek için birkaç ipucu.

    sınav, Eklenen 10/23/2010

    Veri analizi sistemlerinin yapımı. OLAP Küp Tasarımı Algoritmalarının İnşası ve Dahili bir tabloya istek oluşturma. OLAP teknolojisi çok boyutlu veri analizi. Kullanıcıların yönetim kararlarını vermek için bilgi vermek.

    kurs çalışması, 19.09.2008 Eklendi

    OLAP hakkında temel bilgiler. Operasyonel analitik veri işleme. OLAP ürünlerinin sınıflandırılması. Operasyonel analitik işlem araçları için gereksinimler. Operasyonel analitik işlem sistemlerinde çok boyutlu veritabanlarının kullanımı, avantajları.

    dersin işi, eklendi 10.06.2011

    Bir web sitesini analiz etmek için alt sistemlerin gelişimi microsoft kullanarak. Erişim ve OLAP teknolojileri. Müzik portalının bilgi sisteminde veri analizi alt sisteminin geliştirilmesinin teorik yönleri. Analiz nesnesi analiz altsisteminde OLAP teknolojisi.

    kurs Çalışması, Eklendi 11/06/2009

    OLAP fonlarının dikkate alınması: Vitrinlerin ve bilgi depolarının sınıflandırılması, veri küpü kavramı. Karar verme destek sistemi mimarisi. "Abitura" sisteminin yazılım uygulaması. Raporlama Servisleri Teknolojisini Kullanarak Bir Web Raporu Oluşturma.

    kurs çalışması, 05.12.2012 eklendi

    Veri ambarı, organizasyon ilkeleri. Veri iş süreçleri. OLAP yapısı, çok boyutlu veri depolanmanın teknik yönleri. Entegrasyon hizmetleri, Dolum depolama ve veri vitrinleri. Microsoft Technologies kullanan sistemler için fırsatlar.

    kurs çalışması, 05.12.2012 eklendi

    Bir ticaret kuruluşunun veri depolama devresinin inşası. Depolama ilişkisi devrelerinin açıklamaları. Ürün bilgisini görüntüler. Daha fazla bilgi analizi için bir olap küp oluşturma. Süpermarketin verimliliğini değerlendirmek için isteklerin geliştirilmesi.

    sınav, Eklenen 12/19/2015

    Veri depolarını atayın. SAP BW mimarisi. SAP BW sisteminde OLAP küplerine dayanarak analitik raporlama oluşturun. Veri depolama ve OLTP sistemi arasındaki temel farklar. BEX işlevsel kürelerin gözden geçirilmesi. Bex Query Designer'da bir sorgu oluşturma.

Amaç dönem Kağıdı OLAP teknolojisinin incelenmesi, uygulama ve yapısı kavramıdır.

İÇİNDE modern dünya bilgisayar ağları ve hesaplama sistemleri, büyük veri dizilerini analiz etmenize ve işlemeldir.

Büyük miktarda bilgi, çözüm aramasını büyük ölçüde karmaşıklaştırır, ancak çok daha doğru hesaplama ve analiz yapmanızı sağlar. Böyle bir sorunu çözmek için, analiz eden bir komplo sınıfı var. Bu sistemlerin karar alma destek sistemleri (DSS, karar destek sistemi) denir.

SPPR analizini gerçekleştirmek için, bilgi giriş ve depolaması ile bilgi biriktirmelidir. SPPR'de çözülen üç ana görevi tahsis edebilirsiniz:

· veri girişi;

· veri depolama;

· veri analizi.

SPPR'ye veri girmek, ortamın veya işlemin durumunu veya insan operatörü tarafından karakterize eden sensörlerden otomatik olarak gerçekleştirilir.

Veri girişi sensörlerden otomatik olarak gerçekleştirilirse, veriler bilgi göründüğünde veya döngüsel ankete göre oluşan bir hazırlık sinyali ile birikir. Giriş, bir kişi tarafından gerçekleştirilirse, kullanıcılara girişin doğruluğunda kontrol eden verileri girmek için uygun aletler sunmaları ve gerekli hesaplamaları yapması gerekir.

Verileri aynı anda birden fazla operatöre girerken, aynı verilerin modifikasyon ve paralel erişimini çözmek için gereklidir.

SPPR, analist verilerini raporlar, tablolar, okumak ve analiz etmek için grafikler şeklinde sağlar; bu nedenle bu tür sistemler, karar destek işlevlerinin yürütülmesini sağlar.

OLTP (LinetransactionProcessing) olarak adlandırılan veri giriş alt sistemlerinde, veriler uygulanır. Onları uygulamak için, geleneksel veritabanı yönetim sistemlerini (DBMS) kullanın.

Analiz alt sistemi şunları temel alınabilir:

· SQL kullanarak ilişkisel DBM'lere ve statik sorgulara dayanan bilgi alma analizi alt sistemleri;

· Operasyonel analiz alt sistemleri. Bu tür alt sistemleri uygulamak için, OLAP verilerinin operasyonel analitik işlenmesi teknolojisi, çok boyutlu veri temsili kavramını kullanan, uygulanır;

· Entelektüel analiz alt sistemleri. Bu alt sistem veri yolu yöntemlerini ve algoritmalarını uygular.

Kullanıcının bakış açısından, OLAP sistemi, çeşitli bölümlerde bilginin esnek bir şekilde görüntülenmesini temsil eder. otomatik makbuz Toplam veri, analitik işlemler, detay, zaman içinde karşılaştırma gerçekleştirme. Tüm bunlar sayesinde, OLAP sistemleri, çeşitli kesimlerde veri sunumu ve satış raporları, çeşitli bütçeler ve diğerleri gibi farklı hiyerarşilerde veri sunumu ve farklı hiyerarşi düzeyleri için veri hazırlama konusunda büyük avantajlara sahip bir çözümdür. OLAP sistemi, öngörmek için de dahil olmak üzere diğer veri analizlerinde böyle bir sunumun büyük avantajlarına sahiptir.

1.2 tanımı Olap.Sistemler

Entegre çok boyutlu veri analizinin teknolojisi OLAP olarak adlandırıldı. OLAP, Organizasyon HD'nin kilit bileşenidir.

OLAP işlevselliği, hem ofis uygulamalarındaki verileri analiz etmenin hem de sunucu ürünlerine dayanan daha karmaşık dağıtılan analitik sistemlerin hem de daha karmaşık - dağıtılmış analitik sistemlerin hem de çeşitli şekillerde uygulanabilir.

OLAP (on-lineanaalyticalprocessing) - Çok boyutlu verilerin toplanması, depolanması ve analiz edilmesi ve karar alma süreçlerini desteklemenin araçlarını ve yöntemlerini kullanarak operasyonel analitik veri işleme teknolojisi.

OLAP sistemlerinin temel amacı, analitik faaliyetleri, analist kullanıcılarının keyfi bir şekilde sorgusu desteklemektedir. OLAP analizinin amacı, ortaya çıkan hipotezleri kontrol etmektir.

1993 yılında, EDGAR CODD'sini ortaklarla (Edgar CODD, Matematics ve Scholant IBM) inşa etmek için ilişkisel yaklaşımın kurucusu (Edgar Codd, Matematics ve Scholant IBM), Arbor Yazılımı tarafından başlatılan bir makale yayınladı (Bugün OLAP Hatası "başlıklı" Hyperion Solutions ") (Operasyonel Analitik İşleme) Analist Kullanıcılar için "OLAP teknolojisinin 12 özelliğinin formüle edildiği, daha sonra altı daha fazla desteklenmiştir. Bu hükümler, yeni ve çok umut verici teknolojinin ana içeriği haline geldi.

Teknolojinin temel özellikleri OLAP (temel):

  • verilerin çok boyutlu kavramsal gösterimi;
  • sezgisel veri manipülasyonu;
  • kullanılabilirlik ve veri detayları;
  • paket veri ekstraksiyonu yorumlamaya karşı;
  • OLAP analiz modelleri;
  • İstemci-sunucu mimarisi (OLAP masaüstünden temin edilebilir);
  • şeffaflık (dış verilere şeffaf erişim);
  • Çok oyunculu destek.

Özel Özellikler (Özel):

  • işlenmeyen bilgiler;
  • oLAP sonuçlarını kaydetme: Kaynak verilerinden ayrı olarak onları depolamak;
  • eksik değerlerin ortadan kaldırılması;
  • eksik değerleri işleme.

Raporların sunulmasının özellikleri (Bildiri):

  • raporlama Esnekliği;
  • standart rapor performansı;
  • veri ekstraksiyonunun fiziksel seviyesinin otomatik konfigürasyonu.

Ölçüm Yönetimi (Boyut):

  • Ölçümlerin Evrenselliği;
  • sınırsız sayıda ölçüm ve toplama seviyesi;
  • boyutlar arasında sınırsız sayıda işlem.

Tarihsel olarak, bugün bugün "OLAP" terimi, yalnızca son kullanıcıdan gelen verilerin çok boyutlu bir şekilde görünmesini değil, aynı zamanda hedef veritabanına verilerin çok boyutlu bir sunumunu da ifade eder. Bu, bağımsız bir terim olarak görünümden kaynaklanmaktadır. "İlişkisel olap" (ROLAP) ve "Çoklu OLAP" (Molap).

OLAP Sservis, büyük miktarda veriyi gerçek zamanlı olarak analiz etmek için bir araçtır. OLAP sistemiyle etkileşime giren kullanıcı, esnek bilgi izlemeyi, keyfi veri bölümlerini elde edebilecek, rastgele veri bölümlerini alabilecek ve birçok parametrede eşzamanlı olarak, zaman karşılaştırmalarını, zaman karşılaştırmalarını birçok parametrede tutabilecektir. OLAP'li tüm çalışmalar konu alanı açısından meydana gelir ve istatistiksel olarak kanıtlanmış iş durumları oluşturmanıza olanak sağlar.

OLAP Yazılım Araçları - bu bir operasyonel analiz aracıdırdepoda bulunur. Başlıca özellik, bu fonların bilgi teknolojisi alanında bir uzman değil, istatistiksel bir uzman değil, uygulama alanında, departman, departman, departmandaki ve nihayet direktörün bir uzmanının kullanmasına odaklanmış olmasıdır. Araçlar analitik iletişim kurmak için tasarlanmıştır bir problemle ve bir bilgisayarla değil. İncirde. 6.14, üç boyut için veri tahminlerinin üretilmesine izin veren bir temel OLAP -KUB'dur.

Çok boyutlu OLAP -KUB ve ilgili matematiksel istatistiksel işleme algoritmalarının sistemi, herhangi bir zaman aralıklarında herhangi bir karmaşıklığın verilerini analiz etmenizi sağlar.


İncir. 6.14.

Veri ve görsel gösterimi manipüle etmek için elden çıkarma esnek mekanizmalarına sahip olması (Şek. 6.15, Şekil 6.16), yönetici önce, çözüldüğü sorunla ilişkili olan (ve olmayabilir) farklı taraflardan verileri dikkate alır.

Daha sonra, gizli ilişkileri tanımlamaya çalışan, kendi aralarında çeşitli iş göstergelerini karşılaştırır; Verileri daha yakından, örneğin, bölgeler veya müşteriler tarafından veya aksine, dikkat dağıtıcı ayrıntıları gidermek için bilgilerin sunumunu daha da özetlemek için, onları daha yakından görebilir, örneğin, bunları daha yakından düşünebilir, örneğin, zaman miktarına ayrışmayı, bunları daha da uzaklaştırabilir. Bundan sonra modülle İstatistiksel Tahmin ve Simülasyon Modellemesi Etkinlikleri geliştirmek için çeşitli seçenekler inşa edilmiştir ve en kabul edilebilir seçenek seçilir.


İncir. 6.15.

Örneğin, yönetim şirketi, şirketin çeşitli dallarındaki varlık büyümesinin yayılmasının teknik ve ekonomik eğitimi olan uzmanların oranına bağlı olduğu bir hipotez ile doğabilir. Bu hipotezi kontrol etmek için, yönetici depodan talep edebilir ve mevcut çeyreğe göre, varlıkların büyümesinin geçen yılın% 10'undan daha fazla karşılaştırıldığında, varlıkların büyümesinin% 10'dan fazla karşılaştırıldığında ve % 25. Önerilen menüden basit bir seçim kullanabilmelidir. Elde edilen sonuçlar iki ilgili gruba önemli ölçüde parçalanırsa, bu, uzatılmış hipotezin daha fazla doğrulanması için bu bir teşvik olmalıdır.

Halen, hızlı gelişme denilen bir yön aldı dinamik modelleme (Dinamik simülasyon), yukarıdaki prensibi FASMI'yi tamamen uygulayın.

Dinamik modelleme kullanarak, analist, zaman içinde gelişen bir iş durumu, bir senaryo tarafından geliştirir. Bu durumda, bu modellemenin sonucu bir ağaç üreten birkaç yeni işletme durumu olabilir. muhtemel çözümler Olasılık değerlendirmesi ve her birinin umutları ile.


İncir. 6.16.

Tablo 6.3 Gösterileri karşılaştırmalı Özellikler Statik ve dinamik analiz.

Tablo 6.3.
Karakteristik Statik analiz Dinamik analiz
Soru türleri DSÖ! Ne? Kaç? Nasıl? Ne zaman? Nerede? Neden? Ne olurdu? Farzedelim…?
Tepki Süresi Düzenlenmemiş Saniye
Veri ile çalışan tipik işlemler Düzenlenmiş Rapor, Diyagram, Tablo, Çizim Etkileşimli raporlar dizisi, diyagramlar, ekran formları. Toplama ve veri bölümlerinin seviyelerinde dinamik değişim
Analitik Gereksinimler Seviyesi Orta Uzun boylu
Ekran formları türü Esas olarak önceden belirlenmiş, düzenlenmiş Kullanıcı tanımlı, özelleştirme özellikleri var
Veri Toplama Seviyesi Detaylı ve toplam Kullanıcı tarafından belirlenir
Verilerin "yaşı" Tarihsel ve Güncel Tarihsel, akım ve yansıtılan
İstekler türleri Çoğunlukla öngörülebilir Tahmin edilemez - fırsattan duruma kadar
Amaç Düzenlenmiş Analitik İşleme Çok amaçlı analiz, modelleme ve bina tahminleri

Neredeyse her zaman çok boyutlu veri analizi için analitik bir sistem oluşturma görevi inşa etme görevidir. homojen olmayan birleşik, kararlaştırılan bir işleyiş bilgi sistemi yazılım ve çözümler. Ve zaten IP'yi uygulamak için fon seçimi son derece zor bir görev haline gelir. Çeşitli karşılıklı uyumluluk dahil olmak üzere birçok faktör dikkate alınmalıdır. yazılım Bileşenleri , gelişmeleri, kullanımı ve entegrasyonu, işleyiş, istikrarın verimliliği, hatta çeşitli üreticilerin firmalarının formu, düzey ve potansiyel umutsuz ilişkilerini kolaylaştırır.

OLAP, multifactor verileri analiz etmenin bir görevi olan her yerde geçerlidir. Genel olarak, veri içeren bir tabloda, en az bir tanımlayıcı sütun ve sayılarla bir sütun bulunduğunda, OLAP işlemi etkili araç Raporların analizi ve üretimi. OLAP teknolojisini uygulama örneği olarak, satış sürecinin sonuçlarının çalışmasını düşünün.

Anahtar sorular "Kaç tane satıldı?", "Ne miktarda satılır?" İş komplikasyonları ve tarihsel verilerin birikimi olarak belirli bir faktöre biriktirme veya kesik birikimi olarak genişler: ".. .. şu anki "," .. Tedarikçi ve Tedarikçi B ... "ve benzeri.

Bu tür soruların cevapları, yönetim kararlarını yapmak için gereklidir: Mağazaların, fiyatı, kapanmasını ve mağazaların, şubelerin, şubeleri, fesih ve imzalama sözleşmelerinin menzilini, fiyatlarını, kapanmasını ve açılmasını değiştirmek veya reklam kampanyalarının sonlandırılması, vb.

Analisti manipüle eden, şirketin işini genişletmeyi veya optimize etmeye çalışan ana sayıları (gerçekleri) ve kesmeyi (ölçüm argümanlarını) vurgulamaya çalışırsanız, tablo, uygun ayar gerektiren bir şablon olarak satış analizi için uygun bir tablo olacaktır. Her bir işletme için.

Zaman. Kural olarak, bunlar birkaç dönemdir: yıl, çeyrek, ay, on yıl, hafta, gün. Birçok OLAP baskısı, tarihten itibaren eski periyotları otomatik olarak hesaplar ve sonuçları hesaplar.

Mal kategorisi. Kategoriler birkaç olabilir, her türlü iş türü için farklılık gösterir: çeşitli, model, paketleme türü, vb. Sadece bir ürün satılırsa veya aralık çok küçükse, kategori gerekli değildir.

Ürün. Bazen malların (veya hizmetlerin) adı uygulanır, kodu veya makalesi. Aralığın çok büyük olduğu durumlarda (ve bazı işletmeler fiyat listesinde on binlerce pozisyona sahip), her türlü mal için ilk analiz yapılamaz, ancak bazı kararlaştırılmış kategorilerle iletişim kurmak.

Bölge. İş dünyasına bağlı olarak, kıta, bir grup ülke, ülke, bölge, şehir, ilçe, caddeyi, caddenin bir parçası olarak saklamak mümkündür. Tabii ki, yalnızca bir alışveriş noktası varsa, bu boyut eksik.

Satıcı. Bu ölçüm aynı zamanda işin yapısına ve ölçeğine de bağlıdır. İşte şube, dükkan, bayi, satış müdürü olabilir. Bazı durumlarda, boyut eksik, örneğin, satıcı satış hacimlerini etkilemediğinde, mağaza sadece bir vb.

Alıcı. Bazı durumlarda, örneğin, perakende satışta, alıcı kişiliksizdir ve boyut yoktur, diğer durumlarda alıcı hakkında bilgi vardır ve satışlar için önemlidir. Bu ölçüm, Alıcının şirketinin adını veya müşterilerin birçok gruplandırması ve özelliklerinin adını içerebilir: Endüstri, Kurumsal Grubu, Sahibi ve benzeri .. Satış yapısının analizi Bölüm bağlamında en önemli bileşenleri tanımlamak için. Bunu yapmak için, örneğin, bir kerede 3 ölçüm çalıştığında, zor durumlarda "pasta" diyagramının kullanılması uygundur - "Sütunlar". Örneğin, bilgisayar teknolojisi mağazasında satış yelpazesinde 100.000 ABD doları, fotoğraf ekipmanı - 10.000 $, sarf malzemeleri - 4500 $ tutarında. Sonuç: Mağazanın cirosu, bilgisayar satışından büyük ölçüde (aslında, belki de bilgisayarların satışı için sarf malzemeleri gereklidir, ancak bu zaten iç bağımlılıkların bir analizidir).

Dinamik Analizi ( regresyon analizi - Trendlerin tespiti). Trendlerin tespiti, mevsimlik salınımlar. Citely Dynamics, çizgi tipi grafiği görüntüler. Örneğin, Intel ürünlerinin satış hacimleri yıl boyunca düştü ve Microsoft satışları büyüdü. Belki de ortalama alıcının refahını geliştirdi veya mağazanın görüntüsü değişti ve onunla alıcıların kompozisyonu. Aralığın ayarlanması yapılması gerekir. Başka bir örnek: Kışın 3 yıl boyunca, video kameraların satışı azalır.

Bağımlılıkların Analizi (korelasyon analizi). İstenilen aralığı tanımlamak için zaman içinde farklı malların satış hacimlerinin karşılaştırılması - "Sepetler". Bunu yapmak için, "çizgi" grafiğini kullanmak da uygundur. Örneğin, ilk iki ay boyunca yazıcı aralığından çıkarılırken, toz kartuşlarının satışlarındaki bir düşüş keşfedilmiştir.