لائحة الطعام
مجاني
تحقق في
الرئيسية  /  التثبيت والإعداد / المفاهيم الأساسية التي تعمل تقنية OLAP. أولاب التكنولوجيا

المفاهيم الأساسية التي تعمل تقنية OLAP. أولاب التكنولوجيا

إملاء شروط المنافسة العالية والديناميات المتزايدة للبيئة الخارجية زيادة متطلبات نظم إدارة المؤسسات. كان تطوير نظرية وممارسة الإدارة مصحوبا بظهور أساليب وتكنولوجيات جديدة تركز على تحسين كفاءة النشاط. ساهمت الأساليب والنماذج بدورها في ظهور النظم التحليلية. الطلب على النظم التحليلية في روسيا مرتفع. الأكثر إثارة للاهتمام من حيث تطبيق هذه الأنظمة في القطاع المالي: البنوك، أعمال التأمين، شركات الاستثمار. تتطلب نتائج عمل النظم التحليلية في المقام الأول للأشخاص الذين تعتمد قراراتهم على تطوير الشركة: المديرون والخبراء والمحللون. تسمح لك النظم التحليلية بحل مهام الدمج والإبلاغ والتحسين والتنبؤ. حتى الآن، لم يكن التصنيف النهائي للأنظمة التحليلية، كما لا نظام مشترك التعاريف من المصطلحات المستخدمة في هذا الاتجاه. يمكن تمثيل هيكل المعلومات للمؤسسة بسلسلة من المستويات، كل منها يتميز بطريقة معالجة المعالجة والمعلومات، ولديها وظيفتها الخاصة في عملية الإدارة. وبالتالي، ستكون النظم التحليلية موجودة هرمية على مستويات مختلفة من هذه البنية التحتية.

مستوى أنظمة المعاملات

مستوى مستودع البيانات

مستوى البيانات يعوض

مستوى OLAP - أنظمة

مستوى التطبيقات التحليلية

OLAP - أنظمة - (المعالجة التحليلية عبر الإنترنت، العلاج التحليلي في الوقت الحالي) - هي تكنولوجيا تحليل البيانات المتعدد الأبعاد الشامل. OLAP - تنطبق الأنظمة حيث توجد مهمة تحليل بيانات متعددة الاستخدامات. هناك وسيلة فعالة لتحليل وتوليد التقارير. تشير مستودعات البيانات أعلاه، وتعرض البيانات وأنظمة OLAP إلى أنظمة الاستخبارات التجارية (ذكاء الأعمال، BI).

في كثير من الأحيان، تكون أنظمة المعلومات والتحليلات التي تم إنشاؤها على الاستخدام المباشر لأشخاص صنع القرار بسيطة للغاية، ولكنها محدودة بشكل صارم في الوظيفة. يتم استدعاء هذه النظم الثابتة في أدب النظم المعلوماتية للمدير (IPR) أو أنظمة المعلومات التنفيذية (EIS). وهي تحتوي على طلبات متعددة محددة مسبقا، ويكف كافية للاستعراض اليومي، غير قادر على الاستجابة لجميع الأسئلة للبيانات المتاحة التي قد تنشأ عند اتخاذ القرارات. نتيجة مثل هذا النظام، كقاعدة عامة، هي تقارير متعددة الصفحات، بعد دراسة شاملة التي يظهر فيها المحلل سلسلة جديدة أسئلة. ومع ذلك، يجب أن يتم وصف كل طلب جديد، غير متوقع عند تصميم مثل هذا النظام، رسميا، مشفرة من قبل مبرمج ثم يتم تنفيذه. يمكن أن وقت الانتظار في هذه الحالة ساعات وأيام غير مقبولة دائما. وبالتالي، فإن البساطة الخارجية الخاصة ب STATIC SPPR، والتي تقاتل معظم عملاء المعلومات والأنظمة التحليلية بنشاط، يتحول الفقدان الكارثي للمرونة.



تركز SPRS الديناميكي، على العكس من ذلك، على معالجة غير المنتخبة (المخصصة) للمحللين إلى البيانات. إن الاحتياجات الأكثر عمقا لمثل هذه الأنظمة تم استعراضها E. F. Codd في المقال، والتي نشرت بداية مفهوم OLAP. عمل المحللين مع هذه النظم هو التسلسل التفاعلي للاستعلام ودراسة نتائجها.

ولكن SPRS الديناميكي يمكن أن يتصرف ليس فقط في مجال المعالجة التحليلية التشغيلية (OLAP)؛ يمكن إجراء دعم لجعل قرارات الإدارة القائمة على البيانات المتراكمة في ثلاثة مجالات أساسية.

مجال البيانات التفصيلية. هذه هي مجال عمل معظم الأنظمة الرامية إلى إيجاد معلومات. في معظم الحالات، تتناول DBMSS العلائقية بشكل مثالي مع المهام الناشئة هنا. المعيار المقبول عموما لغة التلاعب مع البيانات العلائقية هو SQL. يمكن استخدام محركات المعلومات والبحث التي توفر واجهة المستخدم النهائي في مهام البحث الخاصة بمعلومات مفصلة كوظائف إضافية على حد سواء على قواعد بيانات نظام المعاملات المنفصلة وأكثر من تخزين البيانات الشائعة.

مجال المؤشرات المجمعة. نظرة شاملة على المعلومات التي تم جمعها في مستودع البيانات، فإن تعميمها وتجميعها، تمثيل فرطكي وتحليل متعدد الأبعاد تحليل متعدد الأبعاد هي مهام أنظمة معالجة البيانات التحليلية التشغيلية (OLAP). هنا يمكنك أو التركيز على DBMS متعددة الأبعاد خاصة، أو تبقى داخل التقنيات العلائقية. في الحالة الثانية، يمكن جمع البيانات المسبقة التجميعية في قاعدة بيانات نوع يشبه النجوم، أو يمكن تنفيذ تجميع المعلومات على الطيران في عملية مسح الجداول التفصيلية لقاعدة البيانات العلائقية.

مجال أنماط. يتم إجراء معالجة ذكية من خلال أساليب تحليل البيانات الذكية (JAAD، تعدين البيانات)، المهام الرئيسية التي هي البحث عن أنماط وظيفية ومنطقية في المعلومات المتراكمة، وبناء النماذج والقواعد التي تفسر الحالات الشاذة و / أو توقع تطوير بعض العمليات.

معالجة البيانات التحليلية التشغيلية

يكمن أساس مفهوم OLAP مبدأ عرض البيانات المتعدد الأبعاد. في عام 1993، نظرت مقالة IDD في أوجه القصور في أوجه القصور في النموذج العلائقي، أولا وقبل كل شيء تحديد عدم القدرة على "الجمع، عرض وتحليل البيانات من وجهة نظر التعددية في القياسات، أي أكثر مفهومة لمحللين الشركات في الطريق "وحددت المتطلبات العامة لأنظمة OLAP توسيع وظائف DBMS العلائقية وتشمل تحليل متعدد الأبعاد كأحد خصائصه.

تصنيف منتجات OLAP وفقا لطريقة تمثيل البيانات.

حاليا، هناك عدد كبير من المنتجات موجودة في السوق، والتي توفر بدرجات متفاوتة وظائف OLAP. يتم سرد حوالي 30 الأكثر شهرة في قائمة مراجعة خادم الويب http://www.olapreport.com/. توفير تمثيل مفاهيمي متعدد الأبعاد من قبل واجهة المستخدم إلى قاعدة البيانات المصدر، يتم تقسيم جميع منتجات OLAP إلى ثلاث فئات حسب نوع قاعدة البيانات المصدر.

تنتمي أحدث أنظمة معالجة تحليلية أولية (على سبيل المثال، برامج Essbase Arbor، شركة Oracle's Oracle Express Server) إلى فئة MOLAP، أي أنها لا يمكن أن تعمل فقط مع قواعد بياناتها متعددة الأبعاد الخاصة بهم. وهي تستند إلى تقنيات خاصة ل DBMS متعددة الأبعاد وهي أغلى مكلفة. توفر هذه الأنظمة دورة معالجة OLAP كاملة. إما إما تضمين، بالإضافة إلى مكون الخادم، واجهة العميل المتكاملة الخاصة، أو استخدامها للتواصل مع المستخدم. البرامج الخارجية العمل مع جداول البيانات. للحفاظ على هذه الأنظمة، يلزم وجود موظفين خاصين عن طريق التثبيت، يرافقه النظام، وتشكيل طرق عرض البيانات للمستخدمين النهائيين.

توفر أنظمة معالجة البيانات التحليلية التشغيلية (ROLAP) البيانات المخزنة في القاعدة العلائقية، في شكل متعدد الأبعاد، مما يضمن تحويل المعلومات إلى نموذج متعدد الأبعاد من خلال الطبقة الوسيطة من البيانات الوصفية. يتم تكييف أنظمة Rolap بشكل جيد للعمل مع تخزين كبير. مثل أنظمة Molap، فإنها تتطلب تكاليف خدمة كبيرة لمهنيي تكنولوجيا المعلومات وتوفير عملية متعددة اللاعبين.

أخيرا، تم تصميم الأنظمة الهجينة (Hybrid OLAP، HOLAP) لتحقيق مزايا وتقليل العيوب المتأصلة في الفصول السابقة. Speedware Media / MR يشمل هذه الفئة. وفقا للمطورين، فإنه يجمع بين المرونة التحليلية وسرعة استجابة MOLAP مع الوصول المستمر إلى البيانات الحقيقية الخاصة إلى Rolap.

OLAP متعدد الأبعاد (MOLAP)

في DBMS المتخصصة المستندة إلى عرض البيانات المتعدد الأبعاد، لا يتم تنظيم البيانات في شكل جداول ذات دلالية، ولكن في شكل صفائف متعددة الأبعاد المرتبة:

1) Hypercubes (يجب أن تحتوي جميع الخلايا المخزنة في قاعدة البيانات بنفس البعد، أي أن تكون في أقصى قدر من القياس الكامل) أو

2) polycubes (يتم تخزين كل متغير بمجموعة من القياسات الخاصة به، ويتم تحويل جميع التعقيد المرتبط للمعالجة إلى الآليات الداخلية للنظام).

يستخدم استخدام قواعد البيانات متعددة الأبعاد في أنظمة المعالجة التحليلية التشغيلية المزايا التالية.

في حالة استخدام DBMS متعدد الأبعاد، يتم إجراء البحث والعينة من البيانات بشكل أسرع بكثير من إلقاء نظرة مفاهيمية متعددة الأبعاد على قاعدة البيانات العلائقية، نظرا لأن قاعدة البيانات المتعددة الأبعاد غير معلمة، تحتوي على مؤشرات مجمعة مسبقا وتوفر الوصول الأمثل إلى الخلايا المطلوبة وبعد

تعدد الأبعاد DBMS تعامل بسهولة مع مهام إدراجها نموذج المعلومات وظائف متنوعة مدمجة، في حين أن القيود الموجودة موضوعية لغة SQL. جعل هذه المهام بناء على DBMS العلائقية معقدة للغاية، وأحيانا مستحيلة.

من ناحية أخرى، هناك قيود كبيرة.

لا تسمح DBMSs متعددة الأبعاد بالعمل مع قواعد بيانات كبيرة. بالإضافة إلى ذلك، نظرا لعدم التشفير والتجميع المسبق مسبقا، فإن مقدار البيانات في قاعدة متعددة الأبعاد، كقاعدة عامة، يتوافق مع (من خلال تقييم التعليمات البرمجية) في 2.5-100 أضعاف الحجم الأصغر من مصدر البيانات التفصيلية المصدر.

DBMSs متعددة الأبعاد مقارنة مع العلائقية تستخدم بشكل غير فعال للغاية ذاكرة خارجيةوبعد في الغالبية الساحقة من الحالات، يتم تنظيف HyperCube المعلومات بقوة، وبما أن البيانات يتم تخزينها في شكل أمر، يتم حذف القيم غير المؤكدة فقط عن طريق تحديد ترتيب الفرز الأمثل، والذي يسمح لك بتنظيم البيانات في الحد الأقصى للمجموعات المستمرة وبعد ولكن حتى في هذه الحالة، تم حل المشكلة جزئيا فقط. بالإضافة إلى ذلك، فإن إجراء الفرز هو الأكثر احتمالا الأمثل من وجهة نظر التخزين، وسوف يتزامن ترتيب الفرز على الأرجح مع الترتيب الذي يستخدم في معظم الأحيان في الاستعلامات. لذلك ب. أنظمة حقيقية يجب عليك البحث عن حل وسط بين سرعة وتكرار مساحة القرص التي تحتلها قاعدة البيانات.

وبالتالي، فإن استخدام DBMS متعدد الأبعاد مبرر فقط وفقا للشروط التالية.

لا يكون مقدار البيانات المصدر لتحليله كبيرا جدا (لا يزيد عن عدد قليل من جيجابايت)، أي مستوى تجميع البيانات مرتفع للغاية.

مجموعة قياسات المعلومات مستقرة (نظرا لأن أي تغيير في هيكلهم يتطلب دائما إعادة هيكلة كاملة فرط الضغط).

وقت استجابة النظام لطلبات غير المنتخبة هو المعلمة الأكثر أهمية.

مطلوب الاستخدام الواسع للوظائف المدمجة المعقدة لإجراء حسابات عبر الأبعاد على خلايا Hypercube، بما في ذلك إمكانية كتابة وظائف المستخدم.

العلاقة OLAP (ROLAP)

الاستخدام المباشر لقواعد البيانات العلائقية في أنظمة المعالجة التحليلية التشغيلية له المزايا التالية.

في معظم الحالات، تنفذ مستودعات بيانات الشركات عن طريق DBMS العلائقية، وأدوات Rolap تجعل من الممكن تحليلها مباشرة فوقها. في هذه الحالة، لا يكون حجم التخزين معلمة حاسمة كما هو الحال في حالة MOLAP.

في حالة البعد المتغير للمهمة، عند إجراء تغييرات في هيكل القياس في كثير من الأحيان، ص أنظمة OLAP مع تمثيل ديناميكي للأبعاد هو الحل الأمثل، نظرا لأن هذه التعديلات لا تتطلب إعادة تنظيم بدني لقاعدة البيانات.

تقدم DBMS العلائقية مستوى أعلى بكثير من حماية البيانات و فرص جيدة مكافآت حقوق الوصول.

العيب الرئيسي ل RoLap مقارنة مع DBMS متعدد الأبعاد أقل أداء أقل. لضمان الأداء القابل للمقارنة مع MOLAP، تتطلب أنظمة العلائقية دراسة شاملة لمخطط قاعدة البيانات وإعدادات الفهرس، أي بذل جهود كبيرة من مسؤولي قاعدة البيانات. فقط عند استخدام مخططات على شكل ستار، يمكن التعامل مع أداء أنظمة العلائقية التي تم تكوينها جيدا من خلال أداء الأنظمة بناء على قواعد بيانات متعددة الأبعاد.

تم صياغة مفهوم تكنولوجيا أولاب من قبل إدغار كود في عام 1993.

تعتمد هذه التكنولوجيا على بناء مجموعات بيانات متعددة الأبعاد - ما يسمى مكعبات OLAP (وليس بالضرورة ثلاثية الأبعاد، لأنه سيكون من الممكن أن نستنتج من التعريف). الغرض من استخدام OLAP Technologies هو تحليل البيانات وعرض هذا التحليل في النموذج، مريح لتصور إدارة الموظفين واعتماد الحلول بناء عليهم.

المتطلبات الأساسية للتطبيقات للتحليل متعدد الأبعاد:

  • - توفير المستخدم لنتائج التحليل لفترة زمنية مقبولة (وليس أكثر من 5 ص)؛
  • - الوصول إلى البيانات متعددة اللاعبين؛
  • - عرض البيانات المتعدد الأبعاد؛
  • - القدرة على الرجوع إلى أي معلومات بغض النظر عن مكان تخزينها وحجمها.

توفر أدوات نظام OLAP القدرة على فرز وتحديد البيانات في الظروف المحددة. يمكن تعيين الظروف النوعية والكمية المختلفة.

النموذج الرئيسي للبيانات المستخدمة في العديد من أدواتآه إنشاء ودعم قواعد البيانات - DBMS هو نموذج علائقية. يتم تقديم البيانات الموجودة فيها كمجموعة من علاقات الجدول ثنائية الأبعاد المتصلة بمجالات رئيسية. للقضاء على الازدواجية والتناقضات والحد من تكاليف العمالة للحفاظ على قواعد البيانات، يتم تطبيق جهاز رسمي لتطبيع كيانات الجدول. ومع ذلك، يرتبط تطبيقها بوقت إضافي يقضيه في تكوين الردود على طلب قواعد البيانات، على الرغم من أن موارد الذاكرة يتم حفظها.

يمثل نموذج البيانات المتعدد الأبعاد الكائن قيد الدراسة في شكل مكعب متعدد الأبعاد، في كثير من الأحيان استخدام نموذج ثلاثي الأبعاد. على محاور أو حواف المكعب أو القياسات أو التفاصيل تم تأجيلها. الملاحظات - القواعد تملأ خلايا كوبا. يمكن تقديم مكعب متعدد الأبعاد بمجموعة من مكعبات ثلاثية الأبعاد من أجل تسهيل التصور والعرض في تشكيل الوثائق الإبلاغ والتحليلية والعروض التقديمية متعددة الوسائط بناء على العمل التحليلي في نظام صنع القرار.

كجزء من تقنيات OLAP بناء على حقيقة أنه يمكن تنظيم تمثيل متعدد الأبعاد للبيانات كوسيلة ل DBMSs العلائقية، لذلك وكلاء متخصصون متعدد الأبعاد، تميز ثلاثة أنواع من أنظمة OLAP متعددة الأبعاد:

  • - متعدد الأبعاد (متعدد الأبعاد) OLAP-MOLAP؛
  • - العلاقة (العلاقة) OLAP-ROLAP؛
  • - مختلطة أو هجينة (hibrid) olap-holap.

في DBMS متعدد الأبعاد، يتم تنظيم البيانات ليس في شكل جداول علوية، ولكن في شكل صفائف متعددة الأبعاد المرتبة في شكل فرط تكوب، عندما يجب أن تحتوي جميع البيانات المخزنة على نفس البعد، مما يعني الحاجة إلى تشكيل القياس الأكثر شمولية أساس. يمكن تنظيم البيانات في شكل ماكياج، في هذا التجسيد، يتم تخزين قيم كل مؤشر بمجموعة من القياسات الخاصة بها، يتم تنفيذ معالجة البيانات بواسطة أداة النظام الخاصة بها. هيكل المستودع في هذه الحالة مبسطة، ل ليست هناك حاجة لمنطقة تخزين في نموذج متعدد الأبعاد أو موجه نحو الكائنات. يتم تقليل تكاليف العمالة الضخمة إلى إنشاء نماذج وأنظمة تحويل البيانات من النموذج العلائقي إلى الكائن.

مزايا MOLAP هي:

  • - أسرع من Rolap استلام ردود على الطلبات - قضى وقت واحد لكل واحد أو اثنين، أقل؛
  • - بسبب قيود SQL، فإن تنفيذ العديد من الوظائف المدمجة أمر صعب.

تشمل قيود المولي:

  • - أحجام قاعدة البيانات الصغيرة نسبيا؛
  • - نظرا لإشعال التنوردي والكدمات الأولية، يتم استخدام صفائف متعددة الأبعاد في 2.5-100 أضعاف الذاكرة أكثر من البيانات الأولية (استهلاك الذاكرة بزيادة عدد القياسات يتزايد وفقا للقانون الأسي)؛
  • - لا توجد معايير حول واجهة ووسائل معالجة البيانات؛
  • - هناك قيود عند تحميل البيانات.

تكاليف العمالة لإنشاء بيانات متعددة الأبعاد تزيد بشكل كبير، لأن غائبة عمليا في هذه الحالة، وسائل متخصصة في تعريف النموذج العلائقي للبيانات الواردة في تخزين المعلومات. غالبا ما يستطيع وقت الاستجابة أن تفي بإطار متطلبات أنظمة OLAP.

مزايا أنظمة Rolap هي:

  • - إمكانية التحليل التشغيلي الوارد مباشرة في تخزين البيانات، ل معظم قواعد البيانات المصدر - النوع العلائقية؛
  • - مع البعد المتغير للمشكلة فاز RO LOP، لأن لا يلزم إعادة تنظيم جسدي لقاعدة البيانات؛
  • - يمكن أن تستخدم أنظمة ROLAP محطات عمل وعملاء أقل قوة، والتحميل الرئيسي على معالجة استعلامات SQL المعقدة يقع على الخوادم؛
  • - مستوى حماية المعلومات وتعيين حقوق الوصول في DBMS العلائقية أعلى بكثم أعلى من الأكبر في متعدد الأبعاد.

عيب أنظمة Rolap أقل إنتاجية، والحاجة إلى دراسة دقيقة لمخططات قواعد البيانات والإعداد الخاص الفهارس وتحليل إحصائيات الاستعلام ومحاسبة استنتاجات التحليل في تحسين مخططات قاعدة البيانات، مما يؤدي إلى تكاليف عمالية إضافية كبيرة.

يسمح تنفيذ هذه الشروط عند استخدام أنظمة Rolap لتحقيق مشابه لأنظمة MOLAP للمؤشرات فيما يتعلق بوقت الوصول، وكذلك تجاوز وفورات الذاكرة.

أنظمة OLAP Hybrid هي مزيج من الأدوات التي تنفذ نموذج بيانات علائقية متعددة الأبعاد. هذا يتيح لك تقليل تكاليف الموارد بشكل كبير لإنشاء وحيات هذا النموذج، وقت الاستجابة للطلبات.

مع هذا النهج، يتم استخدام مزايا النهج الأولين وعيوبهم تعويضها. في منتجات البرامج الأكثر تطورا لهذا الموعد، يتم تنفيذ هذا المبدأ بالذات.

يعد استخدام الهندسة المعمارية المختلطة في أنظمة OLAP هي الطريقة الأكثر قبولا لحل المشكلات المتعلقة باستخدام أدوات مفيدة البرامج في التحليل متعدد الأبعاد.

يستند وضع التعريف للأنماط إلى معالجة البيانات الفكرية. المهمة الرئيسية هنا هي تحديد الأنماط في العمليات والعلاقات والتأثير المتبادل للعوامل المختلفة، والبحث عن الانحرافات "غير العادية" الرئيسية، وتوقعات مسار مختلف العمليات الموضوعية. تشير هذه المنطقة إلى التحليل الذكي (تعدين البيانات).

أرسل عملك الجيد في قاعدة المعارف بسيطة. استخدم النموذج أدناه

سيكون الطلاب الطلاب الدراسات العليا، العلماء الشباب الذين يستخدمون قاعدة المعارف في دراساتهم وعملهم ممتنين لك.

منشور من طرف http://www.allbest.ru/

العمل بالطبع

عن طريق الانضباط: قواعد البيانات

موضوع: تقنيةأولاب.

إجراء:

Chizhikov ألكسندر Alexandrovich.

مقدمة

1. تصنيف منتجات OLAP

2. OLAP Client - OLAP Server: "ل" و "ضد"

3. نظام أولاب الأساسي

3.1 مبادئ البناء

استنتاج

قائمة المصادر المستخدمة

التطبيقات

فيصيانة

من الصعب العثور على شخص في عالم الكمبيوتر الذي، على الأقل على مستوى بديهية، لم يفهم قواعد البيانات ولماذا هناك حاجة إليها. على عكس DBMS العلائقية التقليدية، فإن مفهوم OLAP غير معروف على نطاق واسع، على الرغم من أن المصطلح الغامض "كوبا أولاب" سمعت، وربما كل ذلك تقريبا. ما هو المعالجة التحليلية عبر الإنترنت؟

OLAP ليس منتجا منفصلا برمجيات، وليس لغة البرمجة وليس حتى تقنية محددة. إذا حاولت تغطية OLAP في جميع مظاهره، فحدد هذه المجموعة من المفاهيم والمبادئ والمتطلبات الأساسية لمنتجات البرمجيات التي تيسر المحللين الوصول إلى البيانات. على الرغم من حقيقة أن مثل هذا التعريف من غير المرجح أن يوافق أي شخص، فمن المشكوك فيه أنه على الأقل في إطلاع IOTA على غير متخصصين لفهم الموضوع. لذلك، في رغبته في معرفة OLAP، من الأفضل أن تذهب بطرق مختلفة. تحتاج أولا إلى معرفة سبب حاجة المحللين إلى سهولة الوصول بشكل خاص إلى البيانات.

الحقيقة هي أن المحللين هم مستهلكون خاصون لمعلومات الشركات. مهمة التحليلات هي العثور على منتديات في صفائف البيانات الكبيرة. لذلك، لن ينتبه المحلل إلى حقيقة منفصلة، \u200b\u200bفهو يحتاج إلى معلومات حول المئات والآلاف من الأحداث. بالمناسبة، واحدة من اللحظات الأساسية، التي أدت إلى ظهور OLAP - الأداء والكفاءة. تخيل ما يحدث عندما يحتاج المحلل إلى تلقي المعلومات، ولا توجد أدوات OLAP في المؤسسة. يحقق محلل بشكل مستقل (وهو أمر غير مرجح) أو استخدام المبرمج استعلام SQL المقابل ويحصل على بيانات الاهتمام في التقرير أو تصديرها إلى جدول البيانات. المشاكل تنشأ مجموعة رائعة. أولا، يجبر المحلل على المشاركة بعدم العمل مع عمله (برمجة SQL) أو انتظر المهمة لذلك، سيؤدي المبرمجون - كل هذا يؤثر تماما على إنتاجية العمل، ويزيد مستوى احتشاء وسكتة الدماغية وما إلى ذلك وبعد ثانيا، تقرير واحد أو جدول، كقاعدة عامة، لا ينقذ عمالقة الفكر والآباء من التحليل الروسي - ويتعين على الإجراء بأكمله مرارا وتكرارا. ثالثا، كما اكتشفنا بالفعل، لا يسأل المحللون على تفاهاتهم - إنهم بحاجة إلى كل شيء على الفور. هذا يعني (على الرغم من أن هذه التقنية وتستمر مع خطوات سبعة أميال) أن خادم DBMS العلائقية للشركات التي يرسمها المحلل، يمكن أن يفكر في عمق ووقت طويل، وحظر المعاملات الأخرى.

ظهر مفهوم OLAP خصيصا لحل هذه المشاكل. كوبا أولاب هي تقارير التعريف في الأساس. خفض التقارير التلوي (كوبا، أي) للقياسات، يحصل المحلل، في الواقع، التقارير "العادية" ذات الأبعاد التي تهمل (هذه ليست بالضرورة تقارير في الفهم المعتاد لهذا المصطلح - نحن نتحدث عن البيانات الهياكل مع نفس الوظائف). من الواضح مزايا المكعبات - يجب طلب البيانات من DBMS العلائقية مرة واحدة فقط - عند بناء مكعب. نظرا لأن المحللين، كقاعدة عامة، لا تعمل مع المعلومات التي تتكمل وتغيير "على الطاير"، فإن المكعب المشكلات ذات صلة بوقت طويل بما فيه الكفاية. نظرا لهذا، لا يستبعد فقط الانقطاعات في تشغيل خادم DBMS العلائقي (لا توجد استفسارات تحتوي على الآلاف والملايين من خطوط الإجابات)، ولكن أيضا زيادة شديدة من سرعة الوصول إلى البيانات للمحلل نفسه. بالإضافة إلى ذلك، كما أشار بالفعل، يزداد الأداء وبحسب المبالغ الوسيطة الوسيطة والقيم المجمعة الأخرى في وقت بناء مكعب.

بالطبع، للزيادة في هذه الطريقة في الأداء، من الضروري الدفع. في بعض الأحيان يقولون أن هيكل البيانات ببساطة "ينفجر" - يمكن أن يشغل المكعب OLAP في العشرات وحتى مئات المرات أكثر من البيانات المصدر.

الآن، عندما تم فرزنا قليلا حول كيفية عمل OLAP، فإنه لا يزال يستحق كل هذا العناء، لا يزال، إضفاء الطابع الرسمي على معرفتنا إلى حد ما وإعطاء معايير OLAP دون الترجمة في وقت واحد إلى اللغة البشرية المعتادة. تم صياغة هذه المعايير (المجموع 12) في عام 1993 من قبل E.F. الرمز هو خالق مفهوم DBMS العلائقية، بدوام جزئي، OLAP. لن نعتبرهم مباشرة، منذ وقت لاحق تم إعادة صياغتهم في اختبار Fashi المزعوم، والذي يحدد متطلبات منتجات OLAP. fasmi هو اختصار من اسم كل نقطة اختبار:

سريع. هذه الخاصية تعني أن النظام يجب أن يقدم إجابة طلب المستخدم في المتوسط \u200b\u200bخمس ثوان؛ في الوقت نفسه، تتم معالجة معظم الطلبات في غضون ثانية واحدة، وينبغي معالجة الطلبات الأكثر تعقيدا في غضون عشرين ثانية. أظهرت الدراسات الحديثة أن المستخدم يبدأ في الشك في نجاح الطلب، إذا استغرق الأمر أكثر من ثلاثين ثانية.

تحليل (تحليلي). يجب أن يتعامل النظام مع أي تحليل منطقي وإحصائي، وسيمتي تطبيقات الأعمال، ويضمن الحفاظ على النتائج في النموذج المتاح للمستخدم النهائي. قد تتضمن أدوات التحليل إجراءات لتحليل السلسلة الزمنية، وتوزيع التكلفة، وتحويل العملات، وتغيير النمذجة في الهياكل التنظيمية وبعض الآخرين.

مشترك (مشترك). يجب أن يوفر النظام فرصا واسعة للتمييز بين الوصول إلى البيانات والعمل المتزامن للعديد من المستخدمين.

متعددة الأبعاد (متعدد الأقصى). يجب أن يوفر النظام عرضا مفاهما متعدد الأبعاد للبيانات، بما في ذلك دعم كامل التسلسلات الهرمية المتعددة.

معلومة. تتميز قوة منتجات البرامج المختلفة بعدد بيانات المدخلات المعالجة. تحتوي أنظمة OLAP المختلفة على قوة مختلفة: يمكن أن تعمل حلول OLAP المتقدمة على الأقل ألف مرة مع كمية كبيرة من البيانات مقارنة بأكثر قوة منخفضة. عند اختيار أداة OLAP، يجب مراعاة عدد من العوامل في الاعتبار، بما في ذلك ازدواجية البيانات المطلوبة من خلال ذاكرة الوصول العشوائي، واستخدام مساحة القرص، ومؤشرات التشغيل، والتكامل مع مرافق تخزين المعلومات، إلخ.

1. تصنيف منتجات OLAP

لذلك، فإن جوهر OLAP هو أنه يتم تقديم مصدر المعلومات للتحليل في شكل مكعب متعدد الأبعاد، ومن الممكن التعامل معه التعسفي والحصول على تخفيضات المعلومات اللازمة - التقارير. في هذه الحالة، يرى المستخدم النهائي مكعب كجدول ديناميكي متعدد الأبعاد، مما يلخص تلقائيا البيانات (الحقائق) في مختلف التخفيضات (القياسات)، ويسمح لك بإدارة الحسابات بشكل تفاعلي ونموذج تقرير. يتم توفير تنفيذ هذه العمليات بواسطة جهاز OLAP (أو آلة الحوسبة OLAP).

حتى الآن، تم تطوير العديد من المنتجات التي تنفذ تقنيات OLAP في العالم. لتسهيل التنقل بينها، استخدم تصنيفات منتجات OLAP: وفقا لطريقة تخزين البيانات للتحليل وموقع جهاز OLAP. النظر في كل فئة من منتجات OLAP.

سأبدأ مع التصنيف بواسطة طريقة تخزين البيانات. اسمحوا لي أن أذكرك بأن المكعبات متعددة الأبعاد مبنية على أساس البيانات والبيانات الإجمالية. يمكن تخزين كل من المصدر والبيانات الإجمالية للمكعبات في قواعد البيانات العلائقية والمتعددة الأبعاد. لذلك، يتم تطبيق ثلاثة طرق تخزين البيانات حاليا: Molap (OLAP متعدد الأبعاد)، ROLAP (ollasal olap) و holap (hybrid olap). وفقا لذلك، يتم تقسيم منتجات OLAP حسب طريقة التخزين إلى ثلاث فئات مماثلة:

1. في حالة MOLAP، يتم تخزين البيانات الأولية والإجمالية في قاعدة بيانات متعددة الأبعاد أو في كوبا محلية متعددة الأبعاد.

2. في منتجات Rolap، يتم تخزين البيانات المصدر في قواعد البيانات العلائقية أو في الجداول المحلية المسطحة على خادم الملفات. يمكن وضع البيانات الإجمالية في جداول الخدمة في نفس قاعدة البيانات. يحدث تحويل البيانات من قاعدة البيانات العلائقية إلى مكعبات متعددة الأبعاد بناء على طلب OLAP.

3. في حالة استخدام هولاب بنية، تظل البيانات الأولية في الأساس العلائقية، ويتم وضع الوحدات في متعدد الأبعاد. يتم إجراء بناء مكعب OLAP بناء على طلب أدوات OLAP- القائمة على البيانات العلائقية والمتعددة الأبعاد.

التصنيف التالي - في مكان وضع سيارة OLAP. وفقا لهذه الميزة، يتم تقسيم منتجات OLAP إلى خوادم OLAP وعملاء OLAP:

في أدوات OLAP Server، يتم إجراء حساب وتخزين البيانات الإجمالية بواسطة عملية منفصلة - خادم. يتلقى تطبيق العميل فقط نتائج الاستعلامات إلى مكعبات متعددة الأبعاد يتم تخزينها على الخادم. بعض خوادم OLAP تدعم تخزين البيانات فقط في القواعد العلائقية، وبعضها فقط في متعدد الأبعاد. تدعم العديد من خوادم OLAP الحديثة جميع أساليب تخزين البيانات الثلاثة: Molap، Rolap و Holap.

تم تصميم عميل OLAP بشكل مختلف. يتم إجراء بناء مكعب متعدد الأبعاد وحسابات OLAP في ذاكرة الكمبيوتر العميل. ينقسم عملاء OLAP أيضا إلى Rolap و Molap. ويمكن للبعض أن يدعم كل من خيارات الوصول إلى البيانات.

كل من هذه النهج، هناك "إيجابيات" و "ناقل". على عكس الرأي المشترك في فوائد أدوات الخادم أمام العميل، في عدد من الحالات، قد يتحول تطبيق عميل OLAP للمستخدمين إلى أن يكون أكثر كفاءة وأكثر ربحية لاستخدام خادم OLAP.

2. OLAP Client - OLAP Server: "ل" و "ضد"

عند البناء نظام معلومات يمكن تنفيذ وظيفة OLAP كل من الخادم والعميل OLAPS. في الممارسة العملية، فإن الخيار هو نتيجة لسحب مؤشرات الأداء وتكلفة البرامج.

يتم تحديد مقدار البيانات من خلال مجموعة الخصائص التالية: عدد السجلات وعدد القياسات وعدد عناصر القياس وطول القياسات وعدد الحقائق. من المعروف أن خادم OLAP يمكنه معالجة كميات كبيرة من البيانات من عميل OLAP مع طاقة مساوية للكمبيوتر. هذا موضح من خلال حقيقة أن OLAP Server يخزن الأقراص الصلبة قاعدة بيانات متعددة الأبعاد تحتوي على مكعبات محسوبة مسبقا.

تقوم برامج العميل في وقت تنفيذ عمليات OLAP بتقديم طلبات لغة تشبه SQL، واستلامها وليس المكعب بأكمله، وشظاياها المعروضة. يجب أن يكون عميل OLAP في وقت العمل ذاكرة الوصول العشوائي كل مكعب في حالة بنية Rolap، من الضروري التحميل المطلوب للذاكرة جميع صفيف البيانات المستخدمة لحساب المكعب. بالإضافة إلى ذلك، مع زيادة عدد القياسات أو الحقائق أو القياسات القياسات، ينمو عدد المجاميع في تقدم هندسي. وبالتالي، فإن مقدار البيانات التي تمت معالجتها بواسطة عميل OLAP يعتمد بشكل مباشر على نطاق ذاكرة الوصول العشوائي للمستخدم.

ومع ذلك، نلاحظ أن معظم عملاء OLAP يوفرون الحوسبة الموزعة. لذلك، تحت عدد السجلات التي تتم معالجتها، مما يحد من عمل أدوات OLAP العميل، فمن المفهوم وليس مقدار البيانات الأولية لقاعدة بيانات الشركة، ولكن حجم العينة المجمعة منه. يولد عميل OLAP طلبا إلى DBMS، والتي تصف ظروف التصفية والخوارزمية للبيانات الأولية المسبقة للتجميل. يجد الخادم السجلات وإرجاع عينة مدمجة لمزيد من حسابات OLAP. يمكن أن يكون حجم هذه العينة في عشرات ومئات المرات أقل من حجم السجلات الأولية وغير التجميعية. وبالتالي، يتم تقليل الحاجة إلى مثل هذا العميل OLAP في موارد الكمبيوتر بشكل كبير.

بالإضافة إلى ذلك، فرض عدد القياسات قيودا على احتمال الإدراك البشري. من المعروف أن الشخص العادي يمكن أن يعمل في وقت واحد 3-4، أقصى القياسات. مع مزيد من القياسات في الجدول الديناميكي، فإن تصور المعلومات صعب للغاية. يجب أن يؤخذ هذا العامل في الاعتبار عند حساب ذاكرة الوصول العشوائي المسبق، والتي قد تكون مطلوبة من قبل عميل OLAP.

يؤثر طول القياس أيضا على حجم مساحة العنوان OLAP-يعني المحتلة من خلال حساب OLAP COBE. كلما طالت القياس، كلما كانت هناك حاجة إلى المزيد من الموارد لإجراء فرز أولية من مجموعة متعددة الأبعاد، والعكس صحيح. تعد القياسات القصيرة فقط في البيانات المصدر حجة أخرى لصالح عميل OLAP.

يتم تحديد هذه الخصائص من قبل العاملين الذي تمت مناقشته أعلاه: حجم البيانات التي تتم معالجتها وقوة أجهزة الكمبيوتر. كزيادة في الكمية، على سبيل المثال، يتم تقليل الأداء لجميع أموال OLAP بسبب زيادة كبيرة في عدد الوحدات، ولكن معدل الانخفاض مختلف. سنقوم بإظهار هذا الاعتماد على الرسم البياني.

مخطط 1. اعتماد أداء أموال العميل وخادم OLAP من الزيادة في مقدار البيانات

تخضع خصائص سرعة خادم OLAP أقل حساسية للزيادة في مقدار البيانات. هذا يرجع إلى تقنيات مختلفة لمعالجة طلبات المستخدمين OLAP Server وعميل OLAP. على سبيل المثال، عند خادم OLAP، يشير خادم OLAP إلى البيانات المخزنة و "تسحب" البيانات من هذا "الفرع". يقوم عميل OLAP بحساب مجموعة الوحدات بأكملها في وقت التحميل. ومع ذلك، إلى كمية معينة من البيانات والخادم وأداء العميل قابلة للمقارنة. بالنسبة لعملاء OLAP الذين يدعمون الحسابات الموزعة، يمكن توزيع مجال قابلية قدرات الأداء على مقدار البيانات التي تغطي الاحتياجات في تحليل OLAP رقم ضخم المستخدمين. تم تأكيد ذلك من خلال نتائج الاختبار الداخلي MS OLAP Server و OLAP Client "Contur Standard". يتم إجراء الاختبار على جهاز الكمبيوتر الشخصي من IBM PC PC PCETIUM CELERON 400 MHz، 256 ميغابايت لعينة من 1 مليون شخص فريد (أي مجمعة) مع 7 قياسات تحتوي على من 10 إلى 70 عضوا. لا يتجاوز وقت تحميل المكعب في كلتا الحالتين 1 ثانية، ويتم تنفيذ عمليات OLAP المختلفة (الحفر، والانتقال إلى أسفل، والتحرك، والمرشح، وما إلى ذلك) لمئات الثانية.

عندما يتجاوز حجم العينة مقدار ذاكرة الوصول العشوائي، يبدأ التبادل (المبادلة) بالقرص وأداء عميل OLAP ينخفض \u200b\u200bبشكل حاد. فقط من هذه اللحظة يمكن أن نتحدث عن ميزة خادم OLAP.

يجب أن نتذكر أن النقطة "الكسر" تحدد حيلة الارتفاع الحاد في أسعار حلول OLAP. لمهام الجميع مستخدم معين يتم تحديد هذه النقطة بسهولة من خلال اختبارات أداء عميل OLAP. يمكن الحصول على هذه الاختبارات من شركة المطور.

بالإضافة إلى ذلك، تزيد تكلفة حلول OLAP Server مع زيادة عدد المستخدمين. والحقيقة هي أن خادم OLAP يقوم بعمل حسابات لجميع المستخدمين على كمبيوتر واحد. وفقا لذلك، كلما زاد عدد المستخدمين، زاد تشغيل ذاكرة الوصول العشوائي وقوة المعالج. وبالتالي، إذا كانت وحدات تخزين البيانات التي تتم معالجتها في مجال الأداء القابل للمقارنة لأنظمة الخادم والعميل، فستكون جميع الأشياء الأخرى متساوية، فإن استخدام عميل OLAP سيكون أكثر ربحية.

يوفر استخدام خادم OLAP في الأيديولوجية "الكلاسيكية" لتفريغ هذه DBMS العلائقية في قاعدة بيانات متعددة الأبعاد. يتم تنفيذ التفريغ لفترة معينة، لذلك لا تعكس بيانات خادم OLAP الحالة في الوقت الحالي. يتم حرمان هذا النقص من خوادم OLAP فقط التي تدعم وضع Rolap.

وبالمثل، يتيح لك عدد من عملاء OLAP تنفيذ ROLAP وكن من بنية سطح المكتب مع الوصول المباشر إلى قاعدة البيانات. يوفر هذا تحليلا للبيانات المصدر في الوضع عبر الإنترنت.

يضع خادم OLAP الحد الأدنى من المتطلبات الخاصة بسلطة محطات العميل. بموضوعية، فإن متطلبات عميل OLAP أعلى، لأن يجعل الحسابات في ذاكرة الوصول العشوائي من مستخدم الكمبيوتر. تعد حالة حديقة أدوات الأجهزة لمنظمة محددة هي المؤشر الأكثر أهمية التي يجب اتخاذها عند اختيار OLAP. ولكن هنا هناك "إيجابيات" و "ناقل". لا يستخدم OLAP Server قوة حوسبة ضخمة للحديث حواسيب شخصيةوبعد في حالة وجود المنظمة بالفعل حديقة من أجهزة الكمبيوتر الحديثة، فمن غير فعال لتطبيقها فقط كعرض المحطات وفي الوقت نفسه تكاليف إضافية للخادم المركزي.

إذا كانت قوة أجهزة الكمبيوتر للمستخدمين "يترك الكثير مما هو مرغوب فيه"، سيعمل عميل OLAP ببطء أو لن يكون قادرا على العمل على الإطلاق. قد يكون شراء خادم قوي واحد أرخص من ترقية جميع أجهزة الكمبيوتر.

من المفيد مراعاة الاتجاهات في تطوير الأجهزة. نظرا لأن مقدار البيانات للتحليل هو ثابت تقريبا، فإن زيادة الطاقة المستقرة في قوة الكمبيوتر ستؤدي إلى توسيع قدرات عميل OLAP وخوادم OLEP إلى قطاع قواعد بيانات كبيرة جدا.

عند استخدام خادم OLAP عبر الشبكة، يتم إرسال البيانات فقط إلى جهاز الكمبيوتر العميل لعرضها، في حين أن عميل OLAP يتلقى حجم بيانات العينة الأولية بالكامل.

لذلك، حيث ينطبق عميل OLAP، ستكون حركة مرور الشبكة أعلى.

ولكن، عند استخدام عملية تشغيل المستخدم OLAP Server، على سبيل المثال، تفصيل، قم بإنشاء استعلامات جديدة إلى قاعدة البيانات المتعددة الأبعاد، وهذا يعني نقل بيانات جديد. يتم تنفيذ عميل OLAP Olap Olap في ذاكرة الوصول العشوائي، وعدم وجود تدفقات بيانات جديدة على الشبكة.

تجدر الإشارة أيضا إلى أن الشبكة الحديثة المعدات يوفر مستوى عال من النطاق الترددي.

لذلك، في الغالبية الساحقة من الحالات، لن يؤدي تحليل أحجام قاعدة البيانات "المتوسطة" باستخدام عميل OLAP إلى إبطاء المستخدم.

تكلفة خادم OLAP مرتفع بما فيه الكفاية. يجب أن يبدأ هذا أيضا تكلفة الكمبيوتر المميز والتكاليف الثابتة لإدارة القاعدة المتعددة الأبعاد. بالإضافة إلى ذلك، يتطلب تنفيذ وصيانة خادم OLAP موظفي مؤهلين مرتفعين بما فيه الكفاية.

تكلفة عميل OLAP هو أمر أقل من تكلفة خادم OLAP. الإدارة والمعدات التقنية الإضافية تحت الخادم غير مطلوبة. لم يتم تقديم مؤهلات الموظفين في تنفيذ عميل OLAP من المتطلبات العالية. يمكن تنفيذ عميل OLAP أسرع بكثير من خادم OLAP.

تطوير التطبيقات التحليلية باستخدام أموال OLAP العميل - العملية سريعة ولا تتطلب إعداد خاص للمقاول. يمكن للمستخدم الذي يعرف التنفيذ المادي لقاعدة البيانات تطوير تطبيق تحليلي بشكل مستقل دون جذب أخصائي تكنولوجيا المعلومات. عند استخدام خادم OLAP، يجب أن تتعلم 2 أنظمة مختلفةفي بعض الأحيان من العديد من الموردين، - إنشاء مكعبات على الخادم، وتطوير تطبيق عميل. يوفر عميل OLAP واجهة مرئية واحدة لوصف المكعبات وإعداد واجهات المستخدم.

النظر في عملية إنشاء تطبيق OLAP باستخدام أداة مفيدة العميل.

مخطط 2. إنشاء تطبيق OLAP باستخدام Rolap عميل

يعد مبدأ تشغيل عملاء Rolap وصفا أوليا للطبقة الدلالية التي تخفي الهيكل المادي للبيانات المصدر. في هذه الحالة، يمكن أن تكون مصادر البيانات: الجداول المحلية، RDBD. يتم تعريف قائمة مصادر البيانات المدعومة من خلال منتج برنامج معين. بعد ذلك، يمكن للمستخدم معالجة الكائنات بشكل مستقل فهمه من حيث مجال الموضوع لإنشاء مكعبات واجهات تحليلية.

مبدأ تشغيل خادم OLAP مختلف. في خادم OLAP، عند إنشاء مكعبات، يقوم المستخدم بمعالجة الأوصاف البدنية لقاعدة البيانات.

في الوقت نفسه، يتم إنشاء أوصاف مخصصة في كوبا نفسها. يتم تكوين عميل خادم OLAP فقط إلى المكعب.

دعونا نوضح مبدأ تشغيل عميل Rolap على مثال إنشاء تقرير مبيعات ديناميكية (انظر المخطط 2). دع بيانات التحليل الأولية يتم تخزينها في طاولتين: المبيعات والتعامل.

عند إنشاء طبقة دلالة دلالية، يتم وصف مصادر البيانات - المبيعات وجداول الصفقة بمصطلحات المستخدم النهائي المفهوم والتحول إلى "منتجات" و "المعاملات". يتم إعادة تسمية حقل "المعرف" من جدول "المنتجات" إلى "التعليمات البرمجية"، و "الاسم" - في "المنتج"، إلخ.

ثم يتم إنشاء كائن أعمال "مبيعات". كائن العمل هو طاولة مسطحة، بناء على مكعب متعدد الأبعاد. عند إنشاء كائن أعمال "منتجات" و "المعاملات" الجدول "، الجمع بين حقل" التعليمات البرمجية ". نظرا لعرضه في التقرير، فإن جميع مجالات الجداول مطلوبة - يستخدم كائن الأعمال حقول "المنتج" فقط، و "التاريخ" و "المبلغ".

بعد ذلك، على أساس كائن الأعمال، يتم إنشاء تقرير OLAP. يختار المستخدم كائنا عمل واسحب سماته في منطقة العمود أو صفوف جدول التقرير. في مثالنا على أساس كائن أعمال المبيعات، تم إنشاء تقرير عن مبيعات البضائع حسب الشهر.

عند العمل مع تقرير تفاعلي، يمكن للمستخدم تعيين ظروف التصفية والتجمع مع نفس الحركات البسيطة "الماوس". في هذه المرحلة، يناشد عميل Rolap البيانات الموجودة في ذاكرة التخزين المؤقت. يقوم عميل خادم OLAP بإنشاء طلب جديد إلى قاعدة بيانات متعددة الأبعاد. على سبيل المثال، تطبيق مرشح المبيعات في تقرير المبيعات، يمكنك الحصول على تقرير عن مبيعات السلع ذات الاهتمام إلينا.

يمكن تخزين جميع إعدادات تطبيقات OLAP في مستودع بيانات تعريف مخصص، في تطبيق أو في مستودع نظام قاعدة بيانات متعدد الأبعاد. يعتمد التنفيذ على منتج البرمجيات المحددة.

لذلك، في الحالات، يمكن أن يكون تطبيق عميل OLAP للمستخدمين أكثر كفاءة وأكثر ربحية لاستخدام خادم OLAP؟

يحدث الجدوى الاقتصادية لتطبيق خادم OLAP عندما يكون مقدار البيانات مرتفع للغاية ولا يحصى من أجل عميل OLAP، وإلا فإن استخدام الأخير هو مبرر. في هذه الحالة، يجمع عميل OLAP بين خصائص الأداء العالية والتكلفة المنخفضة.

محللو أجهزة الكمبيوتر القوي هم حجة أخرى لصالح عملاء OLAP. عند تطبيق خادم OLAP، لا يتم استخدام هذه الطاقة. من بين مزايا عملاء OLAP، يمكن أيضا استدعاء ما يلي:

تكلفة تنفيذ وصيانة عميل OLAP أقل بكثير من تكلفة خادم OLAP.

عند استخدام عميل OLAP مع انتقال نقل بيانات مدمج عبر الشبكة، يتم تنفيذها مرة واحدة. عند إجراء عمليات OLAP، لا يتم إنشاء تدفقات بيانات جديدة.

يتم تبسيط إعداد عملاء Rolap من خلال القضاء على الرابط المتوسط \u200b\u200b- إنشاء قاعدة بيانات متعددة الأبعاد.

3. نظام أولاب الأساسي

3.1 مبادئ البناء

تطبيق بيانات نموذج Kernel

من قال بالفعل، من الواضح أن آلية OLAP في اليوم واحدة من أساليب تحليل البيانات الشعبية. هناك طريقتان رئيسيتان لحل هذه المهمة. الأول يسمى OLAP متعدد الأبعاد (MOLAP) - تنفيذ الآلية باستخدام قاعدة بيانات متعددة الأبعاد على جانب الخادم، والثاني العلائقية OLAP (ROLAP) - مكعبات البناء "على الطاير" بناء على طلبات SQL. لعلدية DBMS. كل من هذه الأساليب لها إيجابيات وسلبياتها. تحليلهم المقارن يتجاوز هذا العمل. هنا سيتم وصف تنفيذ Kernel لنمط Rolap Desktop Rolap.

نشأت هذه المهمة بعد تطبيق نظام Rolap بناء على مكونات مكعب القرار التي تشكل بورلاند دلفي. لسوء الحظ، أظهر استخدام هذا المكون المحدد أداء منخفضا بكميات كبيرة من البيانات. يمكن تقليل شدة هذه المشكلة من خلال محاولة قطع أكبر قدر ممكن من البيانات قبل إطعامها لبناء مكعبات. ولكن هذا لا يحدث دائما ما يكفي.

على شبكة الإنترنت والصحافة، يمكنك العثور على الكثير من المعلومات حول أنظمة OLAP، ولكن في أي مكان تقريبا مذكورة حول كيفية ترتيبها في الداخل.

مخطط العمل:

يمكن تمثيل المخطط العام لعمل نظام OLAP لسطح المكتب على النحو التالي:

مخطط 3. عمل نظام OLAP Desktop

خوارزمية العمل هي كما يلي:

1. حساب البيانات في شكل جدول مسطح أو نتيجة تنفيذ طلب SQL.

2. البيانات النقدية وتحويلها إلى كوبا متعددة الأبعاد.

3. صورة كوبا المبنية باستخدام المائدة أو الرسم البياني، إلخ. في الحالة العامة، يمكن توصيل عدد التعسفي من التعيينات بواحدة كوبا.

النظر في كيفية ذلك نظام مماثل قد يتم ترتيبها في الداخل. لنبدأ هذا من الجانب الذي يمكنك رؤيته ويشعر به، أي مع تعيينات. العرض المستخدمة في أنظمة OLAP، في معظم الأحيان هناك نوعان - جداول ومخططات. النظر في طاولة عرضية، وهي الطريقة الرئيسية والأكثر شيوعا لعرض كوبا.

في الشكل أدناه، يتم عرض الأسعار والأعمدة التي تحتوي على نتائج مجمعة، يتم تمييز الخلايا بخلايا رمادية فاتحة تحتوي على الحقائق والخلايا الرمادية الداكنة تحتوي على الأبعاد.

وبالتالي، يمكن تقسيم الجدول إلى العناصر التالية التي سنعمل بها في المستقبل:

ملء مصفوفة مع الحقائق، يجب أن نتصرف كما يلي:

بناء على بيانات القياس، حدد إحداثيات العنصر المضافة في المصفوفة.

تحديد إحداثيات الأعمدة وخطوط النتائج التي يتأثر بها العنصر المضافة.

إضافة عنصر إلى المصفوفة والأعمدة المقابلة وخطوط النتائج.

تجدر الإشارة إلى أن المصفوفة الناتجة ستكون بقوة، لماذا ليست مؤسستها في شكل صفيف ثنائي الأبعاد (الخيار الكذب على السطح) غير عقلاني فحسب، بل على الأرجح، وليس ممكنا بسبب كبير البعد من هذه المصفوفة، التي لا تضمن أي كمية من ذاكرة الوصول العشوائي. على سبيل المثال، إذا كان المكعب لدينا يحتوي على معلومات مبيعات في عام واحد، وإذا كان هناك 3 قياسات فقط في ذلك - العملاء (250)، والمنتجات (500) والتاريخ (365)، ثم سنحصل على مصفوفة الأحجام التالية: الرقم عناصر \u003d 250 × 500 × 365 \u003d 45،262،000. وهذا على الرغم من حقيقة أن العناصر المملوءة في المصفوفة يمكن أن يكون فقط عدة آلاف. علاوة على ذلك، كلما زاد حجم القياسات، فإن المصفوفة الأكثر ندرة ستكون.

لذلك، للعمل مع هذه المصفوفة تحتاج إلى تطبيق آليات خاصة للعمل مع مصفوفات نادرة. خيارات مختلفة لتنظيم مصفوفة نادرة ممكنة. وهي موضحة جيدا في أدب البرمجة، على سبيل المثال، في الحجم الأول من الكتاب الكلاسيكي "فن برمجة" دونالد كتادا.

فكر الآن في كيفية تحديد إحداثيات المصنع، مع العلم القياسات المقابلة. للقيام بذلك، فكر في مزيد من التفاصيل هيكل الرأس:

في هذه الحالة، يمكنك بسهولة العثور على طريقة لتحديد أرقام الخلية المقابلة والنتائج التي يسقط فيها. هنا يمكنك تقديم العديد من الأساليب. أحدهم هو استخدام شجرة للبحث عن الخلايا المقابلة. يمكن بناء هذه الشجرة عند تمرير العينة. بالإضافة إلى ذلك، يمكنك بسهولة تحديد الصيغة المتكررة التحليلية لحساب الإحداثيات المطلوبة.

يجب تحويل البيانات المخزنة في الجدول لاستخدامها. لذلك، من أجل زيادة الإنتاجية في بناء طبركوبا، من المستحسن العثور على عناصر فريدة مخزنة في الأعمدة التي تقيس مكعب. بالإضافة إلى ذلك، يمكنك تجميع الحقائق السابقة للإدخالات التي لها نفس الأبعاد. كما ذكر أعلاه، فإن القيم الفريدة المتاحة في حقول القياس مهمة. ثم، للتخزين، يمكنك تقديم الهيكل التالي:

مخطط 4. هيكل تخزين القيم الفريدة

عند استخدام مثل هذا الهيكل، فإننا تقلل بشكل كبير من الحاجة إلى الذاكرة. ما هو ذات الصلة جدا، ل لزيادة سرعة التشغيل، من المستحسن تخزين البيانات في ذاكرة الوصول العشوائي. بالإضافة إلى ذلك، يمكنك تخزين مجموعة من العناصر فقط، ويتم تفريغ قيمها على القرص، لأنها ستكون مطلوبة فقط عند اشتقاق المبرد.

تم الحفاظ على الأفكار الموضحة أعلاه عند إنشاء مكتبة مكون Cubeebase.

مخطط 5. هيكل مكتبة مكون Cubeebase

Tsubesource يجعل التخزين المؤقت وتحويل البيانات إلى التنسيق الداخلي، وكذلك التجميع المسبق للبيانات. ينفذ مكون Tsubeeengine حساب Hypercube والعمليات معها. في الواقع، إنه جهاز OLAP الذي يحول جدول مسطح إلى مجموعة بيانات متعددة الأبعاد. ينفذ مكون TCUBEGRID الشاشة المتقاطعة والتحكم في عرض HyperCube. يسمح لك Tsubechart بمشاهدة Hypercube في شكل رسوم بيانية، وتحكم مكون Tsubepivote في عمل Cube Core.

لذلك، اعتبرت بنية وتفاعل المكونات التي يمكن استخدامها لبناء جهاز OLAP. الآن النظر في مزيد من التفاصيل الهيكل الداخلي للمكونات.

ستكون الخطوة الأولى من تشغيل النظام تحميل البيانات وتحويلها إلى التنسيق الداخلي. سيكون السؤال طبيعيا - ولماذا هو ضروري، لأنه يمكنك ببساطة استخدام البيانات من طاولة مسطحة من خلال النظر إليه عند إنشاء قطع مكعب. من أجل الإجابة على هذا السؤال، فكر في بنية الجدول من وجهة نظر الجهاز OLAP. بالنسبة إلى OLAP، يمكن أن يكون نظام عمود الطاولة إما حقائق أو قياسات. في هذه الحالة، سيكون منطق العمل مع هذه الأعمدة مختلفة. في قياسات HyperCube هي في الواقع محاور، وقيم القياس هي إحداثيات على هذه المحاور. في الوقت نفسه، سيتم ملء المكعب بشكل غير متفاوي للغاية - سيكون هناك مزيج من الإحداثيات أنه لن يتم تكوين أي إدخالات وستكون هناك مجموعات تتوافق مع العديد من الإدخالات في الجدول المصدر، والوضع الأول يلتقي في كثير من الأحيان، ذلك هو، سيكون المكعب مشابها للكون - مساحة فارغة، في أماكن منفصلة تشجع النقاط (الحقائق). وبالتالي، إذا تم تحميل البيانات الأولية، فسنقوم بإجراء ما قبل البيانات، وهذا هو، نجمع بين السجلات التي لها نفس قيم القياس، مع حساب الحقائق المجمعة الأولية من الحقائق، ثم في المستقبل سنضطر إلى العمل مع عدد أصغر من السجلات، والتي ستزيد السرعة وتقليل المتطلبات إلى حجم ذاكرة الوصول العشوائي.

لبناء أقسام فرط الضغط، نحتاج إلى الميزات التالية - تعريف الإحداثيات (قيم القياس فعليا) لإدخالات الجدول، وكذلك تعريف السجلات التي لها إحداثيات محددة (قيم القياس). النظر في كيفية تحقيق هذه الاحتمالات. لتخزين Hypercubes، فإن أسهل طريقة لاستخدام قاعدة بيانات تنسيقك الداخلي هي الأسهل.

يمكن تمثيل التحويل التخطيطي على النحو التالي:

مخطط 6. تحويل قاعدة بيانات التنسيق الداخلي إلى قاعدة بيانات طبيعية

وهذا هو، بدلا من جدول واحد، تلقينا قاعدة بيانات طبيعية. في الواقع، يقلل التطبيع من سرعة النظام، ويمكنهم أن يقولوا أخصائيي قواعد البيانات، وفي هذا سيكونون بالتأكيد سيكونون على حق، في الحالة عندما نحتاج إلى الحصول على قيم لعناصر القواميس (في قيمنا، قيم القياس) وبعد لكن الشيء هو أن هذه القيم لا تحتاج إلى هذه القيم في مرحلة البناء. كما ذكر أعلاه، نحن مهتمون فقط في الإحداثيات في Hypercub لدينا، لذلك نحدد الإحداثيات لقيم القياس. أبسط لإعادة ترقيم قيم العناصر. من أجل ترقيم قياس واحد، كان الترقيم لا لبس فيه، مسبقا قوائم قيم القياس (القواميس، معربا عن شروط قاعدة البيانات) بالترتيب الأبجدي. بالإضافة إلى ذلك، نحن نقدم الحقائق، والحقائق ما قبل الماجساة. نحصل على المخطط التالي:

مخطط 7. قاعدة بيانات تطبيع الإشعاع لتحديد إحداثيات قيم القياس

الآن لا يزال فقط لربط عناصر الجداول المختلفة فيما بينها. في نظرية قواعد البيانات العلائقية، يتم تنفيذ ذلك باستخدام الجداول الوسيطة الخاصة. لدينا ما يكفي لكل إدخال في جداول القياس، بما يتماشى مع قائمة التي ستكون حقائق الحقائق، عندما يتم استخدام تكوين هذه القياسات (أي، لتحديد كل الحقائق التي لها نفس قيمة الإحداثيات الموصوفة بواسطة هذا القياس). بالنسبة للوقائع، على التوالي، وضع كل إدخال وفقا لقيم الإحداثيات التي يقع بموجبها في Hypercube. في المستقبل، سيتم فهم الأرقام في كل مكان بموجب إحداثيات الدخول في Hypercube بأرقام الإدخالات المقابلة في جداول قيم القياس. ثم للحصول على مثالنا الافتراضي، نحصل على المجموعة التالية، والتي تحدد التمثيل الداخلي لنظام التشغيل Hypercuba:

مخطط 8. التمثيل الداخلي لنطل الصوت

سيكون تمثيلنا الداخلي ل Hypercuba. نظرا لأننا لا نفعل ذلك ليس من أجل قاعدة البيانات العلائقية، فإن الحقول ذات الأطوال المتغيرة تستخدم كحقول اتصال (RBDS، فلن يكون من الممكن جعلها، نظرا لأن هناك عددا من أعمدة الجدول مقدما).

سيكون من الممكن محاولة استخدام جدول مؤقت لتنفيذ Hypercube، ولكن هذه الطريقة ستوفر سرعة منخفضة للغاية (مثال - مجموعة من مكون مكعب القرار)، لذلك سوف نستخدم هياكل التخزين الخاصة بك.

لتنفيذ HyperCube، نحتاج إلى استخدام هياكل البيانات التي ستضمن أقصى سرعة وتكاليف ذاكرة الوصول العشوائي الدنيا. من الواضح أننا سنحصل على الهياكل الرئيسية لتخزين القواميس وقصائق المصنع. النظر في المهام التي يجب على القاموس أن تؤدي بسرعة أكبر:

التحقق من وجود عنصر في القاموس؛

إضافة عنصر إلى القاموس؛

البحث عن أرقام السجلات ذات قيمة تنسيق محددة؛

البحث عن إحداثيات قيمة القياس؛

البحث عن قيم القياس من خلال تنسيقها.

لتنفيذ هذه المتطلبات، يمكنك استخدام أنواع مختلفة وهياكل البيانات. على سبيل المثال، يمكنك استخدام صفائف الهياكل. في الحالة الحقيقية، تتطلب هذه الصفائف آليات فهرسة إضافية تزيد من سرعة تنزيل البيانات والحصول على المعلومات.

لتحسين عمل Hypercube، من الضروري تحديد المهام التي من الضروري اتخاذ قرار بشأن الأولوية، وما المعايير التي نحتاج إلى تحقيق جودة عمل محسنة. الشيء الرئيسي بالنسبة لنا هو زيادة سرعة البرنامج، في حين أنه من المرغوب فيه أن لا تكون كمية كبيرة جدا من ذاكرة الوصول العشوائي مطلوبة. يمكن زيادة الأداء المتزايد بسبب إدخال آليات إضافية للوصول إلى البيانات، على سبيل المثال، إدخال الفهرسة. لسوء الحظ، فإنه يعزز النفقات الكبيرة من ذاكرة الوصول العشوائي. لذلك، نحدد العمليات التي نحتاجها لأداء أعلى السرعة. للقيام بذلك، اعتبر المكونات الفردية التي تنفذ Hypercubes. هذه المكونات لها نوعان رئيسيان - قياس وجدول الحقائق. لقياس مهمة نموذجية ستكون:

إضافة قيمة جديدة؛

تقدير الإحداثيات لقيمة القياس؛

تحديد قيمة الإحداثيات.

عند إضافة قيمة عنصر جديد، نحتاج إلى التحقق مما إذا كان لدينا بالفعل مثل هذه القيمة، وإذا لم يكن هناك ذلك، فلا تتم إضافته إلى الجديد، ولكن لاستخدام الإحداثيات الموجودة، وإلا تحتاج إلى إضافة عنصر جديد و تحديد تنسيقها. هذا يتطلب وسيلة بحث سريع وجود العنصر المطلوب (بالإضافة إلى ذلك، مثل هذه المهمة تنشأ وعند تحديد التنسيق بشأن قيمة العنصر). للقيام بذلك، سيكون استخدام التجزئة الأمثل. في هذه الحالة، سيكون الهيكل الأمثل هو استخدام أشجار التجزئة، حيث سنخزن المراجع إلى العناصر. في الوقت نفسه، ستكون العناصر هي خطوط قاموس القياس. ثم يمكن تمثيل هيكل قيمة القياس على النحو التالي:

pactlink \u003d ^ tactlink؛

tactlink \u003d سجل

Factno: عدد صحيح // فهرس الحقائق في الجدول

tdimensionrecord \u003d سجل.

القيمة: سلسلة؛ // قيمة القياس

الفهرس: عدد صحيح // تنسيق القيمة

FactLink: Pfatilink؛ / / مؤشر إلى بداية قائمة عناصر جدول الحقائق

وفي شجرة التجزئة، سنخزن المراجع إلى عناصر فريدة من نوعها. بالإضافة إلى ذلك، نحتاج إلى حل مهمة التحويل - بالتنسيق لتحديد قيمة القياس. ليزود الاداء العالي تحتاج إلى استخدام العنوان المباشر. لذلك، يمكنك استخدام صفيف آخر، الفهرس الذي هو قياس الإحداثيات، والقيمة هي الإشارة إلى الإدخال المناسب في القاموس. ومع ذلك، فمن الممكن القيام بذلك أسهل (ولإحفظ على الذاكرة) إذا كان يمكن ترتيب صفيف العناصر وفقا لذلك فهرس العناصر هو تنسيقه.

تنظيم الصفيف الذي ينفذ قائمة الحقائق لا يقدم مشاكل خاصة بسبب بنية البسيطة. ستكون الملاحظة الوحيدة هي أنه من المستحسن حساب جميع طرق التجميع التي قد تكون هناك حاجة إليها والتي يمكن حسابها تدريجيا (على سبيل المثال، المبلغ).

لذلك، وصفنا كيفية تخزين البيانات في شكل Hypercuba. يسمح لك بتشكيل مجموعة من النقاط في مساحة متعددة الأبعاد بناء على المعلومات في مستودع البيانات. من أجل أن يكون الشخص قادرا على العمل مع هذه البيانات، يجب تقديمه في النموذج مناسب للمعالجة. في الوقت نفسه، يتم استخدام جدول ملخص والرسومات بأنه الأنواع الرئيسية من عرض البيانات. علاوة على ذلك، فإن كل من هذه الأساليب تمثل فعلا توقعات Hypercuba. من أجل ضمان أقصى قدر من الكفاءة في بناء تمثيلات، سيتم إعادة صياغة ما هي هذه التوقعات. دعنا نبدأ في النظر في الجدول الموحد كما هو الحال مع أهم تحليل البيانات.

ابحث عن طرق لتنفيذ مثل هذا الهيكل. يمكنك تحديد ثلاثة أجزاء تتكون منه جدول الملخص من: هذه هي عناوين السلاسل ورؤوس الأعمدة والجدول الفعلي للحقائق المجمعة. معظم. طريقة بسيطة ستكون تمثيلات جدول الحقائق تستخدم مجموعة ثنائية الأبعاد، ويمكن تحديد البعد منها عن طريق بناء العناوين. لسوء الحظ، ستكون أسهل طريقة غير فعالة، لأن الجدول سيكون متنازع بقوة، وستكون الذاكرة غير فعالة للغاية، نتيجة لذلك، يمكن بناء مكعبات صغيرة جدا، نظرا لأن الذاكرة الأخرى قد لا تكون كافية. وبالتالي، نحتاج إلى اختيار تخزين معلومات مثل هذا بنية البيانات التي ستضمن الحد الأقصى لسرعة البحث / إضافة العنصر الجديد وفي نفس الوقت الحد الأدنى لاستهلاك التردد. سيكون هذا الهيكل ما يسمى المصفوفات المتفرقة، والتي يمكن قراءتها بمزيد من التفاصيل في السوط. طرق مختلفة لتنظيم المصفوفة ممكنة. من أجل تحديد الخيار الذي يناسبنا، فكر في الهيكل الأولي لتوجه الجدول.

تحتوي العناوين الرئيسية على هيكل هرمي واضح، لذلك سيتم افتراض ذلك بشكل طبيعي استخدام الخشب لاستخدامها. في الوقت نفسه، يمكن تصوير الهيكل التخطيطي لعقدة الشجرة على النحو التالي:

الملحق C.

في الوقت نفسه، مثل قيمة القياس، من المنطقي تخزين مرجع إلى العنصر المقابل لجدول قياس المكعب متعدد الأبعاد. سيؤدي ذلك إلى تقليل تكاليف الذاكرة لتخزين قطع وتسريع العمل. تستخدم الروابط أيضا كأوالة وشركات تابعة.

لإضافة عنصر إلى شجرة، يجب أن يكون لديك معلومات حول موقعها في Hypercub. مثل هذه المعلومات، من الضروري استخدام تنسيقها، والتي يتم تخزينها في قيم القياس. النظر في رسم تخطيطي لإضافة عنصر إلى شجرة رأس الجدول الموحد. في الوقت نفسه، كمعلومات مصدر، استخدم قيم تنسيق القياس. يتم تحديد الترتيب الذي يتم فيه سرد هذه القياسات المدرجة بالطريقة المطلوبة للتجميع وتتزامن مع مستويات التسلسل الهرمي للمستوى من العناوين الرئيسية. نتيجة لذلك، من الضروري الحصول على قائمة بالأعمدة أو صفوف الجدول الموحد والتي من الضروري إضافة عنصر.

طلبد.

كبيانات مصدر لتحديد هذا الهيكل، استخدم إحداثيات القياسات. بالإضافة إلى ذلك، وبالتأكيد، نفترض أننا نحدد عمود الاهتمام بالنسبة لنا في المصفوفة (كما نحدد السلسلة سيعتبر لاحقا قليلا، لأنه أكثر ملاءمة لتطبيق هياكل البيانات الأخرى هناك، سبب هذا الاختيار هو أيضا أدناه). كإحداثيات، خذ أعداد صحيحة - أعداد قيم القياس التي يمكن تعريفها كما هو موضح أعلاه.

لذلك، بعد إجراء هذا الإجراء، نحصل على مجموعة مرجعية إلى أعمدة مصفوفة نادرة. الآن تحتاج إلى أداء جميع الإجراءات اللازمة مع الصفوف. للقيام بذلك، داخل كل عمود، من الضروري العثور على العنصر المرغوب وإضافة القيمة المقابلة هناك. لكل من القياسات في المجموعة، من الضروري معرفة عدد القيم الفريدة والمجموعة الفعلية لهذه القيم.

الآن النظر، في أي شكل من الضروري تمثيل القيم داخل الأعمدة - وهذا هو، وكيفية تحديد السلسلة المطلوبة. للقيام بذلك، يمكنك استخدام العديد من الأساليب. سيكون من الأسهل تقديم كل عمود في شكل متجه، ولكن نظرا لأنه سيتم تجاريه بقوة، سيتم استهلاك الذاكرة غير فعالة للغاية. لتجنب ذلك، سنقوم بتطبيق هياكل البيانات التي ستوفر فعالية أكبر لتمثيل صفيفات نادرة واحدة الأبعاد (ناقلات). يبدو أن أبسطها هي القائمة المعتادة أو الواحدة أو المزدوجة، ومع ذلك، فهي غير محمية من وجهة نظر الوصول إلى العناصر. لذلك، سوف نستخدم شجرة ستوفر المزيد الوصول السريع للعناصر.

على سبيل المثال، يمكنك استخدام نفس الشجرة تماما بالنسبة للأعمدة، ولكن بعد ذلك، سيتعين عليها أن تجعل شجرة خاصة بك لكل عمود، مما سيؤدي إلى مكبرات صوت ذات الذاكرة العلوية الكبيرة ووقت المعالجة. سأفعل القليل من الماكرة - سنكسب شجرة واحدة لتخزين جميع مجموعات القياس المستخدمة في الصفوف، والتي ستكون متطابقة لما ورد أعلاه، لكن عناصرها لن تشير إلى أن الخطوط (التي ليست كذلك) الفهارس، والقيم الفهرس نفسها لا تهمنا وتستخدم فقط كمفاتيح فريدة من نوعها. ثم سيتم استخدام هذه المفاتيح للبحث عن العنصر المطلوب داخل العمود. الأعمدة نفسها أسهل تخيلها في شكل شجرة ثنائية تقليدية. يمكن تمثيل هيكل تم الحصول عليها بيانيا على النحو التالي:

مخطط 9. صورة طاولة موحدة في شكل شجرة ثنائية

لتحديد أرقام الأسطر المناسبة، يمكنك استخدام نفس الإجراء مثل الإجراء الموضح أعلاه الإجراء لتحديد أعمدة الجدول الموحد. في الوقت نفسه، تكون أرقام الصفوف فريدة من نوعها في جدول الموجز نفسه وتحديد العناصر الموجودة في المتجهات التي تعد أعمدة الجدول المحوري. ستكون أسهل طريقة لتوليد هذه الأرقام صيانة العداد وزيادة تكنولوجيا المعلومات لكل وحدة عند إضافة عنصر جديد في شجرة رأس الشجرة. هذه الأعمدة المتجهة أنفسهم أسهل في تخزينها في شكل أشجار ثنائية، حيث يتم استخدام رقم الصف كإجراء المفتاح. بالإضافة إلى ذلك، فإن استخدام طاولات التجزئة أمر ممكن أيضا. نظرا لأن إجراءات العمل مع هذه الأشجار تعتبر بالتفصيل في مصادر أخرى، فلن نتوقف عند هذا الأمر والنظر فيه مخطط عام إضافة عنصر إلى العمود.

بشكل عام، يمكن وصف تسلسل الإجراءات لإضافة عنصر إلى المصفوفة على النحو التالي:

1. هل سيتم وضع أرقام الصفوف التي يتم فيها إضافة العناصر.

2. النظر في مجموعة الأعمدة التي تتم فيها إضافة العناصر.

3. لجميع الأعمدة للعثور على العناصر الأرقام الصحيحة صفوف وإضافة العنصر الحالي إليها (تتضمن الإضافة توصيل العدد المطلوب من الحقائق وحساب القيم المجمعة التي يمكن تحديدها تدريجيا).

بعد إجراء هذه الخوارزمية، نحصل على مصفوفة، وهي طاولة مدمجة نحتاج إلى بناءها.

الآن بضع كلمات حول التصفية عند إنشاء قطع. من الأسهل تنفيذها فقط في مرحلة بناء مصفوفة، حيث يوجد في هذه المرحلة الوصول إلى جميع الحقول المطلوبة، بالإضافة إلى ذلك، يتم تجميع القيم. في الوقت نفسه، أثناء استلام التسجيل من ذاكرة التخزين المؤقت، يتم التحقق من امتثالها لظروف التصفية، وفي حالة عدم الامتثال، يتم التخلص من السجل.

نظرا لأن الهيكل الموصوف أعلاه يصف بالكامل جدول موحد، فإن مهمة تصورها ستكون تافهة. في هذه الحالة، يمكنك استخدام المكونات القياسية للجدول، والتي تتوفر في جميع أدوات البرمجة تقريبا تحت Windows.

أول منتج يؤدي طلبات OLAP كان Express (IRI). ومع ذلك، اقترح مصطلح OLAP نفسه من قبل Edgarododod، "الأب العلائقية BD". وتم تمويل قانون الكود من قبل أربور، الشركة التي أصدرت منتجه OLAP الخاص به - Essbase (تم شراؤه لاحقا بواسطة Hyperion، الذي تم استيعابه في عام 2007 بواسطة Oracle) - قبل عام. تشمل منتجات OLAP المعروفة الأخرى خدمات تحليل Microsoft (سابقا تسمى خدمات OLAP، الجزء SQL Server)، خيار Oracle OLAP، خادم OLAP DB2 من IBM (في الواقع، EssBase مع الإضافات من IBM)، SAP BW، BRAIO، BusinessObjects المنتجات، Cognos ، microstrategy وغيرها من الشركات المصنعة.

من وجهة نظر فنية، تنقسم المنتجات المقدمة في السوق إلى "OLAP المادية" و "الظاهري". في الحالة الأولى، يوجد برنامج يقوم بإجراء حساب أولي للمجموعات، التي يتم تخزينها بعد ذلك في قاعدة بيانات خاصة متعددة الأبعاد توفر استخراج سريع. أمثلة على هذه المنتجات هي خدمات تحليل Microsoft، Oracle Olap Option، Oracle / Hyperion Essbase، Cognos PowerPlay. في الحالة الثانية، يتم تخزين البيانات في DBMS العلائقية، وقد لا توجد الوحدات على الإطلاق أو يتم إنشاؤها في الطلب الأول في DBMS أو ذاكرة التخزين المؤقت للبرامج التحليلية. أمثلة على هذه المنتجات - SAP BW، BusinessObjects، microstrategy. الأنظمة التي لديها أساس "OLAP المادي" توفر مستقرة أفضل وقت استجابة لطلبات أنظمة "OLAP" الافتراضية ". يعلن موردو نظام OLAP الظاهري زيادة أكبر قدر أكبر من منتجاتهم من حيث دعم كميات كبيرة جدا من البيانات.

في هذه الورقة، أود أن أعتبر نتاج مختبرات Beasgroup للشركة - خصم.

خصم هو منصة تحليلية، I.E. أساس إنشاء الانتهاء الحلول التطبيقيةوبعد تتيح تطبيق تقنية التخصيص على أساس بنية واحدة لإكمال جميع مراحل إنشاء نظام تحليلي: من إنشاء مستودع بيانات لتحديد النماذج تلقائيا وتصور النتائج التي تم الحصول عليها.

تكوين النظام:

Deductor Studio هو النواة التحليلية لمنصة الدالون. يتضمن Studio Dedduct مجموعة كاملة من الآليات التي تتيح لك الحصول على معلومات من مصدر بيانات تعسف، وقضاء دورة المعالجة بأكملها (تنظيف وتحويل البيانات، ونماذج البناء)، وعرض النتائج التي تم الحصول عليها في الطريقة الأكثر ملاءمة (OLAP، الجداول، الرسوم البيانية والأشجار والحلول ...) ونتائج التصدير.

خصم Viewer هو وجهة وظيفة المستخدم النهائي. البرنامج يسمح لك بتقليل متطلبات الموظفين، لأن يتم تنفيذ جميع العمليات المطلوبة تلقائيا باستخدام سيناريوهات المعالجة المعدة في وقت سابق، ليست هناك حاجة للتفكير في طريقة الحصول على آليات البيانات ومعالجة. يحتاج مستخدم DEDUSTOR VAWER إلى تحديد التقرير فقط.

مستودع خصم هو تخزين بيانات متعدد الأبعاد عبر منصة تتراكم جميع المعلومات اللازمة لتحليل مجال الموضوع. يسمح لك استخدام مستودع واحد بتوفير وصول مريح وسرعة معالجة عالية واتساق المعلومات والتخزين المركزي والدعم التلقائي لعملية تحليل البيانات بأكملها.

4. خادم العميل

تم تصميم Deductor Server للمعالجة التحليلية عن بعد. يوفر القدرة على بيانات "محرك الأقراص" تلقائيا من خلال السيناريوهات الموجودة على الخادم وإعادة تعيين النماذج الحالية. يتيح لك استخدام Deductor Server تطبيق بنية كاملة من ثلاث نجوم يتم تشغيله وظيفة خادم التطبيقات. يتم الإشراف على الوصول إلى الخادم باستخدام عميل Diductor.

مبادئ العمل:

1. واردات البيانات

يبدأ تحليل أي معلومات في خصم استيراد البيانات. نتيجة للاستيراد، يتم إعطاء البيانات للنموذج المناسب للتحليل اللاحق باستخدام جميع الآليات المتاحة في البرنامج. طبيعة البيانات والتنسيق و DBMS وغيرها لا يهم، ل آليات العمل مع كل موحدة.

2. صادرات البيانات

تتيح لك وجود آليات التصدير إعادة توجيه النتائج في تطبيقات الطرف الثالث، على سبيل المثال، لنقل توقعات المبيعات إلى النظام لتشكيل أمر شراء أو وضع تقرير أعد على موقع الويب الخاص بالشركة.

3. معالجة البيانات

بموجب المعالجة في خصم يعني أي إجراء مرتبط ببعض تحويل البيانات، على سبيل المثال، تصفية، بناء نموذج، تنظيف، وهلم جرا. في الواقع في هذه الكتلة وأنتج الأهم من وجهة نظر التحليل. أهم ميزة آليات المعالجة المنفذة في خصمها هي أن البيانات التي تم الحصول عليها نتيجة للمعالجة يمكن معالجة أي من الأساليب المتاحة. وبالتالي، فمن الممكن بناء سيناريوهات المعالجة المعقدة بشكل تعسفي.

4. التصور

يمكنك تصور البيانات في Deductor Studio (المشاهد) في أي مرحلة من مراحل المعالجة. يحدد النظام بشكل مستقل كيف يمكنه القيام بذلك، على سبيل المثال، إذا تم تدريبه الشبكة العصبيةبالإضافة إلى الجداول والرسوم البيانية، يمكنك عرض الرسم البياني للشبكة العصبية. يحتاج المستخدم إلى الاختيار بحاجة إلى خيار من القائمة وتكوين العديد من المعلمات.

5. آليات التكامل

لا يوفر خصم أدوات إدخال البيانات - يتم توجيه النظام الأساسي حصريا للمعالجة التحليلية. يتم توفير آليات الاستيراد المرنة للاستيراد لاستخدام المعلومات المخزنة في أنظمة غير متجانسة. يمكن تنظيم التفاعل باستخدام تنفيذ الدفعات والتشغيل في خادم OLE والوصول إلى خادم Deductor.

6. علاج المعرفة

يتيح لك خصم تطبيق إحدى أهم المهام لأي نظام تحليلي - دعم لعملية النسخ المتماثل المعرفي، أي ضمان الفرصة للموظفين الذين لا يفهمون أساليب التحليل والأساليب للحصول على نتيجة معينة، تلقي إجابة على أساس النماذج التي أعدها الخبير.

z.عمل

في هذه الورقة، مثل هذه المنطقة الحديثة تكنولوجيات المعلوماتكأنظمة تحليل البيانات. حلل الأداة الرئيسية لمعالجة المعلومات التحليلية - OLAP - التكنولوجيا. يتم الكشف عنها بالتفصيل جوهر مفهوم OLAP وقيمة أنظمة OLAP في عملية الأعمال الحديثة. يتم وصف هيكل وعملية عمل خادم Rolap بالتفصيل. كمثال على تنفيذ بيانات OLAP، يتم إعطاء منصة خصم التحليلية. تم تطوير الوثائق المقدمة وتوافق مع المتطلبات.

OLAP Technology هي أداة قوية لمعالجة البيانات في الوقت الفعلي. يتيح لك OLAP Server تنظيم البيانات وتقديمها في قسم الاتجاهات التحليلية المختلفة وتحويل البيانات معلومات قيمةمما يساعد الشركات على اتخاذ قرارات أكثر استنارة.

يوفر استخدام أنظمة OLAP مستوى عال للغاية من الأداء والقابلية للتوسع، والحفاظ على وحدات تخزين البيانات لعدة جيجابايت، والتي يمكن الوصول إلى الآلاف من المستخدمين. بمساعدة تقنيات OLAP، يتم الوصول إلى المعلومات في الوقت الفعلي، أي لم تعد معالجة الطلب يبطئ عملية التحليل، مما يوفر كفاءته وكفاءةها. تتيح لك أدوات الإدارة المرئية تطوير وتطبيق التطبيقات التحليلية الأكثر تعقيدا، مما يجعل هذه العملية ببساطة وبسرعة.

وثائق مماثلة

    أساس مفهوم OLAP (المعالجة التحليلية عبر الإنترنت) - معالجة البيانات التحليلية التشغيلية، ميزات استخدامها على العميل وعلى الخادم. الخصائص العامة للمتطلبات الأساسية لأنظمة OLAP، وكذلك أساليب تخزين البيانات فيها.

    مجردة، وأضاف 10/12/2010

    أولاب: الخصائص العامةوالغرض والأهداف والمهام. تصنيف منتجات OLAP. مبادئ بناء نظام OLAP، مكتبة مكونات Cubeebase. اعتماد أموال عمل العميل والخادم OLAP من الزيادة في مقدار البيانات.

    دورة العمل، وأضاف 12/25/2013

    التخزين الأبدية للبيانات. جوهر وقيمة OLAP (المعالجة التحليلية عبر الإنترنت). قواعد ومستودعات البيانات، خصائصها. هيكل، بنية تخزين البيانات، مورديهم. عدة نصائح لتحسين أداء مكعبات OLAP.

    الفحص، وأضاف 10/23/2010

    بناء نظم تحليل البيانات. بناء خوارزميات تصميم مكعب OLAP وإنشاء طلبات إلى طاولة مدمجة. أولاب تكنولوجيا تحليل البيانات المتعددة الأبعاد. تزويد المستخدمين بمعلومات لإجراء قرارات الإدارة.

    العمل بالطبع، وأضاف 19.09.2008

    معلومات بسيطة معلومات عن OLAP. معالجة البيانات التحليلية التشغيلية. تصنيف منتجات OLAP. متطلبات وسائل المعالجة التحليلية التشغيلية. استخدام قواعد بيانات متعددة الأبعاد في أنظمة المعالجة التحليلية التشغيلية، ومزاياها.

    العمل بالطبع، وأضاف 10.06.2011

    تطوير النظم الفرعية لتحليل موقع الويب باستخدام Microsoft. الوصول والوصول إلى تكنولوجيات OLAP. الجوانب النظرية لتطوير النظام الفرعي لتحليل البيانات في نظام المعلومات لمدينة الموسيقى. تقنية OLAP في النظام الفرعي لتحليل كائن التحليل.

    الدورات الدراسية، وأضاف 11/06/2009

    النظر في أموال OLAP: تصنيف العوامل والمستودعات المعلومات، ومفهوم مكعب البيانات. قرار نظام دعم القرار. تنفيذ البرمجيات لنظام "أبيتورا". إنشاء تقرير ويب باستخدام تقنية خدمات التقارير.

    الدورات الدراسية، وأضاف 05.12.2012

    مستودع البيانات، مبادئ المنظمة. عمليات عمل البيانات. هيكل OLAP، الجوانب الفنية لتخزين البيانات المتعددة الأبعاد. خدمات التكامل، تعبئة التخزين والبيانات تعرض. فرص النظم باستخدام تقنيات Microsoft.

    الدورات الدراسية، وأضاف 05.12.2012

    بناء دائرة تخزين البيانات لمؤسسة تداول. أوصاف الدوائر علاقات التخزين. يعرض معلومات المنتج. إنشاء مكعب OLAP لمزيد من تحليل المعلومات. تطوير الطلبات لتقييم كفاءة السوبر ماركت.

    الفحص، وأضاف 12/19/2015

    تعيين مستودعات البيانات. SAP BW العمارة. بناء التقارير التحليلية بناء على مكعبات OLAP في نظام SAP BW. الاختلافات الرئيسية بين تخزين البيانات ونظام OLTP. مراجعة كرات BEX الوظيفية. إنشاء استعلام في مصمم استعلام BEX.

غرض ورقة مصطلح هي دراسة تكنولوجيا OLAP، مفهوم تنفيذها وهيكلها.

في العالم الحديث شبكات الحاسب وتتيح لك أنظمة الحوسبة تحليل ومعالجة صفائف البيانات الكبيرة.

تعقد كمية كبيرة من المعلومات بشكل كبير البحث عن الحلول، لكنه يتيح لك الحصول على حسابات وتحليل أكثر دقة. لحل مثل هذه المشكلة، هناك فئة كاملة من نظم المعلومات التي تحلل. وتسمى هذه الأنظمة أنظمة دعم القرار (DSS ونظام دعم القرار).

لإجراء تحليل SPPR، يجب أن تتراكم المعلومات معلومات عن طريق مدخلاتها وتخزينها. يمكنك تخصيص ثلاث مهام رئيسية حلها في SPPR:

· إدخال بيانات؛

· مخزن البيانات؛

· تحليل البيانات.

يتم تنفيذ بيانات الدخول في SPPR تلقائيا من أجهزة الاستشعار التي تميز حالة الوسيلة أو العملية، أو من قبل المشغل البشري.

إذا تم تنفيذ إدخال البيانات تلقائيا من أجهزة الاستشعار، يتم تجميع البيانات بواسطة إشارة الاستعداد التي تحدث عند ظهور المعلومات أو بواسطة مسح دوري. إذا تم إجراء الإدخال من قبل شخص، فيجب عليهم تقديم المستخدمين أدوات مريحة لدخول البيانات التي تتحقق منها على صحة المدخلات، وكذلك أداء الحسابات اللازمة.

عند إدخال البيانات في نفس الوقت مشغلين متعددين، من الضروري حل مشاكل التعديل والوصول الموازي لنفس البيانات.

يوفر SPPR بيانات المحللين في شكل تقارير وجداول ورسمية للدراسة والتحليل، وهذا هو السبب في أن هذه الأنظمة تضمن تنفيذ وظائف دعم القرار.

في النظم الفرعية لإدخال البيانات، تسمى OLTP (عند الكتانالخصلة)، يتم تنفيذ البيانات. لتنفيذها، استخدم أنظمة إدارة قواعد البيانات التقليدية (DBMS).

يمكن بناء النظام الفرعي للتحليل على أساس:

· النظم الفرعية للتحليل لاسترجاع المعلومات بناء على DBMS العلائقية والاستفسارات الثابتة باستخدام SQL؛

· النظام الفرعي للتحليل التشغيلي. لتنفيذ مثل هذه الأنظمة الفرعية، يتم تطبيق تكنولوجيا المعالجة التحليلية التشغيلية لبيانات OLAP التي تستخدم مفهوم تمثيل البيانات المتعدد الأبعاد؛

· التحليل الفكري للنظم الفرعية. ينفذ النظام الفرعي هذا أساليب البيانات والخوارزميات.

من وجهة نظر المستخدم، يمثل نظام OLAP وسائل عرض المعلومات المرنة في أقسام مختلفة، الاستلام التلقائي البيانات المجمعة، أداء العمليات التحليلية، التفاصيل، مقارنة مع مرور الوقت. بفضل كل هذا، فإن أنظمة OLAP هي حل مزايا رائعة في إعداد البيانات لجميع أنواع التقارير التجارية، والتي تشير إلى عرض بيانات في مختلف التخفيضات ومستويات مختلفة من التسلسل الهرمي، مثل تقارير المبيعات، أشكال مختلفة من الميزانيات وغيرها. يحتوي نظام OLAP على مزايا كبيرة من هذا العرض التقديمي بأشكال أخرى من تحليل البيانات، بما في ذلك التنبؤ به.

1.2 التعريف أولاب.النظم

تم تسمية تقنية تحليل البيانات المتعدد الأبعاد المتكاملة OLAP. OLAP هو المكون الرئيسي في المنظمة HD.

يمكن تنفيذ وظيفة OLAP بطرق مختلفة، سواء أبسط، مثل تحليل البيانات في تطبيقات Office، وكذلك أنظمة تحليلية أكثر تعقيدا تعتمد على منتجات الخادم.

olap (on-lineanaalticalprocessing) - تكنولوجيا معالجة البيانات التحليلية التشغيلية باستخدام الأدوات والأساليب لجمع البيانات متعددة الأبعاد وتحليلها ودعم عمليات صنع القرار.

الغرض الرئيسي من أنظمة OLAP يدعم الأنشطة التحليلية، الاستعلام التعسفي لمستخدمي المحللين. الغرض من تحليل OLAP هو التحقق من الفرضيات الناشئة.

في عام 1993، مؤسس النهج العلائقي لبناء قاعدة بيانات Edgar Codd مع الشركاء (Codd Edgar، الرياضيات والذاتح IBM)، نشر مقال بدأ بواسطة برنامج Arbor (اليوم هو الشركة الأكثر شهرة "Hyperion Solutions") بعنوان "اعتماد OLAP (المعالجة التحليلية التشغيلية) للمستخدمين المحللين "، والتي يتم فيها صياغة 12 ملامح من تقنية OLAP، والتي استكملت فيما بعد ستة آخرين. أصبحت هذه الأحكام المحتوى الرئيسي للتكنولوجيا الجديدة والوفيقة للغاية.

الملامح الرئيسية للتكنولوجيا OLAP (أساسي):

  • التمثيل المفاهيمي متعدد الأبعاد للبيانات؛
  • التلاعب بديهية البيانات؛
  • توافر تفاصيل البيانات
  • رزمة استخراج البيانات ضد التفسير؛
  • نماذج تحليل OLAP
  • بنية خادم العميل (OLAP متاح من سطح المكتب)؛
  • الشفافية (الوصول الشفاف إلى البيانات الخارجية)؛
  • دعم متعددة اللاعبين.

مميزات خاصة (خاص):

  • معالجة البيانات غير الرسمية؛
  • حفظ النتائج OLAP: تخزينها بشكل منفصل عن البيانات المصدر؛
  • القضاء على القيم المفقودة؛
  • معالجة القيم المفقودة.

ميزات تقديم التقارير (تقرير):

  • الإبلاغ عن المرونة؛
  • أداء التقرير القياسي؛
  • التكوين التلقائي للمستوى المادي لاستخراج البيانات.

إدارة القياس (البعد):

  • عالمية القياسات؛
  • عدد غير محدود من القياسات ومستويات التجميع؛
  • عدد غير محدود من العمليات بين الأبعاد.

تاريخيا، اليوم أن مصطلح "OLAP" لا يعني فقط عرض متعدد الأبعاد للبيانات من المستخدم النهائي، ولكن أيضا عرض تقديمي متعدد الأبعاد للبيانات في قاعدة البيانات المستهدفة. هذا يرجع إلى ظهور مصطلح مستقل "olap olal" (رولاب) و "OLAP متعددة" (مولي).

OLAP SSERVIS هي أداة لتحليل كميات كبيرة من البيانات في الوقت الفعلي. التفاعل مع نظام OLAP، سيكون المستخدم قادرا على ممارسة المشاهدة المرنة للمعلومات، والحصول على أقسام بيانات تعسفية وأداء عمليات تحليلية للتفصيل، والتفيد، من خلال التوزيع، مقارنات الوقت في وقت واحد في العديد من المعلمات. يحدث كل العمل مع OLAP من حيث مجال الموضوع ويسمح لك ببناء مواقف تجارية محمولة إحصائيا.

أدوات البرمجيات OLAP - هذه هي أداة التحليل التشغيليالواردة في المستودع. الميزة الرئيسية هي أن هذه الأموال تركز على استخدام ليست أخصائية في مجال تكنولوجيا المعلومات، وليس خبير إحصائي، ولكن المهنية في مجال التطبيق، الإدارة، القسم، الإدارة، وأخيرا المدير. الوسائل تهدف إلى توصيل التحليلات مع مشكلة وليس مع جهاز كمبيوتروبعد في التين. 6.14 هو OLAP الابتدائي -kub، والذي يسمح بإنتاج تقديرات البيانات لمدة ثلاثة أبعاد.

تتيح لك OLAP -KUB متعدد الأبعاد ونظام خوارزميات المعالجة الإحصائية الرياضية المعنية تحليل بيانات أي تعقيد في أي فترات زمنية.


تين. 6.14.

عند وجود آليات مرنة للتخلص من التلاعب بالبيانات والشاشة المرئية (الشكل 6.15، الشكل 6.16)، تعتبر المدير أولا البيانات من جوانب مختلفة، والتي قد تكون (وقد لا تكون) مرتبطة بالمشكلة التي يتم حلها.

بعد ذلك، يقارن مؤشرات الأعمال المختلفة فيما بينها، في محاولة لتحديد العلاقات الخفية؛ قد ينظر في البيانات عن كثب، تفصيلها، على سبيل المثال، تتحلل في كميات الوقت، من خلال المناطق أو العملاء، أو على العكس من ذلك، لتلخيص تقديم المعلومات لإزالة تفاصيل صرف الانتباه. بعد ذلك مع الوحدة التقدير الإحصائي ونمذجة المحاكاة يتم بناء العديد من الخيارات لتطوير الأحداث، ويتم تحديد الخيار الأكثر قبولا.


تين. 6.15.

يمكن أن تولد شركة الإدارة، على سبيل المثال، من قبل فرضية أن انتشار نمو الأصول في فروع مختلفة من الفروع يعتمد على نسبة المتخصصين التعليم التقني والاقتصادي. للتحقق من هذه الفرضية، يمكن للمدير طلب من المستودع وعرض علاقته لتلك الفروع، والتي من أجل الربع الحالي، انخفض نمو الأصول مقارنة بالعام الماضي بأكثر من 10٪، ولأولئك الذين ارتفعوا أكثر من 25٪. يجب أن تكون قادرا على استخدام مجموعة مختارة بسيطة من القائمة المقترحة. إذا حصلت النتائج على تفكك كبيرتين في مجموعتين ذي صلة، فسيكون ذلك حافزا لمزيد من التحقق من الفرضية الممتدة.

حاليا، تلقى التطور السريع اتجاه يسمى النمذجة الديناميكية (محاكاة ديناميكية)، تنفذ بشكل كامل المبدأ أعلاه fasmi.

باستخدام النمذجة الديناميكية، يبني المحلل نموذجا لوضع أعمال تطوير في الوقت المناسب، من قبل بعض السيناريو. في هذه الحالة، قد تكون نتيجة مثل هذه النمذجة عدة حالات تجارية جديدة تولد شجرة الحلول الممكنة مع تقييم احتمالية وآفاق كل منها.


تين. 6.16.

جدول 6.3 يوضح الخصائص المقارنة تحليل ثابت وديناميكي.

الجدول 6.3.
صفة مميزة تحليل ثابت التحليل الديناميكي
أنواع الأسئلة منظمة الصحة العالمية! لما؟ كم العدد؟ كيف؟ متى؟ أين؟ لماذا هذا؟ ماذا سيحدث لو ...؟ ماذا إذا…؟
وقت الاستجابة غير منتظم ثواني
العمليات النموذجية تعمل مع البيانات تقرير منظم، الرسم البياني، الجدول، الرسم تسلسل التقارير التفاعلية، الرسوم البيانية، أشكال الشاشة. التغيير الديناميكي في مستويات مجموعات التجميع والبيانات
مستوى المتطلبات التحليلية وسط طويل
نوع نماذج الشاشة تحديد أساسا مقدما، منظمة المعرفة من قبل المستخدم، هناك ميزات التخصيص
مستوى تجميع البيانات مفصلة وإجمالي يحددها المستخدم
"العمر" للبيانات تاريخي وحالى تاريخي، الحالي ومتوقع
أنواع الطلبات يمكن التنبؤ بها في الغالب لا يمكن التنبؤ بها - من مناسبة إلى مناسبة
غرض منظم المعالجة التحليلية تحليل التدفقات، النمذجة والبناء توقعات

تقريبا دائما مهمة بناء نظام تحليلي لتحليل البيانات المتعدد الأبعاد هو مهمة البناء نظام معلومات موحد، متفق عليه، بناء على غير متجانس البرمجيات والحلولوبعد وكان بالفعل اختيار الأموال لتنفيذ IP مهمة صعبة للغاية. يجب أن تؤخذ العديد من العوامل في الاعتبار، بما في ذلك التوافق المتبادل لمختلف مكونات البرمجيات وسهولة تطورها واستخدامها وتكاملها وكفاءة الأداء والاستقرار وحتى النماذج والمستوى والعلاقات الواعدة المحتملة لشركات المصنعين المختلفة.

OLAP تطبق أينما كانت هناك مهمة تحليل بيانات متعددة الاستخدامات. بشكل عام، مع وجود بعض الجدول مع البيانات، حيث يوجد عمود وصفي واحد على الأقل وعمدا واحدا مع أرقام، ستعمل عملية OLAP أداة فعالة تحليل وتوليد التقارير. كمثال على تطبيق تقنية OLAP، فكر في دراسة نتائج عملية المبيعات.

أسئلة رئيسية "كم تم بيعها؟"، "ما هو المبلغ الذي تباع؟" يتوسع بمثابة مضاعفات تجارية وتراكم البيانات التاريخية لمجموعة معينة من العوامل، أو تخفيضات: ".. في سانت بطرسبرغ، في موسكو، في الأورال، في سيبيريا ..."، "، في الربع الماضي، مقارنة إلى الحالي "،" .. المورد ومقارنة مع المورد B ... "وهلم جرا.

إجابات على هذه الأسئلة ضرورية لإجراء قرارات الإدارة: حول تغيير النطاق والسعر والإغلاق وفتح المتاجر والفروع والإنهاء وتوقيع العقود مع التجار أو إنهاء الحملات الإعلانية وما إلى ذلك.

إذا حاولت إبراز الأرقام الرئيسية (الحقائق) والتخفيضات (حجج القياس)، والذي يعالج المحلل، في محاولة لتوسيع أو تحسين أعمال الشركة، فإن الجدول سيكون طاولة مناسبة لتحليل المبيعات كقالب يتطلب التعديل المناسب لكل مؤسسة معينة.

زمنوبعد كقاعدة عامة، هذه فترات عدة: سنة، ربع، شهر، عقد من الزمان، الأسبوع، اليوم. تقوم العديد من المطبوعات OLAP تلقائيا بحساب الفترات القديمة من التاريخ وحساب النتائج عليها.

فئة السلعوبعد الفئات قد تكون عدة، أنها تختلف عن كل نوع من أنواع الأعمال: متنوعة، نموذج، نوع التعبئة والتغليف، إلخ. إذا تم بيع منتج واحد فقط أو النطاق صغير جدا، فلا تكون هناك حاجة للفئة.

منتجوبعد في بعض الأحيان يتم تطبيق اسم البضائع (أو الخدمات)، رمز أو مقاله. في الحالات التي يكون فيها النطاق كبير جدا (وبعض الشركات لديها عشرات الآلاف من المواقف في قائمة الأسعار الخاصة بها)، قد لا يتم إجراء التحليل الأولي لجميع أنواع البضائع، ولكن للتواصل مع بعض الفئات المتفق عليها.

منطقةوبعد اعتمادا على عالم الأعمال التجارية، من الممكن أن تضع في اعتبارك القارة، مجموعة من البلدان، البلد، الأراضي، المدينة، المقاطعة، الشارع، جزء من الشارع. بالطبع، إذا كان هناك نقطة تسوق واحدة فقط، فإن هذا البعد مفقود.

تاجروبعد هذا القياس يعتمد أيضا على هيكل وحجم الأعمال. هنا يمكن أن يكون: فرع، متجر، تاجر، مدير المبيعات. في بعض الحالات، يكون البعد مفقود، على سبيل المثال، عندما لا يؤثر البائع على أحجام المبيعات، فإن المتجر هو واحد فقط وما إلى ذلك.

مشتروبعد في بعض الحالات، على سبيل المثال، في تجارة التجزئة، المشتري غير شخصي ولا يوجد بعد، في حالات أخرى هناك معلومات حول المشتري، ومن المهم للمبيعات. قد يحتوي هذا القياس على اسم شركة المشتري أو العديد من التجمعات والخصائص للعملاء: الصناعة ومجموعة المشاريع والمالك وما إلى ذلك .. تحليل هيكل المبيعات لتحديد أهم مكونات في سياق القسم. للقيام بذلك، من المريح استخدامها، على سبيل المثال، رسم تخطيطي "فطيرة" في حالات صعبة عند دراسة 3 قياسات في وقت واحد - "الأعمدة". على سبيل المثال، في متجر تكنولوجيا الكمبيوتر لمجموعة المبيعات من أجهزة الكمبيوتر بلغت 100000 دولار، معدات التصوير الفوتوغرافي - 10000 دولار، المواد الاستهلاكية - 4500 دولار. الخلاصة: يعتمد حجم مبيعات المتجر إلى حد كبير من بيع أجهزة الكمبيوتر (في الواقع، ربما تكون المواد الاستهلاكية ضرورية لبيع أجهزة الكمبيوتر، ولكن هذا بالفعل تحليل التبعيات الداخلية).

تحليل الديناميات ( تحليل الانحدار - الكشف عن الاتجاهات). الكشف عن الاتجاهات، التذبذبات الموسمية. تعمل الديناميات بسرعة الرسم البياني من نوع السطر. على سبيل المثال، سقطت أحجام مبيعات منتجات Intel على مدار العام، وقد نمت مبيعات Microsoft. ربما تحسين رفاهية المشتري المتوسطة، أو تغيير صورة المتجر، ومعه تكوين المشترين. مطلوب إجراء تعديل للنطاق. مثال آخر: لمدة 3 سنوات في فصل الشتاء، يتم تقليل مبيعات كاميرات الفيديو.

تحليل التبعيات (تحليل الارتباط). مقارنة أحجام المبيعات من السلع المختلفة في الوقت المناسب لتحديد النطاق المطلوب - "سلال". للقيام بذلك، من المناسب أيضا استخدام الرسم البياني "السطر". على سبيل المثال، عند الإزالة من نطاق الطابعات خلال الشهرين الأولين، تم اكتشاف انخفاض في مبيعات خراطيش المسحوق.