قائمة طعام
مجاني
التسجيل
الصفحة الرئيسية  /  تشغيل/ أنظمة أولاب. فئات نظم المعلومات

أنظمة أولاب. فئات نظم المعلومات

إجراء

في الآونة الأخيرة ، تمت كتابة الكثير عن OLAP. يمكننا القول أنه كان هناك بعض الازدهار حول هذه التقنيات. صحيح أن هذه الطفرة كانت متأخرة بعض الشيء بالنسبة لنا ، لكن هذا مرتبط بالطبع بالوضع العام في البلاد.

تحتوي أنظمة المعلومات على مستوى المؤسسة ، كقاعدة عامة ، على تطبيقات مصممة للتحليل المعقد متعدد المتغيرات للبيانات ، ودينامياتها ، واتجاهاتها ، وما إلى ذلك. يهدف هذا التحليل في النهاية إلى تسهيل اتخاذ القرار. غالبًا ما تسمى هذه الأنظمة بأنظمة دعم القرار.

عادة ما يكون لأنظمة دعم القرار وسائل لتزويد المستخدم ببيانات مجمعة لعينات مختلفة من المجموعة الأولية في شكل مناسب للإدراك والتحليل. عادةً ما تشكل هذه الوظائف المجمعة مجموعة بيانات متعددة الأبعاد (وبالتالي غير علائقية) (غالبًا ما يطلق عليها hypercube أو metacube) ، تحتوي محاورها على معلمات ، والخلايا - البيانات المجمعة التي تعتمد عليها - ويمكن لهذه البيانات يتم تخزينها أيضًا في جداول علائقية ، لكن في هذه الحالة ، نتحدث عن التنظيم المنطقي للبيانات ، وليس عن التنفيذ المادي لتخزينها). على طول كل محور ، يمكن تنظيم البيانات في تسلسل هرمي يمثل مستويات مختلفة من التفاصيل. بفضل نموذج البيانات هذا ، يمكن للمستخدمين صياغة استعلامات معقدة وإنشاء تقارير واسترداد مجموعات فرعية من البيانات.

تسمى تقنية تحليل البيانات المعقدة متعددة المتغيرات OLAP (المعالجة التحليلية عبر الإنترنت).

OLAP هو عنصر أساسي في تنظيم مستودع البيانات.

تم وصف مفهوم OLAP لأول مرة في عام 1993 من قبل Edgar Codd ، وهو باحث قاعدة بيانات مشهور ومؤلف نموذج البيانات العلائقية.إي. كود ، س. Codd و C.T. Salley ، توفير OLAP (المعالجة التحليلية عبر الإنترنت) لمحللي المستخدمين: تفويض تكنولوجيا المعلومات.تقرير تقني ، 1993).

في عام 1995 ، بناءً على المتطلبات التي حددتها Codd ، تمت صياغة ما يسمى باختبار التحليل السريع للمعلومات المشتركة متعددة الأبعاد (FASMI) ، والذي يتضمن المتطلبات التالية لتطبيقات التحليل متعدد المتغيرات:

· تزويد المستخدم بنتائج التحليل في وقت معقول (لا يزيد عادة عن 5 ثوانٍ) ، حتى على حساب تحليل أقل تفصيلاً ؛

· القدرة على إجراء أي تحليل منطقي وإحصائي نموذجي لهذا التطبيق وحفظه في نموذج يمكن للمستخدم النهائي الوصول إليه ؛

· وصول متعدد المستخدمين إلى البيانات بدعم من آليات القفل المناسبة ووسائل الوصول المصرح بها ؛

· التمثيل المفاهيمي متعدد الأبعاد للبيانات ، بما في ذلك الدعم الكامل للتسلسلات الهرمية والتسلسلات الهرمية المتعددة (هذا مطلب أساسي لـ OLAP) ؛

· القدرة على الوصول إلى أي معلومات ضرورية ، بغض النظر عن حجمها وموقع التخزين.

تجدر الإشارة إلى أنه يمكن تنفيذ وظائف OLAP بطرق مختلفة ، بدءًا من أبسط أدوات تحليل البيانات في التطبيقات المكتبية إلى الأنظمة التحليلية الموزعة القائمة على منتجات الخادم.يمكن للمستخدمين بسهولة عرض البيانات في هيكل متعدد الأبعاد كما هو مطبق على احتياجاتهم الخاصة.

2. ما هو OLAP

OLAP هو اختصار للمعالجة التحليلية عبر الإنترنت ، وهو ليس اسمًا لمنتج معين ، ولكنه اسم لتقنية كاملة. في اللغة الروسية ، من الأنسب الاتصال بمعالجة OLAP التحليلية عبر الإنترنت. على الرغم من أن بعض المنشورات تشير إلى المعالجة التحليلية على أنها عبر الإنترنت وتفاعلية ، فإن صفة "عبر الإنترنت" بأكبر قدر ممكن من الدقة تعكس معنى تقنية OLAP.

يندرج تطوير القيادة للحلول الإدارية في فئة المجالات التي يصعب أتمتتها. ومع ذلك ، توجد اليوم فرصة لمساعدة المدير في تطوير القرارات ، والأهم من ذلك ، الإسراع بشكل كبير في عملية تطوير القرارات واختيارها واعتمادها. يمكنك استخدام OLAP لهذا الغرض.

دعنا نلقي نظرة على كيفية عمل عملية تطوير الحلول عادة.

من الناحية التاريخية ، تعد حلول أتمتة الأنشطة التشغيلية هي الأكثر تطورًا. نحن نتحدث عن أنظمة معالجة بيانات المعاملات (OLTP) ، والتي تسمى ببساطة أنظمة التشغيل. توفر هذه الأنظمة تسجيل بعض الحقائق ، وقصر تخزينها وتخزينها في الأرشيف. يتم توفير أساس هذه الأنظمة من خلال أنظمة إدارة قواعد البيانات العلائقية (RDBMS). تتمثل الطريقة التقليدية في محاولة استخدام أنظمة التشغيل التي تم إنشاؤها بالفعل لدعم اتخاذ القرار. عادة ما يحاولون بناء نظام مطور من الاستفسارات للنظام التشغيلي واستخدام التقارير التي تم الحصول عليها بعد التفسير المباشر لدعم القرار. يمكن إنشاء التقارير على أساس مخصص ، أي يطلب المدير تقريرًا ، وعلى أساس منتظم ، عندما يتم إنشاء التقارير عند الوصول إلى حدث أو وقت ما. على سبيل المثال ، قد تبدو عملية دعم القرار التقليدية كما يلي: يذهب المدير إلى متخصص في تكنولوجيا المعلومات ويشاركه سؤاله. يقوم أخصائي CIO بعد ذلك ببناء طلب إلى نظام التشغيل ، ويتلقى تقريرًا إلكترونيًا ، ويفسره ، ثم يرسله إلى فريق الإدارة. بالطبع ، يوفر مثل هذا المخطط إلى حد ما دعم القرار ، لكنه يتميز بكفاءة منخفضة للغاية وعدد كبير من العيوب. يتم استخدام القليل من البيانات لدعم القرارات الحاسمة للمهمة. هناك مشاكل أخرى أيضا. هذه العملية بطيئة للغاية ، لأن عملية كتابة الطلبات وتفسير التقرير الإلكتروني هي عملية طويلة. يستغرق الأمر عدة أيام ، في وقت قد يحتاج فيه القائد إلى اتخاذ قرار الآن ، على الفور. إذا أخذنا في الاعتبار أن المدير ، بعد تلقي التقرير ، قد يكون مهتمًا بسؤال آخر (على سبيل المثال ، توضيح أو طلب النظر في البيانات في سياق مختلف) ، فيجب تكرار هذه الدورة البطيئة ، ومنذ عملية التحليل ستحدث بيانات أنظمة التشغيل بشكل متكرر ، حتى يتم إنفاق المزيد من الوقت. مشكلة أخرى هي مشكلة المجالات المختلفة لنشاط متخصص تكنولوجيا المعلومات والقائد ، الذي قد يفكر في فئات مختلفة ، ونتيجة لذلك ، لا يفهم كل منهما الآخر. ثم ستكون هناك حاجة إلى تكرارات تنقية إضافية ، وهذا هو الوقت مرة أخرى ، وهذا لا يكفي دائمًا. مسألة أخرى مهمة هي تعقيد التقارير لفهم. ليس لدى المدير الوقت لاختيار الأرقام ذات الأهمية من التقرير ، خاصة أنه قد يكون هناك الكثير منها (تذكر التقارير الضخمة متعددة الصفحات التي يتم فيها استخدام عدة صفحات بالفعل ، والباقي - فقط في حالة). نلاحظ أيضًا أن أعمال الترجمة الفورية تقع في الغالب على عاتق المتخصصين في أقسام المعلومات. أي أن الاختصاصي المختص يصرف انتباهه عن العمل الروتيني وغير الفعال لرسم المخططات ، وما إلى ذلك ، والذي ، بالطبع ، لا يمكن أن يكون له تأثير إيجابي على مؤهلاته. بالإضافة إلى ذلك ، لا يخفى على أحد أن هناك أشخاصًا متمنّين في سلسلة الترجمة التفسيرية يهتمون بتشويه المعلومات الواردة عمداً.

إن أوجه القصور المذكورة أعلاه تجعل المرء يفكر في كل من الكفاءة الكلية للنظام التشغيلي والتكاليف المرتبطة بوجوده ، حيث اتضح أن تكاليف إنشاء نظام تشغيلي لا يتم تعويضها بشكل كافٍ من خلال كفاءة عمله.

في الواقع ، هذه المشاكل ليست نتيجة لسوء نوعية نظام التشغيل أو بنيته الرديئة. تكمن جذور المشاكل في الاختلاف الأساسي بين الأنشطة التشغيلية المؤتمتة بواسطة نظام التشغيل وأنشطة التطوير وصنع القرار. يكمن هذا الاختلاف في حقيقة أن بيانات الأنظمة التشغيلية هي مجرد سجلات لبعض الأحداث التي وقعت ، والحقائق ، ولكنها ليست بأي حال من الأحوال معلومات بالمعنى العام للكلمة. المعلومات هي التي تقلل من عدم اليقين في أي منطقة. وسيكون من الجيد جدًا أن تقلل المعلومات من عدم اليقين في مجال إعداد القرارات. سيئ السمعة E.F. Codd ، رائد تقنيات إدارة قواعد البيانات العلائقية في السبعينيات: "في حين أن أنظمة إدارة قواعد البيانات العلائقية متاحة للمستخدمين ، لم يُنظر إليها أبدًا على أنها توفر وظائف قوية للتوليف والتحليل والدمج (وظائف تسمى تحليل البيانات متعدد المتغيرات).)" . يتعلق الأمر على وجه التحديد بتوليف المعلومات ، وحول كيفية تحويل بيانات أنظمة التشغيل إلى معلومات وحتى إلى تقييمات نوعية. يتيح لك OLAP إجراء هذا التحويل.

يعتمد OLAP على فكرة نموذج بيانات متعدد الأبعاد. التفكير البشري متعدد الأبعاد من حيث التعريف. عندما يطرح الشخص أسئلة ، فإنه يفرض قيودًا ، وبالتالي يصوغ أسئلة بأبعاد عديدة ، وبالتالي فإن عملية التحليل في نموذج متعدد الأبعاد قريبة جدًا من واقع التفكير البشري. وفقًا للأبعاد الموجودة في النموذج متعدد الأبعاد ، يتم تأجيل العوامل التي تؤثر على أنشطة المؤسسة (على سبيل المثال: الوقت ، والمنتجات ، وأقسام الشركة ، والجغرافيا ، وما إلى ذلك). وبالتالي ، يتم الحصول على مكعب مفرط (بالطبع ، الاسم ليس جيدًا جدًا ، نظرًا لأن المكعب يُفهم عادةً على أنه شكل ذو حواف متساوية ، وهو في هذه الحالة بعيدًا عن الحالة) ، والذي يتم ملؤه بعد ذلك بمؤشرات نشاط المنشأة (أسعار ، مبيعات ، خطة ، أرباح ، خسائر ... إلخ). يمكن تنفيذ هذا الملء مع كل من البيانات الحقيقية لأنظمة التشغيل ، والتنبؤ به على أساس البيانات التاريخية. يمكن أن تكون أبعاد المكعب التشعبي معقدة وهرمية ويمكن إنشاء علاقات بينهما. في عملية التحليل ، يمكن للمستخدم تغيير وجهة نظر البيانات (ما يسمى بعملية تغيير العرض المنطقي) ، وبالتالي عرض البيانات في أقسام مختلفة وحل مشاكل محددة. يمكن إجراء عمليات مختلفة على المكعبات ، بما في ذلك التنبؤ والتخطيط الشرطي (تحليل ماذا لو). علاوة على ذلك ، يتم تنفيذ العمليات مرة واحدة على المكعبات ، أي منتج ، على سبيل المثال ، سينتج عن منتج hypercube ، كل خلية منها هي نتاج خلايا المكعبات المفرطة المضاعفة المقابلة. بطبيعة الحال ، من الممكن إجراء عمليات على المكعبات المفرطة بأعداد مختلفة من الأبعاد.

3. تاريخ إنشاء تقنية OLAP

إن فكرة معالجة البيانات على المصفوفات متعددة الأبعاد ليست جديدة. يعود تاريخه إلى عام 1962 ، عندما نشر كين إيفرسون كتابه A Programming Language (APL). تم تنفيذ أول تطبيق عملي لـ APL في أواخر الستينيات من قبل شركة IBM. APL هي لغة أنيقة جدًا ومحددة رياضيًا مع متغيرات متعددة الأبعاد وعمليات قابلة للمعالجة. كان من المفترض أن تكون أداة التحويل القوية متعددة الأبعاد الأصلية مقارنةً بلغات البرمجة العملية الأخرى.

ومع ذلك ، لم يتم استخدام الفكرة على نطاق واسع لفترة طويلة ، حيث لم يحن الوقت بعد للواجهات الرسومية ، وأجهزة الطباعة عالية الجودة ، وعرض الأحرف اليونانية يتطلب شاشات خاصة ولوحات مفاتيح وأجهزة طباعة. في وقت لاحق ، تم استخدام الكلمات الإنجليزية أحيانًا لتحل محل المشغلين اليونانيين ، لكن دعاة نقاء APL أحبطوا محاولات تعميم لغتهم المفضلة. استهلك APL أيضًا موارد الماكينة. كان استخدامه باهظ الثمن في تلك الأيام. كانت البرامج بطيئة جدًا في التنفيذ ، بالإضافة إلى التكلفة ذاتها لتشغيلها. استغرق الأمر الكثير من الذاكرة ، في ذلك الوقت مجرد مجلدات مروعة (حوالي 6 ميغا بايت).

ومع ذلك ، فإن الإحباط من هذه الأخطاء الأولية لم يقضي على الفكرة. تم استخدامه في العديد من تطبيقات الأعمال في السبعينيات والثمانينيات. العديد من هذه التطبيقات لها ميزات أنظمة المعالجة التحليلية الحديثة. على سبيل المثال ، طورت شركة IBM نظام تشغيل لـ APL يسمى VSPC ، والذي اعتبره بعض الناس بيئة مثالية للاستخدام الشخصي حتى تصبح جداول البيانات في كل مكان.

لكن APL كان من الصعب جدًا استخدامه ، خاصة أنه في كل مرة كان هناك تناقضات بين اللغة نفسها والأجهزة التي تم إجراء محاولات لتطبيقها عليها.

في الثمانينيات ، أصبحت APL متاحة على الأجهزة الشخصية ولكنها لم تجد استخدامها في السوق. كان البديل هو برمجة تطبيقات متعددة الأبعاد باستخدام المصفوفات بلغات أخرى. كانت هذه مهمة صعبة للغاية حتى بالنسبة للمبرمجين المحترفين ، مما أجبرهم على انتظار الجيل التالي من منتجات البرامج متعددة الأبعاد.

في عام 1972 ، وجدت العديد من منتجات البرامج التطبيقية متعددة الأبعاد المستخدمة سابقًا للأغراض التعليمية استخدامًا تجاريًا: Express. لا يزال في شكل معاد كتابته بالكامل حتى الآن ، لكن المفاهيم الأصلية للسبعينيات لم تعد ذات صلة. تعد Express واحدة من أكثر تقنيات OLAP شيوعًا في التسعينيات اليوم ، وستدفعها Oracle (r) للأمام وتضيف ميزات جديدة.

ظهرت المزيد من المنتجات متعددة الأبعاد في الثمانينيات. في بداية العقد - منتج يسمى Stratagem ، أطلق عليه فيما بعد Acumate (مملوك الآن من قبل شركة Kenan Technologies) ، والذي كان لا يزال يتم الترويج له حتى أوائل التسعينيات ، ولكن اليوم ، على عكس Express ، لا يتم استخدامه عمليًا.

كان Comshare System W منتجًا متعدد الأبعاد بأسلوب مختلف. تم تقديمه في عام 1981 ، وكان أول من يقدم المزيد من تطوير التطبيقات المالية للمستخدم النهائي. لقد جلب العديد من المفاهيم التي لم يتم تكييفها بشكل جيد ، مثل القواعد غير الإجرائية تمامًا ، وعرض ملء الشاشة وتحرير البيانات متعددة الأبعاد ، وإعادة الحساب التلقائي ، وتكامل الدُفعات مع البيانات العلائقية. ومع ذلك ، كان نظام Comshare System W ثقيلًا بدرجة كافية بالنسبة للأجهزة في ذلك الوقت مقارنةً بالمنتجات الأخرى ، وتم استخدامه بشكل أقل في المستقبل ، وتم بيعه بشكل أقل ، ولم يتم إجراء أي تحسينات على المنتج. على الرغم من أنه لا يزال متاحًا على UNIX اليوم ، إلا أنه ليس خادم عميل ، مما لا يزيد من عرضه في السوق التحليلي. في أواخر الثمانينيات من القرن الماضي ، أصدرت شركة Comshare منتجًا لنظام التشغيل DOS والإصدارات الأحدث لنظام التشغيل Windows. تم تسمية هذه المنتجات باسم Commander Prism واستخدمت نفس المفاهيم مثل System W.

منتج إبداعي آخر في أواخر الثمانينيات كان يسمى الاستعارة. كان يستهدف المسوقين المحترفين. كما اقترح العديد من المفاهيم الجديدة التي بدأ استخدامها على نطاق واسع اليوم: الحوسبة بين العميل والخادم ، واستخدام نموذج متعدد الأبعاد في البيانات العلائقية ، وتطوير التطبيقات الموجه للكائنات. ومع ذلك ، لم تكن أجهزة الماكينة الشخصية القياسية في ذلك الوقت قادرة على العمل مع Metaphor واضطر البائعون إلى تطوير معاييرهم الخاصة للآلات والشبكات الشخصية. بدأت Metaphor تدريجيًا في العمل بنجاح على أجهزة الكمبيوتر الشخصية التسلسلية ، ولكن المنتج تم تصنيعه حصريًا لنظام التشغيل OS / 2 ولديه واجهة مستخدم رسومية خاصة به.

دخلت Metaphor بعد ذلك في تحالف تسويقي مع IBM ، والذي تم الاستحواذ عليه لاحقًا. في منتصف عام 1994 ، قررت شركة IBM دمج تقنية Metaphor (أعيدت تسميتها DIS) مع تقنياتها المستقبلية وبالتالي إنهاء التمويل لخط منفصل ، لكن العملاء أعربوا عن استيائهم وطالبوا بدعم مستمر للمنتج. استمر الدعم للعملاء الباقين ، وأعادت شركة IBM إصدار المنتج تحت اسم جديد DIS ، والذي ، مع ذلك ، لم يجعله شائعًا. لكن المفاهيم الإبداعية والمبتكرة للاستعارة لم تُنسى وهي ظاهرة في العديد من المنتجات اليوم.

في منتصف الثمانينيات ، وُلد مصطلح EIS (نظام المعلومات التنفيذي). كان أول منتج يوضح هذا الاتجاه بوضوح هو مركز قيادة الطيار. لقد كان منتجًا سمح بالحوسبة التعاونية ، وهو ما نسميه حوسبة العميل والخادم اليوم. نظرًا لأن قوة أجهزة الكمبيوتر الشخصية في الثمانينيات كانت محدودة ، كان المنتج "مرتكزًا على الخادم" للغاية ، لكن المبدأ لا يزال شائعًا للغاية حتى يومنا هذا. لم تبيع Pilot مركز القيادة لفترة طويلة ، ولكنها قدمت العديد من المفاهيم التي يمكن تعلمها في منتجات OLAP الحالية ، بما في ذلك التوقيت التلقائي ، وحوسبة العميل / الخادم متعددة الأبعاد ، والتحكم المبسط في عملية التحليل (الماوس ، والشاشات الحساسة ، وما إلى ذلك). تمت إعادة تطبيق بعض هذه المفاهيم لاحقًا في خادم التحليل التجريبي.

في أواخر الثمانينيات ، كانت جداول البيانات هي الأداة المهيمنة في السوق لتوفير التحليل للمستخدمين النهائيين. تم تقديم أول جدول بيانات متعدد الأبعاد بواسطة Compete. تم تسويقه كمنتج مكلف للغاية للمتخصصين ، لكن البائعين لم يوفروا فرصة اقتناص السوق لهذا المنتج ، واكتسبت شركة Computer Associates حقوقه مع منتجات أخرى ، بما في ذلك Supercalc و 20/20. كان التأثير الرئيسي للاستحواذ على CA Compete هو الانخفاض الحاد في سعره وإزالة حماية النسخ ، مما ساهم بشكل طبيعي في توزيعه. ومع ذلك ، لم تكن ناجحة. تقع المنافسة في قلب Supercalc 5 ، ولكن لم يتم الترويج لجانبها متعدد الأبعاد. لا يزال تطبيق Compete القديم مستخدمًا في بعض الأحيان نظرًا لحقيقة أنه تم استثمار الكثير من الأموال فيه في وقت واحد.

كان Lotus هو التالي لمحاولة الدخول إلى سوق جداول البيانات متعددة الأبعاد من خلال تحسين ، والذي يعمل على جهاز NeXT. كفل هذا ، على الأقل ، أن مبيعات 1-2-3 لم تنخفض ، ولكن عندما تم إصدارها في النهاية لنظام التشغيل Windows ، كان لبرنامج Excel بالفعل حصة كبيرة في السوق ، مما منع لوتس من إجراء أي تغييرات على توزيع السوق. قامت Lotus ، مثل CA مع Compete ، بنقل تحسين إلى الطرف الأدنى من السوق ، ولكن هذا لم يكن شرطًا أساسيًا لتقدم السوق بنجاح ، ولم تستمر التطورات الجديدة في هذا المجال. اتضح أن مستخدمي الكمبيوتر الشخصي يفضلون جداول البيانات 1-2-3 ولم يكونوا مهتمين بقدرات جديدة متعددة الأبعاد إذا لم تكن متوافقة تمامًا مع جداول البيانات القديمة. وبالمثل ، فإن مفاهيم جداول البيانات الصغيرة لسطح المكتب المقدمة كتطبيقات شخصية لم تثبت حقًا أنها مفيدة وترسخت في عالم الأعمال الحقيقي. سلكت Microsoft (r) هذا المسار مضيفةً جداول PivotTables (تسمى في النسخة الروسية "الجداول المحورية") إلى Excel. في حين استفاد عدد قليل من مستخدمي Excel من هذه الميزة ، فمن المحتمل أن تكون الحقيقة الوحيدة هي أن إمكانات التحليل متعدد الأبعاد مستخدمة على نطاق واسع في العالم ، وذلك ببساطة بسبب وجود العديد من مستخدمي Excel في العالم.

4. OLAP ، ROLAP ، MOLAP ...

من المعروف أنه عندما نشر Codd قواعده لبناء نظم إدارة قواعد البيانات العلائقية في عام 1985 ، تسببت في رد فعل قوي وكان لها تأثير قوي على صناعة نظم إدارة قواعد البيانات بشكل عام. ومع ذلك ، قلة من الناس يعرفون أنه في عام 1993 نشرت Codd عملاً بعنوان "OLAP للمستخدمين التحليليين: ما يجب أن يكون". في ذلك ، حدد المفاهيم الأساسية للمعالجة التحليلية عبر الإنترنت وحدد 12 قاعدة يجب أن تلبيها المنتجات التي تتيح المعالجة التحليلية عبر الإنترنت.

هذه هي القواعد (يتم الاحتفاظ بالنص الأصلي حيثما أمكن ذلك):

1. التمثيل المفاهيمي متعدد الأبعاد. يرى المستخدم المحلل أن عالم المؤسسة متعدد الأبعاد في طبيعته. وفقًا لذلك ، يجب أن يكون نموذج OLAP متعدد الأبعاد في جوهره. الرسم التخطيطي المفاهيمي متعدد الأبعاد أو العرض المخصص يسهل النمذجة والتحليل وكذلك الحساب.

2. الشفافية. بغض النظر عما إذا كان منتج OLAP جزءًا من أموال المستخدم أم لا ، يجب أن تكون هذه الحقيقة شفافة للمستخدم. إذا تم توفير OLAP بواسطة حوسبة خادم العميل ، فيجب أن تكون هذه الحقيقة أيضًا ، إذا أمكن ، غير مرئية للمستخدم. يجب تقديم OLAP في سياق بنية مفتوحة حقًا ، مما يسمح للمستخدم ، أينما كان ، بالاتصال بالخادم باستخدام أداة تحليلية. بالإضافة إلى ذلك ، يجب تحقيق الشفافية عندما تتفاعل الأداة التحليلية مع بيئات قواعد البيانات المتجانسة وغير المتجانسة.

3. التوفر. يجب أن يكون مستخدم محلل OLAP قادرًا على إجراء التحليل بناءً على مخطط مفاهيمي مشترك يحتوي على بيانات على مستوى المؤسسة في قاعدة بيانات علائقية ، بالإضافة إلى بيانات من قواعد البيانات القديمة وطرق الوصول المشتركة ونموذج تحليلي مشترك. هذا يعني أن OLAP يجب أن يوفر منطقه الخاص للوصول في بيئة قاعدة بيانات غير متجانسة وإجراء تحويلات مناسبة لتقديم البيانات إلى المستخدم. علاوة على ذلك ، يجب أن تفكر مسبقًا في مكان وكيفية ، وأنواع تنظيم البيانات المادية التي سيتم استخدامها بالفعل. يجب أن يصل نظام OLAP إلى البيانات المطلوبة بالفعل فقط ، ولا يطبق مبدأ قمع المطبخ العام ، والذي يستلزم إدخالاً غير ضروري.

4. إنتاجية متسقة عند تطوير التقارير. إذا زاد عدد الأبعاد أو حجم قاعدة البيانات ، يجب ألا يشعر المستخدم المحلل بأي تدهور كبير في الأداء. يعد الأداء المتسق أمرًا ضروريًا لدعم المستخدم النهائي بسهولة الاستخدام والحد من تعقيد OLAP. إذا واجه محلل المستخدم اختلافات كبيرة في الأداء وفقًا لعدد الأبعاد ، فسوف يسعى إلى تعويض هذه الاختلافات باستراتيجية تصميم ، مما سيؤدي إلى تقديم البيانات بطرق أخرى غير الطريقة التي يجب أن تكون بها البيانات حقًا. قدم. إن تخصيص الوقت للتجول في النظام للتعويض عن عدم كفايته ليس ما تم تصميم منتجات التحليلات من أجله.

5. هندسة العميل الخادم. معظم البيانات التي يجب معالجتها بشكل تحليلي عبر الإنترنت اليوم موجودة في حواسيب كبيرة ويمكن الوصول إليها عبر جهاز كمبيوتر. هذا يعني ، بالتالي ، أن منتجات OLAP يجب أن تكون قادرة على العمل في بيئة خادم العميل. من وجهة النظر هذه ، من الضروري أن يكون مكون الخادم للأداة التحليلية "ذكيًا" إلى حد كبير بحيث يمكن للعملاء المختلفين الاتصال بالخادم بأقل قدر من المتاعب وبرمجة التكامل. يجب أن يكون الخادم "الذكي" قادرًا على إجراء التعيين والدمج بين مخططات قاعدة البيانات المنطقية والمادية غير المناسبة. سيوفر هذا الشفافية ويبني مخططًا مفاهيميًا ومنطقيًا وماديًا شاملاً.

6. تعددية الأبعاد العامة. يجب تطبيق كل بُعد بغض النظر عن هيكله وقدراته التشغيلية. يمكن توفير قدرات تشغيلية إضافية لأبعاد محددة ، وبما أن الأبعاد متناظرة ، يمكن توفير وظيفة واحدة لأي بُعد. لا ينبغي تحيز هياكل البيانات الأساسية والصيغ وتنسيقات التقارير تجاه أي بُعد.

7. الإدارة الديناميكية لمصفوفات متفرقة. يجب أن يتكيف التصميم المادي لأداة OLAP تمامًا مع النموذج التحليلي المحدد للإدارة المثلى للمصفوفات المتفرقة. لأي مصفوفة متفرقة معينة ، هناك مخطط فيزيائي مثالي واحد وواحد فقط. يوفر هذا المخطط أقصى كفاءة للذاكرة وقابلية تشغيل المصفوفة ، ما لم تكن مجموعة البيانات بأكملها بالطبع غير مناسبة للذاكرة. يجب تكوين الفيزياء الأساسية لأداة OLAP لأي مجموعة فرعية من الأبعاد ، بأي ترتيب ، للعمليات العملية باستخدام النماذج التحليلية الكبيرة. يجب أن تتغير الموصِّل المادي أيضًا ديناميكيًا وأن تحتوي على أنواع مختلفة من الآليات ، مثل: الحساب المباشر ، والأشجار B والمشتقات ، والتجزئة ، والقدرة على الجمع بين هذه الآليات إذا لزم الأمر. التباين (يقاس كنسبة مئوية من الخلايا الفارغة لكل ما هو ممكن) هو أحد خصائص انتشار البيانات. يمكن أن يؤدي عدم القدرة على التحكم في التباين إلى جعل كفاءة العمليات غير قابلة للتحقيق. إذا لم تتمكن أداة OLAP من التحكم في توزيع قيم البيانات التي تم تحليلها وتنظيمها ، فإن النموذج الذي يدعي أنه عملي ، استنادًا إلى العديد من مسارات وأبعاد التوحيد ، قد يكون في الواقع غير ضروري ويائس.

8. دعم متعدد المستخدمين. في كثير من الأحيان ، يحتاج العديد من المستخدمين التحليليين إلى العمل مع نفس النموذج التحليلي أو إنشاء نماذج مختلفة من نفس البيانات. لذلك ، يجب أن توفر أداة OLAP إمكانية المشاركة (الاستعلام والمكمل) والتكامل والأمان.

9. عمليات الانتقال غير محدودة. تمثل مستويات التجميع ومسارات التوحيد المتنوعة ، نظرًا لطبيعة التدرج الهرمي ، العلاقات التابعة في نموذج أو تطبيق OLAP. لذلك ، يجب أن تتضمن الأداة نفسها الحسابات المناسبة وألا تطلب من المستخدم المحلل إعادة تعريف تلك الحسابات والعمليات. تتطلب الحسابات التي لا تتبع من هذه العلاقات الموروثة تحديد صيغ مختلفة وفقًا لبعض اللغة المعمول بها. يمكن أن تسمح مثل هذه اللغة بحساب ومعالجة البيانات من أي بُعد وعدم تقييد العلاقة بين خلايا البيانات ، وعدم الانتباه إلى عدد سمات البيانات الشائعة لخلايا معينة.

10. معالجة بيانات بديهية. يجب تطبيق إعادة توجيه مسارات الدمج والتفاصيل والتوسيع والمعالجات الأخرى التي تنظمها مسارات الدمج من خلال إجراء منفصل على خلايا النموذج التحليلي ، ويجب ألا تتطلب استخدام نظام قائمة أو إجراءات متعددة أخرى مع واجهة المستخدم. يجب أن يحتوي منظور المستخدم المحلل للأبعاد المحددة في النموذج التحليلي على جميع المعلومات اللازمة لتنفيذ الإجراءات المذكورة أعلاه.

11. خيارات إعداد التقارير المرنة. يعد تحليل البيانات وتقديمها أمرًا بسيطًا عندما تكون صفوف وأعمدة وخلايا البيانات التي سيتم مقارنتها بصريًا مع بعضها البعض قريبة من بعضها البعض أو وفقًا لبعض الوظائف المنطقية التي تحدث في المؤسسة. يجب أن تمثل أدوات إعداد التقارير البيانات المركبة أو المعلومات الناتجة عن نموذج البيانات في أي اتجاه محتمل. هذا يعني أن الصفوف أو الأعمدة أو الصفحات يجب أن تظهر من 0 إلى N أبعاد في نفس الوقت ، حيث N هو عدد الأبعاد في النموذج التحليلي بأكمله. بالإضافة إلى ذلك ، يجب أن يكون كل بُعد محتوى معروض في سجل أو عمود أو صفحة واحدة قادرًا أيضًا على إظهار أي مجموعة فرعية من العناصر (القيم) المضمنة في البعد ، بأي ترتيب.

12. أبعاد وعدد غير محدود من مستويات التجميع. أظهر التحقيق في العدد المحتمل للقياسات المطلوبة المطلوبة في نموذج تحليلي أنه يمكن استخدام ما يصل إلى 19 قياسًا في وقت واحد. ومن هنا جاءت التوصية القوية بأن تكون الأداة التحليلية قادرة على توفير 15 بُعدًا على الأقل في وقت واحد ويفضل أن يكون ذلك 20. علاوة على ذلك ، لا ينبغي تقييد كل بُعد من الأبعاد العامة بعدد مستويات التجميع المحددة بواسطة المستخدم ومسارات التوحيد التي يحددها المستخدم المحلل.

في الواقع ، يتبع مطورو منتجات OLAP اليوم هذه القواعد ، أو على الأقل يسعون لاتباعها. يمكن اعتبار هذه القواعد الأساس النظري للمعالجة التحليلية التشغيلية ، ومن الصعب الجدال معها. في وقت لاحق ، نشأت العديد من العواقب من القواعد الاثني عشر ، والتي ، مع ذلك ، لن نذكرها ، حتى لا نعقد القصة بلا داع.

دعنا نلقي نظرة فاحصة على كيفية اختلاف منتجات OLAP في تنفيذها المادي.

كما هو مذكور أعلاه ، يعتمد OLAP على فكرة معالجة البيانات على الهياكل متعددة الأبعاد. عندما نقول OLAP ، فإننا نعني أن بنية البيانات لمنتج تحليلي متعددة الأبعاد منطقيًا. كيف يتم تنفيذ هذا بالضبط هو أمر آخر. هناك نوعان رئيسيان من المعالجة التحليلية ، والتي تشمل منتجات معينة.

MOLAP ... متعدد الأبعاد OLAP نفسه. يعتمد المنتج على بنية بيانات غير علائقية توفر تخزينًا متعدد الأبعاد ومعالجة وعرض البيانات. وفقًا لذلك ، تسمى قواعد البيانات متعددة الأبعاد. عادةً ما تحتوي المنتجات التي تنتمي إلى هذه الفئة على خادم قاعدة بيانات متعدد الأبعاد. يتم اختيار البيانات في عملية التحليل حصريًا من هيكل متعدد الأبعاد. هذا الهيكل ذو كفاءة عالية.

رولاب ... OLAP العلائقية. كما يوحي الاسم ، يتم تنفيذ الهيكل متعدد الأبعاد في هذه الأدوات بواسطة الجداول العلائقية. ويتم اختيار البيانات في عملية التحليل ، على التوالي ، من قاعدة البيانات العلائقية بواسطة الأداة التحليلية.

عيوب ومزايا كل نهج ، بشكل عام ، واضحة. يوفر OLAP متعدد الأبعاد أداءً أفضل ، ولكن لا يمكن استخدام الهياكل لمعالجة كميات كبيرة من البيانات ، لأن الأبعاد الكبيرة ستتطلب موارد أجهزة كبيرة ، وفي الوقت نفسه ، يمكن أن يكون تباين المكعبات المفرطة مرتفعًا جدًا ، وبالتالي ، استخدام قدرات الأجهزة لن يكون له ما يبرره. على العكس من ذلك ، يوفر OLAP العلاقي معالجة على صفائف كبيرة من البيانات المخزنة ، حيث أنه من الممكن توفير تخزين أكثر اقتصادا ، ولكنه في نفس الوقت يخسر بشكل كبير سرعة العمل متعدد الأبعاد. أدى هذا التفكير إلى تحديد فئة جديدة من الأدوات التحليلية - HOLAP. هذه معالجة تحليلية مختلطة عبر الإنترنت. تتيح لك أدوات هذه الفئة الجمع بين كلا النهجين - العلائقية والمتعددة الأبعاد. يمكن الوصول إلى بيانات قاعدة البيانات متعددة الأبعاد والبيانات العلائقية.

هناك نوع آخر غريب إلى حد ما من المعالجة التحليلية عبر الإنترنت - DOLAP. هذا هو سطح المكتب OLAP. نحن نتحدث عن مثل هذه المعالجة التحليلية ، حيث تكون المكعبات المفرطة صغيرة ، وأبعادها صغيرة ، والاحتياجات متواضعة ، ولمثل هذه المعالجة التحليلية ، يكفي وجود آلة شخصية على سطح المكتب.

تسمح لك المعالجة التحليلية التشغيلية بتبسيط وتسريع عملية التحضير واتخاذ القرار من قبل موظفي الإدارة. تخدم المعالجة التحليلية عبر الإنترنت الغرض من تحويل البيانات إلى معلومات. وهي تختلف اختلافًا جوهريًا عن عملية دعم القرار التقليدية ، والتي غالبًا ما تستند إلى النظر في التقارير المنظمة. بالقياس ، الفرق بين التقارير المنظمة و OLAP هو نفسه بين القيادة في جميع أنحاء المدينة بالترام وبالسيارة. عندما تركب ترامًا ، فإنه يتحرك على طول القضبان ، مما لا يسمح لك برؤية المباني البعيدة جيدًا ، بل وأكثر من ذلك للاقتراب منها. على العكس من ذلك ، تمنحك قيادة السيارة الخاصة حرية الحركة الكاملة (بالطبع ، يجب مراعاة قواعد المرور). يمكنك القيادة إلى أي مبنى والوصول إلى الأماكن التي لا تعمل فيها عربات الترام.

التقارير المنظمة هي القضبان التي تعيق حرية إعداد القرارات. OLAP هي وسيلة لحركة المرور الفعالة على طرق المعلومات السريعة.

مقدمة

في عصرنا هذا ، لا يمكن لأي منظمة تقريبًا الاستغناء عن أنظمة إدارة قواعد البيانات ، خاصة بين تلك التي تركز تقليديًا على التفاعل مع العملاء. البنوك وشركات التأمين وشركات الطيران وشركات النقل الأخرى وسلاسل المتاجر الكبرى وشركات الاتصالات والتسويق ومؤسسات الخدمة وغيرها - جميعهم يجمعون ويخزنون جيجا بايت من البيانات حول العملاء والمنتجات والخدمات في قواعد بياناتهم. قيمة هذه المعلومات لا شك فيها. تسمى قواعد البيانات هذه العملياتية أو المعاملات لأنها تتميز بعدد كبير من المعاملات الصغيرة ، أو عمليات القراءة والكتابة. تسمى أنظمة الكمبيوتر التي تسجل المعاملات والوصول الفعلي إلى قواعد بيانات المعاملات بشكل شائع أنظمة معالجة المعاملات عبر الإنترنت (OLTP) أو أنظمة المحاسبة.

يتم ضبط وتحسين أنظمة المحاسبة لتنفيذ أكبر عدد ممكن من المعاملات في فترات زمنية قصيرة. عادةً ما تكون العمليات الفردية صغيرة جدًا وغير مرتبطة ببعضها البعض. ومع ذلك ، يمكن استخدام كل سجل بيانات يميز التفاعل مع العميل (دعوة للدعم ، أو معاملة نقدية ، أو طلب كتالوج ، أو زيارة موقع الشركة على الويب ، وما إلى ذلك) للحصول على معلومات جديدة نوعياً ، أي لإنشاء التقارير و تحليل نشاط الشركة ....

عادة ما تكون مجموعة الوظائف التحليلية في أنظمة المحاسبة محدودة للغاية. تجعل المخططات المستخدمة في تطبيقات OLTP من الصعب إنشاء تقارير بسيطة ، نظرًا لأن البيانات تنتشر في أغلب الأحيان على العديد من الجداول ، ويجب إجراء الصلات المعقدة لتجميعها. كقاعدة عامة ، تكون محاولات إنشاء تقارير معقدة حسابية مكثفة وتؤدي إلى خسائر في الأداء.

بالإضافة إلى ذلك ، تخزن أنظمة المحاسبة البيانات المتغيرة باستمرار. أثناء جمع المعاملات ، تتغير الإجماليات بسرعة كبيرة ، لذلك قد يؤدي إجراء تحليلين على فترات من عدة دقائق إلى نتائج مختلفة. في أغلب الأحيان ، سيتم إجراء التحليل في نهاية الفترة المشمولة بالتقرير ، وإلا فقد يتم تشويه الصورة. بالإضافة إلى ذلك ، يمكن تخزين البيانات المطلوبة للتحليل في عدة أنظمة.

تتطلب بعض التحليلات تغييرات هيكلية غير مقبولة في بيئة التشغيل الحالية. على سبيل المثال ، تحتاج إلى معرفة ما يحدث إذا كان لدى الشركة منتجات جديدة. لا يمكن إجراء مثل هذا البحث على قاعدة معيشية. وبالتالي ، نادرًا ما يتم إجراء التحليل الفعال مباشرة في نظام المحاسبة.

عادة ما يكون لأنظمة دعم القرار وسائل لتزويد المستخدم ببيانات مجمعة لعينات مختلفة من المجموعة الأولية في شكل مناسب للإدراك والتحليل. عادةً ما تشكل هذه الوظائف المجمعة مجموعة بيانات متعددة الأبعاد (وبالتالي غير علائقية) (غالبًا ما يطلق عليها hypercube أو metacube) ، تحتوي محاورها على معلمات ، والخلايا - البيانات المجمعة التي تعتمد عليها - ويمكن لهذه البيانات يتم تخزينها أيضًا في جداول علائقية. على طول كل محور ، يمكن تنظيم البيانات في تسلسل هرمي يمثل مستويات مختلفة من التفاصيل. بفضل نموذج البيانات هذا ، يمكن للمستخدمين صياغة استعلامات معقدة وإنشاء تقارير واسترداد مجموعات فرعية من البيانات.

هذا هو بالضبط ما أدى إلى الاهتمام بأنظمة دعم القرار ، والتي أصبحت المجال الرئيسي لتطبيق OLAP (المعالجة التحليلية عبر الإنترنت ، والمعالجة التحليلية عبر الإنترنت ، وتحليل البيانات عبر الإنترنت) ، والتي تحول "خام" تتحول أنظمة OLTP إلى "منتج" نهائي يمكن للمديرين والمحللين استخدامه مباشرة. تسمح هذه الطريقة للمحللين والمديرين والمديرين التنفيذيين "بالوصول إلى الجزء السفلي" من البيانات المتراكمة من خلال الوصول السريع والمتسق إلى مجموعة واسعة من طرق عرض المعلومات.

الهدف من عمل الدورة هو مراجعة تقنية OLAP.

معالجة البيانات التحليلية متعددة الأبعاد

الجزء الرئيسي

1 فهم OLAP

يعتمد مفهوم OLAP على مبدأ عرض البيانات متعدد الأبعاد. في عام 1993 ، صاغ إدغار كود مصطلح OLAP. بعد النظر في أوجه القصور في النموذج العلائقي ، أشار أولاً وقبل كل شيء إلى استحالة "الجمع بين البيانات وعرضها وتحليلها من وجهة نظر الأبعاد المتعددة ، أي بأكثر الطرق مفهومة لمحللي الشركات" ، وحدد المتطلبات العامة لأنظمة OLAP التي تعمل على توسيع وظائف DBMS العلائقية وتشمل التحليل متعدد الأبعاد كأحد خصائصها.

في عدد كبير من المنشورات ، يشير الاختصار OLAP ليس فقط إلى عرض متعدد الأبعاد للبيانات ، ولكن أيضًا إلى تخزين البيانات نفسها في قاعدة بيانات متعددة الأبعاد. بشكل عام ، هذا ليس صحيحًا ، حيث يشير Codd نفسه إلى أن "قواعد البيانات العلائقية كانت وستظل التكنولوجيا الأكثر ملاءمة لتخزين بيانات الشركة. ولا توجد حاجة لتقنية قاعدة بيانات جديدة ، بل إلى أدوات التحليل التي تكمل وظائف DBMS الحالية مرنة لتوقع وأتمتة أنواع التعدين المختلفة المتأصلة في OLAP. " يؤدي هذا الالتباس إلى تعارضات مثل "OLAP أو ROLAP" ، وهذا ليس صحيحًا تمامًا ، نظرًا لأن ROLAP (العلائقية OLAP) على المستوى المفاهيمي تدعم جميع الوظائف المحددة بواسطة المصطلح OLAP. يبدو من الأفضل استخدام المصطلح الخاص MOLAP لـ OLAP استنادًا إلى DBMS متعدد الأبعاد. وفقًا لـ Codd ، فإن العرض المفاهيمي متعدد الأبعاد هو منظور متعدد يتكون من عدة أبعاد مستقلة يمكن من خلالها تحليل مجموعات محددة من البيانات. يتم تعريف التحليل المتزامن عبر أبعاد متعددة على أنه تحليل متعدد المتغيرات. يتضمن كل بُعد اتجاهات دمج البيانات ، التي تتكون من سلسلة من مستويات التجميع المتتالية ، حيث يتوافق كل مستوى أعلى مع درجة أكبر من تجميع البيانات للبعد المقابل. لذا ، القياس.

يمكن تحديد المؤدي من خلال اتجاه التوحيد ، الذي يتكون من مستويات التعميم "المؤسسة - الإدارة - القسم - الموظف". قد يتضمن البعد الزمني اتجاهين للدمج - السنة - ربع السنة - الشهر - اليوم والأسبوع - اليوم ، لأن حساب الوقت حسب الشهر والأسبوع غير متوافق. في هذه الحالة ، يصبح من الممكن تحديد المستوى المطلوب لتفاصيل المعلومات بشكل تعسفي لكل من القياسات. تتوافق عملية الحفر مع الحركة من المراحل الأعلى للتوحيد إلى المراحل السفلية ؛ على العكس من ذلك ، فإن عملية التدحرج تعني الانتقال من المستويات الأدنى إلى المستويات الأعلى.

حدد Codd 12 قاعدة يجب أن يفي بها منتج برنامج فئة OLAP.

1.2 متطلبات أدوات المعالجة التحليلية عبر الإنترنت

عرض مفاهيمي متعدد الأبعاد. يجب أن يكون التمثيل المفاهيمي لنموذج البيانات في منتج OLAP متعدد الأبعاد بطبيعته ، أي أنه يجب أن يسمح للمحللين بأداء شرائح ونرد بديهية ، وتدوير ، وعمليات محورية لاتجاهات الدمج. الشفافية يجب ألا يكون المستخدم على دراية بالوسائل المحددة المستخدمة لتخزين البيانات ومعالجتها ، وكيفية تنظيم البيانات ومن أين تأتي.

إمكانية الوصول. يجب أن يكون المحلل قادرًا على إجراء التحليل في إطار إطار عمل مفاهيمي مشترك ، ولكن في نفس الوقت يمكن أن تظل البيانات تحت سيطرة الإرث المتبقي لنظام إدارة قواعد البيانات ، مع ربطها بالنموذج التحليلي العام. بمعنى ، يجب أن تقوم مجموعة أدوات OLAP بتركيب مخططها المنطقي على مجموعات البيانات المادية ، وإجراء جميع التحولات المطلوبة لتوفير رؤية واحدة ومتسقة وشاملة للمستخدم على المعلومات.

أداء تقارير متسق مع زيادة عدد الأبعاد وأحجام قاعدة البيانات ، يجب ألا يواجه المحللون أي تدهور في الأداء. يعد الأداء المستدام ضروريًا للحفاظ على سهولة الاستخدام والتحرر من التعقيد المطلوب لتقديم OLAP للمستخدم النهائي.

العميل - بنية الخادم (هندسة العميل والخادم). يتم تخزين معظم البيانات التي تتطلب معالجة تحليلية تشغيلية في أنظمة حاسب مركزي ويتم استردادها من أجهزة الكمبيوتر الشخصية. لذلك ، فإن أحد المتطلبات هو قدرة منتجات OLAP على العمل في بيئة خادم العميل. الفكرة الرئيسية هنا هي أن مكون الخادم لأداة OLAP يجب أن يكون ذكيًا بدرجة كافية ولديه القدرة على إنشاء مخطط مفاهيمي عام يعتمد على تعميم وتوحيد مختلف مخططات قواعد البيانات المنطقية والمادية للشركة لتوفير تأثير شفاف.

الأبعاد العامة يجب أن تكون جميع قياسات البيانات متساوية. يمكن توفير خصائص إضافية للأبعاد الفردية ، ولكن نظرًا لأنها كلها متماثلة ، يمكن توفير هذه الوظيفة الإضافية لأي بُعد. يجب ألا تعتمد بنية البيانات والصيغ وتنسيقات التقارير الأساسية على أي بُعد واحد.

معالجة ديناميكية للمصفوفة المتفرقة. يجب أن تكون أداة OLAP قادرة على التعامل مع المصفوفات المتفرقة على النحو الأمثل. يجب الحفاظ على سرعة الوصول بغض النظر عن موقع خلايا البيانات وأن تكون ثابتة للنماذج ذات عدد مختلف من الأبعاد وتباين مختلف في البيانات.

دعم الوضع متعدد المستخدمين (دعم متعدد المستخدمين). في كثير من الأحيان ، يحتاج العديد من المحللين إلى العمل باستخدام نفس النموذج التحليلي في نفس الوقت أو إنشاء نماذج مختلفة بناءً على نفس بيانات الشركة. يجب أن توفر لهم أداة OLAP إمكانية الوصول المتزامن وتكامل البيانات والحماية.

عمليات غير مقيدة متعددة الأبعاد. يجب ألا يؤدي حساب البيانات ومعالجتها عبر أي عدد من الأبعاد إلى حظر أو تقييد أي علاقة بين خلايا البيانات. يجب تحديد التحولات التي تتطلب تعريفًا تعسفيًا بلغة صيغة وظيفية كاملة.

معالجة بديهية للبيانات. يجب إجراء إعادة توجيه اتجاهات الدمج ، وتفاصيل البيانات في الأعمدة والصفوف ، والتجميع والمعالجات الأخرى الملازمة لهيكل التسلسل الهرمي لاتجاهات الدمج في واجهة المستخدم الأكثر ملاءمة وطبيعية وراحة.

آلية إعداد التقارير المرنة (التقارير المرنة). يجب دعم الطرق المختلفة لتصور البيانات ، أي أنه يجب تقديم التقارير في أي اتجاه ممكن.

أبعاد وتجميع غير محدود. يوصى بشدة بافتراض خمسة عشر بُعدًا على الأقل ، ويفضل عشرين بُعدًا في النموذج التحليلي في كل أداة OLAP جادة.

2 مكونات أنظمة OLAP

2.1 الخادم. عميل. إنترنت

يتيح لك OLAP إجراء تحليل سريع وفعال على كميات كبيرة من البيانات. يتم تخزين البيانات في شكل متعدد الأبعاد يعكس بشكل وثيق الحالة الطبيعية لبيانات العمل الحقيقية. بالإضافة إلى ذلك ، يوفر OLAP للمستخدمين القدرة على استرداد البيانات الموجزة بشكل أسرع وأسهل. بمساعدتها ، يمكنهم التعمق في محتويات هذه البيانات إذا لزم الأمر للحصول على معلومات أكثر تفصيلاً.

يتكون نظام OLAP من العديد من المكونات. في أعلى مستوى من العرض ، يشتمل النظام على مصدر بيانات وخادم OLAP وعميل. مصدر البيانات هو مصدر يتم أخذ البيانات منه للتحليل. يتم نقل البيانات من المصدر أو نسخها إلى خادم OLAP ، حيث يتم تنظيمها وإعدادها لتوليد الاستجابات على الاستعلامات لاحقًا بشكل أسرع. العميل هو واجهة المستخدم لخادم OLAP. يصف هذا القسم من المقالة وظائف كل مكون وأهمية النظام بأكمله ككل. مصادر. المصدر في أنظمة OLAP هو الخادم الذي يوفر البيانات للتحليل. اعتمادًا على نطاق منتج OLAP ، يمكن أن يكون المصدر عبارة عن مستودع بيانات ، أو قاعدة بيانات موروثة تحتوي على بيانات عامة ، أو مجموعة من الجداول التي تجمع البيانات المالية ، أو أي مجموعة مما سبق. تعتبر قدرة منتج OLAP على العمل مع البيانات من مصادر مختلفة مهمة للغاية. إن طلب تنسيق واحد ، أو قاعدة بيانات واحدة ، لتخزين كافة البيانات الأصلية ، غير مناسب لمسؤولي قاعدة البيانات. بالإضافة إلى ذلك ، يقلل هذا الأسلوب من مرونة وقوة منتج OLAP. يعتقد المسؤولون والمستخدمون على حد سواء أن منتجات OLAP التي تستخرج البيانات ليس فقط من مصادر مختلفة ولكن أيضًا من مصادر متعددة تكون أكثر مرونة وفائدة من تلك ذات المتطلبات الأكثر صرامة.

الخادم. خادم OLAP هو الجزء المطبق من نظام OLAP. يقوم هذا المكون بجميع الأعمال (اعتمادًا على طراز النظام) ، ويخزن في حد ذاته جميع المعلومات التي يتم توفير الوصول النشط إليها. تخضع بنية الخادم لمفاهيم مختلفة. على وجه الخصوص ، فإن السمة الوظيفية الرئيسية لمنتج OLAP هي استخدام قاعدة بيانات متعددة الأبعاد (MMDB ، MDDB) أو علائقية (RDB ، RDB) لتخزين البيانات. البيانات المُجمَّعة / المُجمَّعة مسبقًا

يعد تنفيذ الاستعلام السريع أمرًا ضروريًا لـ OLAP. هذا هو أحد المبادئ الأساسية لـ OLAP - تتطلب القدرة على معالجة البيانات بشكل حدسي استردادًا سريعًا للمعلومات. بشكل عام ، كلما زادت الحاجة إلى الحساب للحصول على جزء من المعلومات ، كانت الاستجابة أبطأ. لذلك ، من أجل توفير وقت قصير لتنفيذ الاستعلامات ، فإن أجزاء المعلومات التي يتم الوصول إليها عادةً في أغلب الأحيان ، ولكنها تتطلب حسابًا في نفس الوقت ، تخضع للتجميع الأولي. أي أنه يتم عدها ثم تخزينها في قاعدة البيانات كبيانات جديدة. من الأمثلة على نوع البيانات التي يمكن حسابها مقدمًا البيانات الموجزة - على سبيل المثال ، أرقام المبيعات حسب الشهر أو ربع السنة أو السنة - والتي تكون البيانات الفعلية التي تم إدخالها عبارة عن أرقام يومية.

لدى البائعين المختلفين طرق اختيار مختلفة للمعلمات التي تتطلب التجميع المسبق وعددًا من القيم المحسوبة مسبقًا. نهج التجميع يؤثر على كل من قاعدة البيانات ووقت تنفيذ الاستعلام. إذا تم حساب المزيد من القيم ، يزداد احتمال أن يطلب المستخدم قيمة محسوبة بالفعل ، وبالتالي سيكون وقت الاستجابة أقصر ، حيث لا توجد حاجة لطلب القيمة الأولية للحساب. ومع ذلك ، إذا لم يكن حساب جميع القيم الممكنة هو الحل الأفضل - في هذه الحالة ، سيزداد حجم قاعدة البيانات بشكل كبير ، مما يجعلها غير قابلة للإدارة ، وسيكون وقت التجميع طويلاً للغاية. بالإضافة إلى ذلك ، عند إضافة القيم الرقمية إلى قاعدة البيانات ، أو في حالة تغييرها ، يجب أن تنعكس هذه المعلومات في القيم المحسوبة مسبقًا اعتمادًا على البيانات الجديدة. وبالتالي ، يمكن أن يستغرق تحديث قاعدة البيانات أيضًا وقتًا طويلاً في حالة وجود عدد كبير من القيم المحسوبة مسبقًا. نظرًا لأن قاعدة البيانات عادةً ما تكون غير متصلة أثناء التجميع ، فمن المستحسن ألا يكون وقت التجميع طويلاً جدًا.

عميل. العميل هو ما يستخدم لتمثيل ومعالجة البيانات في قاعدة البيانات. يمكن أن يكون العميل بسيطًا للغاية - في شكل جدول ، والذي يتضمن إمكانيات OLAP مثل ، على سبيل المثال ، تدوير البيانات (التمحور) وتعميق البيانات (الحفر) ، ويمكن أن يكون متخصصًا ، ولكن مثل عارض تقرير بسيط أو أن تكون قوية مثل تطبيق مصمم خصيصًا للتعامل مع البيانات المعقدة. الإنترنت هو شكل جديد للعميل. بالإضافة إلى ذلك ، فهي تحمل طابع التقنيات الجديدة ؛ تختلف العديد من حلول الإنترنت بشكل كبير في قدراتها بشكل عام وفي جودة حلول OLAP بشكل خاص. يناقش هذا القسم الخصائص الوظيفية المختلفة لكل نوع عميل.

في حين أن الخادم هو العمود الفقري لحل OLAP ، فإن العميل لا يقل أهمية عن ذلك. يمكن أن يوفر الخادم أساسًا متينًا لتسهيل معالجة البيانات ، ولكن إذا كان العميل معقدًا أو لا يعمل بشكل كبير ، فلن يتمكن المستخدم من الاستفادة الكاملة من خادم قوي. العميل مهم جدًا لدرجة أن العديد من البائعين يركزون جهودهم فقط على تنمية العملاء. كل ما يتم تضمينه في هذه التطبيقات هو نظرة قياسية للواجهة ، ووظائف وهيكل محدد مسبقًا ، بالإضافة إلى حلول سريعة لمواقف قياسية أكثر أو أقل. على سبيل المثال ، حزم التمويل شائعة. ستسمح التطبيقات المالية المعدة مسبقًا للمهنيين باستخدام الأدوات المالية المألوفة دون الحاجة إلى تصميم هيكل قاعدة بيانات أو نماذج وتقارير مشتركة. أداة الاستعلام / مولد التقرير. توفر أداة الاستعلام أو منشئ التقارير وصولاً سهلاً إلى بيانات OLAP. لديهم واجهة رسومية سهلة الاستخدام وتسمح للمستخدمين بإنشاء التقارير عن طريق سحب العناصر وإفلاتها في التقرير. بينما يوفر منشئ التقارير التقليدي للمستخدم القدرة على إنتاج تقارير منسقة بسرعة ، فإن منشئي التقارير القادرة على OLAP ينشئون تقارير محدثة. المنتج النهائي هو تقرير لديه القدرة على الانتقال لأسفل إلى مستوى البيانات ، وتدوير التقارير (المحورية) ، ودعم التسلسلات الهرمية ، والمزيد. الوظائف الإضافية (الإضافات) لجداول البيانات.

اليوم ، في العديد من مجالات الأعمال ، يتم تنفيذ أشكال مختلفة من تحليل بيانات الشركة باستخدام جداول البيانات. بطريقة ما ، فهو عارض مثالي للتقارير والبيانات. يمكن للمحلل إنشاء وحدات ماكرو تعمل مع البيانات في الاتجاه المختار ، ويمكن تصميم قالب بحيث تحسب الصيغ القيم الصحيحة عند إدخال البيانات ، مما يلغي الحاجة إلى إعادة إدخال الحسابات البسيطة.

ومع ذلك ، ينتج عن كل هذا تقرير "ثابت" ، مما يعني أنه بمجرد إنشائه ، من الصعب مشاهدته من زوايا مختلفة. على سبيل المثال ، يعرض الرسم البياني المعلومات على مدار فترة زمنية ، على سبيل المثال ، شهر. وإذا أراد المرء رؤية أرقام اليوم (على عكس بيانات الشهر) ، فسيكون من الضروري إنشاء مخطط جديد تمامًا. هناك مجموعات بيانات جديدة يتعين تحديدها وإضافة تسميات جديدة إلى المخطط والعديد من التغييرات البسيطة والمملة التي يتعين إجراؤها. بالإضافة إلى ذلك ، هناك عدد من المجالات التي يمكن أن ترتكب فيها الأخطاء ، مما يقلل بشكل عام من الموثوقية. عند إضافة OLAP إلى جدول ، يصبح من الممكن إنشاء مخطط واحد ، ثم إخضاعه لعمليات معالجة مختلفة من أجل تزويد المستخدم بالمعلومات الضرورية ، دون تحميل نفسه عبء إنشاء جميع طرق العرض الممكنة. الإنترنت كعميل. الإنترنت هو عضو جديد في عائلة عميل OLAP. هناك العديد من المزايا لإنشاء تقارير OLAP عبر الإنترنت. الأهم هو عدم الحاجة إلى برامج متخصصة للوصول إلى المعلومات. هذا يوفر على الشركة الكثير من الوقت والمال.

كل منتج إنترنت محدد. يسهّل البعض إنشاء صفحات الويب ، لكنهم أقل مرونة. يتيح لك الآخرون إنشاء طرق عرض لبياناتك ثم حفظها كملفات HTML ثابتة. كل هذا يجعل من الممكن عرض البيانات عبر الإنترنت ، ولكن ليس أكثر من ذلك. من المستحيل معالجة البيانات بنشاط بمساعدتهم.

هناك نوع آخر من المنتجات ، تفاعلي وديناميكي ، يحول هذه المنتجات إلى أدوات كاملة الميزات. يمكن للمستخدمين التعمق في البيانات والمحور والأبعاد المحددة وغير ذلك. قبل اختيار أداة تنفيذ الإنترنت ، من المهم فهم الوظيفة المطلوبة من حل الويب ، ثم تحديد المنتج الأفضل لتنفيذ هذه الوظيفة.

التطبيقات. التطبيقات هي نوع من العميل يستخدم قواعد بيانات OLAP. إنها متطابقة مع أدوات الاستعلام ومولدات التقارير الموضحة أعلاه ، ولكنها تضيف أيضًا المزيد من الوظائف إلى المنتج. يعد التطبيق بشكل عام أقوى من أداة الاستعلام.

تطوير. بشكل نموذجي ، يوفر موفرو OLAP بيئة تطوير للمستخدمين لإنشاء تطبيقاتهم المخصصة. بيئة التطوير ككل هي واجهة رسومية تدعم تطوير التطبيقات الموجهة للكائنات. بالإضافة إلى ذلك ، يوفر معظم البائعين واجهة برمجة تطبيقات يمكن استخدامها لدمج قواعد بيانات OLAP مع التطبيقات الأخرى.

2.2 عملاء OLAP

يتم تثبيت عملاء OLAP مع جهاز OLAP مضمن على أجهزة الكمبيوتر الخاصة بالمستخدمين. فهي لا تتطلب خادمًا للحساب ، وليس لها إدارة. يسمح هؤلاء العملاء للمستخدم بضبط قواعد البيانات الموجودة لديهم ؛ كقاعدة عامة ، يؤدي هذا إلى إنشاء قاموس يخفي الهيكل المادي للبيانات وراء وصف الموضوع الخاص به ، ويكون مفهومًا للمتخصص. ثم يقوم عميل OLAP بتشغيل استعلامات عشوائية ويعرض النتائج في جدول OLAP. في هذا الجدول ، يمكن للمستخدم بدوره معالجة البيانات وتلقي مئات التقارير المختلفة على الشاشة أو على الورق. يتيح لك عملاء OLAP المصممون للعمل مع RDBMS تحليل البيانات المتوفرة بالفعل في شركة ، على سبيل المثال ، المخزنة في قاعدة بيانات OLTP. ومع ذلك ، قد يكون هدفهم الثاني هو إنشاء مستودعات البيانات أو مجموعات البيانات بسرعة وبتكلفة منخفضة - في هذه الحالة ، يحتاج مبرمجو المؤسسة فقط إلى إنشاء مجموعات من جداول النجوم في قواعد البيانات العلائقية وإجراءات تحميل البيانات. يتم تنفيذ الجزء الأكثر استهلاكا للوقت من العمل - كتابة الواجهات مع العديد من الخيارات للاستعلامات والتقارير المخصصة - في عميل OLAP في غضون ساعات قليلة. من ناحية أخرى ، يستغرق المستخدم النهائي حوالي 30 دقيقة لإتقان مثل هذا البرنامج. يتم توفير عملاء OLAP من قبل مطوري قواعد البيانات أنفسهم ، متعدد الأبعاد والعلائقية. هذه هي SAS Corporate Reporter ، والتي تعد منتجًا معياريًا تقريبًا من حيث الراحة والجمال ، و Oracle Discoverer ، ومجموعة من خدمات MS Pivot وبرامج Pivot Table ، وما إلى ذلك. يتم تسليم العديد من البرامج المصممة للعمل مع خدمات MS OLAP كجزء من حملة OLAP التي أجرتها شركة Microsoft. عادةً ما تكون إصدارات محسّنة من Pivot Table وهي مصممة للاستخدام في MS Office أو مستعرض ويب. هذه منتجات من Matryx و Knosys وما إلى ذلك ، والتي اكتسبت شعبية هائلة في الغرب بسبب بساطتها وانخفاض تكلفتها وكفاءتها.

3 تصنيف منتجات OLAP

3.1 OLAP متعدد الأبعاد

يوجد حاليًا عدد كبير من المنتجات في السوق التي توفر وظائف OLAP بدرجة أو بأخرى. من خلال توفير عرض مفاهيمي متعدد الأبعاد من واجهة المستخدم إلى قاعدة البيانات المصدر ، يتم تقسيم جميع منتجات OLAP إلى ثلاث فئات ، على غرار قاعدة البيانات المصدر.

1. تنتمي أقدم أنظمة المعالجة التحليلية عبر الإنترنت (على سبيل المثال ، Essbase من Arbor Software ، Oracle Express Server من Oracle) إلى فئة MOLAP ، أي أنها يمكن أن تعمل فقط مع قواعد البيانات متعددة الأبعاد الخاصة بها. وهي تستند إلى تقنيات نظم إدارة قواعد البيانات متعددة الأبعاد الملكية وهي الأغلى ثمناً. توفر هذه الأنظمة دورة كاملة من معالجة OLAP. وهي إما تتضمن ، بالإضافة إلى مكون الخادم ، واجهة العميل المتكاملة الخاصة بها ، أو تستخدم برامج جداول بيانات خارجية للتواصل مع المستخدم. لصيانة هذه الأنظمة ، يلزم وجود طاقم خاص من الموظفين لتثبيت النظام وصيانته وتشكيل تمثيلات البيانات للمستخدمين النهائيين.

2. تسمح لك أنظمة المعالجة التحليلية عبر الإنترنت للبيانات العلائقية (ROLAP) بتمثيل البيانات المخزنة في قاعدة بيانات علائقية في شكل متعدد الأبعاد ، مما يوفر تحويل المعلومات إلى نموذج متعدد الأبعاد من خلال طبقة وسيطة من البيانات الوصفية. تتضمن هذه الفئة DSS Suite من MicroStrategy و MetaCube من Informix و DecisionSuite من Information Advantage وغيرها. حزمة برامج InfoVisor ، التي تم تطويرها في روسيا ، في جامعة Ivanovo State Power Engineering University ، هي أيضًا نظام من هذه الفئة. أنظمة ROLAP مناسبة تمامًا للعمل مع مرافق التخزين الكبيرة. مثل أنظمة MOLAP ، فهي تتطلب صيانة كبيرة لتكنولوجيا المعلومات ومتعددة المستخدمين.

3. أخيرًا ، تم تصميم الأنظمة الهجينة (Hybrid OLAP ، HOLAP) لتجمع بين المزايا وتقليل العيوب الكامنة في الفئات السابقة. تتضمن هذه الفئة Media / MR الخاص بـ Speedware. وفقًا للمطورين ، فهو يجمع بين المرونة التحليلية واستجابة MOLAP مع الوصول المستمر إلى البيانات الحقيقية المتأصلة في ROLAP.

بالإضافة إلى هذه الأدوات ، هناك فئة أخرى - أدوات إعداد التقارير واستعلام سطح المكتب ، مكملة بوظائف OLAP أو مدمجة مع الأدوات الخارجية التي تؤدي مثل هذه الوظائف. تقوم هذه الأنظمة المتطورة باسترداد البيانات من المصادر الأصلية وتحويلها ووضعها في قاعدة بيانات ديناميكية متعددة الأبعاد تعمل في محطة العميل الخاصة بالمستخدم النهائي. الممثلون الرئيسيون لهذه الفئة هم BusinessObjects للشركة التي تحمل الاسم نفسه ، و BrioQuery من Brio Technology و PowerPlay من Cognos. يتم توفير نظرة عامة حول بعض منتجات OLAP في الملحق.

في نظم إدارة قواعد البيانات المتخصصة القائمة على تمثيل البيانات متعددة الأبعاد ، لا يتم تنظيم البيانات في شكل جداول علائقية ، ولكن في شكل مصفوفات متعددة الأبعاد مرتبة:

1) المكعبات الفائقة (يجب أن تحتوي جميع الخلايا المخزنة في قاعدة البيانات على نفس البعد ، أي أن تكون في الأساس الأكثر اكتمالا للقياسات) أو

2) البوليكوبس (يتم تخزين كل متغير بمجموعة القياسات الخاصة به ، ويتم تحويل جميع صعوبات المعالجة المرتبطة إلى الآليات الداخلية للنظام).

يتميز استخدام قواعد البيانات متعددة الأبعاد في أنظمة المعالجة التحليلية عبر الإنترنت بالمزايا التالية.

1. في حالة استخدام نظام DBMS متعدد الأبعاد ، يكون البحث عن البيانات واسترجاعها أسرع بكثير من عرض مفاهيمي متعدد الأبعاد لقاعدة بيانات علائقية ، نظرًا لأن قاعدة البيانات متعددة الأبعاد غير منسقة ، وتحتوي على مؤشرات مجمعة مسبقًا وتوفر وصولاً محسنًا إلى الخلايا المطلوبة.

2. يتعامل نظام DBMS متعدد الأبعاد بسهولة مع مهام تضمين وظائف مضمنة مختلفة في نموذج المعلومات ، في حين أن القيود الموجودة بشكل موضوعي للغة SQL تجعل تنفيذ هذه المهام على أساس نظم إدارة قواعد البيانات العلائقية أمرًا صعبًا إلى حد ما وأحيانًا مستحيل.

من ناحية أخرى ، هناك قيود كبيرة.

1. لا يسمح نظام DBMS متعدد الأبعاد بالعمل مع قواعد البيانات الكبيرة. بالإضافة إلى ذلك ، بسبب عدم التطابق والتجميع الأولي ، فإن كمية البيانات في قاعدة بيانات متعددة الأبعاد ، كقاعدة عامة ، تتوافق (وفقًا لـ Codd) مع 2.5-100 مرة أقل من حجم البيانات التفصيلية الأصلية.

2. نظام إدارة قواعد البيانات متعدد الأبعاد ، بالمقارنة مع النظم العلائقية ، يستخدم الذاكرة الخارجية بشكل غير فعال للغاية. في الغالبية العظمى من الحالات ، يكون مكعب المعلومات متناثرًا للغاية ، وبما أنه يتم تخزين البيانات في نموذج مرتب ، لا يمكن إزالة القيم غير المحددة إلا عن طريق اختيار ترتيب الفرز الأمثل الذي يسمح بتنظيم البيانات في أكبر مجموعات متجاورة ممكنة. ولكن حتى في هذه الحالة ، تم حل المشكلة جزئيًا فقط. بالإضافة إلى ذلك ، من المحتمل أن يكون ترتيب الفرز الأمثل لتخزين البيانات المتفرقة مختلفًا عن الترتيب الذي يتم استخدامه غالبًا في الاستعلامات. لذلك ، في الأنظمة الحقيقية ، يتعين عليك إيجاد حل وسط بين الأداء والتكرار في مساحة القرص التي تشغلها قاعدة البيانات.

لذلك ، فإن استخدام DBMS متعدد الأبعاد له ما يبرره فقط في ظل الشروط التالية.

1. حجم البيانات الأولية للتحليل ليس كبيرًا جدًا (لا يزيد عن عدة غيغابايت) ، أي أن مستوى تجميع البيانات مرتفع جدًا.

2. مجموعة أبعاد المعلومات مستقرة (نظرًا لأن أي تغيير في هيكلها يتطلب دائمًا إعادة هيكلة كاملة للمكعب الفائق).

3. وقت استجابة النظام للطلبات المخصصة هو العامل الأكثر أهمية.

4. مطلوب استخدام واسع النطاق للوظائف المدمجة المعقدة لإجراء عمليات حسابية متعددة الأبعاد على خلايا المكعب المفرط ، بما في ذلك القدرة على كتابة وظائف مخصصة.

يتمتع الاستخدام المباشر لقواعد البيانات العلائقية في أنظمة المعالجة التحليلية عبر الإنترنت بالمزايا التالية.

1. في معظم الحالات ، يتم تنفيذ مستودعات بيانات الشركات عن طريق نظم إدارة قواعد البيانات العلائقية ، وتسمح لك أدوات ROLAP بالتحليل المباشر عليها. في الوقت نفسه ، لا يعد حجم التخزين معلمة مهمة كما هو الحال في MOLAP.

2. في حالة البعد المتغير للمشكلة ، عندما يتعين إجراء تغييرات في بنية القياس في كثير من الأحيان ، فإن أنظمة ROLAP ذات التمثيل الديناميكي للبعد هي الحل الأمثل ، لأن مثل هذه التعديلات فيها لا تتطلب إجراءً ماديًا إعادة تنظيم قاعدة البيانات.

3. يوفر نظام DBMS العلاقي مستوى أعلى بكثير من حماية البيانات وفرصًا جيدة للتمييز بين حقوق الوصول.

العيب الرئيسي لـ ROLAP مقارنة بنظام DBMS متعدد الأبعاد هو الأداء المنخفض. تتطلب الأنظمة العلائقية مخطط قاعدة بيانات دقيقًا وضبطًا للفهرس لتحقيق أداء مشابه لـ MOLAP ، مما يعني بذل الكثير من الجهد من جانب مسؤولي قواعد البيانات. فقط باستخدام المخططات النجمية يمكن أن يكون أداء الأنظمة العلائقية المضبوطة جيدًا قريبًا من أداء الأنظمة القائمة على قواعد البيانات متعددة الأبعاد.

وصف مخطط النجوم والتوصيات الخاصة باستخدامه مكرس بالكامل للعمل. تتمثل فكرتها في وجود جداول لكل بُعد ، ويتم وضع جميع الحقائق في جدول واحد ، مفهرسًا بواسطة مفتاح متعدد مكون من مفاتيح الأبعاد الفردية (الملحق أ). يحدد كل شعاع من مخطط النجم ، في مصطلحات Codd ، اتجاه توحيد البيانات على طول البعد المقابل.

بالنسبة للمشكلات المعقدة ذات الأبعاد متعددة المستويات ، من المنطقي النظر إلى امتدادات مخطط النجوم - مخطط كوكبة الحقيقة ومخطط ندفة الثلج. في هذه الحالات ، يتم إنشاء جداول بيانات فعلية منفصلة للمجموعات المحتملة لمستويات التلخيص ذات الأبعاد المختلفة (الملحق ب). يسمح هذا بأداء أفضل ، ولكنه غالبًا ما يؤدي إلى تكرار البيانات وتعقيدات كبيرة في بنية قاعدة البيانات ، والتي تحتوي على عدد كبير من جداول الحقائق.

قد تنتج الزيادة في عدد جداول الحقائق في قاعدة البيانات ليس فقط عن تعدد المستويات ذات الأبعاد المختلفة ، ولكن أيضًا من حقيقة أن الحقائق ، بشكل عام ، لها مجموعات مختلفة من الأبعاد. عند الاستخراج من القياسات الفردية ، يجب أن يحصل المستخدم على إسقاط للمكعب المفرط الأكثر اكتمالاً ، ولا يجب أن تكون قيم المؤشرات الموجودة فيه دائمًا بأي حال من الأحوال نتيجة تجميع أولي. وبالتالي ، مع وجود عدد كبير من الأبعاد المستقلة ، من الضروري الاحتفاظ بالعديد من جداول الحقائق المطابقة لكل مجموعة ممكنة من الأبعاد المحددة في الاستعلام ، مما يؤدي أيضًا إلى الإسراف في استخدام الذاكرة الخارجية ، وزيادة وقت تحميل البيانات في قاعدة بيانات المخطط النجمي من مصادر خارجية ، وتعقيدات الإدارة.

تعمل امتدادات لغة SQL (عوامل التشغيل GROUP BY CUBE "و" GROUP BY ROLLUP "و" GROUP BY GROUPING SETS ") على حل هذه المشكلة جزئيًا ؛ بالإضافة إلى اقتراح آلية لإيجاد حل وسط بين التكرار والأداء ، مع التوصية بإنشاء جداول الحقائق ليس لجميع مجموعات الأبعاد الممكنة ، ولكن فقط لأولئك الذين لا يمكن الحصول على قيم خلاياهم باستخدام التجميع اللاحق لجداول الحقائق الأكثر اكتمالاً (الملحق ب).

في أي حال ، إذا تم تنفيذ النموذج متعدد الأبعاد في شكل قاعدة بيانات علائقية ، فيجب عليك إنشاء جداول حقائق طويلة و "ضيقة" وجداول أبعاد صغيرة و "عريضة" نسبيًا. تحتوي جداول البيانات الفعلية على القيم الرقمية لخلايا المكعب التشعبي ، وتحدد بقية الجداول الأساس متعدد الأبعاد الذي يحتوي على أبعاد. يمكن الحصول على بعض المعلومات باستخدام التجميع الديناميكي للبيانات الموزعة على الهياكل المعيارية غير النجمية ، على الرغم من أنه يجب أن نتذكر أن الاستعلامات التي تتضمن التجميع مع بنية قاعدة بيانات طبيعية للغاية يمكن أن تكون بطيئة للغاية.

يتيح لك التركيز على تمثيل المعلومات متعددة الأبعاد باستخدام نماذج علائقية على شكل نجمة التخلص من مشكلة تحسين تخزين المصفوفات المتفرقة ، وهو أمر حاد بالنسبة لنظام إدارة قواعد البيانات متعدد الأبعاد (حيث يتم حل مشكلة التباين من خلال اختيار خاص للمخطط ). على الرغم من استخدام سجل بأكمله لتخزين كل خلية ، والتي تتضمن ، بالإضافة إلى القيم نفسها ، مفاتيح ثانوية - مراجع لجداول الأبعاد ، والقيم غير الموجودة ببساطة لا يتم تضمينها في جدول البيانات الفعلية.

استنتاج

بعد النظر في قضايا تشغيل وتطبيق تقنية OLAP ، لدى الشركات أسئلة ، ستسمح إجاباتها باختيار المنتج الذي يلبي احتياجات المستخدم على أفضل وجه.

هذه هي الأسئلة التالية:

من أين تأتي المعطيات؟ - يمكن أن توجد البيانات المراد تحليلها في أماكن مختلفة. من الممكن أن تستقبلها قاعدة بيانات OLAP من مستودع بيانات الشركة أو من نظام OLTP. إذا كان منتج OLAP لديه بالفعل القدرة على الوصول إلى مصدر البيانات ، فسيتم تقليل عمليات التصنيف وتنقية البيانات.

ما نوع التلاعب الذي يقوم به المستخدم مع البيانات؟ -
بمجرد وصول المستخدم إلى قاعدة البيانات والبدء في إجراء التحليل ، من المهم أن يكون قادرًا على معالجة البيانات بشكل مناسب. بناءً على احتياجات المستخدم ، قد تجد أنك بحاجة إلى منشئ تقرير قوي أو القدرة على إنشاء واستضافة صفحات ويب ديناميكية. ومع ذلك ، قد يكون من الأفضل أن يكون لدى المستخدم وسيلة لإنشاء تطبيقاته الخاصة بسهولة وسرعة.

ما هو الحجم الإجمالي للبيانات؟ - هذا هو العامل الأكثر أهمية عند تعريف قاعدة بيانات OLAP. يمكن لمنتجات OLAP العلائقية معالجة كميات كبيرة من البيانات بشكل أفضل من تلك متعددة الأبعاد. إذا كان حجم البيانات لا يتطلب استخدام قاعدة بيانات علائقية ، فيمكن استخدام المنتج متعدد الأبعاد بنجاح مماثل.

من هو المستخدم؟ - عند تحديد عميل نظام OLAP ، يكون مستوى مهارة المستخدم مهمًا. سيجد بعض المستخدمين أنه من الأنسب دمج OLAP مع جدول بيانات ، بينما يفضل الآخرون تطبيقًا متخصصًا. اعتمادًا على مؤهلات المستخدم ، يتم أيضًا تحديد مسألة إجراء التدريب. قد ترغب شركة كبيرة في الدفع مقابل تدريب المستخدم ، وقد لا ترغب شركة أصغر. يجب أن يكون العميل على هذا النحو بحيث يشعر المستخدمون بالثقة ويمكنهم استخدامه بفعالية.

اليوم ، انتقلت معظم شركات العالم إلى استخدام OLAP كتكنولوجيا أساسية لتوفير المعلومات لصانعي القرار. لذلك ، فإن السؤال الأساسي الذي يجب طرحه ليس ما إذا كان ينبغي الاستمرار في استخدام جداول البيانات كمنصة أساسية لإعداد التقارير والميزنة والتنبؤ. يجب على الشركات أن تسأل نفسها عما إذا كانت مستعدة لخسارة الميزة التنافسية باستخدام معلومات غير دقيقة وغير ذات صلة وغير كاملة قبل أن تنضج وتفكر في التقنيات البديلة.

أيضًا ، في الختام ، تجدر الإشارة إلى أن القدرات التحليلية لتقنيات OLAP تزيد من فائدة البيانات المخزنة في مستودع معلومات الشركة ، مما يسمح للشركة بالتفاعل بشكل أكثر فاعلية مع عملائها.

قائمة المصطلحات

مفهوم تعريف
1 أدوات ذكاء الأعمال الأدوات والتقنيات المستخدمة للوصول إلى المعلومات. يتضمن تقنيات OLAP واستخراج البيانات والتحليل المعقد ؛ أدوات المستخدم النهائي وأدوات بناء الاستعلام المخصص ولوحات معلومات مراقبة الأعمال ومولدات تقارير الشركات.
2 المعالجة التحليلية عبر الإنترنت ، OLAP تقنية للمعالجة التحليلية للمعلومات في الوقت الفعلي ، بما في ذلك الإعداد والنشر الديناميكي للتقارير والوثائق.
3 شريحة ونرد مصطلح يستخدم لوصف وظيفة تحليل البيانات المعقدة التي توفرها أدوات OLAP. جلب البيانات من مكعب متعدد الأبعاد بقيم محددة وموضع نسبي محدد للأبعاد.
4 محور البيانات عملية تدوير جدول البيانات ، أي تحويل الأعمدة إلى صفوف والعكس صحيح.
5 عضو محسوب عنصر بُعد يتم تحديد قيمته بواسطة قيم العناصر الأخرى (على سبيل المثال ، التطبيقات الرياضية أو المنطقية). يمكن أن يكون العنصر المحسوب جزءًا من خادم OLAP أو أن يصفه المستخدم أثناء جلسة تفاعلية. العنصر المحسوب هو أي عنصر لم يتم إدخاله ، ولكن تم حسابه.
6 نماذج الأعمال العالمية نوع من مستودعات البيانات يوفر الوصول إلى المعلومات التي يتم توزيعها عبر أنظمة مختلفة للمؤسسة ويخضع لسيطرة الأقسام أو الأقسام المختلفة بقواعد البيانات ونماذج البيانات المختلفة. يصعب بناء هذا النوع من مستودع البيانات بسبب الحاجة إلى دمج جهود المستخدمين من الإدارات المختلفة لتطوير نموذج بيانات مشترك للمستودع.
7 بيانات التعدين تقنيات تستخدم أدوات برمجية مصممة للمستخدم الذي ، كقاعدة عامة ، لا يمكنه أن يقول مسبقًا ما الذي يبحث عنه بالضبط ، ولكن يمكنه فقط الإشارة إلى أنماط واتجاهات بحث معينة.
8 خدمة الزبائن النهج التكنولوجي ، والذي يتكون من تقسيم العملية إلى وظائف منفصلة. يؤدي الخادم العديد من الوظائف - إدارة الاتصالات ، وصيانة قاعدة البيانات ، وما إلى ذلك. يؤدي العميل وظائف المستخدم الفردية - توفير واجهات مناسبة ، وإجراء التنقل بين الشاشات ، وتوفير وظائف المساعدة ، وما إلى ذلك.
9 قاعدة بيانات متعددة الأبعاد ، MDBS و MDBMS قاعدة بيانات قوية تسمح للمستخدمين بتحليل كميات كبيرة من البيانات. قاعدة بيانات مع منظمة تخزين خاصة - مكعبات ، توفر عملًا عالي السرعة مع البيانات المخزنة كمجموعة من الحقائق والأبعاد والتجميعات المحسوبة مسبقًا.
10 حفر لأسفل طريقة استخراج البيانات التفصيلية المستخدمة في تحليل مستوى البيانات الإجمالية. تعتمد مستويات "التعميق" على دقة البيانات في [التخزين.
11 المستودع المركزي

1. قاعدة بيانات تحتوي على بيانات تم جمعها من أنظمة التشغيل الخاصة بالمنظمة. لديه هيكل مناسب لتحليل البيانات. مصممة لدعم اتخاذ القرار وخلق مساحة معلومات واحدة للشركة.

2. طريقة أتمتة تغطي جميع أنظمة المعلومات المتحكم بها من مكان واحد.

1 Golitsina O.L.، Maksimov N.V.، Popov I.I. قواعد البيانات: دروس. - م: منتدى: INFRA-M، 2003. - 352 صفحة.

2 تاريخ ك.مقدمة لأنظمة قواعد البيانات. - م: نوكا ، 2005 - 246 ص.

3 Elmanova NV، Fedorov A.A. مقدمة لتقنيات Microsoft OLAP. - م: Dialog-MEPhI، 2004. - 312 صفحة.

4 كاربوفا ت. قواعد البيانات: النماذج ، التطوير ، التنفيذ. - SPb .: بيتر ، 2006. - 304 ص.

5 Korovkin S. D. ، Levenets I. A. ، Ratmanova I. D. ، Starykh V. A. ، Shchavelev L. V. حل مشكلة التحليل التشغيلي المعقد للمعلومات في مستودعات البيانات // DBMS. - 2005. - رقم 5-6. - 47-51 ص.

6 Krechetov N.، Ivanov P. منتجات لتعدين البيانات ComputerWeek-Moscow. - 2003. - رقم 14-15. - 32-39 ص.

7 Przhiyalkovsky V.V. التحليل المعقد للبيانات الكبيرة: وجهات نظر جديدة للحوسبة // نظم إدارة قواعد البيانات. - 2006. - رقم 4. - 71-83 ص.

8 ساخاروف أ.أ. ركز مفهوم بناء وتنفيذ نظم المعلومات على تحليل البيانات // نظم إدارة قواعد البيانات. - 2004. - رقم 4. - 55-70 ص.

9 أولمان ج. أساسيات أنظمة قواعد البيانات. - م: المالية والإحصاء 2003. - 312 ص.

10 Hubbard J. تصميم قواعد البيانات بمساعدة الحاسوب. - م: مير ، 2007. - 294 ص.


كوروفكين S. D. ، Levenets I. A. ، Ratmanova I. D. ، Starykh V. A. ، Shchavelev L. V. حل مشكلة التحليل التشغيلي المعقد للمعلومات في مستودعات البيانات // DBMS. - 2005. - رقم 5-6. - 47-51 ص.

أولمان ج. أساسيات أنظمة قواعد البيانات. - م: المالية والإحصاء 2003. - 312 ص.

بارسيجيان أ.أ ، كوبريانوف إم إس. تقنيات تحليل البيانات: تعدين البيانات ، التعدين المرئي ، تعدين النصوص ، أولاب. - SPb .: BHV-Petersburg، 2007. - 532 صفحة.

Elmanova NV، Fedorov A.A. مقدمة لتقنيات Microsoft OLAP. - م: Dialog-MEPhI، 2004. - 312 صفحة.

تاريخ ك. مقدمة في نظم قواعد البيانات. - م: نوكا ، 2005 - 246 ص.

Golitsina O.L. ، Maksimov N.V. ، Popov I.I. قواعد البيانات: دروس. - م: منتدى: INFRA-M ، 2003. - 352 ثانية.

Sakharov A.A. ركز مفهوم بناء وتنفيذ نظم المعلومات على تحليل البيانات // DBMS. - 2004. - رقم 4. - 55-70 ص.

Przhiyalkovskiy V.V. التحليل المعقد للبيانات الكبيرة: وجهات نظر جديدة للحوسبة // نظم إدارة قواعد البيانات. - 2006. - رقم 4. - 71-83 ص.

الهدف من عمل الدورة هو دراسة تقنية OLAP ومفهوم تنفيذها وهيكلها.

في العالم الحديث ، تتيح شبكات الكمبيوتر وأنظمة الحوسبة تحليل كميات كبيرة من البيانات ومعالجتها.

يؤدي وجود كمية كبيرة من المعلومات إلى تعقيد البحث عن حلول بشكل كبير ، ولكنه يجعل من الممكن الحصول على حسابات وتحليلات أكثر دقة. لحل هذه المشكلة ، هناك فئة كاملة من أنظمة المعلومات تقوم بالتحليل. تسمى هذه الأنظمة أنظمة دعم القرار (DSS) (DSS ، نظام دعم القرار).

لإجراء التحليل ، يجب أن يجمع نظام دعم القرار (DSS) المعلومات ، وأن يكون لديه وسائل إدخالها وتخزينها. في المجموع ، هناك ثلاث مهام رئيسية تم حلها في DSS:

· إدخال بيانات؛

· مخزن البيانات؛

· تحليل البيانات.

يتم إدخال البيانات في DSS تلقائيًا من أجهزة الاستشعار التي تميز حالة البيئة أو العملية ، أو بواسطة عامل بشري.

إذا تم إدخال البيانات تلقائيًا من أجهزة الاستشعار ، يتم تجميع البيانات بواسطة إشارة الاستعداد التي تظهر عند ظهور المعلومات أو عن طريق الاقتراع الدوري. إذا تم تنفيذ الإدخال بواسطة شخص ما ، فيجب عليهم تزويد المستخدمين بوسائل ملائمة لإدخال البيانات ، والتحقق منها للتأكد من صحة الإدخال ، وكذلك إجراء الحسابات اللازمة.

عند إدخال البيانات في وقت واحد من قبل العديد من المشغلين ، من الضروري حل مشاكل التعديل والوصول المتوازي لنفس البيانات.

يوفر DSS للمحللين بيانات في شكل تقارير وجداول ورسوم بيانية للدراسة والتحليل ، وهذا هو السبب في أن هذه الأنظمة توفر وظائف دعم القرار.

في الأنظمة الفرعية لإدخال البيانات التي تسمى OLTP (معالجة النقل المباشر) ، يتم تنفيذ معالجة البيانات التشغيلية. لتنفيذها ، يتم استخدام أنظمة إدارة قواعد البيانات التقليدية (DBMS).

يمكن بناء نظام التحليل الفرعي على أساس:

· الأنظمة الفرعية لتحليل استرجاع المعلومات على أساس نظم إدارة قواعد البيانات العلائقية والاستعلامات الثابتة باستخدام لغة SQL.

· النظم الفرعية للتحليل التشغيلي. لتنفيذ مثل هذه الأنظمة الفرعية ، يتم استخدام تقنية معالجة البيانات التحليلية عبر الإنترنت OLAP ، والتي تستخدم مفهوم عرض البيانات متعدد الأبعاد ؛

· النظم الفرعية للتحليل الفكري. يطبق هذا النظام الفرعي طرق وخوارزميات تنقيب البيانات.

من وجهة نظر المستخدم ، توفر أنظمة OLAP وسيلة لعرض مرن للمعلومات في شرائح مختلفة ، والحصول التلقائي على البيانات المجمعة ، وإجراء العمليات التحليلية للالتفاف ، والتفاصيل ، والمقارنة بمرور الوقت. بفضل كل هذا ، تعد أنظمة OLAP حلاً ذا مزايا كبيرة في مجال إعداد البيانات لجميع أنواع تقارير الأعمال ، بما في ذلك عرض البيانات في أقسام مختلفة ومستويات مختلفة من التسلسل الهرمي ، مثل تقارير المبيعات ، وأشكال مختلفة من الميزانيات ، و اخرين. تتمتع أنظمة OLAP بمزايا كبيرة لمثل هذا العرض التقديمي في أشكال أخرى من تحليل البيانات ، بما في ذلك التنبؤ.

1.2 التعريف OLAP-نظم

تسمى تقنية تحليل البيانات المعقدة متعددة المتغيرات OLAP. OLAP هو عنصر أساسي في مؤسسة HD.

يمكن تنفيذ وظائف OLAP بعدة طرق ، سواء كانت أبسطها ، مثل تحليل البيانات في التطبيقات المكتبية ، أو الأنظمة التحليلية الموزعة الأكثر تعقيدًا والتي تعتمد على منتجات الخادم.

OLAP (On-LineAnalyticalProcessing) هي تقنية لمعالجة البيانات التحليلية عبر الإنترنت باستخدام أدوات وطرق لجمع البيانات متعددة الأبعاد وتخزينها وتحليلها ودعم عمليات صنع القرار.

الغرض الرئيسي من أنظمة OLAP هو دعم الأنشطة التحليلية والطلبات التعسفية لمستخدمي التحليل. الغرض من تحليل OLAP هو اختبار الفرضيات الناشئة.

الغرض من التقرير

سيركز هذا التقرير على إحدى فئات التقنيات الذكية التي تعتبر أداة تحليلية ملائمة - تقنيات OLAP.

الغرض من التقرير: الكشف عن مسألتين وتسليط الضوء عليهما: 1) مفهوم OLAP وقيمته التطبيقية في الإدارة المالية. 2) تنفيذ وظيفة OLAP في الحلول البرمجية: الاختلافات ، الفرص ، المزايا ، العيوب.

أريد أن أشير على الفور إلى أن OLAP هي أداة عالمية يمكن استخدامها في أي مجال مطبق ، ليس فقط في التمويل (كما يمكن فهمه من عنوان التقرير) ، الأمر الذي يتطلب تحليل البيانات بطرق مختلفة.

ادارة مالية

الإدارة المالية مجال يكون فيه التحليل أكثر أهمية من أي مجال آخر. ينشأ أي قرار مالي وإداري نتيجة لبعض الإجراءات التحليلية. اليوم ، تكتسب الإدارة المالية دورًا مهمًا للتشغيل الناجح للمؤسسة. على الرغم من حقيقة أن الإدارة المالية هي عملية مساعدة في المؤسسة ، إلا أنها تتطلب اهتمامًا خاصًا ، لأن القرارات المالية والإدارية الخاطئة يمكن أن تؤدي إلى خسائر كبيرة.

تهدف الإدارة المالية إلى تزويد المؤسسة بالموارد المالية بالأحجام المطلوبة وفي الوقت المناسب وفي المكان المناسب من أجل الحصول على أقصى تأثير من استخدامها من خلال التوزيع الأمثل.

ربما يكون من الصعب تحديد مستوى "الكفاءة القصوى لاستخدام الموارد" ، ولكن على أي حال ،

يجب أن يعرف المدير المالي دائمًا:

  • كم من الموارد المالية هناك؟
  • من أين ستأتي الأموال وبأي مبالغ؟
  • أين تستثمر بشكل أكثر كفاءة ولماذا؟
  • وفي أي وقت يجب القيام بكل هذا؟
  • ما هو المبلغ المطلوب لضمان التشغيل الطبيعي للمشروع؟

للحصول على إجابات معقولة لهذه الأسئلة ، يجب أن يكون لديك وتحليل ومعرفة كيفية تحليل عدد كبير بما فيه الكفاية من مؤشرات الأداء. بالإضافة إلى ذلك ، تغطي FI عددًا كبيرًا من المجالات: تحليل التدفقات النقدية (التدفق النقدي) ، وتحليل الأصول والخصوم ، وتحليل الربحية ، وتحليل الهامش ، وتحليل الربحية ، وتحليل المجموعة.

المعرفه

لذلك ، فإن العامل الرئيسي في فعالية عملية الإدارة المالية هو توافر المعرفة:

  • المعرفة الشخصية في مجال الموضوع (قد يقول المرء النظرية والمنهجية) ، بما في ذلك الخبرة ، حدس الممول / المدير المالي
  • معرفة عامة (مؤسسية) أو معلومات منهجية حول حقائق المعاملات المالية في المؤسسة (أي معلومات حول حالة المؤسسة في الماضي والحاضر والمستقبل ، معروضة في مؤشرات وقياسات مختلفة)

إذا كان الأول يكمن في مجال عمل هذا الممول (أو مدير الموارد البشرية الذي وظف هذا الموظف) ، فيجب أن يتم إنشاء الثاني عن قصد في المؤسسة من خلال الجهود المشتركة لموظفي الخدمات المالية والمعلوماتية.

ماذا الان

ومع ذلك ، أصبح الوضع المتناقض الآن أمرًا معتادًا في المؤسسات: هناك معلومات ، وهناك الكثير منها ، والكثير جدًا. لكنها في حالة فوضوية: غير منظمة ، غير متسقة ، مبعثرة ، غير موثوقة دائمًا وغالبًا ما تكون خاطئة ، يكاد يكون من المستحيل العثور عليها والحصول عليها. يتم تنفيذ جيل طويل وغير مفيد في كثير من الأحيان من البيانات المالية ، وهو أمر غير ملائم للتحليل المالي ، ويصعب فهمه ، لأنه لم يتم إنشاؤه للإدارة الداخلية ، ولكن للعرض على السلطات التنظيمية الخارجية.

حسب نتائج دراسة اجرتها الشركة رويترزمن بين 1300 مدير دولي ، قال 38٪ ممن شملهم الاستطلاع إنهم يقضون الكثير من الوقت في محاولة العثور على المعلومات التي يحتاجونها. اتضح أن أحد المتخصصين المؤهلين تأهيلا عاليا يقضي وقته المرتفع ليس في تحليل البيانات ، ولكن في جمع والبحث وتنظيم المعلومات اللازمة لهذا التحليل. في الوقت نفسه ، يواجه المديرون عبئًا ثقيلًا من البيانات التي غالبًا ما تكون غير ذات صلة ، مما يقلل من كفاءتهم مرة أخرى. سبب هذا الموقف: فائض في المعلومات ونقص في المعرفة.

ما يجب القيام به

يجب تحويل المعلومات إلى معرفة. بالنسبة للأعمال الحديثة ، فإن المعلومات القيمة ، والاستحواذ المنتظم ، والتوليف ، والتبادل ، والاستخدام هي نوع من العملات ، ولكن من أجل الحصول عليها ، من الضروري إدارة المعلومات ، مثل أي عملية تجارية.

مفتاح إدارة المعلومات هو تقديم المعلومات الصحيحة بالطريقة الصحيحة لأصحاب المصلحة داخل المنظمة في وقت محدد. الهدف من هذه الحوكمة هو مساعدة الناس على العمل بشكل أفضل معًا باستخدام كميات متزايدة من المعلومات.

تعمل تقنيات المعلومات في هذه الحالة كوسيلة يمكن من خلالها تنظيم المعلومات في المؤسسة ، وتزويد بعض المستخدمين بالوصول إليها ومنحهم أدوات لتحويل هذه المعلومات إلى معرفة.

المفاهيم الأساسية لتقنيات OLAP

لا تعتبر تقنية OLAP (من المعالجة التحليلية عبر الإنترنت باللغة الإنجليزية) اسمًا لمنتج معين ، ولكنها اسم تقنية كاملة للتحليل التشغيلي للبيانات متعددة الأبعاد المتراكمة في التخزين. لفهم جوهر OLAP ، من الضروري النظر في العملية التقليدية للحصول على المعلومات من أجل اتخاذ القرار.

نظام دعم القرار التقليدي

هنا ، بالطبع ، يمكن أن يكون هناك أيضًا العديد من الخيارات: فوضى المعلومات الكاملة ، أو الموقف الأكثر شيوعًا عندما يكون لدى المؤسسة أنظمة تشغيل بمساعدة يتم تسجيل وقائع عمليات معينة وتخزينها في قواعد البيانات. لاسترداد البيانات من قواعد البيانات للأغراض التحليلية ، تم إنشاء نظام استعلامات لعينات بيانات معينة.

لكن طريقة دعم القرار هذه تفتقر إلى المرونة ولها العديد من العيوب:

  • يستخدم كمية ضئيلة من البيانات التي يمكن أن تكون مفيدة لصنع القرار
  • في بعض الأحيان يتم إنشاء تقارير معقدة متعددة الصفحات ، يتم استخدام سطرين منها فعليًا (والباقي فقط في حالة) - زيادة المعلومات
  • رد الفعل البطيء للعملية على التغييرات: إذا كان تمثيل البيانات الجديد مطلوبًا ، فيجب عندئذٍ وصف الطلب رسميًا وترميزه من قبل المبرمج ، وعندئذٍ فقط يتم تنفيذه. وقت الانتظار: ساعات ، أيام. ربما هناك حاجة إلى حل الآن ، على الفور. لكن بعد تلقي معلومات جديدة ، سيظهر سؤال جديد (توضيح)

إذا تم تقديم تقارير الاستعلام بتنسيق أحادي البعد ، فعادة ما تكون مشكلات العمل متعددة الأبعاد ومتعددة الأوجه. إذا كنت بحاجة إلى الحصول على صورة واضحة عن أعمال الشركة ، فمن الضروري تحليل البيانات في جوانب مختلفة.

تنشئ العديد من الشركات قواعد بيانات علائقية ممتازة ، تعمل بشكل مثالي على تفكيك تلال من المعلومات غير المستخدمة على الرفوف ، والتي لا توفر بحد ذاتها رد فعل سريعًا أو كفؤًا بشكل كافٍ لأحداث السوق. نعم - قواعد البيانات العلائقية كانت ، وستكون ، هي التقنية الأكثر ملاءمة لتخزين بيانات الشركة. هذه ليست تقنية قاعدة بيانات جديدة ، ولكنها مجموعة أدوات تحليل تكمل وظائف DBMS الحالية وتتميز بالمرونة الكافية لاستيعاب وأتمتة أنواع التعدين المختلفة المتأصلة في OLAP.

فهم OLAP

ماذا يقدم OLAP؟

  • أدوات متقدمة للوصول إلى تخزين البيانات
  • معالجة البيانات التفاعلية الديناميكية (التدوير أو الدمج أو الحفر)
  • عرض مرئي واضح للبيانات
  • سريع - يتم التحليل في الوقت الفعلي
  • عرض بيانات متعدد الأبعاد - تحليل متزامن لمؤشرات متعددة عبر أبعاد متعددة

للحصول على تأثير من استخدام تقنيات OLAP ، يجب عليك: 1) فهم جوهر التقنيات نفسها وقدراتها ؛ 2) حدد بوضوح العمليات التي يجب تحليلها ، وما هي المؤشرات التي سيتم تمييزها والأبعاد التي يُنصح برؤيتها ، أي إنشاء نموذج تحليل.

المفاهيم الأساسية المستخدمة بواسطة تقنيات OLAP هي كما يلي:

تعدد الأبعاد

لفهم الأبعاد المتعددة للبيانات ، تحتاج أولاً إلى تقديم جدول يعرض ، على سبيل المثال ، أداء "تكاليف المؤسسة" حسب العنصر الاقتصادي ووحدة الأعمال.

يتم تقديم هذه البيانات في بعدين:

  • مقالة - سلعة
  • وحدة عمل

هذا الجدول ليس بالمعلومات ، لأنه يعرض المبيعات لفترة زمنية معينة. لفترات زمنية مختلفة ، سيتعين على المحللين مقارنة عدة جداول (لكل فترة زمنية):

يوضح الشكل البعد الثالث ، الوقت ، بالإضافة إلى الأولين. (مقال ، وحدة الأعمال)

هناك طريقة أخرى لإظهار البيانات متعددة الأبعاد وهي تمثيلها في شكل مكعب:

تسمح مكعبات OLAP للمحللين بالحصول على البيانات في شرائح مختلفة للحصول على إجابات للأسئلة التي يطرحها العمل:

  • ما هي التكاليف الحرجة في أي وحدات العمل؟
  • كيف تتغير تكاليف وحدة الأعمال بمرور الوقت؟
  • كيف تتغير عناصر التكلفة بمرور الوقت؟

تعد الإجابات على هذه الأسئلة ضرورية لاتخاذ قرارات إدارية: بشأن تقليل عناصر تكلفة معينة ، والتأثير على هيكلها ، وتحديد أسباب التغييرات في التكاليف بمرور الوقت ، والانحرافات عن الخطة والقضاء عليها - تحسين هيكلها.

في هذا المثال ، يتم النظر في 3 أبعاد فقط. من الصعب تصوير أكثر من 3 أبعاد ، لكنها تعمل بنفس الطريقة التي تعمل بها الأبعاد الثلاثة.

عادةً ما تسمح لك تطبيقات OLAP بالحصول على بيانات على 3 أبعاد أو أكثر ، على سبيل المثال ، يمكنك إضافة بُعد آخر - الخطة - الفعلية ، فئة التكلفة: مباشر ، غير مباشر ، حسب الطلبات ، حسب الشهر. تسمح لك الأبعاد الإضافية بالحصول على المزيد من الشرائح التحليلية وتقديم إجابات للأسئلة ذات الشروط المتعددة.

تسلسل

يسمح OLAP أيضًا للمحللين بتنظيم كل بُعد في تسلسل هرمي للمجموعات والمجموعات الفرعية والإجماليات التي تمثل مقياسًا عبر المؤسسة بأكملها - الطريقة الأكثر منطقية لتحليل الأعمال.

على سبيل المثال ، يُنصح بتجميع التكاليف بشكل هرمي:

يسمح OLAP للمحللين بالحصول على بيانات من مقياس ملخص شامل (في المستوى الأعلى) ، ثم الانتقال لأسفل إلى المستويات السفلية واللاحقة ، وبالتالي اكتشاف السبب الدقيق للتغيير في المقياس.

من خلال السماح للمحللين باستخدام أبعاد متعددة في مكعب بيانات ، مع إمكانية الأبعاد الهرمية ، يوفر OLAP صورة للأعمال غير مضغوطة بواسطة هيكل مستودع البيانات.

تغيير اتجاهات التحليل في مكعب (تدوير البيانات)

كقاعدة عامة ، فإنها تعمل بالمفاهيم التالية: الأبعاد المحددة في الأعمدة والصفوف (قد يكون هناك العديد منها) ، وشرائح النموذج الباقية ، ومحتويات الجدول تتكون من الأبعاد (المبيعات والتكاليف والنقد)

عادةً ما يسمح لك OLAP بتغيير اتجاه أبعاد المكعب ، وبالتالي تقديم البيانات في طرق عرض مختلفة.

يعتمد عرض بيانات المكعب على:

  • اتجاهات الأبعاد: ما هي الأبعاد المحددة في الصفوف والأعمدة والشرائح ؛
  • مجموعات من المؤشرات المميزة في الصفوف والأعمدة والشرائح.
  • يكمن تغيير الأبعاد في مجال عمل المستخدم.

وبالتالي ، يتيح لك OLAP إجراء أنواع مختلفة من التحليل وفهم علاقتها بنتائجها.

  • تحليل الانحراف - تحليل تنفيذ الخطة ، الذي يكمله تحليل عاملي لأسباب الانحرافات عن طريق تفصيل المؤشرات.
  • تحليل التبعية: يتيح لك OLAP تحديد التبعيات المختلفة بين التغييرات المختلفة ، على سبيل المثال ، عندما تمت إزالة البيرة من المجموعة خلال الشهرين الأولين ، تم العثور على انخفاض في مبيعات الصراصير.
  • المقارنة (تحليل مقارن). مقارنة نتائج التغييرات في المؤشر بمرور الوقت ، لمجموعة معينة من المنتجات ، في مناطق مختلفة ، إلخ.
  • يسمح لنا تحليل الديناميكيات بتحديد اتجاهات معينة في التغيير في المؤشرات بمرور الوقت.

السرعة: يمكننا القول أن OLAP يقوم على قوانين علم النفس: القدرة على معالجة طلبات المعلومات في "الوقت الحقيقي" - بوتيرة عملية الفهم التحليلي للبيانات من قبل المستخدم.

إذا كان بإمكانك قراءة حوالي 200 سجل في الثانية من قاعدة بيانات علائقية وكتابة 20 ، فإن خادم OLAP الجيد ، باستخدام الصفوف والأعمدة المحسوبة ، يمكنه دمج 20.000 إلى 30.000 خلية (أي ما يعادل سجل واحد في قاعدة بيانات علائقية) في الثانية.

الرؤية: يجب التأكيد على أن OLAP يوفر عرضًا رسوميًا متقدمًا للبيانات للمستخدم النهائي. إن الدماغ البشري قادر على إدراك وتحليل المعلومات التي يتم تقديمها في شكل صور هندسية ، في حجم أكبر بعدة مرات من المعلومات المقدمة في شكل أبجدي رقمي. مثال: لنفترض أنك بحاجة إلى العثور على وجه مألوف في واحدة من مئات الصور. أعتقد أن هذه العملية ستستغرق أقل من دقيقة. تخيل الآن أنه بدلاً من الصور الفوتوغرافية ، سيتم تقديم مائة وصف شفهي لنفس الأشخاص. أعتقد أنك لن تكون قادرًا على حل المشكلة المقترحة على الإطلاق.

بساطة: السمة الرئيسية لهذه التقنيات هي أنها تركز على استخدامها ليس من قبل متخصص في تكنولوجيا المعلومات ، وليس من قبل خبير إحصائي ، ولكن بواسطة متخصص في المجال التطبيقي - مدير قسم الائتمان ، مدير قسم الميزانية ، وأخيراً المخرج. وهي مصممة للمحلل للتواصل مع المشكلة وليس مع الكمبيوتر..

على الرغم من الإمكانات العظيمة لـ OLAP (بالإضافة إلى ذلك ، الفكرة قديمة نسبيًا - الستينيات) ، في الواقع ، لم يتم العثور على استخدامها عمليًا في مؤسساتنا. لماذا ا؟

  • لا توجد معلومات أو الاحتمالات غير واضحة
  • عادة التفكير ثنائي الأبعاد
  • حاجز السعر
  • القابلية المفرطة لتصنيع المقالات على OLAP: المصطلحات غير المألوفة تخيف - OLAP ، "حفر وتقطيع البيانات" ، "استعلامات مخصصة" ، "تحديد الارتباطات المهمة"

نهجنا والنهج الغربي لتطبيقات OLAP

بالإضافة إلى ذلك ، لدينا أيضًا فهم محدد لفائدة OLAP حتى أثناء فهم قدراتها التكنولوجية.

يعبر مؤلفونا والروس لمواد مختلفة على OLAP عن الرأي التالي فيما يتعلق بفائدة OLAP: الغالبية ترى OLAP كأداة تسمح لك بتوسيع البيانات وطيها ببساطة وسهولة ، وإجراء عمليات التلاعب التي تأتي إلى رأس المحلل أثناء التحليل. كلما زاد عدد "الشرائح" و "القطع" من البيانات التي يراها المحلل ، زادت الأفكار لديه ، والتي بدورها تتطلب المزيد والمزيد من "الشرائح" ليتم التحقق منها. فإنه ليس من حق.

يعتمد الفهم الغربي لفائدة OLAP على نموذج منهجي للتحليل ، والذي يجب وضعه في تصميم حلول OLAP. لا ينبغي للمحلل أن يلعب بمكعب OLAP وأن يغير أبعاده ومستويات التفاصيل ، واتجاه البيانات ، والعرض الرسومي للبيانات (وهو ما يتطلبه الأمر حقًا!) بدون هدف ، ولكن فهم بوضوح ما هي العروض التي يحتاجها ، وفي أي تسلسل ولماذا (بالطبع ، عناصر "اكتشافات" قد تكون موجودة ، لكن هذا ليس عنصرًا أساسيًا لفائدة OLAP).

الاستخدام التطبيقي لـ OLAP

  • الدخل
  • تدفق الأموال

أحد أكثر مجالات التطبيق خصوبة لتقنيات OLAP. ليس من قبيل الصدفة عدم اعتبار أي نظام موازنة حديث مكتمل بدون وجود أدوات OLAP لتحليل الميزانية في تكوينه. يتم إنشاء معظم تقارير الموازنة بسهولة على أساس أنظمة OLAP. في الوقت نفسه ، تجيب التقارير على مجموعة واسعة جدًا من الأسئلة: تحليل هيكل النفقات والدخل ، ومقارنة النفقات لعناصر معينة في أقسام مختلفة ، وتحليل ديناميكيات واتجاهات النفقات لعناصر معينة ، وتحليل التكلفة والأرباح .

سيسمح لك OLAP بتحليل التدفقات النقدية الداخلة والخارجة في سياق المعاملات التجارية والأطراف المقابلة والعملات والوقت من أجل تحسين تدفقاتها.

  • إعداد التقارير المالية والإدارية (مع التحليلات التي تحتاجها الإدارة)
  • تسويق
  • بطاقة التهديف المتوازن
  • التحليل الربحي

عندما تتوفر البيانات ذات الصلة ، يمكنك العثور على تطبيق تقنية OLAP مختلف.

منتجات OLAP

سيتحدث هذا القسم عن OLAP كحل برمجي.

المتطلبات العامة لمنتجات OLAP

هناك العديد من الطرق لتنفيذ تطبيقات OLAP ، فلا حاجة إلى تقنية معينة أو حتى التوصية بها. في ظل ظروف وظروف مختلفة ، قد يكون أحد الأساليب أفضل من الآخر. تتضمن تقنية التنفيذ العديد من أفكار الملكية المختلفة التي يفخر بها البائعون: نكهات بنية العميل / الخادم ، وتحليل السلاسل الزمنية ، وتوجيه الكائن ، وتحسين التخزين ، والعمليات المتوازية ، وما إلى ذلك ، لكن هذه التقنيات لا يمكن أن تكون جزءًا من تعريف OLAP.

هناك خصائص يجب مراعاتها في جميع منتجات OLAP (إذا كان منتج OLAP) ، وهي تقنية مثالية. هذه 5 تعريفات رئيسية تميز OLAP (ما يسمى باختبار FASMI): تحليل سريع للمعلومات المشتركة متعددة الأبعاد.

  • بسرعة(سريع) - يعني أن النظام يجب أن يكون قادرًا على توفير غالبية الردود للمستخدمين في غضون خمس ثوانٍ تقريبًا. حتى إذا حذر النظام من أن العملية ستستغرق وقتًا أطول بكثير ، يمكن أن يشتت انتباه المستخدمين ويفقدوا أفكارهم ، وستتأثر جودة التحليل. ليس من السهل تحقيق هذه السرعة مع كميات كبيرة من البيانات ، خاصة إذا كانت هناك حاجة إلى حسابات خاصة أثناء الطيران. يلجأ البائعون إلى مجموعة متنوعة من الأساليب لتحقيق هذا الهدف ، بما في ذلك الأشكال المتخصصة لتخزين البيانات ، والحساب المسبق الشامل ، أو تشديد متطلبات الأجهزة. ومع ذلك ، لا توجد حاليًا حلول مُحسَّنة بالكامل. للوهلة الأولى ، قد يبدو مفاجئًا أنه عند تلقي تقرير في دقيقة واحدة ، وهو ما لم يستغرق أيامًا طويلة ، يشعر المستخدم بالملل بسرعة كبيرة أثناء الانتظار ، ويتبين أن المشروع أقل نجاحًا مما كان عليه في حالة استجابة فورية ، حتى على حساب تحليل أقل تفصيلاً.
  • مشتركيعني أن النظام يجعل من الممكن تلبية جميع متطلبات حماية البيانات وتنفيذ الوصول الموزع والمتزامن إلى البيانات لمستويات مختلفة من المستخدمين. يجب أن يكون النظام قادرًا على التعامل مع تغييرات البيانات المتعددة في الوقت المناسب وبطريقة آمنة. يعد هذا أحد نقاط الضعف الرئيسية في العديد من منتجات OLAP ، والتي تميل إلى افتراض أن جميع تطبيقات OLAP للقراءة فقط وتوفر حماية مبسطة.
  • متعدد الأبعادهو مطلب رئيسي. إذا كان عليك تحديد OLAP في كلمة واحدة ، فستختاره. يجب أن يوفر النظام رؤية مفاهيمية متعددة الأبعاد للبيانات ، بما في ذلك الدعم الكامل للتسلسلات الهرمية والتسلسلات الهرمية المتعددة ، لأن هذا يحدد الطريقة الأكثر منطقية لتحليل الأعمال. لا يوجد حد أدنى لعدد الأبعاد المراد معالجتها ، حيث يعتمد ذلك أيضًا على التطبيق ، ومعظم منتجات OLAP لها أبعاد كافية للأسواق التي تستهدفها. مرة أخرى ، لا نحدد تقنية قاعدة البيانات الأساسية التي يجب استخدامها إذا تلقى المستخدم تمثيلًا مفاهيميًا متعدد الأبعاد حقًا للمعلومات. هذه الميزة في قلب OLAP
  • معلومة.يجب الحصول على المعلومات الضرورية عند الحاجة ، بغض النظر عن حجمها ومكان التخزين. ومع ذلك ، يعتمد الكثير على التطبيق. تُقاس قوة المنتجات المختلفة من حيث مقدار المدخلات التي يمكن معالجتها ، ولكن ليس من حيث عدد الجيجابايت التي يمكن تخزينها. تختلف قوة المنتجات اختلافًا كبيرًا - يمكن لأكبر منتجات OLAP معالجة بيانات أكثر ألف مرة على الأقل من أصغرها. هناك العديد من العوامل التي يجب مراعاتها في هذا الصدد ، بما في ذلك تكرار البيانات وذاكرة الوصول العشوائي المطلوبة واستخدام مساحة القرص والأداء وتكامل تخزين البيانات والمزيد.
  • التحليلاتيعني أن النظام يمكنه التعامل مع أي تحليل منطقي وإحصائي خاص بتطبيق معين ، ويضمن حفظه في نموذج يمكن للمستخدم النهائي الوصول إليه. يجب أن يكون المستخدم قادرًا على تحديد حسابات مخصصة جديدة كجزء من التحليل دون الحاجة إلى البرمجة. بمعنى ، يجب توفير جميع وظائف التحليل المطلوبة بطريقة بديهية للمستخدمين النهائيين. يمكن أن تتضمن أدوات التحليل إجراءات معينة ، مثل تحليل السلاسل الزمنية ، وتخصيص التكلفة ، وتحويلات العملات الأجنبية ، والبحث المستهدف ، وما إلى ذلك. وتختلف هذه القدرات على نطاق واسع بين المنتجات ، اعتمادًا على الاتجاه المستهدف.

بمعنى آخر ، هذه التعريفات الخمسة الأساسية هي الأهداف التي صممت منتجات OLAP لتحقيقها.

جوانب تقنية OLAP

يتضمن نظام OLAP مكونات معينة. هناك مخططات مختلفة لعملهم يمكن لمنتج معين تنفيذها.

مكونات أنظمة OLAP (ما الذي يتكون منه نظام OLAP؟)

بشكل نموذجي ، يتضمن نظام OLAP المكونات التالية:

  • مصدر البيانات
    المصدر الذي تؤخذ منه البيانات للتحليل (مستودع البيانات ، قاعدة بيانات أنظمة المحاسبة التشغيلية ، مجموعة من الجداول ، مجموعات مما سبق).
  • خادم OLAP
    يتم نقل البيانات من المصدر أو نسخها إلى خادم OLAP ، حيث يتم تنظيمها وإعدادها لتوليد الاستجابات على الاستعلامات لاحقًا بشكل أسرع.
  • عميل OLAP
    واجهة المستخدم لخادم OLAP ، حيث يعمل المستخدم

وتجدر الإشارة إلى أنه ليست كل المكونات مطلوبة. هناك أنظمة سطح مكتب OLAP تسمح لك بتحليل البيانات المخزنة مباشرة على كمبيوتر المستخدم ولا تتطلب خادم OLAP.

ومع ذلك ، ما هو العنصر المطلوب هو مصدر البيانات: توافر البيانات هو مسألة مهمة. إذا كانت موجودة ، بأي شكل ، مثل جدول Excel ، في قاعدة بيانات نظام المحاسبة ، في شكل تقارير منظمة للفروع ، يمكن لأخصائي تكنولوجيا المعلومات التكامل مع نظام OLAP مباشرة أو مع تحويل وسيط. لهذا ، تحتوي أنظمة OLAP على أدوات خاصة. إذا كانت هذه البيانات غير متوفرة ، أو أنها غير مكتملة بما فيه الكفاية وذات جودة غير كافية ، فلن يساعد OLAP. وهذا يعني أن OLAP ليست سوى بيانات إضافية ، وإذا لم يكن هناك أي منها ، فإنها تصبح شيئًا عديم الفائدة.

تنشأ معظم البيانات الخاصة بتطبيقات OLAP في أنظمة أخرى. ومع ذلك ، في بعض التطبيقات (على سبيل المثال ، للتخطيط أو وضع الميزانية) ، يمكن إنشاء البيانات مباشرة في تطبيقات OLAP. عندما تأتي البيانات من تطبيقات أخرى ، فمن الضروري عادةً تخزين البيانات في نموذج منفصل مكرر لتطبيق OLAP. لذلك ، يُنصح بإنشاء مستودعات بيانات.

وتجدر الإشارة إلى أن مصطلح "OLAP" يرتبط ارتباطًا وثيقًا بمصطلح "مستودع البيانات" (مستودع البيانات). مستودع البيانات عبارة عن مجموعة بيانات محددة المجال ومحددة زمنياً وغير قابلة للتغيير لدعم عملية صنع القرار الإداري. تأتي البيانات الموجودة في المستودع من أنظمة التشغيل (أنظمة OLTP) ، المصممة لأتمتة العمليات التجارية ؛ يمكن تجديد المستودع من مصادر خارجية ، على سبيل المثال ، التقارير الإحصائية.

على الرغم من أنها تحتوي على معلومات زائدة عن الحاجة بشكل متعمد ، وهي موجودة بالفعل في قواعد البيانات أو ملفات أنظمة التشغيل ، فإن تخزين البيانات ضروري للأسباب التالية:

  • تجزئة البيانات وتخزينها في تنسيقات DBMS مختلفة ؛
  • تحسين أداء استرجاع البيانات
  • إذا تم تخزين جميع البيانات في مؤسسة ما على خادم قاعدة بيانات مركزي (وهو أمر نادر للغاية) ، فمن المحتمل ألا يفهم المحلل هياكلها المعقدة والمربكة في بعض الأحيان
  • تؤدي الاستعلامات التحليلية المعقدة للمعلومات التشغيلية إلى إبطاء العمل الحالي للشركة ، ومنع الجداول لفترة طويلة والاستيلاء على موارد الخادم
  • القدرة على تنقية البيانات والتوفيق بينها
  • من المستحيل أو الصعب للغاية تحليل بيانات أنظمة التشغيل مباشرة ؛

الغرض من المستودع هو توفير "المواد الخام" للتحليل في مكان واحد وبنية بسيطة ومفهومة. أي أن مفهوم مستودعات البيانات ليس مفهومًا لتحليل البيانات ، بل هو مفهوم لإعداد البيانات للتحليل. يفترض تنفيذ مصدر بيانات واحد متكامل.

منتجات OLAP: البنى

عند استخدام منتجات OLAP ، هناك سؤالان مهمان: كيف وأين احتفظو للمعالجةالبيانات. يتم تمييز معماريات OLAP بناءً على كيفية تنفيذ هاتين العمليتين. هناك ثلاث طرق لتخزين البيانات لـ OLAP و 3 طرق لمعالجة هذه البيانات. تقدم العديد من الشركات المصنعة عدة خيارات ، ويحاول البعض إثبات أن نهجهم هو النهج الوحيد الأكثر حصافة. هذا هو، بطبيعة الحال، سخيف. ومع ذلك ، يمكن لعدد قليل جدًا من المنتجات العمل بكفاءة في أكثر من وضع.

خيارات تخزين بيانات OLAP

يعني الاحتفاظ في هذا السياق محتوى البيانات في حالة محدثة باستمرار.

  • قواعد البيانات العلائقية: هذا هو الخيار المعتاد إذا كانت المؤسسة تخزن بيانات الاعتماد في RDB. في معظم الحالات ، يجب تخزين البيانات في بنية غير طبيعية (المخطط النجمي هو الأكثر قبولًا). قاعدة البيانات التي تم تسويتها غير مقبولة بسبب أداء الاستعلام المنخفض للغاية عند إنشاء قيم مجمعة لـ OLAP (غالبًا ما يتم تخزين الإجماليات في جداول مجمعة).
  • ملفات قاعدة البيانات على جهاز الكمبيوتر العميل (الأكشاك أو مجموعات البيانات): يمكن نشر هذه البيانات مسبقًا أو إنشاؤها عند الطلب على أجهزة الكمبيوتر العميلة.

قواعد البيانات متعددة الأبعاد: تفترض أن البيانات مخزنة في قاعدة بيانات متعددة الأبعاد على الخادم. يمكن أن تشمل البيانات المسترجعة والملخصة من الأنظمة الأخرى وقواعد البيانات العلائقية ، وملفات المستخدم النهائي ، وما إلى ذلك. في معظم الحالات ، يتم تخزين قواعد البيانات متعددة الأبعاد على القرص ، ولكن بعض المنتجات تسمح أيضًا باستخدام ذاكرة الوصول العشوائي ، وحساب البيانات الأكثر استخدامًا على يطير ". في عدد صغير جدًا من المنتجات التي تستند إلى قواعد بيانات متعددة الأبعاد ، يمكن إجراء تعديلات متعددة على البيانات ، وتسمح العديد من المنتجات بإجراء تعديلات فردية ولكن قراءات متعددة للبيانات ، بينما يقتصر البعض الآخر على القراءة فقط.

مواقع التخزين الثلاثة هذه لها سعات تخزين متفاوتة ويتم ترتيبها بترتيب تنازلي من السعة. لديهم أيضًا خصائص أداء استعلام مختلفة: قواعد البيانات العلائقية أبطأ بكثير من الأخيرين.

خيارات معالجة بيانات OLAP

هناك 3 من نفس خيارات معالجة البيانات:

  • استخدام SQL: يستخدم هذا الخيار بالطبع عند تخزين البيانات في RDB. ومع ذلك ، لا يسمح SQL بإجراء عمليات حسابية متعددة الأبعاد في استعلام واحد ، لذا فإن استعلامات SQL المعقدة مطلوبة لتحقيق أكثر من وظيفة عادية متعددة الأبعاد. ومع ذلك ، هذا لا يمنع المطورين من المحاولة. في معظم الحالات ، يقومون بإجراء عدد محدود من حسابات SQL ذات الصلة ، مع النتائج التي يمكن الحصول عليها من معالجة البيانات متعددة الأبعاد أو من جهاز العميل. من الممكن أيضًا استخدام ذاكرة الوصول العشوائي (RAM) ، والتي يمكنها تخزين البيانات باستخدام أكثر من طلب واحد: وقد أدى ذلك إلى تحسين الاستجابة بشكل كبير.
  • معالجة متعددة الأبعاد من جانب العميل: يقوم منتج عميل OLAP بالحسابات بنفسه ، ولكن هذه المعالجة متاحة فقط إذا كان لدى المستخدمين أجهزة كمبيوتر شخصية قوية نسبيًا.

المعالجة متعددة الأبعاد من جانب الخادم: هذا مكان شائع للحوسبة متعددة الأبعاد في تطبيقات العميل / الخادم OLAP ويستخدم في العديد من المنتجات. عادةً ما يكون الأداء جيدًا لأن معظم العمليات الحسابية قد تم إجراؤها بالفعل. ومع ذلك ، يتطلب هذا مساحة كبيرة على القرص.

مصفوفة معمارية OLAP

وفقًا لذلك ، من خلال الجمع بين خيارات التخزين / المعالجة ، يمكنك الحصول على مصفوفة من بنى أنظمة OLAP. وفقًا لذلك ، من الناحية النظرية ، يمكن أن يكون هناك 9 مجموعات من هذه الطرق. ومع ذلك ، نظرًا لأن 3 منها خالية من الفطرة السليمة ، في الواقع هناك 6 خيارات فقط لتخزين ومعالجة بيانات OLAP.

خيارات تخزين متعددة الأبعاد
البيانات

المتغيرات
متعدد الأبعاد
معالجة البيانات

قاعدة بيانات علائقية

قاعدة بيانات متعددة الأبعاد من جانب الخادم

كمبيوتر العميل

حجم كارتيس

معالجة الخادم متعدد الأبعاد

Crystal Holos (وضع ROLAP)

خادم IBM DB2 OLAP

CA EUREKA: الإستراتيجية

Informix ميتاكوب

سبيدوير ميديا ​​/ MR

خدمات تحليل Microsoft

Oracle Express (وضع ROLAP)

خادم التحليل التجريبي

أبليكس iTM1

هولوس كريستال

قرار Comshare

Hyperion Essbase

اوراكل اكسبريس

سبيدواري ميديا ​​/ م

خدمات تحليل Microsoft

خادم PowerPlay Enterprise

خادم التحليل التجريبي

أبليكس iTM1

معالجة متعددة الأبعاد على جهاز الكمبيوتر العميل

مكتشف أوراكل

Informix ميتاكوب

البصيرة الأبعاد

مؤسسة هايبريون

كوجنوس باور بلاي

اكسبرس الشخصية

آفاق iTM1

نظرًا لأن التخزين هو الذي يحدد المعالجة ، فمن المعتاد التجميع حسب خيارات التخزين ، أي:

  • منتجات ROLAP في القطاعات 1 ، 2 ، 3
  • OLAP لسطح المكتب - في القطاع 6

منتجات MOLAP - في القطاعين 4 و 5

منتجات HOLAP (تتيح تخزين البيانات متعددة الأبعاد والعلائقية) - في 2 و 4 (بخط مائل)

فئات منتجات OLAP

يوجد أكثر من 40 من مزودي OLAP ، على الرغم من أنه لا يمكن اعتبارهم جميعًا منافسين ، لأن قدراتهم مختلفة جدًا ، وفي الواقع ، يعملون في قطاعات مختلفة من السوق. يمكن تجميعها في 4 فئات أساسية ، والتي تختلف بناءً على المفاهيم: الوظائف المعقدة - الوظائف البسيطة ، والأداء - مساحة القرص. من الملائم رسم الفئات كمربع لأنها توضح العلاقة بينهما. يتم تقديم سمة مميزة لكل فئة من الفئات على جانبها ، وأوجه التشابه مع الآخرين - على الجوانب المجاورة ، لذلك ، تختلف الفئات الموجودة على الجوانب المتقابلة اختلافًا جوهريًا.

الخصائص

مزايا

سلبيات

مندوب

تطبيق OLAP

تطبيقات كاملة غنية بالوظائف. تتطلب جميعها تقريبًا قاعدة بيانات متعددة الأبعاد ، على الرغم من أن بعضها يعمل مع قاعدة بيانات علائقية أيضًا. العديد من هذه الفئة من التطبيقات متخصصة ، على سبيل المثال ، المبيعات ، التصنيع ، الأعمال المصرفية ، الميزانية ، الدمج المالي ، تحليل المبيعات

القدرة على التكامل مع التطبيقات المختلفة

مستوى عال من الوظائف

مستوى عال من المرونة وقابلية التوسع

تعقيد التطبيق (الحاجة إلى تدريب المستخدم)

غالي السعر

حلول هايبريون

قرارات الكريستال

بناة المعلومات

يعتمد المنتج على بنية بيانات غير علائقية توفر تخزينًا متعدد الأبعاد ومعالجة وعرض البيانات. يتم اختيار البيانات في عملية التحليل حصريًا من هيكل متعدد الأبعاد. على الرغم من المستوى العالي من الانفتاح ، يقنع الموردون العملاء بشراء مجموعة الأدوات الخاصة بهم.

أداء عالي (حسابات سريعة للمجاميع وتحولات متعددة الأبعاد لأي أبعاد). متوسط ​​وقت الاستجابة لاستعلام تحليلي مخصص عند استخدام قاعدة بيانات متعددة الأبعاد عادة ما يكون 1-2 أوامر من حيث الحجم أقل من حالة RDB

مستوى عالٍ من الانفتاح: عدد كبير من المنتجات يمكن التكامل معها

إنهم يتعاملون بسهولة مع مهام تضمين الوظائف المدمجة المختلفة في نموذج المعلومات ، وإجراء تحليل متخصص من قبل المستخدم ، وما إلى ذلك.

الحاجة إلى مساحة قرص كبيرة لتخزين البيانات (بسبب التكرار في البيانات المخزنة). يعد هذا استخدامًا غير فعال للغاية للذاكرة - نظرًا لعدم التطابق والتجميع الذي تم إجراؤه مسبقًا ، فإن كمية البيانات في قاعدة بيانات متعددة الأبعاد تقابل 2.5-100 مرة أقل من حجم البيانات التفصيلية الأصلية. على أي حال ، لا تسمح MOLAP بالعمل مع قواعد البيانات الكبيرة. الحد الحقيقي هو أساس 10-25 جيجا بايت

انفجار محتمل لقاعدة البيانات - زيادة غير متوقعة وحادة وغير متناسبة في حجمها

عدم المرونة عندما يكون من الضروري تعديل هياكل البيانات. يتطلب أي تغيير في بنية الأبعاد دائمًا إعادة هيكلة كاملة للمكعب المفرط.

بالنسبة لقواعد البيانات متعددة الأبعاد ، لا توجد حاليًا معايير موحدة للواجهة ، ولغات لوصف البيانات ومعالجتها

هايبريون (إيسبيس)

DOLAP (سطح المكتب OLAP)

منتجات OLAP من جانب العميل سهلة التنفيذ وتتميز بتكلفة منخفضة لكل مقعد

نحن نتحدث عن مثل هذه المعالجة التحليلية ، حيث تكون المكعبات الفائقة صغيرة ، وأبعادها صغيرة ، والاحتياجات متواضعة ، ولمثل هذه المعالجة التحليلية ، يكفي وجود آلة شخصية على سطح المكتب.

هدف الشركات المصنعة في هذا السوق هو أتمتة مئات وآلاف أماكن العمل ، ولكن يجب على المستخدمين إجراء تحليل بسيط إلى حد ما. غالبًا ما يتم توجيه المشترين لشراء وظائف أكثر من اللازم

تكامل جيد مع قاعدة البيانات: متعدد الأبعاد ، علاقي

القدرة على القيام بعمليات شراء معقدة مما يقلل من تكلفة تنفيذ المشاريع

سهولة استخدام التطبيقات

وظائف محدودة للغاية (لا يمكن مقارنتها في هذا الصدد بالمنتجات المتخصصة)

طاقة محدودة للغاية (أحجام بيانات صغيرة ، قياسات قليلة)

كوجنوس (PowerPlay)

الكائنات الأعمال

قرارات الكريستال

هذا هو أصغر قطاع في السوق.

تبقى البيانات التفصيلية حيث كانت في الأصل - في قاعدة بيانات علائقية ؛ يتم تخزين بعض المجاميع في نفس قاعدة البيانات في جداول الخدمة المنشأة خصيصًا

قادر على التعامل مع كميات كبيرة جدًا من البيانات (تخزين اقتصادي)

يوفر وضع تشغيل متعدد المستخدمين ، بما في ذلك وضع التحرير ، وليس القراءة فقط

مستوى أعلى من حماية البيانات وفرص جيدة للتمييز بين حقوق الوصول

التغييرات المتكررة في هيكل القياس ممكنة (لا تتطلب إعادة التنظيم المادي لقاعدة البيانات)

أداء ضعيف ، وهو أدنى بكثير من سرعة الاستجابة للأسئلة متعددة الأبعاد (تُقاس الاستجابة للاستعلامات المعقدة بالدقائق أو حتى ساعات بدلاً من الثواني). هم منشئو التقارير أكثر سهولة في الاستخدام من الأدوات التحليلية التفاعلية

تعقيد المنتجات. يتطلب تكاليف كبيرة لخدمة تكنولوجيا المعلومات. تتطلب الأنظمة العلائقية مخطط قاعدة بيانات دقيقًا وضبطًا للفهرس لتحقيق أداء مشابه لـ MOLAP ، مما يعني بذل الكثير من الجهد من جانب مسؤولي قواعد البيانات.

مكلفة في التنفيذ

تظل قيود SQL حقيقة واقعة ، مما يمنع العديد من الوظائف المضمنة التي يتم توفيرها بسهولة في الأنظمة القائمة على تمثيل البيانات متعدد الأبعاد في RDBMS.

ميزة المعلومات

Informix (ميتاكوب)

وتجدر الإشارة إلى أن مستهلكي المنتجات الهجينة التي تسمح بتحديد وضع ROLAP و MOLAP ، مثل Microsoft Analysis Services و OracleExpress و Crystal Holos و IBM DB2 OLAPServer ، يختارون دائمًا وضع MOLAP.

كل فئة من الفئات المقدمة لها نقاط القوة والضعف الخاصة بها ؛ لا يوجد خيار واحد أمثل. يؤثر الاختيار على 3 جوانب مهمة: 1) الأداء ؛ 2) مساحة القرص لتخزين البيانات ؛ 3) القدرات والوظائف وخاصة قابلية التوسع لحل OLAP. في الوقت نفسه ، من الضروري مراعاة أحجام البيانات المعالجة وقوة التكنولوجيا واحتياجات المستخدمين والبحث عن حل وسط بين السرعة والتكرار في مساحة القرص التي تشغلها قاعدة البيانات ، بسيطة ومتعددة الوظائف.

تصنيف مخازن البيانات حسب حجم قاعدة البيانات المستهدفة

عيوب OLAP

مثل أي تقنية OLAP ، لها أيضًا عيوبها: متطلبات عالية للأجهزة ، وتدريب ومعرفة الموظفين الإداريين والمستخدمين النهائيين ، والتكاليف المرتفعة لتنفيذ مشروع التنفيذ (النقدي والوقت ، والفكري).

اختيار منتج OLAP

يعد اختيار منتج OLAP المناسب أمرًا صعبًا ، ولكنه مهم جدًا إذا كنت تريد ألا يفشل مشروعك.

كما ترى ، تكمن اختلافات المنتج في العديد من المجالات: وظيفية ، معمارية ، تقنية. بعض المنتجات محدودة للغاية في التخصيص. بعضها مصمم لمجالات متخصصة: التسويق والمبيعات والتمويل. هناك منتجات للأغراض العامة ، وليست مخصصة للاستخدام التطبيقي ، والتي يجب أن تكون مرنة بدرجة كافية. كقاعدة عامة ، تكون هذه المنتجات أرخص من المنتجات المتخصصة ، ولكن هناك المزيد من تكاليف التنفيذ. نطاق منتجات OLAP واسع جدًا - بدءًا من أبسط الأدوات لإنشاء الجداول المحورية والمخططات التي تشكل جزءًا من منتجات المكتب ، إلى تحليل البيانات والبحث عن الأنماط ، والتي تبلغ تكلفتها عشرات الآلاف من الدولارات.

كما هو الحال مع أي حقل ، لا يمكن أن تكون هناك إرشادات محددة لاختيار الأدوات في مجال OLAP. يمكنك التركيز فقط على عدد من النقاط الرئيسية ومطابقة إمكانيات البرامج المقدمة لاحتياجات المنظمة. هناك شيء واحد مهم: إذا كنت لا تفكر في كيفية استخدامك لأدوات OLAP ، فإنك تخاطر بإصابة نفسك بصداع قوي.

في عملية الاختيار ، من الضروري النظر في سؤالين:

  • تقييم احتياجات وقدرات المؤسسة
  • تقييم العرض الحالي في السوق ، واتجاهات التنمية مهمة أيضًا

ثم يمكن مقارنة كل هذا ، وفي الواقع ، يتم الاختيار.

تقييم الاحتياجات

لا يمكنك اتخاذ خيار عقلاني لمنتج ما دون فهم الغرض الذي سيتم استخدامه من أجله. تريد العديد من الشركات "أفضل منتج" بدون فهم واضح لكيفية استخدامه.

من أجل تنفيذ المشروع بنجاح ، يجب على المدير المالي على الأقل صياغة رغباته ومتطلباته بشكل صحيح للمدير ومتخصصي خدمة الأتمتة. تنشأ العديد من المشكلات بسبب عدم كفاية الاستعداد والوعي لاختيار OLAP ، يواجه متخصصو تكنولوجيا المعلومات والمستخدمون النهائيون صعوبات في الاتصال لمجرد أنهم يتلاعبون بمفاهيم ومصطلحات مختلفة في المحادثة ويطرحون تفضيلات متضاربة. أنت بحاجة إلى الاتساق في الغرض داخل الشركة.

لقد أصبحت عدة عوامل واضحة بالفعل بعد قراءة نظرة عامة على فئات منتجات OLAP ، وهي:

الجوانب الفنية

  • مصادر البيانات: مستودع بيانات الشركة ، نظام OLTP ، ملفات الجدول ، قواعد البيانات العلائقية. إمكانية ربط مجموعة أدوات OLAP بجميع نظم إدارة قواعد البيانات المستخدمة في المنظمة. كما تظهر الممارسة ، يعد دمج المنتجات غير المتشابهة في نظام تشغيل مستقر أحد أهم المشكلات ، ويمكن أن يرتبط حلها في بعض الحالات بمشكلات كبيرة. من الضروري فهم مدى سهولة وموثوقية دمج أدوات OLAP مع نظم إدارة قواعد البيانات الموجودة في المؤسسة. من المهم أيضًا تقييم إمكانيات التكامل ليس فقط مع مصادر البيانات ، ولكن أيضًا مع التطبيقات الأخرى التي قد تحتاج إلى تصدير البيانات إليها: البريد الإلكتروني ، والتطبيقات المكتبية
  • تنوع البيانات التي تؤخذ في الاعتبار
  • منصة الخادم: NT ، و Unix ، و AS / 400 ، و Linux - لكن لا تصر على أن تعمل منتجات OLAP على منصات مشكوك فيها أو محتضرة لا تزال تستخدمها
  • معايير جانب العميل والمتصفح
  • العمارة المنتشرة: مودم LAN و PC ، عميل / خادم عالي السرعة ، إنترانت ، إكسترانت ، إنترنت
  • الميزات الدولية: دعم متعدد العملات ، عمليات متعددة اللغات ، مشاركة البيانات ، الترجمة ، الترخيص ، تحديث Windows

كميات معلومات الإدخال المتوفرة والتي ستظهر في المستقبل

المستخدمون

  • نطاق التطبيق: تحليل المبيعات / التسويق ، الميزنة / التخطيط ، تحليل مؤشرات الأداء ، تحليل التقارير المحاسبية ، التحليل النوعي ، الوضع المالي ، تكوين المواد التحليلية (التقارير)
  • عدد المستخدمين وموقعهم ، ومتطلبات فصل حقوق الوصول إلى البيانات والوظائف ، وسرية (سرية) المعلومات
  • عرض المستخدم: الإدارة العليا ، والتمويل ، والتسويق ، والموارد البشرية ، والمبيعات ، والتصنيع ، إلخ.
  • تجربة المستخدم. مستوى مهارة المستخدم. ضع في اعتبارك توفير التدريب. من المهم جدًا أن يكون تطبيق عميل OLAP بحيث يشعر المستخدمون بالثقة ويمكنهم استخدامه بفعالية.

الملامح الرئيسية: الحاجة إلى إعادة كتابة البيانات ، والحوسبة الموزعة ، وتحويلات العملات المعقدة ، والحاجة إلى طباعة التقارير ، وواجهة جداول البيانات ، وتعقيد منطق التطبيق ، والبعد المطلوب ، وأنواع التحليل: الإحصائي ، والبحث عن الهدف ، وتحليل ماذا لو

تطبيق

  • من سيقوم بالتنفيذ والتشغيل: المستشارون الخارجيون ، أو تكنولوجيا المعلومات الداخلية ، أو المستخدمون النهائيون
  • الميزانية: البرمجيات والأجهزة والخدمات ونقل البيانات. تذكر أن تراخيص منتجات OLAP ليست سوى جزء صغير من التكلفة الإجمالية للمشروع. يمكن أن تكون تكاليف التنفيذ والأجهزة أكبر من رسوم الترخيص ، ومن المؤكد تقريبًا أن تكاليف الدعم والصيانة والإدارة على المدى الطويل أعلى بكثير. وإذا اتخذت القرار الخاطئ بشراء منتج خاطئ لمجرد أنه أرخص ، يمكن أن تحصل في النهاية على تكلفة إجمالية أعلى للمشروع بسبب ارتفاع تكاليف الصيانة والإدارة و / أو الأجهزة ، بينما من المحتمل أن تحصل على مستوى أقل من الفوائد التجارية . عند تقدير التكلفة الإجمالية ، تأكد من طرح الأسئلة التالية: ما مدى اتساع اختيار مصادر التنفيذ والتدريب والدعم؟ هل المخزون العام المحتمل (موظفون ، مقاولون ، استشاريون) عرضة للنمو أو الانخفاض؟ إلى أي مدى يمكن استخدام خبرتك في العمل؟

على الرغم من حقيقة أن تكلفة الأنظمة التحليلية حتى اليوم لا تزال مرتفعة للغاية ، ولا تزال منهجيات وتقنيات تنفيذ هذه الأنظمة في مرحلة تكوينها ، إلا أن التأثير الاقتصادي الذي توفره هذه الأنظمة يتجاوز بشكل كبير تأثير الأنظمة التقليدية. أنظمة التشغيل.

من الصعب تقدير تأثير التنظيم الصحيح والتخطيط الاستراتيجي والتشغيلي لتطوير الأعمال مسبقًا بالأرقام ، ولكن من الواضح أنه يمكن أن يتجاوز تكاليف تنفيذ مثل هذه الأنظمة بعشرات أو حتى مئات المرات. ومع ذلك ، لا ينبغي للمرء أن يخطئ. لا يتم توفير التأثير من خلال النظام نفسه ، ولكن من خلال الأشخاص الذين يعملون معه. لذلك ، فإن التصريحات من النوع: "نظام مستودعات البيانات وتقنيات OLAP ستساعد المدير على اتخاذ القرارات الصحيحة" ليست صحيحة تمامًا. الأنظمة التحليلية الحديثة ليست أنظمة ذكاء اصطناعي ولا يمكنها المساعدة أو إعاقة عملية صنع القرار. هدفهم هو تزويد المدير بجميع المعلومات اللازمة لاتخاذ القرار بشكل مناسب في الوقت المناسب. وما هي المعلومات التي سيتم طلبها والقرار الذي سيتم اتخاذه على أساسها يعتمد فقط على الشخص المحدد الذي يستخدمها.

يبقى شيء واحد يقال ، يمكن أن تساعد هذه الأنظمة في حل العديد من مشاكل الأعمال ويمكن أن يكون لها آثار إيجابية بعيدة المدى. يبقى فقط انتظار من هو أول من يدرك مزايا هذا النهج وسيكون متقدمًا على الآخرين.

المعالجة التحليلية عبر الإنترنت ، أو OLAP ، هي تقنية فعالة لمعالجة البيانات ، ونتيجة لذلك يتم عرض المعلومات الموجزة على أساس مصفوفات ضخمة من جميع أنواع البيانات. إنه منتج قوي يساعدك في الوصول إلى المعلومات واسترجاعها وعرضها على جهاز الكمبيوتر وتحليلها من وجهات نظر مختلفة.

OLAP هي أداة توفر موقعًا استراتيجيًا للتخطيط طويل الأجل وتأخذ في الاعتبار المعلومات الأساسية للبيانات التشغيلية في المستقبل 5 أو 10 سنوات أو أكثر. يتم تخزين البيانات في قاعدة بيانات ذات بعد هو السمة الخاصة بها. يمكن للمستخدمين عرض نفس مجموعة البيانات بسمات مختلفة ، اعتمادًا على الغرض من التحليل.

تاريخ OLAP

OLAP ليس مفهومًا جديدًا وقد تم استخدامه منذ عقود. في الواقع ، تعود أصول التكنولوجيا إلى عام 1962. لكن المصطلح لم يُصاغ إلا في عام 1993 من قبل مؤلف قاعدة البيانات تيد كودوم ، الذي وضع أيضًا 12 قاعدة للمنتج. كما هو الحال مع العديد من التطبيقات الأخرى ، مر المفهوم بعدة مراحل تطورية.

يعود تاريخ تقنية OLAP نفسها إلى عام 1970 ، عندما تم إصدار محتوى Express وأول خادم Olap. تم الحصول عليها من قبل Oracle في عام 1995 وأصبحت فيما بعد العمود الفقري للمعالجة التحليلية عبر الإنترنت لمحرك الحوسبة متعدد الأبعاد الذي قدمته العلامة التجارية المعروفة لأجهزة الكمبيوتر في قاعدة بياناتها. في عام 1992 ، تم إطلاق منتج آخر معروف للمعالجة التحليلية عبر الإنترنت ، Essbase ، بواسطة Arbor Software (استحوذت عليه Oracle في 2007).

في عام 1998 ، أصدرت Microsoft خادم تحليلات معالجة البيانات عبر الإنترنت لخدمات التحليل MS. ساهم هذا في شعبية التكنولوجيا ودفع تطوير منتجات أخرى. يوجد اليوم العديد من الموردين العالميين المشهورين الذين يقدمون تطبيقات Olap ، بما في ذلك IBM و SAS و SAP و Essbase و Microsoft و Oracle و IcCube.

المعالجة التحليلية عبر الإنترنت

OLAP هي أداة تسمح لك باتخاذ قرارات بشأن الأحداث المجدولة. يمكن أن يكون حساب Olap غير النمطي أكثر تعقيدًا من تجميع البيانات البسيط. يتم استخدام الاستعلامات التحليلية في الدقيقة (AQM) كمعيار قياسي لمقارنة أداء الأدوات المختلفة. يجب أن تخفي هذه الأنظمة المستخدمين من بناء جملة الاستعلامات المعقدة قدر الإمكان وتوفر أوقات استجابة متسقة للجميع (بغض النظر عن مدى تعقيدها).

هناك الخصائص الرئيسية التالية لـ OLAP:

  1. تمثيلات البيانات متعددة الأبعاد.
  2. دعم العمليات الحسابية المعقدة.
  3. استطلاع مؤقت.

يوفر العرض متعدد الأبعاد إطار عمل للمعالجة التحليلية من خلال الوصول المرن إلى بيانات الشركة. يسمح للمستخدمين بتحليل البيانات في أي بعد وعلى أي مستوى من التجميع.

دعم العمليات الحسابية المعقدة هو العمود الفقري لبرنامج OLAP.

يتم استخدام ذكاء الوقت لتقييم أداء أي تطبيق تحليلي على مدار فترة زمنية. على سبيل المثال ، هذا الشهر مقابل الشهر الماضي ، هذا الشهر مقابل نفس الشهر من العام الماضي.

هيكل بيانات متعدد الأبعاد

تعد بنية البيانات متعددة الأبعاد إحدى الخصائص الرئيسية للمعالجة التحليلية عبر الإنترنت. يمكن أن يكون للمكعب أبعاد متعددة. باستخدام هذا النموذج ، تكون عملية تعدين OLAP بأكملها سهلة للمديرين والمديرين التنفيذيين ، نظرًا لأن الكائنات الممثلة في الخلايا هي كائنات أعمال في العالم الحقيقي. بالإضافة إلى ذلك ، يسمح نموذج البيانات هذا للمستخدمين بالتعامل ليس فقط مع المصفوفات المهيكلة ، ولكن أيضًا غير المنظمة وشبه المنظمة. كل هذا يجعلها شائعة بشكل خاص لتحليل البيانات وتطبيقات ذكاء الأعمال.

الخصائص الرئيسية لأنظمة OLAP:

  1. استخدم طرق تحليل البيانات متعددة الأبعاد.
  2. يوفر دعمًا متقدمًا لقواعد البيانات.
  3. إنشاء واجهات سهلة الاستخدام للمستخدم النهائي.
  4. يدعم هندسة العميل / الخادم.

أحد المكونات الرئيسية لمفاهيم OLAP هو الخادم من جانب العميل. بالإضافة إلى تجميع البيانات ومعالجتها مسبقًا من قاعدة بيانات علائقية ، فإنه يوفر خيارات حساب وتسجيل متقدمة ووظائف إضافية وقدرات استعلام أساسية متقدمة والمزيد.

تتوفر نماذج وأدوات بيانات مختلفة ، اعتمادًا على نموذج التطبيق الذي يختاره المستخدم ، بما في ذلك التنبيه في الوقت الفعلي ، والبرمجة النصية ماذا لو ، والتحسين ، وتقارير OLAP المعقدة.

شكل مكعب

يعتمد المفهوم على شكل مكعب. يوضح موقع البيانات الموجودة فيه كيف يلتزم OLAP بمبدأ التحليل متعدد الأبعاد ، مما ينتج عنه بنية بيانات مصممة لتحليل سريع وفعال.

يُشار إلى مكعب OLAP أيضًا باسم "المكعب المفرط". يوصف بأنه يتكون من حقائق (مقاييس) رقمية مصنفة حسب الأوجه (الأبعاد). تشير الأبعاد إلى السمات التي تحدد مشكلة العمل. ببساطة ، البعد هو تسمية تصف مقياسًا. على سبيل المثال ، في تقارير المبيعات ، سيكون المقياس هو حجم المبيعات ، وستتضمن الأبعاد فترة المبيعات ، ومندوب المبيعات ، والمنتج أو الخدمة ، ومنطقة المبيعات. في الإبلاغ عن عمليات التصنيع ، يمكن أن يكون المقياس إجمالي تكاليف الإنتاج ووحدات الإنتاج. ستكون الأبعاد هي تاريخ أو وقت الإنتاج ، أو مرحلة الإنتاج أو المرحلة ، حتى العمال المشاركين في عملية الإنتاج.

مكعب بيانات OLAP هو حجر الزاوية في النظام. يتم تنظيم البيانات الموجودة في المكعب باستخدام إما مخطط نجمة أو ندفة الثلج. يوجد في المركز جدول حقائق يحتوي على مجاميع (مقاييس). إنه مرتبط بعدد من جداول الأبعاد التي تحتوي على معلومات القياس. تصف الأبعاد كيف يمكن تحليل هذه المقاييس. إذا كان المكعب يحتوي على أكثر من ثلاثة أبعاد ، فغالبًا ما يشار إليه على أنه مكعب مفرط.

تتمثل إحدى الوظائف الرئيسية للمكعب في طبيعته الثابتة ، مما يعني أنه لا يمكن تغيير المكعب بعد تصميمه. لذلك ، تعد عملية تجميع مكعب وإعداد نموذج بيانات خطوة حاسمة نحو معالجة البيانات المناسبة في بنية OLAP.

الجمع بين البيانات

يعد استخدام التجميع هو السبب الرئيسي وراء معالجة الاستعلامات بشكل أسرع في أدوات OLAP (مقارنة بـ OLTP). التجميعات هي ملخصات للبيانات التي تم حسابها مسبقًا أثناء المعالجة. يقوم كل الأعضاء المخزنين في جداول أبعاد OLAP بتعريف الاستعلامات التي يمكن أن يتلقاها المكعب.

في المكعب ، يتم تخزين تراكمات المعلومات في الخلايا ، ويتم تعيين إحداثياتها حسب أبعاد محددة. يعتمد عدد المجاميع التي يمكن أن يحتويها المكعب على كل المجموعات الممكنة لأعضاء الأبعاد. لذلك ، يمكن أن يحتوي المكعب النموذجي في تطبيق ما على عدد كبير جدًا من الركام. سيتم احتساب المجاميع الرئيسية فقط التي يتم توزيعها عبر المكعب التحليلي الكامل للتحليلات عبر الإنترنت مسبقًا. سيؤدي هذا إلى تقليل الوقت المستغرق بشكل كبير لتحديد أي تجميعات عند تنفيذ استعلام على نموذج البيانات.

هناك أيضًا خياران مرتبطان بالتجميع يمكنهما تحسين أداء المكعب النهائي: إنشاء تجميع ذاكرة التخزين المؤقت للقدرة ، واستخدام التجميع بناءً على تحليل استعلامات المستخدم.

مبدأ التشغيل

عادةً ، يمكن إجراء تحليل المعلومات التشغيلية التي تم الحصول عليها من المعاملات باستخدام جدول بيانات بسيط (يتم تمثيل قيم البيانات في صفوف وأعمدة). هذا أمر جيد بالنظر إلى الطبيعة ثنائية الأبعاد للبيانات. في حالة OLAP ، هناك اختلافات بسبب مجموعة البيانات متعددة الأبعاد. نظرًا لأنه يتم الحصول عليها غالبًا من مصادر مختلفة ، فقد لا يقوم جدول البيانات دائمًا بمعالجتها بكفاءة.

يحل المكعب هذه المشكلة ويحافظ أيضًا على تشغيل مستودع بيانات OLAP بطريقة منطقية ومنظمة. تجمع الشركات البيانات من مصادر متعددة ويتم تقديمها في مجموعة متنوعة من التنسيقات مثل الملفات النصية وملفات الوسائط المتعددة وجداول بيانات Excel وقواعد بيانات Access وحتى قواعد بيانات OLTP.

يتم جمع جميع البيانات في مستودع يتم ملؤه مباشرة من المصادر. سيقوم بتنظيف المعلومات الأولية من OLTP والمصادر الأخرى لأي معاملات خاطئة وغير كاملة وغير متسقة.

بعد التنظيف والتحويل ، سيتم تخزين المعلومات في قاعدة بيانات علائقية. سيتم بعد ذلك تحميله إلى خادم OLAP متعدد الأبعاد (أو Olap cube) لتحليله. سيتمكن المستخدمون النهائيون المسؤولون عن تطبيقات الأعمال واستخراج البيانات والعمليات التجارية الأخرى من الوصول إلى المعلومات التي يحتاجون إليها من Olap cube.

فوائد نموذج المصفوفة

OLAP هي أداة توفر أداء استعلام سريعًا من خلال التخزين المحسن والفهرسة متعددة الأبعاد والتخزين المؤقت ، وهي مزايا مهمة للنظام. بالإضافة إلى ذلك ، الفوائد هي:

  1. حجم بيانات أصغر على القرص.
  2. الحساب الآلي لتجميعات مستوى البيانات الأعلى.
  3. توفر نماذج المصفوفة فهرسة طبيعية.
  4. يتم استخراج البيانات بكفاءة من خلال الهيكلة المسبقة.
  5. الانضغاط لمجموعات البيانات منخفضة الأبعاد.

تشمل عيوب OLAP حقيقة أن بعض القرارات (خطوة المعالجة) يمكن أن تكون طويلة جدًا ، خاصة مع كميات كبيرة من المعلومات. يتم تصحيح هذا عادةً عن طريق إجراء معالجة إضافية فقط (فحص البيانات التي تم تغييرها).

العمليات التحليلية الأساسية

التفاف(التدحرج / الحفر) يُعرف أيضًا باسم "التوحيد". يتضمن الالتفاف جمع كل البيانات التي يمكن استرجاعها وحسابها كلها في بُعد واحد أو أكثر. في كثير من الأحيان ، قد يتطلب ذلك تطبيق صيغة رياضية. كمثال OLAP ، ضع في اعتبارك شبكة بيع بالتجزئة بها منافذ بيع في مدن مختلفة. لتحديد الأنماط وتوقع اتجاهات المبيعات المستقبلية ، يتم "تجميع" البيانات المتعلقة بها من جميع النقاط إلى قسم المبيعات الرئيسي للشركة للتوحيد والحساب.

إفشاء(حفر لأسفل). هذا هو عكس التخثر. تبدأ العملية بمجموعة بيانات كبيرة ثم تنقسم إلى مجموعات أصغر ، مما يسمح للمستخدمين بمشاهدة التفاصيل. في مثال البيع بالتجزئة ، سيقوم المحلل بتحليل بيانات المبيعات وإلقاء نظرة على العلامات التجارية الفردية أو المنتجات التي تعتبر الأفضل مبيعًا في كل من المنافذ في مدن مختلفة.

المقطع العرضي(شريحة ونرد). إنها عملية تشتمل فيها العمليات التحليلية على خطوتين: أخذ مجموعة محددة من البيانات من مكعب OLAP (جانب "القطع" من التحليل) وعرضها من وجهات نظر أو زوايا مختلفة. يمكن أن يحدث هذا عندما يتم استلام جميع بيانات نقاط البيع وإدخالها في المكعب التشعبي. يقوم المحلل بتقطيع مجموعة من بيانات المبيعات من OLAP Cube. ستتم مراجعته بعد ذلك عند تحليل مبيعات الوحدات الفردية في كل منطقة. خلال هذا الوقت ، يمكن للمستخدمين الآخرين التركيز على تقييم فعالية المبيعات من حيث التكلفة أو تقييم فعالية الحملة التسويقية والإعلانية.

منعطف أو دور(محوري). يقوم بتدوير محاور البيانات لتحل محل عرض المعلومات.

أنواع قواعد البيانات

بشكل أساسي ، هذا مكعب OLAP نموذجي يقوم بتنفيذ معالجة تحليلية للبيانات متعددة الأبعاد باستخدام OLAP Cube أو أي مكعب بيانات بحيث يمكن للعملية التحليلية إضافة أبعاد حسب الحاجة. سيتم تخزين أو أرشفة أي معلومات يتم تحميلها في قاعدة بيانات متعددة الأبعاد ويمكن استرجاعها عند الحاجة.

المعنى

OLAP العلائقية (ROLAP)

ROLAP هو نظام DBMS متقدم إلى جانب خرائط بيانات متعددة الأبعاد لأداء عملية ارتباطية قياسية

OLAP متعدد الأبعاد (MOLAP)

MOLAP - ينفذ العمل في البيانات متعددة الأبعاد

المعالجة التحليلية الهجينة عبر الإنترنت (HOLAP)

في نهج HOLAP ، يتم تخزين الإجماليات المجمعة في قاعدة بيانات متعددة الأبعاد ، ويتم تخزين المعلومات التفصيلية في قاعدة بيانات علائقية. هذا يضمن كلاً من كفاءة نموذج ROLAP وأداء نموذج MOLAP.

OLAP Desktop (DOLAP)

في سطح المكتب OLAP ، يقوم المستخدم بتنزيل جزء من البيانات من قاعدة بيانات محليًا أو إلى سطح المكتب الخاص به ويقوم بتحليلها. DOLAP أرخص نسبيًا في النشر لأنه يوفر وظائف قليلة جدًا مقارنة بأنظمة OLAP الأخرى

ويب OLAP (WOLAP)

Web OLAP هو نظام OLAP يمكن الوصول إليه من خلال مستعرض ويب. WOLAP عبارة عن بنية ثلاثية المستويات. يحتوي على ثلاثة مكونات: العميل والبرمجيات الوسيطة وخادم قاعدة البيانات

OLAP المحمول

يساعد Mobile OLAP المستخدمين في الحصول على بيانات OLAP وتحليلها باستخدام أجهزتهم المحمولة

OLAP المكاني

تم إنشاء SOLAP لتسهيل إدارة البيانات المكانية وغير المكانية في نظام المعلومات الجغرافية (GIS)

هناك أنظمة أو تقنيات OLAP أقل شهرة ، ولكن هذه هي الأنظمة الرئيسية المستخدمة حاليًا من قبل الشركات الكبيرة والشركات وحتى الحكومات.

أدوات OLAP

يتم تمثيل أدوات المعالجة التحليلية عبر الإنترنت بشكل جيد للغاية على الإنترنت في كل من الإصدارات المدفوعة والمجانية.

الأكثر شيوعًا هي:

  1. Dundas BI من Dundas Data Visualization هو محلل أعمال قائم على المستعرض ومنصة تصور البيانات التي تتضمن لوحات معلومات متكاملة وتقارير OLAP وتحليلات البيانات.
  2. Yellowfin هي عبارة عن منصة ذكاء الأعمال وهي عبارة عن حل فردي متكامل مصمم للشركات من جميع الصناعات والأحجام. هذا النظام قابل للتخصيص للشركات في مجالات المحاسبة والإعلان والزراعة.
  3. ClicData هو حل ذكاء الأعمال (BI) مصمم للاستخدام بشكل أساسي من قبل الشركات الصغيرة والمتوسطة الحجم. تتيح الأداة للمستخدمين النهائيين إنشاء التقارير ولوحات المعلومات. تم تصميم Board لدمج ذكاء الأعمال وإدارة أداء الشركات وهو نظام كامل الميزات يخدم الشركات متوسطة الحجم والشركات.
  4. Domo عبارة عن مجموعة إدارة أعمال قائمة على السحابة تتكامل مع مصادر بيانات متعددة بما في ذلك جداول البيانات وقواعد البيانات والوسائط الاجتماعية وأي حل سحابي أو برنامج محلي.
  5. InetSoft Style Intelligence عبارة عن نظام أساسي لبرنامج تحليل الأعمال يمكّن المستخدمين من إنشاء لوحات معلومات وتقنية تحليل OLAP المرئية وتقارير Mashup.
  6. Birst by Infor Company هو محلل أعمال قائم على الويب وحل تحليل يجمع الأفكار من فرق مختلفة معًا لمساعدتك في اتخاذ قرارات مستنيرة. تتيح الأداة للمستخدمين اللامركزيين توسيع نطاق نموذج فريق الشركة.
  7. Halo هو نظام شامل لإدارة سلسلة التوريد وذكاء الأعمال يساعد في تخطيط الأعمال والتنبؤ بالمخزون لإدارة سلسلة التوريد. يستخدم النظام البيانات من جميع المصادر - الكبيرة والصغيرة والمتوسطة.
  8. تشارتيو هو حل محلل أعمال قائم على السحابة يوفر للمؤسسين وفرق العمل ومحللي البيانات ومجموعات المنتجات الأدوات اللازمة لتنظيم عملهم اليومي.
  9. Exago BI هو حل قائم على الويب مصمم ليتم تضمينه في تطبيقات الويب. يتيح تطبيق Exago BI للشركات من جميع الأحجام تزويد عملائها بتقارير مخصصة وفي الوقت المناسب وتفاعلية.

تأثير الأعمال

سيجد المستخدم OLAP في معظم تطبيقات الأعمال عبر مختلف الصناعات. يتم استخدام التحليل ليس فقط من قبل الشركة ، ولكن أيضًا من قبل أصحاب المصلحة الآخرين.

تتضمن بعض تطبيقاته الأكثر شيوعًا ما يلي:

  1. تحليل بيانات OLAP التسويقية.
  2. التقارير المالية ، والتي تغطي المبيعات والمصروفات والميزانية والتخطيط المالي.
  3. إدارة عمليات الأعمال.
  4. تحليل المبيعات.
  5. تسويق قواعد البيانات.

تستمر الصناعات في النمو ، مما يعني أن المستخدمين سيرون قريبًا المزيد من تطبيقات OLAP. توفر المعالجة المصممة متعددة المتغيرات تحليلاً أكثر ديناميكية. ولهذا السبب يتم استخدام أنظمة وتقنيات OLAP لتقييم سيناريوهات ماذا لو وسيناريوهات الأعمال البديلة.