قائمة طعام
مجاني
التسجيل
الصفحة الرئيسية  /  مشاكل/ يشتمل نموذج بيانات المؤسسة على عناصر. نموذج البيانات العلائقية

يشتمل نموذج بيانات المؤسسة على عناصر. نموذج البيانات العلائقية

ستركز هذه المقالة على بنية مستودع البيانات. ما الذي يجب الاسترشاد به عند إنشائه ، وما نهج العمل - ولماذا.

"الحكاية كذبة - لكن هناك تلميح فيها ..."

زرع الجد ... التخزين. ونما المخزن ، عظيم ، عظيم. أنا فقط لم أكن أعرف حقًا كيف يعمل. وبدأ الجد في المراجعة. دعا الجد الجدة والحفيدة والقط والفأر إلى مجلس الأسرة. ويقول ما يلي: "لقد نما التخزين لدينا. تتدفق البيانات من جميع الأنظمة ، وتكون الجداول مرئية وغير مرئية. يقوم المستخدمون بتلفيق تقاريرهم. يبدو أن كل شيء على ما يرام - للعيش والعيش. نعم ، حزن واحد فقط - لا أحد يعرف كيف يعمل. يتطلب أقراصًا على ما يبدو - بشكل غير مرئي - لا يمكنك توفير ما يكفي! ثم اعتاد المستخدمون القدوم إلي بشكاوى مختلفة: إما أن يتجمد التقرير ، أو أن البيانات قديمة. ثم إنها كارثة كبيرة - نأتي بتقارير لأب القيصر ، لكن الأرقام لا تتفق مع بعضها البعض. الساعة ليست حتى - الملك غاضب - فلا تخلع الرأس - لا لي ولا من أجلك. لذلك قررت أن أجمعكم معًا والتشاور: ماذا سنفعل؟

ألقى بنظرته على الاجتماع ويسأل:
- أنت ، جدتي ، هل تعرف كيف يتم ترتيب التخزين لدينا؟
- لا يا جدي ، لا أعرف. وكيف لي أن أعرف؟ هناك ، أي شباب شجعان يحرسونه! بعضهم! لن تقترب. ذهبت لرؤيتهم بطريقة ما ، فطائر مخبوزة. وأكلوا الفطائر ومسحوا شاربيهم وقالوا: "لماذا أتيت يا جدتي؟ أي نوع من التخزين أنت؟ أخبرني ما نوع التقرير الذي تحتاجه - سنفعل ذلك من أجلك! يجب عليك إحضار الفطائر في كثير من الأحيان! إنها لذيذة بشكل مؤلم ".
- وأنت ، الحفيدة الحبيبة ، هل تعرف كيف يتم ترتيب التخزين لدينا؟
- لا يا جدي ، لا أعرف. لقد أعطوني الوصول إليها بطريقة ما. لقد اتصلت ، وأبدو - وهناك طاولات - غير مرئية على ما يبدو. ومخططات مختلفة مخفية. عيون تتقدم…. في البداية كنت في حيرة من أمري. ثم نظرت عن كثب - بعضها فارغ ، والبعض الآخر ممتلئ ، لكن نصفه فقط. ويبدو أن البيانات تتكرر. فلا عجب أنك لن تكفي من الأقراص بهذا التكرار!
- حسنًا ، يا قطة ، ماذا تقول عن مرفق التخزين لدينا؟ هل هناك أي شيء جيد عن ذلك؟
- نعم ، كيف لا أقول ، يا جدي - سأفعل. بناءً على طلب حفيدتي ، حاولت أن أجعل طيارًا في دائرة منفصلة - عرض صغير. من أجل فهم نوع التجارة المربحة لدولتنا - ما هي المنتجات المفيدة للتجار ، فإنهم يشيدون - يقومون بتجديد الخزانة. وأي منها سيء للغاية. وبدأت في اختيار البيانات لنفسي من هذا المستودع. حقائق مجمعة. وبدأ يحاول مقارنتها بالمنتجات. وماذا ، يا جدي ، لقد رأيت - تبدو المنتجات متشابهة ، لكنك تنظر إلى اللوحات - إنها مختلفة! ثم بدأت في تمشيطهم بمشط حفيدتي. خدش شيسال - وأدى إلى تماثل معين ، مداعبة العينين. لكن في وقت مبكر ابتهجت - في اليوم التالي أطلقت نصوصي لتحديث البيانات الرائعة في النافذة - وذهب كل شيء من أجلي! "كيف ذلك؟" - أعتقد - الحفيدة ستغضب - اليوم سيكون من الضروري إظهار قائدنا للوزير. كيف نتعامل مع مثل هذه البيانات؟
- نعم ، حكايات حزينة ، قطة ، كما تقول. حسنًا ، أنت ، أيها الفأر الصغير ، لم تحاول حقًا التعرف على التخزين؟ أنت معنا فتاة مفعمة بالحيوية وذكية ومؤنسة! ماذا ستقول لنا؟
- نعم ، كيف ، يا جدي ، لا تحاول - بالطبع ، أنا فأر هادئ ، نعم ذكي. بمجرد أن طلبت مني حفيدة القطة الحصول على نموذج بيانات لتخزين دولتنا. والقط ، بالطبع ، أتى إلي - من أجلك ، كما يقول ، الفأر ، كل أمل! حسنًا ، ما هو العمل الصالح الذي لا يفعله الطيبون (والقطط)؟ ذهبت إلى القلعة ، حيث يخفي رئيس المستودع نموذج البيانات في الخزنة. واختبأت. انتظرته ليخرج هذا النموذج من الخزنة. بمجرد أن خرج لتناول القهوة ، قفزت على الطاولة. ألقي نظرة على النموذج - لا أستطيع أن أفهم أي شيء! كيف ذلك؟ لا أتعرف على مساحة التخزين لدينا! لدينا آلاف لا حصر لها من الجداول ، لا يمكن كبح تدفقات البيانات! وهنا - كل شيء متناغم وجميل ... نظر إلى هذا النموذج بالذات - وأعاده إلى الخزنة.
- نعم ، أشياء غريبة جدًا ، أخبرتنا أيها الفأر.
فكر الجد بجدية.
- ماذا سنفعل يا أصدقائي؟ بعد كل شيء ، مع هذا المستودع كذا وكذا لن تعيش طويلاً ... سيفقد المستخدمون صبرهم قريبًا.

مهما كان ما قرره جدنا من قصة خيالية - لبناء منشأة تخزين جديدة أو محاولة إحياء واحدة موجودة - فمن الضروري استخلاص النتائج قبل "نشمر عن سواعدنا" مرة أخرى.
دعنا نضع الجوانب التنظيمية جانباً - مثل خطر تركيز الخبرة في مجموعة مغلقة وضيقة معينة ، وغياب عمليات التحكم وضمان شفافية بنية الأنظمة المستخدمة في المؤسسة ، إلخ.
أود اليوم أن أركز على بناء بنية نظام معين (أو مجموعة أنظمة) - مستودعات البيانات. ما يحتاج إلى التركيز عليه أولاً وقبل كل شيء ، عندما تبدأ المؤسسة في بناء مثل هذا النظام المعقد والمكلف مثل التخزين.

استخلاص المعلومات

لا أحد منا ، الذي يعمل على إنشاء وتطوير أي نظام ، لا يريد أن يكون هذا "منزلًا مؤقتًا" ، أو حلًا "يذبل" في غضون عام أو عامين ، لأن لن تكون قادرة على تلبية متطلبات وتوقعات العملاء والأعمال. بغض النظر عن مدى قوة التحيز تجاه "المنهجيات المرنة" التي لوحظت اليوم ، فمن الجيد أن يشعر الشخص بأنه "سيد" يصنع الكمان أكثر من الحرفي الذي يستخدم العصي للطبول التي تستخدم لمرة واحدة.
تبدو نيتنا طبيعية: صنع أنظمة صلبة وعالية الجودة ، والتي لن تتطلب منا إقامة "سهرات ليلية منتظمة مع ملف" ، والتي لن نخجل منها أمام المستخدمين النهائيين والتي لن تبدو مثل "الصندوق الأسود" لجميع المتابعين "غير المبتدئين".

بادئ ذي بدء ، دعنا نضع قائمة بالمشكلات النموذجية التي نواجهها بانتظام عند العمل مع المستودعات. دعنا نكتب فقط ما لدينا - حتى الآن دون محاولة تبسيط وإضفاء الطابع الرسمي.

  1. من حيث المبدأ ، لدينا مساحة تخزين جيدة: إذا تركته وشأنه ، فكل شيء يعمل. صحيح ، بمجرد أن يتطلب التغيير ، تبدأ "الانهيارات المحلية".
  2. يتم تحميل البيانات يومياً حسب اللوائح وفي عملية واحدة كبيرة وفي غضون 8 ساعات. وهو يناسبنا. ولكن في حالة حدوث عطل مفاجئ ، فإنه يتطلب تدخلاً يدويًا. وبعد ذلك يمكن أن يعمل كل شيء بشكل غير متوقع لفترة طويلة ، tk. سوف تتطلب مشاركة بشرية في العملية.
  3. لقد طويت الإصدار - توقع المشاكل.
  4. تعذر على مصدر واحد إرسال البيانات في الوقت المحدد - كل العمليات في انتظار.
  5. تتحكم قاعدة البيانات في سلامة البيانات - لذلك تتعطل عملياتنا عند تعطلها.
  6. لدينا مساحة تخزين كبيرة جدًا - 2000 جدول في مخطط واحد مشترك. و 3000 أكثر في العديد من المخططات الأخرى. لدينا بالفعل فكرة بسيطة عن كيفية ترتيبها ولأي سبب ظهورها. لذلك ، قد يكون من الصعب علينا إعادة استخدام شيء ما. والعديد من المهام يجب أن تحل من جديد. لأن هذا أسهل وأسرع (من فهم "رمز شخص آخر"). نتيجة لذلك ، لدينا اختلافات ووظائف مكررة.
  7. نتوقع أن يقدم المصدر بيانات جيدة النوعية. لكن اتضح أن الأمر ليس كذلك. نتيجة لذلك ، نقضي الكثير من الوقت في التوفيق بين تقاريرنا النهائية. وكانوا ناجحين للغاية في هذا. لدينا حتى عملية مبسطة. صحيح أن الأمر يستغرق وقتًا. لكن المستخدمين معتادون على ...
  8. لا يثق المستخدم دائمًا في تقاريرنا ويتطلب تبريرًا لشخص أو لآخر. في بعض الحالات يكون على حق ، وفي حالات أخرى يكون على حق. لكن يصعب علينا تبريرها منذ ذلك الحين ليس لدينا أي وسيلة "للتحليل الشامل" (أو نسب البيانات).
  9. يمكننا جلب مطورين إضافيين. لكن لدينا مشكلة - كيف ندرجهم في العمل؟ ما هي الطريقة الأكثر فعالية لموازنة الوظائف؟
  10. كيف يتم تطوير النظام تدريجياً دون الدخول في تطوير "جوهر النظام" لمدة عام كامل؟
  11. مستودع البيانات مرتبط بنموذج الشركة. لكننا نعلم على وجه اليقين (رأينا ذلك في البنك XYZ) أن بناء نموذج يمكن أن يكون طويلاً إلى ما لا نهاية (ذهبنا إلى بنك XYZ لمدة ستة أشهر وناقشنا الكيانات التجارية ، دون أي حركة). لماذا هي على الاطلاق؟ أو ربما يكون من الأفضل بدونها ، إذا كانت هناك مشاكل كثيرة معها؟ ربما يمكننا توليدها بطريقة ما؟
  12. قررنا قيادة النموذج. ولكن كيف يمكنك تطوير نموذج بيانات المستودع بشكل منهجي؟ هل نحتاج إلى "قواعد اللعبة" وماذا يمكن أن تكون؟ ماذا ستعطينا؟ ماذا لو كنا مخطئين مع النموذج؟
  13. هل يجب حفظ البيانات أو تاريخ التغييرات إذا كانت "الشركة لا تحتاجها"؟ لا أرغب في "تخزين القمامة" وتعقيد استخدام هذه البيانات في المهام الحقيقية. هل يجب أن يحتفظ القبو بالتاريخ؟ كيف تبدو؟ كيف يعمل التخزين بمرور الوقت؟
  14. هل يجب أن نحاول توحيد البيانات الموجودة على التخزين إذا كان لدينا نظام رئيسي لإدارة البيانات؟ إذا كان هناك MDM ، فهل هذا يعني أن المشكلة برمتها مع البيانات الرئيسية قد تم حلها الآن؟
  15. من المتوقع أن نستبدل أنظمة المحاسبة الرئيسية قريبًا. هل يجب أن يكون مخزن البيانات جاهزًا لتغيير المصدر؟ كيف احقق هذا؟
  16. هل نحتاج إلى بيانات وصفية؟ ماذا نعني بهذا؟ أين بالضبط يمكن استخدامها؟ كيف يمكنك تنفيذه؟ هل أحتاج إلى تخزينها "في مكان واحد"؟
  17. عملاؤنا غير مستقرين للغاية في متطلباتهم ورغباتهم - هناك شيء يتغير باستمرار. بشكل عام ، أعمالنا ديناميكية للغاية. أثناء قيامنا بشيء ما ، يصبح بالفعل غير ضروري. كيف يمكننا القيام بذلك بطريقة تعطي النتيجة في أسرع وقت ممكن - مثل الكعك الساخن؟
  18. يطالب المستخدمون بالاستجابة. لكن لا يمكننا تشغيل عمليات التمهيد الرئيسية لدينا في كثير من الأحيان ، لأن يؤدي هذا إلى تحميل أنظمة المصدر (له تأثير سيء على الأداء) - وبالتالي ، نقوم بإيقاف تدفقات البيانات الإضافية - والتي ستلتقط نقطة معينة - ما نحتاج إليه. صحيح ، هناك تيارات كثيرة. وبعد ذلك سوف نتجاهل بعض البيانات. علاوة على ذلك ، ستكون هناك مشكلة تقارب. لكن لا توجد طريقة أخرى ...
لقد حدث الكثير بالفعل. لكن هذه ليست قائمة كاملة - من السهل استكمالها وتطويرها. لن نخفيها في الطاولة ، بل نعلقها في مكان واضح - مع إبقاء هذه القضايا في بؤرة اهتمامنا في عملية العمل.
مهمتنا هي التوصل إلى حل شامل نتيجة لذلك.

الهشاشة

بالنظر إلى قائمتنا ، يمكن استخلاص استنتاج واحد. ليس من الصعب إنشاء نوع من "قاعدة بيانات للإبلاغ" ، أو تحميل البيانات هناك ، أو حتى إنشاء نوع من عمليات تحديث البيانات الروتينية. يبدأ النظام بطريقة ما في العيش ، ويظهر المستخدمون ، ومعهم الالتزامات واتفاقية مستوى الخدمة ، تنشأ متطلبات جديدة ، وترتبط مصادر إضافية ، وتتغير المنهجيات - كل هذا يجب أن يؤخذ في الاعتبار في عملية التطوير.

بعد فترة تبدو الصورة كما يلي:
"ها هو القبو. وهو يعمل إذا لم تلمسه. تظهر المشاكل عندما يتعين علينا تغيير شيء ما ".

يصل إلينا تغيير لا يمكننا تقييم تأثيره وفهمه (نظرًا لأننا لم نضع مثل هذه الأدوات في النظام منذ البداية) - ومن أجل عدم المخاطرة ، لا نلمس ما هو ، لكننا نقوم بتمديد إضافي على الجانب ، وآخر ، وأيضًا - تحويل قرارنا إلى أحياء فقيرة ، أو ، كما يقولون في أمريكا اللاتينية ، "أحياء فقيرة" ، حيث تخشى الشرطة دخولها.
هناك شعور بفقدان السيطرة على نظام الفرد ، الفوضى. يتطلب الأمر المزيد والمزيد من الأيدي للحفاظ على العمليات الحالية وحل المشكلات. والتغييرات تزداد صعوبة. بمعنى آخر ، يصبح النظام غير مستقر للضغط ، وغير قادر على التكيف مع التغييرات. وإلى جانب ذلك ، هناك اعتماد قوي على الشخصيات التي "تعرف المسار الصحيح" ، حيث لا يوجد لدى أي شخص "خريطة".

خاصية الكائن - الانهيار تحت تأثير الفوضى والأحداث العشوائية والصدمات - نسيم نيكولاس طالب يدعو هشاشة ... ويقدم أيضًا المفهوم المعاكس: الهشاشة عندما لا ينهار الكائن من الإجهاد والحوادث ، بل يستفيد منه بشكل مباشر... ("منع الهشاشة. كيفية الاستفادة من الفوضى")
خلاف ذلك يمكن استدعاؤه القدرة على التكيف أو المرونة للتغيير .

ماذا يعني هذا في هذا السياق؟ ما هي "مصادر الفوضى" لأنظمة تكنولوجيا المعلومات؟ وماذا يعني "الاستفادة من الفوضى" فيما يتعلق بهندسة تكنولوجيا المعلومات؟
الفكرة الأولى التي تتبادر إلى الذهن هي التغييرات التي تأتي من الخارج. ما هو العالم الخارجي للنظام؟ للتخزين على وجه الخصوص. بالطبع ، أولاً وقبل كل شيء - التغييرات من جانب مصادر البيانات الخاصة بالمخزن:

  • تغيير تنسيقات البيانات الواردة ؛
  • استبدال بعض أنظمة مصادر البيانات بأخرى ؛
  • تغيير القواعد / الأنظمة الأساسية لتكامل الأنظمة ؛
  • تغيير تفسير البيانات (يتم حفظ الأشكال ، منطق العمل مع تغييرات البيانات) ؛
  • تغيير نموذج البيانات إذا تم التكامل على مستوى البيانات (تحليل ملفات سجل معاملات قاعدة البيانات) ؛
  • النمو في أحجام البيانات - على الرغم من عدم وجود الكثير من البيانات في النظام المصدر ، ولم يكن الحمل مرتفعًا - كان من الممكن استردادها في أي وقت ، مع طلب كثيف بشكل تعسفي ، وزيادة البيانات والحمل - الآن هناك قيود صارمة ؛
  • إلخ.
يمكن أن تتغير أنظمة المصدر نفسها ، وتكوين المعلومات وهيكلها ، ونوع تفاعل التكامل ، وكذلك منطق العمل مع البيانات. يقوم كل نظام بتنفيذ نموذج البيانات الخاص به وأساليب العمل معهم ، والتي تلبي أهداف وغايات النظام. وبغض النظر عن مدى صعوبة محاولتهم توحيد نماذج الصناعة والممارسات المرجعية ، ستظهر الفروق الدقيقة حتمًا. (وإلى جانب ذلك ، فإن عملية توحيد الصناعة نفسها ، لأسباب مختلفة ، لا تحقق تقدمًا كبيرًا).
إن ثقافة العمل مع بيانات الشركة - وجود بنية المعلومات والتحكم فيها ، ونموذج دلالي موحد ، وأنظمة إدارة البيانات الرئيسية (MDM) تسهل إلى حد ما مهمة دمج البيانات في المستودع ، ولكن لا تستبعد حاجتها.

لا يتم إجراء تغييرات أقل خطورة من قبل مستهلكي المستودعات (تغيير المتطلبات):

  • في السابق ، كان هناك بيانات كافية لإنشاء تقرير - الآن أصبح مطلوبًا توصيل حقول إضافية أو مصدر بيانات جديد ؛
  • تقنيات معالجة البيانات التي تم تنفيذها سابقًا أصبحت قديمة - تحتاج إلى إعادة صياغة الخوارزميات وكل ما يؤثر عليها ؛
  • في السابق ، كان الجميع راضين عن القيمة الحالية لسمة القاموس على لوحة المعلومات - والآن تكون القيمة مطلوبة ذات صلة في وقت الحقيقة / الحدث الذي تم تحليله ؛
  • كان هناك طلب لعمق سجل تخزين البيانات ، والذي لم يكن موجودًا من قبل - لتخزين البيانات ليس لمدة عامين ، ولكن لمدة 10 سنوات ؛
  • في السابق كان هناك ما يكفي من البيانات اعتبارًا من "نهاية اليوم / الفترة" - أنت الآن بحاجة إلى حالة البيانات "خلال اليوم" ، أو في وقت حدث معين (على سبيل المثال ، اتخاذ قرار بشأن طلب قرض - من أجل بازل الثاني) ؛
  • في وقت سابق كنا راضين عن الإبلاغ عن البيانات الخاصة بالأمس (T-1) أو في وقت لاحق ، نحتاج الآن إلى T0 ؛
  • إلخ.
تعد تفاعلات التكامل مع أنظمة المصدر ومتطلبات المستهلكين لبيانات المستودع عوامل خارجية لمستودع البيانات: بعض أنظمة المصدر تحل محل أنظمة أخرى ، وتنمو أحجام البيانات ، وتنسيقات تغيير البيانات الواردة ، وتغيير متطلبات المستخدم ، وما إلى ذلك. وكل هذه تغييرات خارجية نموذجية يجب أن يكون نظامنا - مستودعنا - جاهزًا لها. مع التصميم الصحيح ، لا ينبغي أن يقتلوا النظام.

ولكن هذا ليس كل شيء.
عند الحديث عن التباين ، فإننا ، أولاً وقبل كل شيء ، نتذكر العوامل الخارجية. بعد كل شيء ، في الداخل يمكننا التحكم في كل شيء ، يبدو لنا كذلك ، أليس كذلك؟ نعم و لا. نعم ، معظم العوامل التي تقع خارج منطقة التأثير خارجية. ولكن هناك أيضًا "إنتروبيا داخلية". وبسبب وجوده بالتحديد ، نحتاج أحيانًا إلى العودة "إلى النقطة 0". ابدأ اللعبة من جديد.
في الحياة ، غالبًا ما نبدأ من الصفر. لماذا هذا غريب بالنسبة لنا؟ وهل هو حقا بهذا السوء؟
تطبق على تكنولوجيا المعلومات. بالنسبة للنظام نفسه - يمكن أن يكون هذا جيدًا جدًا - القدرة على إعادة التفكير في القرارات الفردية. خاصة عندما نتمكن من القيام بذلك محليًا. إعادة الهيكلة هي عملية تفكيك "الويب" التي تظهر بشكل دوري في عملية تطوير النظام. يمكن أن تكون العودة إلى البداية مفيدة. لكن لها ثمن.
مع الإدارة المختصة للهندسة المعمارية ، ينخفض ​​هذا السعر - وتصبح عملية تطوير النظام نفسها أكثر شفافية وقابلية للتحكم. مثال بسيط: إذا تمت مراعاة مبدأ النمطية ، فيمكنك إعادة كتابة وحدة منفصلة دون التأثير على الواجهات الخارجية. وهذا لا يمكن أن يتم ببنية متجانسة.

يتم تحديد قابلية هشاشة النظام من خلال البنية المضمنة فيه. وهذه الخاصية هي التي تجعلها قابلة للتكيف.
عندما نتحدث عن العمارة التكيفية- نعني أن النظام قادر على التكيف مع التغييرات ، وليس على الإطلاق أننا نغير الهيكل نفسه باستمرار. على العكس من ذلك ، فكلما كانت البنية أكثر استقرارًا واستقرارًا ، كلما قلت المتطلبات التي تستلزم مراجعتها ، زاد تكيف النظام.

سيكون للحلول التي تنطوي على مراجعة الهيكل بأكمله سعر أعلى بكثير. وتحتاج إلى أسباب وجيهة جدًا لاعتمادها. على سبيل المثال ، قد يكون هذا الأساس المنطقي مطلبًا لا يمكن تنفيذه داخل الهيكل الحالي. ثم يقولون - لقد ظهر مطلب يؤثر على الهندسة المعمارية.
وبالتالي ، نحتاج أيضًا إلى معرفة "حدود قابلية الهشاشة" لدينا. لم يتم تطوير الهندسة المعمارية "في فراغ" - فهي تعتمد على المتطلبات والتوقعات الحالية. وإذا تغير الوضع بشكل جذري - يجب أن نفهم أننا تجاوزنا الهيكل الحالي - ونحتاج إلى مراجعته ، والعمل على حل مختلف - والتفكير في مسارات الانتقال.
على سبيل المثال ، افترضنا أننا سنحتاج دائمًا إلى البيانات في التخزين في نهاية اليوم ، وسنأخذ البيانات كل يوم باستخدام واجهات النظام القياسية (من خلال مجموعة من طرق العرض). ثم جاء الطلب من قسم إدارة المخاطر على ضرورة تلقي البيانات ليس في نهاية اليوم ، ولكن في وقت اتخاذ القرار بشأن الإقراض. لا داعي لمحاولة "سحب ما هو غير متوتر" - تحتاج فقط إلى الاعتراف بهذه الحقيقة - كلما كان ذلك أفضل. وابدأ في العمل على نهج يتيح لنا حل المشكلة.
هناك خط رفيع للغاية هنا - إذا أخذنا في الاعتبار فقط "المتطلبات في الوقت الحالي" ولم نتطلع إلى عدة خطوات للأمام (وعدة سنوات قادمة) ، فإننا نزيد من مخاطر مواجهة مطلب يؤثر على الهندسة المعمارية بعد فوات الأوان - و سيكون سعر التغيير لدينا مرتفعًا جدًا. التطلع إلى الأمام قليلاً - داخل حدود أفقنا - لم يؤذي أحداً حتى الآن.

إن مثال نظام من "حكاية التخزين" هو مجرد مثال واحد على نظام مهتز للغاية مبني على مناهج التصميم الهشة. وإذا حدث هذا ، فإن التدمير يحدث بسرعة كبيرة لهذه الفئة المعينة من الأنظمة.
لماذا استطيع ان اقول ذلك؟ موضوع المستودعات ليس جديدا. كانت الأساليب والممارسات الهندسية التي تم تطويرها خلال هذا الوقت تهدف على وجه التحديد إلى هذا - الحفاظ على جدوى النظام.
مثال بسيط: أحد الأسباب الأكثر شيوعًا لفشل مشاريع التخزين عند الإقلاع هو محاولة بناء التخزين على أنظمة المصدر قيد التطوير دون الموافقة على واجهات التكامل - محاولة جلب البيانات مباشرة من الجداول. نتيجة لذلك ، دخلنا في التطوير - خلال هذا الوقت تغيرت قاعدة البيانات المصدر - وأصبحت تدفقات التحميل في المستودع معطلة. فات الأوان لإعادة شيء ما. وإذا لم تكن قد قمت بتأمين نفسك بعد عن طريق إنشاء عدة طبقات من الطاولات داخل التخزين ، فيمكنك التخلص من كل شيء والبدء من جديد. هذا مجرد مثال واحد وواحد من الأمثلة البسيطة.

معيار طالب للهشاشة والمضادة للكسر بسيط. القاضي الرئيسي هو الوقت. إذا صمد النظام أمام اختبار الزمن ، وأظهر "حيويته" و "عدم قابليته للتدمير" - فإنه يتمتع بخاصية مقاومة الهشاشة.
إذا أخذنا في الاعتبار ، عند تصميم نظام ما ، قابلية الهشاشة كشرط ، فسيشجعنا ذلك على استخدام مثل هذه الأساليب لبناء هيكلها الذي سيجعل النظام أكثر قابلية للتكيف مع "الفوضى من الخارج" و "الفوضى من الداخل" . وفي النهاية سيكون للنظام عمر أطول.
لا أحد منا يريد بناء "منازل مؤقتة". ولا تخدع نفسك ، فهذه ليست طريقة أخرى اليوم. من الطبيعي أن ينظر الشخص بضع خطوات إلى الأمام في أي وقت ، خاصة أثناء الأزمة.

ما هو مستودع البيانات ولماذا نقوم ببنائه

تفترض المقالة حول بنية التخزين أن القارئ لا يعرف فقط ما هو ، ولكن لديه أيضًا بعض الخبرة في مثل هذه الأنظمة. ومع ذلك ، فقد اعتبرت أنه من الضروري القيام بذلك - للعودة إلى الأصول ، إلى بداية المسار ، لأن هناك يقع "نقطة ارتكاز" التنمية.

كيف توصل الناس إلى فكرة أن مستودعات البيانات مطلوبة؟ وكيف تختلف عن مجرد "قاعدة بيانات كبيرة جدًا"؟
منذ وقت طويل ، عندما كانت هناك ببساطة "أنظمة معالجة بيانات الأعمال" في العالم ، لم يكن هناك تقسيم لأنظمة تكنولوجيا المعلومات إلى فئات مثل أنظمة oltp الأمامية وأنظمة dss للمكاتب الخلفية وأنظمة معالجة النصوص ومستودعات البيانات وما إلى ذلك .
خلال هذا الوقت ، تم إنشاء محرك قاعدة البيانات العلائقية الأول ، Ingres ، بواسطة Michael Stonebreaker.
وكان ذلك هو الوقت الذي اقتحم فيه عصر أجهزة الكمبيوتر الشخصية صناعة الكمبيوتر مثل زوبعة وغيرت إلى الأبد جميع أفكار مجتمع تكنولوجيا المعلومات في ذلك الوقت.

في ذلك الوقت ، كان من السهل العثور على تطبيقات المؤسسة المكتوبة على أساس قواعد بيانات قواعد البيانات (DBMS) لسطح المكتب ، مثل Clipper و dBase و FoxPro. وكان سوق تطبيقات الخادم والعميل ونظام إدارة قواعد البيانات يكتسب زخمًا فقط. ظهرت خوادم قواعد البيانات واحدة تلو الأخرى ، والتي ستحتل مكانتها في مجال تكنولوجيا المعلومات لفترة طويلة - Oracle ، DB2 ، إلخ.
وكان مصطلح "تطبيق قاعدة البيانات" شائعًا. ماذا يتضمن هذا التطبيق؟ المبسطة - بعض نماذج الإدخال التي يمكن للمستخدمين من خلالها إدخال المعلومات في وقت واحد ، وبعض العمليات الحسابية التي تم إطلاقها "بواسطة الزر" أو "في الموعد المحدد" ، بالإضافة إلى بعض التقارير التي يمكن رؤيتها على الشاشة أو حفظها كملفات وإرسالها إلى الختم.
قال أحد المرشدين في بداية مسيرتي المهنية: "لا يوجد شيء خاص - مجرد تطبيق عادي ، مجرد قاعدة بيانات". "إذن لا يوجد شيء مميز؟" - اعتقدت بعد ذلك.

إذا نظرت عن كثب ، لا تزال هناك بعض الخصائص المميزة. مع نمو المستخدمين ، يزداد حجم المعلومات الواردة ، مع زيادة الحمل على النظام ، ينتقل مطوروه ومصمموه ، من أجل الحفاظ على الأداء عند مستوى مقبول ، إلى بعض "الحيل". الأول هو تقسيم "نظام معالجة بيانات الأعمال" المترابط إلى تطبيق محاسبة يدعم المستخدمين عبر الإنترنت ، وتطبيق منفصل للمعالجة المجمعة للبيانات وإعداد التقارير. يحتوي كل تطبيق من هذه التطبيقات على قاعدة بيانات خاصة به ويتم استضافته حتى على مثيل منفصل لخادم قاعدة البيانات ، مع إعدادات مختلفة لأنواع مختلفة من التحميل - OLTP و DSS. وتصطف تدفقات البيانات بينهما.

كل شيء؟ يبدو أنه تم حل المشكلة. ماذا حدث بعد ذلك؟
وبعد ذلك تنمو الشركات ، وتتضاعف احتياجاتها من المعلومات. كما أن عدد التفاعلات مع العالم الخارجي آخذ في الازدياد. ونتيجة لذلك ، لا يوجد تطبيق كبير واحد يقوم بأتمتة جميع العمليات بالكامل ، ولكن هناك العديد من التطبيقات المختلفة من مختلف الشركات المصنعة. عدد الأنظمة التي تولد المعلومات - أنظمة مصادر البيانات في الشركة آخذ في الازدياد. وعاجلاً أم آجلاً ، ستكون هناك حاجة لرؤية ومقارنة المعلومات الواردة من أنظمة مختلفة. هكذا تظهر مستودعات البيانات في الشركة - فئة جديدة من الأنظمة.
التعريف المقبول عمومًا لهذه الفئة من الأنظمة هو كما يلي.

مستودع البيانات (أو مخزن البيانات)- قاعدة بيانات معلومات موضوعية المنحى مصممة ومصممة خصيصًا لإعداد التقارير وتحليل الأعمال من أجل دعم اتخاذ القرار في المنظمة
هكذا، الدمجالبيانات من أنظمة مختلفة ، والقدرة على النظر إليها بطريقة "موحدة" (موحدة) - هذه هي إحدى الخصائص الرئيسية لأنظمة فئة مستودعات البيانات. هذا هو سبب ظهور المستودعات أثناء تطور أنظمة تكنولوجيا المعلومات.

الملامح الرئيسية لمخازن البيانات

دعونا نلقي نظرة فاحصة. ما هي السمات الرئيسية لهذه الأنظمة؟ ما الذي يجعل مستودعات البيانات مختلفة عن أنظمة تكنولوجيا المعلومات الأخرى في المؤسسة؟

أولا ، هذه كميات كبيرة. كبير جدا. VLDB - هذه هي الطريقة التي يطلق عليها كبار البائعين مثل هذه الأنظمة عندما يقدمون توصياتهم بشأن استخدام منتجاتهم. من جميع أنظمة الشركة ، تتدفق البيانات إلى قاعدة البيانات الكبيرة هذه ويتم تخزينها هناك "إلى الأبد ودون تغيير" ، كما يقولون في الكتب المدرسية (عمليًا ، تصبح الحياة أكثر تعقيدًا).

ثانيًا ، هذه بيانات تاريخية - "ذاكرة الشركة" - ما يسمى بمخازن البيانات. فيما يتعلق بالعمل مع الوقت في المستودعات ، كل شيء مثير للاهتمام. في أنظمة المحاسبة ، البيانات محدثة في الوقت الحالي. ثم يقوم المستخدم بنوع من العملية - ويتم تحديث البيانات. في الوقت نفسه ، قد لا يتم حفظ محفوظات التغييرات - يعتمد ذلك على الممارسة المحاسبية. خذ رصيد حساب مصرفي ، على سبيل المثال. قد نكون مهتمين بالرصيد الحالي في "الآن" ، في نهاية اليوم ، أو في وقت حدث ما (على سبيل المثال ، في وقت حساب النتيجة). في حين أن الحل الأول والثاني سهل إلى حد ما ، فمن المرجح أن يتطلب الحل الأخير جهودًا خاصة. يمكن للمستخدم ، الذي يعمل مع التخزين ، الرجوع إلى الفترات الماضية ، ومقارنتها مع الفترة الحالية ، إلخ. هذه القدرات المرتبطة بالوقت هي التي تميز بشكل كبير مستودعات البيانات عن أنظمة المحاسبة - الحصول على حالة البيانات في نقاط مختلفة على المحور الزمني - إلى عمق معين في الماضي.

ثالثًا ، إنه كذلك الدمج و توحيد البيانات ... لكي يصبح تحليلهم المشترك ممكنًا ، من الضروري إحضارهم إلى شكل مشترك - نموذج بيانات موحد ، قارن الحقائق مع الكتب المرجعية الموحدة. يمكن أن يكون هناك العديد من الجوانب والصعوبات هنا. أولا - المفاهيمي - تحت نفس المصطلح ، يمكن لأشخاص مختلفين من أقسام مختلفة فهم أشياء مختلفة. والعكس صحيح - لتسمية شيء مختلف ، وهو في الأساس نفس الشيء. كيف يمكن تقديم "عرض واحد" مع الحفاظ على الرؤية المحددة لمجموعة مستخدمين معينة؟

الرابع ، هذا هو العمل مع جودة البيانات ... في عملية تحميل البيانات في التخزين ، يتم تنظيفها وإجراء عمليات التحويل والتحولات العامة. يجب إجراء التحولات العامة في مكان واحد - ثم استخدامها لإنشاء تقارير مختلفة. سيؤدي ذلك إلى تجنب التناقضات التي تزعج مستخدمي الأعمال - خاصة المديرين التنفيذيين الذين يتم جلبهم إلى طاولة المفاوضات بأرقام من أقسام مختلفة لا تتفق مع بعضها البعض. تؤدي جودة البيانات الرديئة إلى حدوث أخطاء وتباينات في التقارير ، مما يؤدي إلى انخفاض المستوى ثقة المستخدم للنظام بأكمله ، إلى الخدمة التحليلية بأكملها ككل.

المفهوم المعماري

من المرجح أن أي شخص صادف مستودعًا ما قد لاحظ نوعًا من "بنية الطبقات" - منذ ذلك الحين هذا هو النموذج المعماري الذي ترسخ في أنظمة هذه الفئة. وليس من قبيل المصادفة. يمكن اعتبار طبقات التخزين على أنها مكونات منفصلة للنظام - بمهامها الخاصة ، ومنطقة مسؤوليتها ، و "قواعد اللعبة".
العمارة متعددة الطبقات هي وسيلة للتعامل مع تعقيد النظام - كل مستوى لاحق يتم تجريده من تعقيدات التنفيذ الداخلي للمستوى السابق. يتيح لك هذا الأسلوب تفرد المهام من نفس النوع وحلها بطريقة موحدة ، دون إعادة اختراع "العجلة" من نقطة الصفر في كل مرة.
يظهر الرسم التخطيطي المعماري المفاهيمي بشكل تخطيطي في الشكل. هذا رسم تخطيطي مبسط يعكس فقط الفكرة الرئيسية - المفهوم ، ولكن بدون "التفاصيل التشريحية" التي قد تنشأ مع تفصيل أعمق للتفاصيل.

كما هو موضح في الرسم التخطيطي ، حدد الطبقات التالية من الناحية المفاهيمية. الطبقات الثلاث الرئيسية التي تحتوي على منطقة تخزين البيانات (المشار إليها بواسطة المستطيل المعبأ) وبرنامج تحميل البيانات (يشار إليه تقليديًا بأسهم من نفس اللون). وأيضًا طبقة خدمة مساعدة ، والتي ، مع ذلك ، تلعب دورًا مهمًا للغاية في الاتصال - إدارة تحميل البيانات ومراقبة الجودة.

طبقة البيانات الأولية - طبقة البيانات الأولية (أو انطلاق ، أو طبقة التشغيل ) - مصمم للتحميل من أنظمة المصدر وحفظ المعلومات الأولية ، بدون تحويلات - بالجودة الأصلية ودعم التاريخ الكامل للتغييرات.
مهمة هذه الطبقة- لاستخلاص طبقات التخزين اللاحقة من الهيكل المادي لمصادر البيانات وطرق جمع البيانات وطرق فصل دلتا التغييرات.

طبقة البيانات الأساسية - التخزين الأساسي - المكون المركزي للنظام الذي يميز التخزين عن مجرد "منصة تكامل المجموعة" أو "تفريغ البيانات الضخمة" ، نظرًا لأن دورها الرئيسي هو توحيد البياناتمن مصادر مختلفة ، اختزال إلى هياكل موحدة ، مفاتيح. عند التحميل في النواة ، يتم تنفيذ العمل الرئيسي بجودة البيانات والتحولات العامة ، والتي يمكن أن تكون معقدة للغاية.
مهمة هذه الطبقة- تجريد المستهلكين من ميزات الجهاز المنطقي لمصادر البيانات وضرورة مقارنة البيانات من أنظمة مختلفة ، لضمان سلامة البيانات وجودتها.

طبقة مارت البيانات - واجهات عرض تحليلية - أحد المكونات ، وتتمثل وظيفته الرئيسية في تحويل البيانات إلى هياكل ملائمة للتحليل (إذا كان BI يعمل مع واجهات عرض ، فهذا ، كقاعدة عامة ، نموذج بُعد) ، أو وفقًا لمتطلبات نظام المستهلك.
كقاعدة عامة ، تأخذ مجموعات البيانات البيانات من الجوهر - كمصدر موثوق وموثوق به - أي استخدام خدمة هذا المكون لجلب البيانات إلى نموذج واحد. سوف نطلق على هذه المعارض عادي ... في بعض الحالات ، يمكن أن تأخذ واجهات المحلات البيانات مباشرة من التدريج - تعمل بالبيانات الأساسية (في مفاتيح المصدر). يستخدم هذا النهج عادةً للمهام المحلية حيث لا يلزم دمج البيانات من أنظمة مختلفة وحيث تكون الكفاءة مطلوبة أكثر من جودة البيانات. تسمى حالات العرض هذه التشغيل ... يمكن أن تحتوي بعض المؤشرات التحليلية على طرق حسابية معقدة للغاية. لذلك ، بالنسبة لمثل هذه الحسابات والتحولات غير التافهة ، فإن ما يسمى ب حالات العرض الثانوية .
عرض مهمة طبقة- إعداد البيانات وفقًا لمتطلبات مستهلك معين - منصة BI ، أو مجموعة من المستخدمين ، أو نظام خارجي.

تتكون الطبقات الموضحة أعلاه من منطقة تخزين بيانات ثابتة ، بالإضافة إلى وحدة برمجية لتحميل البيانات وتحويلها. هذا التقسيم إلى طبقات ومناطق أمر منطقي. من الناحية المادية ، يمكن أن يكون تنفيذ هذه المكونات مختلفًا - يمكنك حتى استخدام أنظمة أساسية مختلفة لتخزين البيانات أو تحويلها على طبقات مختلفة ، إذا كان ذلك أكثر كفاءة.
تحتوي مناطق التخزين على التقنية (جداول المخزن المؤقت) المستخدمة في عملية تحويل البيانات و الجداول الهدفالذي يشير إليه المكون المستهلك. من الممارسات الجيدة "تغطية" الجداول المستهدفة بالمشاهد. هذا يسهل الصيانة اللاحقة وتطوير النظام. يتم تمييز البيانات الموجودة في الجداول المستهدفة لجميع الطبقات الثلاث بحقول فنية خاصة (السمات الوصفية) ، والتي تُستخدم لدعم عمليات تحميل البيانات ، وكذلك لتمكين التدقيق المعلوماتي لتدفقات البيانات في المستودع.

أيضًا ، يتم تمييز مكون خاص (أو مجموعة مكونات) ، والذي يوفر وظائف خدمة لجميع الطبقات. تتمثل إحدى مهامها الرئيسية في وظيفة التحكم - لتوفير "قواعد موحدة للعبة" للنظام بأكمله ، مع ترك الحق في استخدام خيارات متنوعة لتنفيذ كل طبقة من الطبقات الموضحة أعلاه - بما في ذلك. استخدام تقنيات مختلفة لتحميل البيانات ومعالجتها ومنصات التخزين المختلفة وما إلى ذلك. دعنا نسميها طبقة الخدمة ... لا يحتوي على بيانات أعمال ، لكن له هياكل تخزين خاصة به - فهو يحتوي على منطقة بيانات وصفية ، بالإضافة إلى منطقة للعمل بجودة البيانات (وربما هياكل أخرى ، اعتمادًا على الوظائف المخصصة لها).

مثل هذا التقسيم الواضح للنظام إلى مكونات منفصلة يزيد بشكل كبير من إمكانية التحكم في تطوير النظام:

  • يتم تقليل تعقيد المهمة التي يتم طرحها على مطور وظيفة مكون أو آخر (لا يجب عليه حل مشكلات التكامل مع الأنظمة الخارجية في نفس الوقت ، والتفكير في إجراءات تنقية البيانات ، والتفكير في العرض الأمثل للبيانات بالنسبة للمستهلكين) - المهمة أسهل في التحليل والتقييم وتنفيذ توصيل صغير ؛
  • يمكنك الاتصال بعمل مختلف المؤدين (وحتى الفرق أو المقاولين) - لأن يسمح لك هذا النهج بموازنة المهام بشكل فعال ، مما يقلل من تأثيرها المتبادل على بعضها البعض ؛
  • يسمح لك وجود التدريج المستمر بالاتصال بسرعة بمصادر البيانات دون تصميم الواجهة الأساسية أو واجهات المحلات بالكامل لمنطقة الموضوع بأكملها ، ثم إنهاء بناء الطبقات المتبقية تدريجيًا وفقًا للأولويات (علاوة على ذلك ، ستكون البيانات في المخزن بالفعل - متاحة لـ محللو النظام ، مما يسهل إلى حد كبير مهام التطوير اللاحق للتخزين) ؛
  • يسمح وجود النواة بإخفاء جميع الأعمال المتعلقة بجودة البيانات (بالإضافة إلى الأخطاء والأخطاء المحتملة) من واجهات المتاجر ومن المستخدم النهائي ، والأهم من ذلك - باستخدام هذا المكون كمصدر بيانات واحد لواجهات المتاجر ، يمكنك تجنب البيانات مشاكل التقارب بسبب تنفيذ الخوارزميات الشائعة في مكان واحد ؛
  • يتيح لك اختيار مارت أن تأخذ في الاعتبار الاختلافات وخصائص فهم البيانات التي قد تكون لدى مستخدمي الإدارات المختلفة ، وتصميمها لمتطلبات ذكاء الأعمال يسمح ليس فقط بإصدار أرقام مجمعة ، ولكن لضمان التحقق من صحة البيانات من خلال توفير الفرص ل انتقل إلى المؤشرات الأولية ؛
  • يسمح لك وجود طبقة الخدمة بإجراء تحليل شامل للبيانات (تسلسل البيانات) ، واستخدام أدوات تدقيق البيانات الموحدة ، والأساليب العامة لإبراز دلتا التغييرات ، والعمل بجودة البيانات ، وإدارة الأحمال ، وأدوات المراقبة وتشخيص الأخطاء ، ويسرع حل المشكلة.
هذا النهج في التحلل يجعل النظام أكثر مقاومة للتغيير (بالمقارنة مع "الهيكل المترابط") - فهو يضمن قابليته للتكسر:
  • تتم معالجة التغييرات من جانب أنظمة المصدر عند التدريج - في النواة ، يتم تعديل التدفقات المتأثرة بجداول التدريج هذه فقط ، ويكون التأثير على واجهات المتاجر ضئيلًا أو غائبًا ؛
  • تتم معالجة التغييرات في المتطلبات من جانب المستهلكين في الغالب في واجهات المحلات (إذا كان هذا لا يتطلب معلومات إضافية غير موجودة في المتجر).
بعد ذلك ، سنتناول كل مكون من المكونات المعروضة أعلاه ونلقي نظرة عليها بمزيد من التفصيل.

جوهر النظام

لنبدأ من الوسط - جوهر النظام أو الطبقة الوسطى. يتم تصنيفها على أنها طبقة أساسية. تلعب النواة دور توحيد البيانات - جلب الهياكل الموحدة والكتب المرجعية والمفاتيح. هذا هو المكان الذي يتم فيه تنفيذ العمل الرئيسي مع جودة البيانات - التنظيف والتحويل والتوحيد.

يسمح لك وجود هذا المكون بإعادة استخدام تدفقات البيانات التي تحول البيانات الأولية الواردة من أنظمة المصدر إلى تنسيق موحد معين ، باتباع القواعد العامة والخوارزميات ، وعدم تكرار تنفيذ نفس الوظيفة بشكل منفصل لكل واجهة متجر تطبيق ، والتي ، في بالإضافة إلى الاستخدام غير الفعال للموارد ، قد يؤدي أيضًا إلى وجود اختلافات في البيانات.
يتم تنفيذ جوهر المستودع في نموذج بيانات ، في الحالة العامة ، يختلف عن نماذج أنظمة المصدر ، وعن تنسيقات وهياكل المستهلكين.

نموذج المستودع الأساسي ونموذج بيانات المؤسسة

الشاغل الرئيسي لطبقة التخزين الوسطى هو الاستقرار. لهذا السبب ينصب التركيز الرئيسي هنا على نموذج البيانات. يشار إليه عادة باسم "نموذج بيانات الشركة". لسوء الحظ ، تكوّن حوله نوع من الهالة من الأساطير والسخافات ، والتي تؤدي أحيانًا إلى رفض بنائها تمامًا ، ولكن دون جدوى.

الأسطورة 1. نموذج بيانات المؤسسة هو نموذج ضخم به آلاف الكيانات (الجداول).
في الواقع. في أي مجال موضوع ، في أي مجال عمل ، في بيانات أي شركة ، حتى الأكثر تعقيدًا ، هناك عدد قليل من الكيانات الأساسية - 20-30.

الأسطورة 2. ليست هناك حاجة لتطوير أي "نموذج خاص" - نشتري نموذجًا مرجعيًا للصناعة - ونفعل كل شيء وفقًا له. نحن ننفق المال - لكننا نحصل على نتيجة مضمونة.
في الواقع. يمكن أن تكون النماذج المرجعية مفيدة جدًا بالفعل لأن تحتوي على خبرة صناعية في نمذجة هذا المجال. من بينها يمكنك استخلاص الأفكار والأساليب وممارسات التسمية. تحقق من "عمق التغطية" للمنطقة حتى لا يتم التغاضي عن شيء مهم. لكن من غير المحتمل أن نكون قادرين على استخدام مثل هذا النموذج خارج الصندوق - كما هو. هذه هي نفس أسطورة ، على سبيل المثال ، شراء نظام تخطيط موارد المؤسسات (أو CRM) وتنفيذه دون أي "تشديد على نفسك". تولد قيمة هذه النماذج في تكيفها مع حقائق هذا العمل المعين ، هذه الشركة بالذات.

الأسطورة 3. قد يستغرق تطوير نموذج المستودع الأساسي عدة أشهر ، وخلال هذه الفترة سيتم تجميد المشروع بالفعل. بالإضافة إلى ذلك ، فإنه يتطلب قدرًا مجنونًا من الاجتماعات والكثير من الأشخاص.
في الواقع. يمكن تطوير نموذج المستودع باستخدام المستودع بشكل متكرر ، قطعة قطعة. بالنسبة للمناطق غير المغطاة ، يتم تعيين "نقاط التوسيع" أو "النقاط الجذعية". يتم تطبيق بعض "التصاميم العامة". في الوقت نفسه ، تحتاج إلى معرفة متى تتوقف حتى لا تحصل على شيء فائق العالمية من 4 جداول ، حيث يصعب "وضع البيانات" (بل والأكثر صعوبة) الحصول عليها. وهو دون المستوى الأمثل للغاية من حيث الأداء.

حقا يستغرق وقتا لتطوير النموذج. ولكن ليس هذا هو الوقت المستغرق في "رسم الكيانات" - هذا هو الوقت المطلوب لتحليل مجال الموضوع ، وفهم كيفية ترتيب البيانات. هذا هو السبب في أن المحللين يشاركون عن كثب في هذه العملية ، ويشارك أيضًا العديد من خبراء الأعمال. ويتم ذلك بطريقة انتقائية. وليس من خلال تنظيم اجتماعات بمشاركة عدد مجنون من الناس ، وإرسال استبيانات ضخمة ، إلخ.
يعد تحليل الأعمال والأنظمة الجيد أمرًا أساسيًا في بناء نموذج المستودع الأساسي. هناك الكثير لفهمه: أين (في أي أنظمة) يتم إنشاء البيانات ، وكيف تعمل ، وما هي العمليات التجارية التي يتم تداولها ، وما إلى ذلك. لم يضر التحليل النوعي أبدًا بنظام واحد. بل على العكس من ذلك ، تنشأ المشاكل من "البقع البيضاء" في فهمنا.

إن تطوير نموذج بيانات ليس عملية ابتكار وابتكار شيء جديد. في الواقع ، نموذج البيانات موجود بالفعل في الشركة. وعملية التصميم تشبه إلى حد كبير "التنقيب". يتم استخراج النموذج بعناية وعناية من "تربة" بيانات الشركة ووضعها في شكل منظم.

الأسطورة 4. إن عملنا ديناميكي للغاية في شركتنا ، وكل شيء يتغير بسرعة كبيرة بحيث يصبح من غير المجدي بالنسبة لنا إنشاء نموذج - سيصبح قديمًا قبل أن نبدأ تشغيل هذا الجزء من النظام.
في الواقع. تذكر أن العامل الأساسي هو الاستقرار. وفوق كل شيء ، طوبولوجيا النموذج. لماذا ا؟ لأن هذا هو المكون الأساسي ويؤثر على كل شيء آخر. الاستقرار هو أيضًا مطلب لنموذج النواة. إذا أصبح النموذج قديمًا بسرعة كبيرة ، فهذا يعني أنه مصمم بشكل غير صحيح. تم اختيار الأساليب الخاطئة و "قواعد اللعبة" لتطويرها. وهي أيضًا مسألة تحليل نوعي. نادرا ما تتغير الكيانات الرئيسية لنموذج الشركة.
ولكن إذا حدث لنا أن نصنع شركة تبيع الحلويات ، على سبيل المثال ، بدلاً من دليل "المنتجات" ، فقم بصنع "حلويات" و "كعك" و "فطائر". ثم عندما تظهر البيتزا في قائمة السلع - نعم ، ستحتاج إلى إدخال الكثير من الطاولات الجديدة. وهذه مجرد مسألة نهج.

الأسطورة 5. يعد إنشاء نموذج شركة عملاً جادًا ومعقدًا ومسؤولًا. ومن المخيف ارتكاب خطأ.
في الواقع. النموذج الأساسي ، على الرغم من أنه يجب أن يكون مستقرًا ، لا يزال غير "مصبوب في المعدن". مثل أي حل تصميمي آخر ، يمكن مراجعة هيكله وتعديله. أنت فقط لا تحتاج إلى نسيان هذه الجودة. لكن هذا لا يعني على الإطلاق أنه "لا يمكنك التنفس عليه". وهذا لا يعني أن الحلول المؤقتة و "الدعائم" التي يجب التخطيط لها لإعادة التدوير غير مقبولة.

الأسطورة 6. إذا كان مصدر بياناتنا ، على سبيل المثال ، نظام بيانات مرجعي (أو نظام إدارة بيانات رئيسي - MDM) ، فيجب أن يتوافق بالفعل مع نموذج الشركة بطريقة ودية (خاصةً إذا كان قد تم تصميمه مؤخرًا ولم يكن لديه وقت الحصول على "جانب" و "تقاليد" وأكواخ مؤقتة). اتضح أنه بالنسبة لهذه الحالة - لا نحتاج إلى نموذج النواة؟
في الواقع. نعم ، في هذه الحالة ، يتم تسهيل بناء النموذج الأساسي للمستودع إلى حد كبير - منذ ذلك الحين نتبع نموذجًا مفاهيميًا عالي المستوى جاهزًا. لكنها ليست مستبعدة على الإطلاق. لماذا ا؟ لأنه عند إنشاء نموذج لنظام معين ، يتم تطبيق بعض القواعد الخاصة به - ما هي أنواع الجداول التي يجب استخدامها (لكل كيان) ، وكيفية إصدار البيانات ، وما هي التفاصيل الدقيقة للاحتفاظ بالمحفوظات ، وما هي السمات الوصفية (الحقول التقنية لاستخدام) ، إلخ.

بالإضافة إلى ذلك ، بغض النظر عن مدى روعة نظام البيانات المرجعية و MDM لدينا ، كقاعدة عامة ، ستكون هناك فروق دقيقة مرتبطة بوجود أدلة محلية "تقريبًا" في أنظمة المحاسبة الأخرى. وهذه المشكلة ، سواء أردنا ذلك أم لا ، يجب حلها في المستودع - بعد كل شيء ، يتم جمع التقارير والتحليلات هنا.

طبقة البيانات الأولية (أو طبقة التدريج التاريخية أو الطبقة التشغيلية)

تم تعيينه كطبقة بيانات أولية. دور هذا المكون: التكامل مع أنظمة المصدر ، وتحميل البيانات الأولية وتخزينها ، وكذلك التنظيف الأولي للبيانات - التحقق من الامتثال لقواعد التحكم في التنسيق المنطقي ، المحددة في "اتفاقية واجهة التفاعل" مع المصدر.
بالإضافة إلى ذلك ، يحل هذا المكون مشكلة مهمة جدًا للمستودع - تخصيص "دلتا حقيقية للتغييرات" - بغض النظر عما إذا كان المصدر يسمح لك بتتبع التغييرات في البيانات أم لا وكيف (بأي معيار يمكن "اكتشافها" ). بمجرد أن تدخل البيانات في مرحلة - بالنسبة لجميع الطبقات الأخرى ، أصبحت مسألة تخصيص دلتا واضحة بالفعل - بفضل وضع العلامات باستخدام السمات الوصفية.

يتم تخزين البيانات الموجودة في هذه الطبقة في هياكل أقرب ما يمكن إلى النظام المصدر - من أجل الحفاظ على البيانات الأولية أقرب ما يمكن إلى شكلها الأصلي. اسم آخر لهذا المكون هو "طبقة التشغيل".
لماذا لا تستخدم المصطلح الراسخ "التدريج"؟ الحقيقة هي أنه في وقت سابق ، قبل "عصر البيانات الضخمة و VLDB" ، كانت مساحة القرص باهظة الثمن - وغالبًا ما كانت البيانات الأولية ، إذا تم حفظها ، لفترة محدودة فقط. وغالبًا ما يتم استدعاء اسم "التدريج" قابل للتنظيفمتعادل.
لقد تقدمت التقنيات الآن إلى الأمام - ولا يمكننا فقط تخزين جميع البيانات الأولية ، ولكن أيضًا لإضفاء الطابع التاريخي عليها بدرجة التفصيل الممكنة. هذا لا يعني أننا لا ينبغي أن نتحكم في نمو البيانات ولا يلغي الحاجة إلى إدارة دورة حياة المعلومات ، وتحسين تكلفة تخزين البيانات ، اعتمادًا على "درجة حرارة" الاستخدام - أي. أخذ "البيانات الباردة" الأقل طلبًا إلى وسائط التخزين ومنصات التخزين الأرخص.

ماذا يعطينا وجود "المسرح التاريخي":

  • إمكانية ارتكاب أخطاء (في الهياكل ، في خوارزميات التحويل ، في دقة التاريخ) - وجود بيانات أولية مؤرخة بالكامل في منطقة التوفر للتخزين ، يمكننا دائمًا إعادة تحميل جداولنا ؛
  • فرصة للتفكير - يمكننا أن نأخذ وقتنا للعمل على جزء كبير من النواة في هذا التكرار المحدد لتطوير التخزين ، حيث في مرحلة انطلاقنا ، على أي حال ، سيكون هناك ، ومع أفق زمني متساوٍ (ستكون هناك نقطة واحدة من "مرجع التاريخ") ؛
  • إمكانية التحليل - سنحفظ حتى تلك البيانات التي لم تعد موجودة في المصدر - يمكن الكتابة فوقها هناك ، والانتقال إلى الأرشيف ، وما إلى ذلك. - معنا ، تظل متاحة للتحليل ؛
  • إمكانية تدقيق المعلومات - بفضل المعلومات الأولية الأكثر تفصيلاً ، يمكننا بعد ذلك معرفة كيفية عمل التنزيل لنا ، وانتهى بنا الأمر بمثل هذه الأرقام (لهذا ، نحتاج أيضًا إلى تمييز سمات التعريف والبيانات الوصفية المقابلة الذي يعمل عليه التنزيل - يتم تحديد ذلك من خلال طبقة الخدمة).
ما الصعوبات التي يمكن أن تنشأ عند بناء "مرحلة تاريخية":
  • سيكون من المناسب تحديد متطلبات تكامل المعاملات لهذه الطبقة ، لكن الممارسة توضح أن هذا صعب التحقيق (وهذا يعني أننا في هذا المجال لا نضمن التكامل المرجعي للجداول الأصلية والجداول الفرعية) - تحدث محاذاة التكامل في اللاحق طبقات.
  • تحتوي هذه الطبقة على أحجام كبيرة جدًا (الأكثر ضخامة في التخزين - على الرغم من كل التكرار في الهياكل التحليلية) - ويجب أن تكون قادرًا على التعامل مع مثل هذه الأحجام - سواء من حيث الحمل أو من حيث الطلبات (وإلا ، يمكنك بجدية تقلل من أداء التخزين بالكامل).
ما هو الشيء المثير للاهتمام أن أقوله عن هذه الطبقة.
أولاً ، إذا ابتعدنا عن نموذج "عمليات التحميل من طرف إلى طرف" ، فإن قاعدة "تتحرك القافلة بسرعة آخر جمل" لم تعد صالحة لنا ، وبصورة أدق ، نتخلى عن "القافلة" المبدأ والتبديل إلى مبدأ "الناقل": أخذنا البيانات من المصدر - وضعنا في طبقتك - على استعداد لأخذ الجزء التالي. هذا يعني انه
1) لا ننتظر حدوث المعالجة على طبقات أخرى ؛
2) نحن لا نعتمد على الجدول الزمني لتوفير البيانات من قبل الأنظمة الأخرى.
ببساطة ، نقوم بجدولة عملية تحميل تأخذ البيانات من مصدر واحد من خلال طريقة محددة للاتصال به ، والتحقق من دلتا وتخصيصها - ووضع البيانات في جداول مرحلية الهدف. و هذا كل شيء.

ثانيًا ، هذه العمليات ، كما ترى ، بسيطة جدًا - يمكن للمرء أن يقول بشكل تافه ، من وجهة نظر المنطق. هذا يعني أنه يمكن تحسينها وتخصيصها بشكل جيد للغاية ، مما يقلل الحمل على نظامنا ويسرع عملية توصيل المصادر (وقت التطوير).
لكي يحدث هذا ، يجب أن تعرف جيدًا خصائص الميزات التكنولوجية للنظام الأساسي الذي يعمل عليه هذا المكون - وبعد ذلك يمكنك إنشاء أداة فعالة للغاية.

طبقة العرض

تعد Data Mart Layer مسؤولة عن إعداد البيانات وتوفيرها للمستخدمين النهائيين - الأشخاص أو الأنظمة. في هذا المستوى ، يتم أخذ متطلبات المستهلك في الاعتبار قدر الإمكان - المنطقية (المفاهيمية) والمادية. يجب أن توفر الخدمة ما هو مطلوب بالضبط - لا أكثر ولا أقل.

إذا كان المستهلك نظامًا خارجيًا ، كقاعدة عامة ، فإنه يحدد هياكل البيانات التي يحتاجها وقواعد جمع المعلومات. النهج الجيد هو النهج الذي يكون فيه المستهلك مسؤولاً عن جمع البيانات الصحيحة. تم إعداد مستودع البيانات ، وشكل عرضًا ، ووفّر إمكانية جمع البيانات الإضافية (وضع العلامات بسمات التعريف لتسليط الضوء لاحقًا على دلتا التغييرات) ، ومن ثم يتحكم نظام المستهلك نفسه ويكون مسؤولاً عن كيفية استخدامه لهذا العرض. ولكن هناك بعض الخصائص المميزة: عندما لا يحتوي النظام على مكون نشط لجمع البيانات - إما أن تكون هناك حاجة إلى مكون خارجي يؤدي وظيفة التكامل ، أو أن التخزين سيكون بمثابة "منصة تكامل" - وسيضمن التزايد الصحيح تحميل المزيد من البيانات - خارج التخزين. تظهر العديد من الفروق الدقيقة هنا ، ويجب التفكير في قواعد تفاعل الواجهة وفهمها من قبل الطرفين (ومع ذلك ، كما هو الحال دائمًا ، عندما يتعلق الأمر بالتكامل). كقاعدة عامة ، يتم تطبيق التنظيف / الأرشفة الروتينية للبيانات على مجموعات البيانات هذه (نادرًا ما يكون من الضروري تخزين "بيانات النقل" هذه لفترة طويلة).

أهمها من وجهة نظر المهام التحليلية هي واجهات العرض "للأشخاص" - وبشكل أكثر دقة ، لأدوات ذكاء الأعمال التي يعملون بها.
ومع ذلك ، هناك فئة من "المستخدمين المتقدمين بشكل خاص" - المحللون وباحثو البيانات - الذين لا يحتاجون إلى أدوات ذكاء الأعمال أو العمليات التنظيمية لملء الأنظمة المتخصصة الخارجية. إنهم بحاجة إلى نوع من "واجهات المتاجر المشتركة" و "صندوق الحماية الخاص بهم" ، حيث يمكنهم إنشاء الجداول والتحويلات وفقًا لتقديرهم. في هذه الحالة ، تتمثل مسؤولية المستودع في ضمان ملء واجهات المتاجر المشتركة بالبيانات وفقًا للوائح.
بشكل منفصل ، يمكننا تسليط الضوء على المستهلكين مثل أدوات التنقيب في البيانات - التحليل العميق للبيانات. هذه الأدوات لها متطلبات إعداد البيانات الخاصة بها ، كما يعمل علماء البيانات معها. بالنسبة للتخزين ، تنخفض المهمة إلى - مرة أخرى ، لدعم الخدمة لتحميل بعض واجهات المتاجر بالتنسيق المتفق عليه.

ومع ذلك ، لنعد إلى العروض التحليلية. هذه هي الأشياء المهمة من وجهة نظر مصممي التخزين في طبقة البيانات هذه.
في رأيي ، فإن أفضل نهج تم اختباره على مدار الوقت لتصميم مجموعات البيانات ، والتي تم "شحذها" الآن تقريبًا لجميع منصات ذكاء الأعمال ، هو نهج رالف كيمبال. إنه شائع مثل النمذجة الأبعاد - النمذجة متعددة الأبعاد. هناك العديد من المنشورات حول هذا الموضوع. على سبيل المثال ، يمكن العثور على القواعد الأساسية في المنشور. وبالطبع ، يمكنك التوصية من خبير النمذجة متعدد الأبعاد. مورد آخر مفيد هو نصائح Kimball
تم وصف النهج متعدد الأبعاد لإنشاء واجهات المحلات وعمله جيدًا - سواء من خلال "أسلوب المبشرين" وبائعي البرامج الرائدين ، بحيث لا معنى للتعمق فيه ببعض التفاصيل هنا - يفضل دائمًا المصدر الأصلي .

أود أن أركز على تركيز واحد فقط. يختلف "إعداد التقارير والتحليلات". هناك "تقارير مكثفة" - تقارير مطلوبة مسبقًا يتم إنشاؤها في شكل ملفات وتسليمها إلى المستخدمين من خلال قنوات التسليم المتوفرة. ثم هناك لوحات المعلومات - لوحات معلومات BI. في جوهرها ، هذه هي تطبيقات الويب. ووقت استجابة هذه التطبيقات هو نفسه بالنسبة لأي تطبيق ويب آخر. هذا يعني أن الوقت العادي لتحديث لوحة BI هو ثوانٍ ، وليس دقائق. من المهم أن تضع ذلك في الاعتبار عند تصميم الحل الخاص بك. كيف احقق هذا؟ طريقة التحسين القياسية: نحن ننظر إلى ما يتكون منه وقت الاستجابة وما يمكننا التأثير فيه. ما هو أكثر وقت يضيع؟ لقراءات قاعدة البيانات المادية (القرص) ، لنقل البيانات عبر الشبكة. كيف تقلل كمية البيانات المقروءة والمرسلة في طلب واحد؟ الإجابة واضحة وبسيطة: تحتاج إما إلى تجميع البيانات ، أو تطبيق عامل تصفية على الجداول الكبيرة للجداول الفعلية المشاركة في الاستعلام ، واستبعاد ضم الجداول الكبيرة (يجب أن تمر المراجع إلى جداول البيانات الفعلية فقط من خلال الأبعاد).

ما هو ذكاء الأعمال؟ كيف هي مريحة؟ لماذا النموذج متعدد الأبعاد فعال؟
يسمح BI للمستخدم بتشغيل ما يسمى بالاستعلامات المخصصة. ماذا يعني ذلك؟ هذا يعني أننا لا نعرف الطلب الدقيق مقدمًا ، لكننا نعرف المؤشرات في أي الجوانب يمكن للمستخدم طلبها. يقوم المستخدم بإنشاء مثل هذا الاستعلام عن طريق تحديد عوامل تصفية BI المناسبة. وتتمثل مهمة مطور ذكاء الأعمال ومصمم واجهة المتجر في توفير مثل هذا المنطق للتطبيق بحيث يتم إما تصفية البيانات أو تجميعها ، مما يمنع حدوث موقف عند طلب الكثير من البيانات - و "توقف" التطبيق. عادةً ما يبدأون بأرقام مجمعة ، ثم يتعمقون في بيانات أكثر تفصيلاً ، ولكن على طول الطريق ، قم بتثبيت عوامل التصفية الضرورية.

لا يكفي دائمًا مجرد بناء "النجم المناسب" والحصول على هيكل مناسب لذكاء الأعمال. ستحتاج أحيانًا إلى تطبيق عدم التطابق في مكان ما (أثناء النظر إلى الوراء في كيفية تأثير ذلك على الحمل) ، وفي مكان ما لإنشاء واجهات متاجر ومجموعات ثانوية. أضف فهارس أو إسقاطات في مكان ما (حسب نظام إدارة قواعد البيانات).

وبالتالي ، من خلال "التجربة والخطأ" ، يمكنك الحصول على بنية مثالية لـ BI - والتي ستأخذ في الاعتبار خصوصيات كل من DBMS ومنصة BI ، بالإضافة إلى متطلبات المستخدم لعرض البيانات.
إذا أخذنا البيانات من "النواة" ، فستكون معالجة واجهات المتاجر هذه محلية بطبيعتها ، دون التأثير بأي شكل من الأشكال على المعالجة المعقدة للبيانات الأولية التي تم الحصول عليها مباشرة من أنظمة المصدر - نحن فقط "نحول" البيانات إلى شكل مناسب لذكاء الأعمال. ويمكننا القيام بذلك عدة مرات وبطرق مختلفة ووفقًا لمتطلبات مختلفة. من الأسهل والأسرع القيام بذلك على بيانات kernel بدلاً من التجميع من "الأساسي" (يمكن للبنية والقواعد ، كما نعلم ، "الطفو" أيضًا).

طبقة الخدمة

طبقة الخدمة مسؤولة عن تنفيذ الوظائف العامة (الخدمة) التي يمكن استخدامها لمعالجة البيانات في طبقات التخزين المختلفة - إدارة الأحمال ، وإدارة جودة البيانات ، وتشخيص المشكلات وأدوات المراقبة ، إلخ.
يوفر وجود هذا المستوى الشفافية وتدفق البيانات المنظمة في التخزين.

تتضمن هذه الطبقة منطقتين لتخزين البيانات:

  • منطقة البيانات الوصفية - تستخدم لآلية التحكم في تحميل البيانات ؛
  • مجال جودة البيانات - لتنفيذ فحوصات جودة البيانات خارج الخط (أي تلك التي لم يتم تضمينها مباشرة في عمليات ETL).
يمكنك ترتيب عملية إدارة التنزيل بطرق مختلفة. أحد الأساليب الممكنة هو هذا: قمنا بتقسيم المجموعة الكاملة من جداول التخزين إلى وحدات نمطية. يمكن أن تتضمن الوحدة جداول من طبقة واحدة فقط. يتم تحميل الجداول المضمنة في كل وحدة في عملية منفصلة. دعنا نسميها تحكم العملية ... يتم تعيين بدء عملية التحكم وفقًا للجدول الزمني الخاص بها. تقوم عملية التحكم بتنسيق المكالمات إلى العمليات الذرية ، كل منها يقوم بتحميل جدول هدف واحد ، وتحتوي أيضًا على بعض الخطوات العامة.
من الواضح ، أنه يكفي ببساطة تقسيم الجداول المرحلية إلى وحدات - حسب أنظمة المصدر ، أو بالأحرى من خلال نقاط الاتصال الخاصة بهم. لكن بالنسبة للنواة ، هذا أصعب بالفعل. هناك نحتاج إلى ضمان سلامة البيانات ، مما يعني أننا بحاجة إلى مراعاة التبعيات. أولئك. ستكون هناك تصادمات تحتاج إلى حل. وهناك طرق مختلفة لحلها.

من النقاط المهمة في إدارة الأحمال تطوير نهج ثابت لمعالجة الأخطاء. يتم تصنيف الأخطاء حسب مستوى خطورتها. عند حدوث خطأ فادح ، يجب أن تتوقف العملية ، وفي أسرع وقت ممكن ، لأن يشير حدوثه إلى مشكلة كبيرة يمكن أن تؤدي إلى تلف البيانات في التخزين. وبالتالي ، فإن إدارة الأحمال لا تتعلق فقط ببدء العمليات ، ولكن أيضًا بإيقافها ، فضلاً عن منع البدء المفاجئ (عن طريق الخطأ).

لتشغيل طبقة الخدمة ، يتم إنشاء بنية بيانات وصفية خاصة. ستخزن هذه المنطقة معلومات حول عمليات التحميل ومجموعات البيانات المحملة ونقاط التفتيش المستخدمة للحفاظ على الزيادة (التي قرأت العملية إلى أي نقطة) ومعلومات الخدمة الأخرى اللازمة لتشغيل النظام.
من المهم ملاحظة أن جميع الجداول المستهدفة في جميع الطبقات مميزة بمجموعة خاصة من حقول التعريف ، أحدها هو معرف العملية التي تم تحديث هذا الصف. بالنسبة للجداول الموجودة داخل المستودع ، تتيح عملية وضع العلامات هذه طريقة متسقة لإبراز دلتا التغييرات لاحقًا. عند تحميل البيانات في طبقة البيانات الأولية ، يكون الموقف أكثر تعقيدًا - قد تكون خوارزمية تخصيص دلتا للكائنات المحملة المختلفة مختلفة. لكن منطق معالجة التغييرات المقبولة وتداولها على الجداول المستهدفة للجوهر وواجهات المحلات أكثر تعقيدًا بكثير من التدريج ، حيث يكون كل شيء تافهًا تمامًا - من السهل تحديد المعايير والتفكير في الخطوات القياسية القابلة لإعادة الاستخدام (الإجراءات).

أنا لا أقوم بتعيين المهمة هنا لتغطية هذا الموضوع بالكامل - تنظيم التنزيل - أنا فقط أبرز اللهجات التي تستحق الانتباه إليها.
هذا النهج هو مجرد واحد من الخيارات. إنه سريع الاستجابة. وكان "النموذج الأولي المفاهيمي" هو ناقل Toyota والنظام في الوقت المناسب. أولئك. نحن هنا نبتعد عن النموذج واسع الانتشار المتمثل في "تنزيل البيانات الليلية" حصريًا ، ونقوم بالتنزيل في أجزاء صغيرة أثناء النهار - بمجرد أن تصبح البيانات جاهزة من مصادر مختلفة: ما جاء - تم تنزيله. في الوقت نفسه ، لدينا العديد من العمليات المتوازية قيد التشغيل. وسوف "يومض" "الذيل السريع" للبيانات الجديدة باستمرار - بل ويختفي بمرور الوقت. يجب أن نأخذ في الاعتبار هذه الميزة. وإذا لزم الأمر ، شكّل واجهات عرض مخصصة باستخدام "شرائح" ، حيث يكون كل شيء شاملاً بالفعل. أولئك. من المستحيل تحقيق الكفاءة والاتساق (النزاهة) في نفس الوقت. نحن بحاجة إلى توازن - في مكان ما يكون هناك شيء واحد مهم ، في مكان آخر.

من الضروري توفير مرافق التسجيل والمراقبة. من الممارسات الجيدة استخدام الأحداث المكتوبة ، حيث يمكنك تعيين معلمات مختلفة وتخصيص نظام الإشعارات - الاشتراك في أحداث معينة. لأن من المهم جدًا أنه عندما يكون تدخل مسؤول النظام مطلوبًا ، فسوف يعرف ذلك في أقرب وقت ممكن ويتلقى جميع المعلومات التشخيصية اللازمة. يمكن أيضًا استخدام السجلات لتحليل مشكلات ما بعد الأمر الواقع ، وكذلك للتحقيق في حوادث أعطال النظام ، بما في ذلك. جودة البيانات.

تصميم وصيانة نماذج بيانات المستودعات

لماذا من المهم الانتباه إلى تصميم نماذج البيانات عند تطوير أي نظام يتضمن قاعدة بيانات (وخاصة في المستودعات)؟ لماذا لا تقوم برمي مجموعة من الجداول في أي مكان - حتى في محرر نصوص؟ لماذا نحتاج "هذه الصور"؟
من الغريب أن المطورين ذوي الخبرة يطرحون مثل هذه الأسئلة.
في الواقع ، نعم ، لا شيء يمنعك من رسم الجداول - والبدء في استخدامها. إذا ... إذا كان في نفس الوقت في الرأس (!) لدى المطور صورة عامة متماسكة للهيكل الذي يقوم بنحته. ماذا لو كان هناك العديد من المطورين؟ ماذا لو كان شخص آخر يستخدم هذه الجداول؟ وماذا لو مر الوقت - غادر الشخص هذه المنطقة ، ثم عاد إليها مرة أخرى؟

هل يمكنك معرفة ذلك بدون نموذج؟ من حيث المبدأ ، يمكنك ذلك. ولإيجاد ذلك ، و "اكتشف الصور على قطعة من الورق" ، و "مسح - تسوية" البيانات. ولكن من الأسهل والأوضح والأسرع استخدام الأداة الجاهزة - نموذج البيانات. وكذلك فهم "منطق أجهزتها" - أي. سيكون من الجيد أن يكون لديك قواعد عامة للعبة.

والشيء الأكثر أهمية ليس ذلك. أهم شيء هو أنه عند تصميم نموذج ما ، فنحن مضطرون (بدون خيارات فقط!) إلى دراسة مجال الموضوع عن كثب وعمق ، وميزات جهاز البيانات واستخدامها في حالات العمل المختلفة. وتلك الأسئلة التي كنا سنضعها جانباً بسهولة باعتبارها معقدة ، و "ضبابية" من خلال إلقاء لافتاتنا ، دون أن نحاول تحديدًا التصميمالنموذج - سنضطر إلى التسليم واتخاذ القرار الآن ، عند التحليل والتصميم ، وليس لاحقًا - متى سننشئ التقارير ونفكر في "كيفية تقليل العناصر غير المتوافقة" و "إعادة اختراع العجلة" في كل مرة.

هذا النهج هو أحد تلك الممارسات الهندسية التي تسمح لك بإنشاء أنظمة مضادة للكسر. نظرًا لأنها مرتبة بشكل واضح وشفافة وملائمة للتطوير ، كما أن "حدود هشاشتها" تظهر على الفور - يمكنك تقدير "حجم الكارثة" بدقة أكبر عند ظهور متطلبات جديدة والوقت اللازم لإعادة التصميم (إذا لزم الأمر).
وبالتالي ، فإن نموذج البيانات هو أحد الآثار الرئيسية التي يجب الحفاظ عليها أثناء تطوير النظام. بطريقة ودية ، يجب أن يكون "على طاولة" كل محلل ومطور ، إلخ. - كل من يشارك في مشاريع تطوير النظام.

تصميم نماذج البيانات موضوع كبير ومنفصل. هناك طريقتان رئيسيتان لتصميم التخزين.
النهج يعمل بشكل جيد للنواة علاقة الكيان - عندما يتم بناء نموذج معياري (3NF) على أساس دراسة مجال الموضوع ، وبصورة أدق ، المنطقة المختارة. نفس "نموذج الشركة" الذي تمت مناقشته أعلاه يلعب هنا.

عند تصميم واجهات العرض ، فهي مناسبة نموذج متعدد الأبعاد ... يتناسب هذا النهج جيدًا مع فهم مستخدمي الأعمال - لأن إنه نموذج بسيط ومناسب للإدراك البشري - يعمل الناس بمفاهيم مفهومة ومألوفة للمقاييس (المؤشرات) والأقسام التي يتم تحليلها من خلالها. وهذا يسمح لك ببناء عملية جمع المتطلبات ببساطة وبشكل واضح - نرسم مجموعة من "مصفوفات الأقسام والمؤشرات" ، ونتواصل مع ممثلي مختلف الإدارات. ثم نضعه في هيكل واحد - "نموذج التحليل": نشكل "ناقل القياس" ونحدد الحقائق التي يتم تحديدها عليها. على طول الطريق ، نحن نعمل على قواعد التجميع والتسلسل الهرمي.

ثم من السهل جدًا الانتقال إلى النموذج المادي ، مع إضافة عناصر التحسين مع مراعاة خصائص نظام إدارة قواعد البيانات (DBMS). على سبيل المثال ، بالنسبة إلى Oracle سيكون التقسيم ، مجموعة من الفهارس ، إلخ. بالنسبة إلى Vertica ، سيتم استخدام تقنيات أخرى - الفرز والتجزئة والتقسيم.
أيضًا ، قد تكون هناك حاجة إلى إلغاء التطابق الخاص - عندما نقوم بإدخال التكرار عن عمد في البيانات ، وبفضل ذلك نقوم بتحسين أداء الاستعلام ، ولكن في نفس الوقت يعقد تحديث البيانات (حيث يجب أخذ التكرار في الاعتبار والحفاظ عليه أثناء تحميل البيانات معالجة). ربما ، من أجل تحسين الأداء ، سيتعين علينا أيضًا إنشاء جداول مجمعة إضافية ، أو استخدام ميزات DBMS الإضافية مثل الإسقاطات في Vertica.

لذلك ، عند نمذجة بيانات المستودع ، فإننا في الواقع نحل عدة مشاكل:

  • مهمة بناء نموذج مفاهيمي (منطقي) للنواة - تحليل النظام والأعمال - البحث في مجال الموضوع ، والخوض في التفاصيل ومراعاة الفروق الدقيقة في "البيانات الحية" واستخدامها في الأعمال ؛
  • مهمة بناء نموذج تحليل - ثم نموذج مفاهيمي (منطقي) لواجهة المحل ؛
  • مهمة بناء النماذج المادية - إدارة تكرار البيانات ، والتحسين مع مراعاة خصائص DBMS للاستعلامات وتحميل البيانات.
عند تطوير النماذج المفاهيمية ، قد لا نأخذ في الاعتبار خصوصيات نظام DBMS معين ، حيث نقوم بتصميم هيكل قاعدة بيانات من أجله. علاوة على ذلك ، يمكننا استخدام نموذج مفاهيمي واحد لإنشاء العديد من النماذج المادية - لنظام إدارة قواعد البيانات المختلفة.

دعونا نلخص.

  • نموذج البيانات ليس مجموعة من "الصور الجميلة" ، وعملية تصميمه ليست عملية رسمها. يعكس النموذج فهمنا للمجال. وعملية تجميعها هي عملية دراستها والبحث فيها. هذا هو الوقت الضائع. وليس على الإطلاق "الرسم والتلوين".
  • نموذج البيانات هو أداة تصميم ، وهي طريقة لتبادل المعلومات بطريقة منظمة بين أعضاء الفريق. للقيام بذلك ، يجب أن يكون واضحًا للجميع (يتم توفير ذلك من خلال التدوين والشرح) ومتاح (منشور).
  • لا يتم إنشاء نموذج البيانات مرة واحدة وتجميده ، ولكن يتم إنشاؤه وتطويره في عملية تطوير النظام. وضعنا القواعد لتطويرها بأنفسنا. ويمكننا تغييرها إذا رأينا - كيف نفعل ذلك بشكل أفضل وأسهل وأكثر كفاءة.
  • يسمح لك نموذج البيانات (المادي) بدمج مجموعة من أفضل الممارسات التي تهدف إلى التحسين والاستفادة منها - أي استخدام التقنيات التي نجحت بالفعل في نظام إدارة قواعد البيانات هذا.

ملامح مشاريع مستودع البيانات


دعونا نتناول تفاصيل المشاريع التي تقوم الشركة في إطارها ببناء مستودعات البيانات وتطويرها. ودعونا ننظر إليهم من وجهة نظر تأثير الجانب المعماري. لماذا من المهم لمثل هذه المشاريع أن تبني معمارية ، ومنذ البداية؟ كما أن وجود بنية مدروسة جيدًا يمنح المرونة لمشروع مستودع البيانات ، ويسمح لك بتوزيع العمل بكفاءة بين المؤدين ، كما يسهل التنبؤ بالنتيجة ويجعل العملية أكثر قابلية للتنبؤ.

مستودع البيانات هو برنامج مخصص

يعتبر مستودع البيانات دائمًا "تطويرًا مخصصًا" ، وليس حلاً محاصرًا. نعم ، هناك تطبيقات BI خاصة بالصناعة تتضمن نموذج بيانات مرجعي ، وعمليات ETL مُعدة مسبقًا من مصادر مشتركة (على سبيل المثال ، أنظمة ERP) ، ومجموعة من لوحات وتقارير BI القياسية. ولكن من الناحية العملية ، نادرًا ما يتم تنفيذ التخزين - على شكل "صندوق". لقد كنت أعمل مع المستودعات منذ حوالي 10 سنوات ولم أر مثل هذه القصة من قبل. هناك دائمًا بعض الفروق الدقيقة المرتبطة بالميزات الفريدة للشركة - كلاً من الأعمال التجارية ومشهد تكنولوجيا المعلومات. لذلك ، فإن الأمل في أن يتم توفير الهيكل من قبل "البائع" الذي يقدم الحل هو أمر متهور إلى حد ما. غالبًا ما "تنضج" بنية مثل هذه الأنظمة داخل المنظمة نفسها. أو يتم تشكيلها من قبل المختصين من شركة المقاول وهي المنفذ الرئيسي للمشروع.

مستودع البيانات هو مشروع تكامل

يقوم مستودع البيانات بتحميل ومعالجة المعلومات من العديد من أنظمة المصدر. ومن أجل الحفاظ على "علاقات ودية" معهم ، عليك أن تكون حذرًا للغاية معهم. على وجه الخصوص ، من الضروري تقليل الحمل على أنظمة المصدر ، مع الأخذ في الاعتبار نوافذ "التوافر وعدم التوافر" ، واختيار واجهات التفاعل مع مراعاة بنيتها ، وما إلى ذلك. بعد ذلك ، سيكون التخزين قادرًا على التقاط البيانات في أقرب وقت ممكن وبالتردد المطلوب. خلاف ذلك ، سيتم "زرعك" في دائرة احتياطية ، والتي لا يتم تحديثها في معظم الترددات التشغيلية.
بالإضافة إلى ذلك ، من الضروري مراعاة "العامل البشري". لا يقتصر التكامل على تفاعل الآلات فقط. إنه أيضًا اتصال بين الناس.

مستودع البيانات هو مشروع تعاوني


في شركة كبيرة ، نادرًا ما يمكن تنفيذ مثل هذا النظام بواسطة فريق واحد فقط. كقاعدة عامة ، تعمل عدة فرق هنا ، كل منها يحل مشكلة معينة.

يجب أن توفر الهندسة المعمارية القدرة على تنظيم عملهم الموازي ، مع الحفاظ على سلامتها وتجنب تكرار نفس الوظيفة في أماكن مختلفة ، من قبل أشخاص مختلفين. بالإضافة إلى الجهود غير الضرورية ، يمكن أن تؤدي هذه الازدواجية إلى تناقضات في البيانات لاحقًا.

بالإضافة إلى ذلك ، عندما يشارك الكثير من الأشخاص والفرق ، غالبًا ما يكونون متناثرين ، في تطوير النظام ، فإن السؤال الذي يطرح نفسه لا محالة هو: كيفية بناء الاتصالات والتفاعل المعلوماتي بينهم. كلما تم استخدام الأساليب والممارسات القياسية والمفهومة ، كلما كان تنظيم مثل هذا العمل أسهل وأكثر ملاءمة وفعالية. ومن بين أمور أخرى ، يجدر التفكير في تكوين "المصنوعات اليدوية العاملة" ، ومن بينها نماذج البيانات رقم 1 لمخازن البيانات (انظر القسم السابق).

يتمتع مخزن البيانات بعمر افتراضي أطول من الأنظمة الأخرى

للتوضيح - البيان صحيح بالنسبة للتخزين "الحي" ، العامل ، والمتكامل مع المصادر الرئيسية ، وامتلاك البيانات التاريخية وتقديم المعلومات والخدمات التحليلية للعديد من أقسام الشركة.

ما هي الأسس التي لديّ للاعتقاد بذلك؟
أولاً ، يعد بناء التخزين عملية كثيفة الاستخدام للموارد: فبالإضافة إلى التكاليف الفعلية للمعدات ، وتراخيص البرامج التكنولوجية اللازمة والتطوير ، تشارك جميع أنظمة وأقسام الشركة تقريبًا في هذا الأمر. إن تكرار هذه العملية برمتها من الصفر مرة أخرى فكرة جريئة للغاية.

ثانيًا ، إذا كان للتخزين البنية الصحيحة ، فيمكنه بسهولة أن ينجو من تغييرات أنظمة المصدر ، وظهور متطلبات جديدة من المستخدمين النهائيين ، ونمو أحجام البيانات.
إذا كانت البنية صحيحة ، وكانت تدفقات المعلومات شفافة ، فيمكن عندئذٍ تطوير مثل هذا النظام لفترة طويلة دون التعرض لخطر الوقوع في موقف ما عند إجراء تغييرات بسبب الصعوبات في تقييم التأثير.

التطوير التكراري التدريجي

آخر شيء يرغب فيه العميل ، من خلال المشاركة في القصة مع المستودع ، هو تجميد متطلباته لمدة عام أو عامين ، حتى يتم تصميم نموذج بيانات الشركة الكامل ، وجميع المصادر متصلة بالكامل ، وما إلى ذلك.

في نظر العملاء ، غالبًا ما يبدو مخزن البيانات وكأنه وحش مطلق - المهام والأهداف وأفق تطوير النظام ضخمة للغاية. وغالبًا ما يخشى العميل "على حساب ميزانيته" أن يقوم قسم تكنولوجيا المعلومات بحل بعض "مشكلاته". ومرة أخرى نواجه مسألة التفاعل بين الناس والقدرة على التعبير بهدوء عن موقفنا والتفاوض.

تسمح لك الأساليب المعمارية المختصة بتطوير النظام بشكل متكرر ، وزيادة الوظائف تدريجياً ، دون الدخول في "التطوير" لعدة سنوات قبل البدء في إعطاء نتيجة.

على الرغم من أنه تجدر الإشارة إلى أن "المعجزات لا تحدث" - و "البداية" تستغرق وقتًا أيضًا. بالنسبة إلى المستودعات ، يمكن أن تكون كبيرة جدًا - نظرًا لأن هذه كميات كبيرة من البيانات ، فهذه بيانات تاريخية - للفترات القديمة ، حيث قد تختلف قواعد معالجة المعلومات عن القواعد الحالية. لذلك ، يستغرق الأمر وقتًا كافيًا للعمل التحليلي والتفاعل مع أنظمة المصدر وعدد من "التجربة والخطأ" ، بما في ذلك اختبارات التحميل على البيانات الحقيقية.

مستودعات البيانات - "قصة متعددة المشاريع"

من الصعب تحديد عميل تجاري واحد لمخزن البيانات. ويعتقد (ليس بدون سبب) أن العامل الرئيسي في نجاح مشروع بناء مرفق تخزين هو دعم إدارة الشركة - مباشرة الشخص الأول.
نادرًا ما يتم إنشاء المستودع وتطويره كجزء من مشروع واحد. عادة ، هناك احتياجات مختلفة لتوحيد البيانات والتحليلات ، ورائها عملاء ومجموعات مستخدمين مختلفة. لذلك ، غالبًا ما يتم تطوير المستودع في إطار العديد من المشاريع الموازية.

توازن الابتكار والحلول المجربة

على الرغم من حقيقة أن موضوع التخزين "قديم" جدًا (إذا كانت هذه الكلمة قابلة للتطبيق في صناعة حديثة مثل تكنولوجيا المعلومات) ومحافظًا إلى حد ما. ومع ذلك ، فإن التقدم لا يزال قائما - وتلك القيود التي كانت موجودة في السابق بسبب الأقراص باهظة الثمن والبطيئة ، والذاكرة باهظة الثمن ، وما إلى ذلك. - تمت إزالتها الآن. في الوقت نفسه ، حان الوقت لمراجعة بعض الأساليب المعمارية. علاوة على ذلك ، ينطبق هذا على كل من المنصات التكنولوجية وبنية الأنظمة المطبقة التي تعتمد عليها.

من المهم تحقيق التوازن هنا - والحفاظ على نهج "أخضر" إلى حد ما لكل من الموارد والمعلومات المخزنة. خلاف ذلك ، يمكنك بسرعة كبيرة تحويل التخزين إلى "تفريغ" شبه منظم ، حيث ، إذا كان من الممكن اكتشاف ذلك ، فبالجهد كبير جدًا.
نعم ، لدينا المزيد من الفرص ، لكن هذا لا يعني أننا بحاجة إلى إنكار جميع الممارسات المتراكمة والمُختبرة بمرور الوقت ، والتي من الواضح كيف ولماذا نستخدمها ، و "الذهاب إلى الأمور السيئة" التي يقودها فقط شبح ضبابي " الابتكارات ".
يعني الحفاظ على التوازن استخدام طرق وأساليب جديدة حيث تفتح فرصًا جديدة ، ولكن في نفس الوقت باستخدام الأساليب القديمة التي أثبتت جدواها - لحل المشكلات العاجلة التي لم يتم إلغاؤها.
ماذا يمكننا أن نفعل كمطورين ومصممين لحلول التطبيقات؟ بادئ ذي بدء ، معرفة وفهم التغييرات التكنولوجية للمنصات التي نعمل عليها وإمكانياتها وميزاتها وحدود التطبيق.

لنلقِ نظرة على نظام إدارة قواعد البيانات (DBMS) باعتباره المنصة التكنولوجية الأكثر أهمية وأهمية للتخزين.
في الآونة الأخيرة ، كان هناك انجراف واضح لقواعد البيانات العلائقية ، التي تم إنشاؤها في البداية على أنها "عالمية" ، نحو التخصص. لفترة طويلة ، أطلق كبار البائعين خيارات متنوعة - لتطبيقات من فئات مختلفة (OLTP و DSS و DWH). بالإضافة إلى ذلك ، تظهر فرص إضافية للعمل مع النص والبيانات الجغرافية وما إلى ذلك.

ولكن هذا لم يكن نهاية الأمر - بدأت المنتجات في الظهور والتي كانت تركز في البداية على فئة معينة من المهام ، أي نظم إدارة قواعد البيانات المتخصصة. قد يستخدمون أو لا يستخدمون النموذج العلائقي. من المهم أن يتم "صقلها" في البداية ليس فقط لتخزين ومعالجة "معلومات العمل" بشكل عام ، ولكن لمهام محددة.

على ما يبدو ، فإن المركزية والتخصص هما اتجاهان متكاملان يحلان بشكل دوري محل بعضهما البعض ، مما يضمن التطور والتوازن. وكذلك التطور التطوري (التدريجي) التدريجي والتغيرات الأساسية. على سبيل المثال ، في التسعينيات ، كان مايكل ستونبريكر أحد مؤلفي بيان قاعدة بيانات الجيل الثالث ، والذي عبر بوضوح عن فكرة أن العالم لا يحتاج إلى ثورة أخرى في عالم قواعد البيانات. ومع ذلك ، بعد 10 سنوات ، نشر أعمالًا أعلن فيها عن المتطلبات الأساسية لبداية حقبة جديدة في عالم نظم إدارة قواعد البيانات (DBMS) - بناءً على تخصصهم.
وهو يركز على حقيقة أن نظم إدارة قواعد البيانات العامة العامة مبنية على بنية "مقاس واحد يناسب الجميع" ، والتي لا تأخذ في الاعتبار التغييرات في الأنظمة الأساسية للأجهزة أو تقسيم التطبيقات إلى فئات يمكنك من خلالها التوصل إلى المزيد الحل الأمثل من تنفيذ المتطلبات العالمية.
ويبدأ في تطوير عدد من المشاريع وفق هذه الفكرة. أحدها - C-Store - عبارة عن نظام DBMS عمودي مصمم في بنية لا شيء مشترك (SN) ، تم إنشاؤه في الأصل خصيصًا لأنظمة فئة مستودعات البيانات. ثم تم تسويق هذا المنتج باسم HP Vertica.

يبدو الآن أن موضوع تطوير مستودعات البيانات قد انزلق إلى مرحلة جديدة من التطور. تظهر تقنيات وأساليب وأدوات جديدة. تتيح لنا دراستهم واختبارهم وتطبيقهم الذكي إنشاء حلول ممتعة ومفيدة حقًا. واجلبهم إلى التنفيذ ، واستمتع بحقيقة أن تطويراتك تستخدم في عمل حقيقي ومفيدة.

الخاتمة

أثناء إعداد هذا المقال ، حاولت التركيز بشكل أساسي على المهندسين المعماريين والمحللين والمطورين الذين يعملون مباشرة مع مستودعات البيانات. ولكن اتضح أنها "أخذت الموضوع على نطاق أوسع قليلاً" حتماً - ووقعت فئات أخرى من القراء في مجال الرؤية. ستبدو بعض النقاط مثيرة للجدل ، والبعض الآخر غير واضح ، والبعض الآخر واضح. الناس مختلفون - بخلفيات وخلفيات ومواقف مختلفة.
على سبيل المثال ، الأسئلة الإدارية النموذجية هي "متى يتم توظيف المهندسين المعماريين؟" ، "متى يجب القيام بالهندسة المعمارية؟" يبدو لنا (المطورين والمصممين) غريبًا نوعًا ما ، لأنه بالنسبة لنا تظهر بنية النظام مع ولادته - لا يهم ما إذا كنا على علم به أم لا. وحتى إذا لم يكن هناك دور رسمي للمهندس المعماري في المشروع ، فإن المطور العادي دائمًا "يتضمن مهندسًا داخليًا خاصًا به."

بشكل عام ، لا يهم من يقوم بالضبط بدور المهندس المعماري - من المهم أن يسأل شخص ما أسئلة مماثلة ويفحص الإجابات. إذا تم تحديد المهندس المعماري بوضوح ، فهذا يعني فقط أنه مسؤول بشكل أساسي عن النظام وتطويره.
لماذا وجدت موضوع "منع الهشاشة" ذا صلة بهذا الموضوع؟

"إن تفرد نظام منع الهشاشة هو أنه يسمح لنا بالعمل مع المجهول ، والقيام بشيء ما في ظروف لا نفهم فيها ما نقوم به ، ونحقق النجاح."/ نسيم ن. طالب /
لذلك ، فإن الأزمة ودرجة عالية من عدم اليقين ليست عذراً لغياب العمارة ، بل عوامل تعزز حاجتها.

يبدو الآن أن موضوع تطوير مستودعات البيانات قد انزلق إلى مرحلة جديدة من التطور. تظهر تقنيات وأساليب وأدوات جديدة. تتيح لنا دراستهم واختبارهم وتطبيقهم الذكي إنشاء حلول ممتعة ومفيدة حقًا. واجلبهم إلى التنفيذ ، واستمتع بحقيقة أن تطويراتك تستخدم في عمل حقيقي ومفيدة.

الخاتمة

أثناء إعداد هذا المقال ، حاولت التركيز بشكل أساسي على المهندسين المعماريين والمحللين والمطورين الذين يعملون مباشرة مع مستودعات البيانات. ولكن اتضح أنها "أخذت الموضوع على نطاق أوسع قليلاً" حتماً - ووقعت فئات أخرى من القراء في مجال الرؤية. ستبدو بعض النقاط مثيرة للجدل ، والبعض الآخر غير واضح ، والبعض الآخر واضح. الناس مختلفون - بخلفيات وخلفيات ومواقف مختلفة.
على سبيل المثال ، الأسئلة الإدارية النموذجية هي "متى يتم توظيف المهندسين المعماريين؟" ، "متى يجب القيام بالهندسة المعمارية؟" يبدو لنا (المطورين والمصممين) غريبًا نوعًا ما ، لأنه بالنسبة لنا تظهر بنية النظام مع ولادته - لا يهم ما إذا كنا على علم به أم لا. وحتى إذا لم يكن هناك دور رسمي للمهندس المعماري في المشروع ، فإن المطور العادي دائمًا "يتضمن مهندسًا داخليًا خاصًا به."

بشكل عام ، لا يهم من يقوم بالضبط بدور المهندس المعماري - من المهم أن يسأل شخص ما أسئلة مماثلة ويفحص الإجابات. إذا تم تحديد المهندس المعماري بوضوح ، فهذا يعني فقط أنه مسؤول بشكل أساسي عن النظام وتطويره.
لماذا وجدت موضوع "منع الهشاشة" ذا صلة بهذا الموضوع؟

"إن تفرد نظام منع الهشاشة هو أنه يسمح لنا بالعمل مع المجهول ، والقيام بشيء ما في ظروف لا نفهم فيها ما نقوم به ، ونحقق النجاح."/ نسيم ن. طالب /
لذلك ، فإن الأزمة ودرجة عالية من عدم اليقين ليست عذراً لغياب العمارة ، بل عوامل تعزز حاجتها.

العلامات: إضافة العلامات

5.1 تنظيم البيانات في أنظمة معلومات الشركات.

بالنظر إلى CIS على المستوى الأكثر بساطة ، يمكننا القول أنه يحتوي على شبكة كمبيوتر الشركة (الحوسبة) وحزمة تطبيق متخصصة (PPP) لحل المشكلات في مجال الموضوع. في المقابل ، يفترض كل من PPP وشبكة الكمبيوتر مسبقًا استخدام بيانات المعلومات حول حالة وتطوير الأنظمة التي يتحكمون فيها ويتحكمون فيها. من الناحية التاريخية ، تتكون رابطة الدول المستقلة من أنظمة فرعية متفرعة منفصلة للمؤسسات الفردية ، مترابطة وغالبًا ما تمثل نظامًا هرميًا. من الطبيعي أن نفترض أن هذه الأنظمة الفرعية لها مصادرها الخاصة ومواقع تخزينها الخاصة للبيانات ذات الصلة. عند الدمج في نظام واحد ، تبرز أسئلة بخصوص الاستخدام الصحيح المشترك للبيانات الموجودة جغرافيًا في أماكن مختلفة من تخزينها. وبالتالي ، من أجل الإدارة الناجحة لاتحاد الإنتاج المجهز بـ ICC ، فإنه يحتاج إلى نظام موثوق به لجمع البيانات وتخزينها ومعالجتها. بمعنى آخر ، أنت بحاجة إلى بنية أساسية موحدة للمعلومات تلبي مشاريع BI (ذكاء الأعمال) الإستراتيجية أو قاعدة بيانات متكاملة لتخزين البيانات واستخدامها. الهدف الرئيسي من تكامل البيانات هو الحصول على صورة موحدة ومتماسكة لحالة بيانات أعمال الشركة. يعتبر التكامل بحد ذاته عملية معقدة ، يُنصح بناءً عليها بالتفرد:

التقنيات ،

منتجات،

التطبيقات.

أساليبهي مناهج لتكامل البيانات.

التقنيات- هذه عمليات تنفذ طرقًا معينة لتكامل البيانات.

منتجاتهي حلول تجارية تدعم تقنية أو أخرى لتكامل البيانات.

التطبيقات- هذه حلول تقنية جاهزة يقدمها المطورون وفقًا لرغبات العملاء - العملاء.

اعتمادًا على مدى تعقيد أنظمة معلومات الشركة وعلى المهام المصممة لحلها ، يختلف تنظيم البيانات فيها إلى حد ما. على وجه الخصوص ، في رابطة الدول المستقلة ، المصممة لضمان الإدارة الفعالة للعمليات التجارية لكل من الفروع الفردية والشركة ككل ، من المعتاد التحدث عن وجود قواعد بيانات الشركة. في نظم المعلومات المؤسسية المستخدمة على أعلى مستويات الإدارة والمرتبطة في الغالب بعمليات التحليل التشغيلي وصنع القرار ، في عملية التخطيط والتصميم والتنبؤ لأنواع مختلفة من أنشطة الإدارة ، يستخدمون مصطلحات مستودع البيانات. من الجدير بالملاحظة أن العبارة تخزين متكاملمتأصل في كليهما.

5.2 قواعد بيانات الشركات ومتطلباتها

كمخزن بيانات متكامل على مستوى النظام ، تم تصميم قاعدة بيانات الشركة لتوفير معلومات للإدارة الفعالة لجميع العمليات التجارية وأقسام الشركة. يوفر تكامل البيانات إنشاء هيكل جديد يتضمن بشكل عضوي بيانات من قواعد البيانات لأقسام منفصلة منفصلة ، لذلك ، يجب أن يوفر هذا الهيكل متطلبات معينة:

إدخال بيانات بسيط وسهل الاستخدام في قاعدة البيانات ،

تخزين البيانات بطريقة لا تؤدي إلى زيادة مفرطة في البيانات ،

الوصول إلى المعلومات العامة للموظفين من جميع أقسام الشركة ، مع شرط إلزامي للتمييز في حقوق الوصول ،

سرعة إيجاد واسترجاع المعلومات المطلوبة.

فرز وتصفية البيانات المطلوبة ،

تجميع البيانات التي تحمل الاسم نفسه ،

الحسابات الوسيطة والنهائية فوق الحقول ،

· تحويل ووضوح بيانات الإخراج ،

قابلية التوسع،

الحماية ضد الأعطال العرضية وفقدان البيانات غير القابل للاسترداد والوصول غير المصرح به.

بالإضافة إلى ذلك ، عند دمج قواعد البيانات المعزولة (الموزعة) في قاعدة بيانات شركة واحدة ، من المهم ضمان القدرة على العمل مع قاعدة البيانات بطريقة تجعل المستخدم يعمل معها كما هو الحال مع قاعدة بيانات غير مخصصة.

يمكن إنشاء قاعدة بيانات مؤسسية متكاملة بطرق مختلفة ، أهمها:

الدمج،

الاتحاد ،

· الانتشار.

5.3 خصائص حلول تكامل قواعد البيانات المؤسسية

الدمج.تحت الدمجيعني عادةً إضافة بيانات بنفس الاسم. يستخدم مصطلح مشابه على نطاق واسع في القطاع المصرفي ، حيث يتم تكوين ميزانية عمومية موحدة سنوية ، مما يجعل من الممكن عرض جميع أصول والتزامات البنك الأم مع فروعه.

كما هو مطبق على شركة ، عند استخدام هذه الطريقة ، يتم نسخ البيانات وجمعها من قواعد البيانات الأساسية (DB - Slave) عن طريق التكامل في موقع تخزين واحد (DB - Master). كقاعدة عامة ، يتم اختيار خادم المكتب المركزي (الرئيسي) كموقع تخزين (الشكل 5.1).

الشكل 5.1. طريقة دمج البيانات

البيانات الموجودة في قاعدة البيانات - يتم استخدام Master للإبلاغ والتحليل والتطوير واتخاذ القرار ، بالإضافة إلى مصدر بيانات لفروع أخرى من الشركة.

التقنيات الأكثر شيوعًا لدعم مثل هذه القرارات أثناء التوحيد هي التقنيات التالية:

· استخراج وتحويل وتحميل - ETL (استخراج تحميل تحويل) ؛

· إدارة محتوى الشركة - ECM (إدارة محتوى المؤسسة).

مزايا طريقة الدمج هي:

1. القدرة على إجراء التحول(إعادة الهيكلة والمطابقة والتنظيف و / أو التجميع) لكميات كبيرة من البيانات في عملية نقلها من الأنظمة الأولية إلى مواقع التخزين النهائية باستخدام تقنية ETL ،

2. القدرة على إدارة البيانات غير المهيكلةمثل المستندات والتقارير والصفحات بفضل حلول تكنولوجيا ECM.

للعمل مع قاعدة بيانات رابطة الدول المستقلة الموحدة ، خاصة تطبيقات الأعمال،التي تسمح لك بإنشاء استعلامات لبيانات قاعدة البيانات والتقارير ، وعلى أساسها ، لإجراء تحليل البيانات.

عيب التكامل من خلال الدمج هو عدم القدرة على تحديث البيانات المدمجة في موقع التخزين المتكامل بالتزامن مع تحديثات البيانات في الأنظمة الأولية بسبب التعارضات الناشئة أثناء المزامنة.

هناك فجوة زمنية بين وقت تحديث البيانات في الأنظمة الأساسية وفي موقع التخزين النهائي.

يمكن أن يتراوح هذا التأخير من بضع ثوانٍ إلى عدة ساعات أو حتى أيام.

الاتحاد.تحت الفيدراليةعادة ما يعني الاتحاد. غالبًا ما يستخدم مصطلح مشابه في السياسة عند ترتيب حدود الدولة (على سبيل المثال ، ألمانيا وروسيا والولايات المتحدة الأمريكية).

عملية اتحادية البيانات في قاعدة بيانات الشركة هي إنشاء صورة افتراضية (ظاهرية) تجمع العديد من ملفات البيانات الأولية في كل افتراضي واحد (انظر الشكل 5.2). يتعلق اتحاد البيانات نفسه باستخراج البيانات من الأنظمة الأولية بناءً على المتطلبات الخارجية. تتم إدارة عمل قاعدة بيانات الشركة المتكاملة وفق الطريقة الفيدرالية معالج الفيدرالية.

الصورة 2. طريقة اتحاد البيانات

من خلال الوصول إلى البيانات في قاعدة بيانات افتراضية ، يقوم أي تطبيق أعمال بإنشاء طلب للصورة الافتراضية. يقوم معالج الاتحاد ، بناءً على هذا الطلب ، باستخراج البيانات من الأنظمة الأساسية المعنية ، ودمجها وفقًا للصورة الافتراضية ، وإخراج النتيجة إلى تطبيق الأعمال الذي أنشأ الطلب. في هذه الحالة ، يتم تنفيذ جميع تحويلات البيانات الضرورية عند استخراجها من الأنظمة الأولية.

يتم توفير دعم النهج الموحد لتكامل البيانات من خلال تقنية تكامل معلومات المؤسسة (E I I) ، والتي تعني في الترجمة - تكامل معلومات الشركة.

من ميزات الحل الموحد أن معالج الفيدرالية يستخدمه البيانات الوصفية(المعرفة) ، والتي تشمل بيانات عن تكوين وخصائص الصورة الافتراضية ، حول كمية البيانات ، والعلاقات الدلالية بينها وطرق الوصول إليها ، مما يساعد الحل الموحد على تحسين الوصول إلى الأنظمة الأولية.

المزايا الرئيسية للنهج الفيدرالي هي:

القدرة على الوصول إلى البيانات الحالية دون إنشاء قاعدة بيانات جديدة إضافية ،

ملاءمة التطبيق بعد الاستحواذ أو الاندماج للشركات ،

لا يمكن الاستغناء عنه في الحالات التي ، لأسباب أمنية ، هناك قيود الترخيص على نسخ البيانات من الأنظمة الأولية ،

استخدام ، إذا لزم الأمر ، الاستقلالية العالية للأقسام المحلية للشركة ومرونة السيطرة المركزية على أنشطتها ،

· درجة عالية من المنفعة للشركات عبر الوطنية الكبيرة.

تشمل عيوب هذا النهج ما يلي:

انخفاض الأداء بسبب التكلفة الإضافية للوصول إلى مصادر بيانات متعددة ،

الفيدرالية هي الأنسب لاسترجاع كميات صغيرة من البيانات ،

· متطلبات عالية لجودة البيانات الأولية.

ينتشر.تحت النشريشير عادةً إلى النقل الإقليمي للأشياء المضاعفة. يشير نشر البيانات إلى انتشار قواعد البيانات الأولية ونقلها من موقع إلى آخر. عند تنفيذ هذه الطريقة تطبيقات الأعمالتعمل عبر الإنترنت وتنقل البيانات إلى وجهات بناءً على أحداث معينة تحدث. بالنسبة لهذا الحل التقني ، تصبح مسألة تحديثات البيانات ، التي تكون ممكنة في أوضاع متزامنة أو غير متزامنة ، مهمة. يفترض الوضع المتزامن أن التحديثات لكل من النظام الأساسي والنظام الهدف تحدث أثناء نفس المعاملة المادية.

أمثلة على التقنيات التي تدعم تنفيذ طريقة نشر البيانات هي:

تكامل تطبيقات المؤسسة EAI - تكامل تطبيقات المؤسسة ،

تكرار بيانات الشركة EDR - نسخ بيانات المؤسسة.

الهيكل العام لتنفيذ طريقة نشر البيانات كما هو مبين في الشكل 5.3.

الشكل 5.3. طريقة نشر البيانات

السمة المميزة لطريقة توزيع البيانات هي التسليم المضمون للبيانات إلى نظام الوجهة بأقل تأخير قريب من الوقت الفعلي.

يوفر الجمع بين تقنيات التكامل (EAI) والتكرار (EDR) مزايا متعددة ، في شكل المزايا التالية:

· أداء عالي،

· القدرة على إعادة هيكلة وتنظيف البيانات ،

موازنة الحمل عن طريق إنشاء نسخ احتياطية واستعادة البيانات.

منهج هجين.إن حقائق النشاط الاقتصادي هي أنه لا توجد مؤسستان متطابقتان ، ناهيك عن شركتين متطابقتين. يترك هذا الظرف بصماته على عملية إنشاء وملء نظام معلومات الشركة. ينطبق هذا أيضًا تمامًا على طرق تكامل البيانات في قواعد البيانات. لهذا السبب ، تستخدم العديد من أنظمة رابطة الدول المستقلة ما يسمى ب هجيننهج يتضمن طرق تكامل متعددة في نفس الوقت ، ومن الأمثلة على ذلك التقنيات التي توفر صورة متسقة لمعلومات العميل:

تكامل بيانات العملاء في أنظمة CDI - تكامل بيانات العميل ،

· تكامل بيانات العملاء في وحدات CRM - إدارة علاقات العملاء.

على وجه الخصوص ، يمكن تحقيق نهج تنفيذ CDI بعدة طرق.

إن أبسط طريقة هي إنشاء قاعدة بيانات موحدة للعملاء تحتوي على بيانات من الأنظمة الأساسية. في الوقت نفسه ، يمكن تنظيم تأخر المعلومات باستخدام أوضاع دمج مختلفة: تشغيلية أو دفعية ، اعتمادًا على وتيرة تحديث هذه المعلومات.

الطريقة الثانية هي اتحاد البيانات ، عندما تكون افتراضية عرض عملبيانات العميل الواردة في الأنظمة الأساسية. ويمكن أن يحتوي ملف البيانات الوصفية على عناصر أساسية عامة يمكن استخدامها لربط معلومات العميل.

وبالتالي ، يمكن دمج بيانات العميل العامة (على سبيل المثال ، التفاصيل) باعتبارها البيانات الأكثر ثباتًا. ويمكن جعل البيانات الأكثر ديناميكية (مثل معلومات الطلب) فيدرالية.

علاوة على ذلك ، يمكن توسيع النهج الهجين باستخدام طريقة نشر البيانات. على سبيل المثال ، يقوم العميل الذي يستخدم خدمات متجر على الإنترنت ، أثناء الخدمة ، بتغيير بياناته. يمكن إرسال هذه التغييرات إلى الجزء المدمج من قاعدة البيانات ، ومن هناك يتم نشرها على جميع الأنظمة الأساسية التي تحتوي على بيانات حول عملاء المتجر.

مع الأخذ في الاعتبار مزايا وعيوب كل طريقة من الطرق ، فمن المستحسن التعامل بشكل خلاق مع تطبيقها والاستخدام المشترك.

على سبيل المثال ، يكون اتحاد البيانات مفيدًا عندما تفوق تكاليف دمج البيانات الفوائد التجارية التي يوفرها التوحيد. على وجه الخصوص ، فإن معالجة الطلبات عبر الإنترنت وإعداد التقارير هي بالضبط مثل هذه الحالة.

التطبيقات العملية لطريقة نشر البيانات متنوعة للغاية ، سواء من حيث الأداء أو من حيث القدرة على إعادة هيكلة البيانات وتنقيتها.

5.4. المفهوم والحلول الهيكلية لمخازن البيانات

مخزن البيانات -إنه تخزين متكامل للمعلومات يركز على الموضوعات ويجمع البيانات الخارجية والتشغيلية ، فضلاً عن البيانات من الأنظمة الأخرى ، والتي يتم على أساسها بناء عمليات صنع القرار وتحليل البيانات.

على عكس قواعد البيانات وبنوك البيانات ، فإن أساس مستودعات البيانات ليس داخليًا ، بل مصادر بيانات خارجية: أنظمة معلومات متنوعة ، وأرشيفات إلكترونية ، وكتالوجات إلكترونية عامة ، وكتب مرجعية ومجموعات.

يعتمد مفهوم مستودع البيانات على فكرتين رئيسيتين:

1. دمج البيانات التفصيلية المفصلة (التي تصف حقائق ، خصائص ، أحداث محددة ، إلخ) في مستودع واحد.

2. فصل مجموعات البيانات والتطبيقات المستخدمة في المعالجة والتحليل.

يتم تنظيم مخزن البيانات في الحالات التي يكون من الضروري فيها الحصول على:

تكامل قيم البيانات الحالية والتاريخية ،

الجمع بين البيانات من مصادر مختلفة ،

إنشاء منصة بيانات موثوقة لأغراض التحليل ،

ضمان اتساق البيانات في جميع أنحاء المنظمة ،

تسهيل تنفيذ معايير بيانات الشركة دون تغيير أنظمة التشغيل الحالية ،

· تقديم صورة تاريخية واسعة وفرص لتحليل اتجاهات التنمية.

تاريخيًا ، تم بناء مستودعات البيانات على مخطط من مستوى واحد ، وثنائي ، وثلاثة مستويات.

مخططات المستوى الواحدكانت مخصصة في الأصل لأبسط البنى ، والتي تشمل DSS وظيفية ، مع بنية تحتية للمعلومات غير متطورة بشكل كاف ، عندما يتم إجراء التحليل باستخدام بيانات من أنظمة التشغيل ، وفقًا لمبدأ: البيانات - أشكال العرض.

مزايا هذه المخططات هي:

نقل سريع للبيانات من أنظمة التشغيل إلى نظام متخصص بدون روابط وسيطة ،

· الحد الأدنى من التكاليف بسبب استخدام منصة واحدة.

سلبيات:

نطاق ضيق من المشكلات التي يتعين حلها بسبب مصدر بيانات واحد ،

· تدني جودة البيانات نتيجة عدم وجود خطوة تنظيف.

مخططات من مستويينتقديم سلسلة: بيانات - مجموعات بيانات - نماذج عرض. يتم استخدامها في الشركات التي لديها عدد كبير من الأقسام المستقلة التي تستخدم تقنيات المعلومات الخاصة بها.

مزايا:

تم تصميم حالات العرض المستخدمة للإجابة على مجموعة محددة من الأسئلة ،

· من الممكن تحسين البيانات في مجموعات البيانات لتحسين الأداء.

سلبيات:

صعوبة ضمان اتساق البيانات بسبب تكرارها المتعدد في واجهات المحلات ،

التعقيد المحتمل لمجموعات البيانات التي تملأ بعدد كبير من مصادر البيانات ،

· بسبب الافتقار إلى توحيد البيانات على مستوى الشركة ، لا توجد صورة واحدة للأعمال.

أدى تطور التطور إلى حقيقة أن إنشاء مستودع بيانات كامل لأنظمة الشركات الحديثة بدأ من قبل ثلاثة مستويات العمارة (انظر الشكل 5.4).

تشغيل أوليحتوي المستوى على مجموعة متنوعة من أنظمة التسجيل التي هي مصادر البيانات. يمكن أن تكون هذه الأنظمة أنظمة تخطيط موارد المؤسسات (تخطيط موارد المؤسسات - تخطيط موارد المؤسسات) أو أنظمة مرجعية (تشغيلية) أو مصادر أو أنظمة خارجية توفر البيانات من وكالات المعلومات ، إلخ.

تشغيل ثانيايحتوي المستوى على تخزين مركزي ، حيث يتم جمع البيانات من جميع مصادر المستوى الأول ، بالإضافة إلى مستودع بيانات التشغيل ، والذي تم تصميمه لأداء وظيفتين:

المستودع هو مصدر للمعلومات التحليلية المستخدمة لإدارة العمليات ،

· في المستودع التشغيلي ، يتم إعداد البيانات للتحميل اللاحق إلى المستودع المركزي. يعني إعداد البيانات إجراء عمليات الفحص وتحويل البيانات فيما يتعلق باللوائح المختلفة لاستلام البيانات من المستوى الأول.

ثالثالمستوى عبارة عن مجموعة من مجموعات البيانات الخاصة بالمجال.

سوق البيانات -هذه محركات صغيرة نسبيًا موجهة وظيفيًا ، يساهم محتواها في حل المهام التحليلية للأقسام الفردية للمؤسسة. في الواقع ، تعد مجموعات البيانات مجموعات فرعية من البيانات من المستودع. في الوقت نفسه ، يتمتع المستخدمون النهائيون بالقدرة على الوصول إلى البيانات التفصيلية للمستودع ، في حالة عدم وجود بيانات كافية في السوق ، وكذلك الحصول على صورة أكثر اكتمالاً عن حالة العمل.

الشكل 5.4. بنية مستودع البيانات

العمليات التكنولوجية الرئيسية لمخازن البيانات المنظمة هي:

· استرجاعالبيانات هي عملية نقل البيانات من مصادر غير متجانسة إلى مستودع تشغيلي ،

· تحويلالبيانات عبارة عن تعديل للبيانات بناءً على قواعد خاصة مع نقلها لاحقًا إلى وحدة تخزين مركزية ،

· تنظيفالبيانات هي القضاء على تكرار البيانات القادمة من مصادر مختلفة ،

· تحديثالبيانات هي انتشار تحديث البيانات على البيانات الأصلية للجداول الأساسية والبيانات المشتقة المستضافة في المستودع.

مزايا:

· تم تبسيط عملية ملء واجهات المحلات بسبب استخدام مصدر واحد للبيانات المحذوفة ،

تتم مزامنة مجموعات البيانات مع صورة أعمال الشركة ، مما يسهل توسيع المستودع المركزي وإضافة مجموعات بيانات ،

· أداء مضمون.

سلبيات:

وجود وفرة في البيانات ، مما يؤدي إلى زيادة متطلبات تكنولوجيا تخزين البيانات ،

5. 5. نظم وتقنيات إدارة قواعد البيانات للوصول إلى البيانات في رابطة الدول المستقلة

نظام إدارة قواعد البيانات(DBMS) عبارة عن مجموعة من أدوات اللغة والبرامج المصممة لإنشاء قاعدة بيانات وصيانتها ومشاركتها بواسطة مستخدم واحد أو أكثر.

حاليًا ، الأكثر انتشارًا هي نظم إدارة قواعد البيانات (DBMS) المبنية على أساس نموذج البيانات العلائقية الموصوف بواسطة جهاز رياضي صارم نظرية العلاقات.

تتمثل إحدى ميزات نظام DBMS الذي يعمل في نظام معلومات الشركة في حقيقة أنه يتعين عليهم إدارة قواعد البيانات الموجودة على الوسائط الموزعة في الفضاء.

من أجل القضاء على الازدواجية الإضافية أو نسخ البيانات في رابطة الدول المستقلة ، ينصب التركيز الرئيسي على مبدأ معالجة البيانات عن بعد. تحتوي قواعد البيانات في رابطة الدول المستقلة على البيانات المطلوبة من قبل العديد من المستخدمين. يمكن الحصول على وصول متزامن لعدة مستخدمين إلى قاعدة البيانات عند التثبيت في شبكة كمبيوتر محلية DBMS تعمل مع المستخدمين ومع قاعدة بيانات واحدة.

الحلول التكنولوجية الرئيسية للعمل متعدد المستخدمين مع قواعد البيانات هي تقنيات الملفات / الخادم والعميل / الخادم. من خلال اتخاذ الخيار الأنسب من هذه التقنيات ، فإن العميل / الخادم في رابطة الدول المستقلة عبارة عن أنظمة متخصصة منظمة لمعالجة قواعد البيانات الموزعة. في هذه الحالة ، تتم إدارة قواعد البيانات الموزعة بطريقة لا يتم فيها توزيع البيانات على المستوى المنطقي ، ولكن على المستوى المادي ، وتعتبر قاعدة البيانات نفسها "دائرة فائقة" واحدة. في قاعدة البيانات الموزعة ، يتم توزيع الوظائف الإدارية بين مسؤول قاعدة البيانات المتكاملة ومسؤولي قاعدة البيانات المحليين. يراقب مسؤول قاعدة البيانات المتكاملة التمايز في وصول المستخدمين المختلفين إلى قاعدة البيانات ويضمن سلامة البيانات وسلامتها ، فضلاً عن حماية البيانات من تصحيحها المتزامن من قبل العديد من المستخدمين. يتم التحكم في الوصول وفقًا للحقوق الممنوحة للمستخدمين الفرديين في نظام تشغيل الشبكة.

الميزة المميزة للبرامج التي تم إنشاؤها باستخدام DBMS للعمل مع قواعد بيانات الشركة الموزعة والبعيدة هي استخدام واجهة الوصول إلى البيانات المفتوحة - ODBC (اتصال قاعدة البيانات المفتوحة). يتم تعيين جميع وظائف نقل البيانات إلى واجهة ODBC ، وهي عبارة عن جسر يربط بين قاعدة البيانات المتكاملة DBMS وتطبيق العميل DBMS. في هذه الحالة ، يمكن أن يتفاعل نظام DBMS الخاص بالعميل ليس فقط مع قواعد البيانات المحلية الخاصة به ، ولكن أيضًا مع البيانات الموجودة في قاعدة البيانات المتكاملة. العميل لديه القدرة على إرسال الطلبات إلى قاعدة البيانات المتكاملة DBMS ، وتلقي البيانات عنها وإرسال البيانات المحدثة الخاصة بهم.

نماذج بيانات الصناعة

الغرض الرئيسي من النماذج هو تسهيل التوجيه في مساحة البيانات والمساعدة في إبراز التفاصيل المهمة لتطوير الأعمال. في بيئة اليوم ، من أجل عمل تجاري ناجح ، من الضروري أن يكون لديك فهم واضح للروابط بين المكونات المختلفة وأن يكون لديك فكرة جيدة عن الصورة العامة للمؤسسة. يتيح تحديد جميع التفاصيل والعلاقات باستخدام النماذج الاستخدام الأكثر كفاءة للوقت والأدوات لتنظيم عمل الشركة.

نماذج البيانات هي نماذج مجردة تصف كيفية تقديم البيانات والوصول إليها. تحدد نماذج البيانات عناصر البيانات والعلاقات بينها في منطقة معينة. نموذج البيانات هو أداة تنقل لكل من محترفي الأعمال وتكنولوجيا المعلومات يستخدم مجموعة محددة من الرموز والكلمات لشرح فئة معينة من معلومات العالم الحقيقي بدقة. هذا يسمح بتواصل أفضل داخل المنظمة وبالتالي يخلق بيئة تطبيق أكثر مرونة واستقرارًا.

يحدد نموذج البيانات بشكل فريد معنى البيانات ، والتي تكون في هذه الحالة بيانات منظمة (على عكس البيانات غير المنظمة مثل ، على سبيل المثال ، صورة أو ملف ثنائي أو نص ، حيث يمكن أن يكون المعنى غامضًا).

كقاعدة عامة ، يتم تمييز النماذج ذات المستوى الأعلى (والأكثر عمومية في المحتوى) والمستوى الأدنى (على التوالي ، الأكثر تفصيلاً). المستوى العلوي من النمذجة هو ما يسمى ب نماذج البيانات المفاهيمية(نماذج البيانات المفاهيمية) ، والتي تعطي الصورة الأكثر عمومية لعمل مؤسسة أو مؤسسة. يتضمن النموذج المفاهيمي المفاهيم الرئيسية أو المجالات الموضوعية التي تعتبر حاسمة لعمل المنظمة ؛ عادة لا يتجاوز عددهم 12-15. يصف هذا النموذج فئات الكيانات المهمة للمؤسسة (كائنات الأعمال) ، وخصائصها (سماتها) ، والارتباطات بين أزواج هذه الفئات (أي العلاقات). نظرًا لأن المصطلحات في نمذجة الأعمال لم تستقر بعد بشكل نهائي ، في مصادر مختلفة باللغة الإنجليزية ، يمكن أيضًا تسمية نماذج البيانات المفاهيمية بنموذج مجال الموضوع (والذي يمكن ترجمته كنماذج مجال) أو نموذج بيانات المؤسسة الخاضعة (بيانات الشركة الخاضعة) عارضات ازياء).

المستوى الهرمي التالي هو نماذج البيانات المنطقية(نماذج البيانات المنطقية). يمكن أيضًا أن يطلق عليها نماذج بيانات المؤسسة أو نماذج الأعمال. تحتوي هذه النماذج على هياكل البيانات وخصائصها وقواعد العمل الخاصة بها ، وتمثل المعلومات التي تستخدمها المؤسسة من منظور الأعمال. في مثل هذا النموذج ، يتم تنظيم البيانات في شكل كيانات وعلاقات فيما بينها. يقدم النموذج المنطقي البيانات بطريقة تسهل على مستخدمي الأعمال فهمها. في النموذج المنطقي ، يمكن تمييز قاموس البيانات - قائمة بجميع الكيانات مع تعريفاتها الدقيقة ، والتي تسمح لفئات مختلفة من المستخدمين بالحصول على فهم مشترك لجميع تدفقات المدخلات والمخرجات الخاصة بالنموذج. المستوى التالي ، الأدنى من النمذجة هو التنفيذ المادي للنموذج المنطقي باستخدام برامج محددة ومنصات تقنية.

يحتوي النموذج المنطقي على قرار عمل مؤسسي مفصل ، والذي عادة ما يأخذ شكل نموذج عادي. التطبيع هو عملية تضمن أن كل عنصر بيانات في نموذج له قيمة واحدة فقط ويعتمد بشكل كامل وفريد ​​على المفتاح الأساسي. يتم تنظيم عناصر البيانات في مجموعات وفقًا لتعريفها الفريد. يجب دمج قواعد العمل التي تحكم عناصر البيانات بشكل كامل في النموذج الموحد مع التحقق المسبق من الصحة والتحقق من الصحة. على سبيل المثال ، من المحتمل أن يتم تقسيم عنصر بيانات مثل اسم العميل إلى الاسم الأول واسم العائلة وتجميعه مع عناصر البيانات الأخرى ذات الصلة في كيان عميل بمعرف العميل الأساسي الأساسي.

نموذج البيانات المنطقية مستقل عن تقنيات التطبيق مثل قواعد البيانات أو تقنيات الشبكات أو أدوات إعداد التقارير ووسائل تنفيذها المادي. يمكن أن يكون هناك نموذج بيانات مؤسسي واحد فقط في المؤسسة. تتضمن النماذج المنطقية عادةً آلاف الكيانات والعلاقات والسمات. على سبيل المثال ، يمكن أن يحتوي نموذج البيانات لمؤسسة مالية أو شركة اتصالات على حوالي 3000 مفهوم صناعي.

من المهم التمييز بين نموذج البيانات المنطقي والدلالي. يمثل نموذج البيانات المنطقية حل أعمال المؤسسة ، ويمثل نموذج البيانات الدلالية حلاً عمليًا تطبيقيًا. يمكن تنفيذ نفس نموذج البيانات المنطقية للشركة باستخدام نماذج دلالية مختلفة ، أي يمكن النظر إلى النماذج الدلالية على أنها المستوى التالي من النمذجة التي تقترب من النماذج المادية. علاوة على ذلك ، سيمثل كل من هذه النماذج "شريحة" منفصلة من نموذج بيانات الشركة وفقًا لمتطلبات التطبيقات المختلفة. على سبيل المثال ، في نموذج البيانات المنطقية للشركة ، سيتم تطبيع كيان العميل تمامًا ، وفي النموذج الدلالي لسوق البيانات ، يمكن تمثيله كهيكل متعدد الأبعاد.

يمكن أن يكون لدى الشركة طريقتان لإنشاء نموذج بيانات منطقي للشركة: بنائه بشكل مستقل أو استخدام نموذج جاهز. نموذج الصناعة(نموذج بيانات منطقي للصناعة). في هذه الحالة ، فإن الاختلافات في المصطلحات تعكس فقط مناهج مختلفة لبناء نفس النموذج المنطقي. في حالة قيام شركة ما بشكل مستقل بتطوير وتنفيذ نموذج البيانات المنطقي الخاص بها ، فإن هذا النموذج ، كقاعدة عامة ، يسمى ببساطة النموذج المنطقي للشركة. إذا قررت إحدى المؤسسات استخدام منتج جاهز من مورد محترف ، فيمكننا التحدث عن نموذج بيانات منطقي للصناعة. هذا الأخير عبارة عن نموذج بيانات منطقي جاهز يعكس أداء صناعة معينة بدرجة عالية من الدقة. نموذج منطق الصناعة هو عرض متكامل خاص بالمجال لجميع المعلومات التي يجب أن تكون موجودة في مستودع بيانات المؤسسة للإجابة على أسئلة العمل الإستراتيجية والتكتيكية. مثل أي نموذج بيانات منطقي ، فإن نموذج الصناعة مستقل عن قرارات التطبيق. كما أنه لا يشمل البيانات المشتقة أو غيرها من العمليات الحسابية لاستعادة البيانات بشكل أسرع. كقاعدة عامة ، تتجسد معظم الهياكل المنطقية لهذا النموذج جيدًا في تنفيذه المادي الفعال. تم تطوير هذه النماذج من قبل العديد من الموردين لمجموعة واسعة من مجالات النشاط: التمويل والتصنيع والسياحة والرعاية الصحية والتأمين ، إلخ.

يحتوي نموذج البيانات المنطقية للصناعة على معلومات شائعة في الصناعة ، وبالتالي لا يمكن أن يكون حلاً شاملاً لشركة. يتعين على معظم الشركات تنمية النموذج بمعدل 25٪ عن طريق إضافة عناصر البيانات وتوسيع التعريفات. تحتوي النماذج الجاهزة على عناصر بيانات أساسية فقط ، ويجب إضافة باقي العناصر إلى كائنات الأعمال المقابلة أثناء تثبيت النموذج في الشركة.

تحتوي نماذج البيانات المنطقية للصناعة على قدر كبير من التجريد. تعني التجريدات اتحاد المفاهيم المتشابهة تحت أسماء شائعة مثل حدث أو مشارك. هذا يضيف المرونة والتوحيد لنماذج الصناعة. وبالتالي ، فإن مفهوم الحدث ينطبق على جميع الصناعات.

يحدد المتخصص في استخبارات الأعمال ستيف هوبرمان خمسة عوامل يجب مراعاتها عند اتخاذ قرار بالحصول على نموذج بيانات الصناعة. الأول هو الوقت والمال اللازمين لبناء النموذج. إذا احتاجت المنظمة إلى تحقيق النتائج بسرعة ، فسيكون نموذج الصناعة مفيدًا. قد لا يوفر استخدام نموذج الصناعة صورة للمؤسسة بأكملها على الفور ، ولكن يمكن أن يوفر قدرًا كبيرًا من الوقت. بدلاً من النمذجة نفسها ، سيتم إنفاق الوقت في ربط الهياكل الحالية بنموذج الصناعة ومناقشة أفضل السبل لتخصيصها لاحتياجات المنظمة (على سبيل المثال ، التعريفات التي يجب تغييرها وعناصر البيانات التي يجب إضافتها).

العامل الثاني هو الوقت والمال اللازمين للحفاظ على النموذج في حالة عمل جيدة. إذا لم يكن نموذج بيانات المؤسسة جزءًا من منهجية تسمح لك بمراقبة الامتثال لدقته وامتثاله للمعايير الحديثة ، فسيصبح هذا النموذج قديمًا بسرعة كبيرة. يمكن لنموذج بيانات الصناعة منع حدوث هذه المخاطر حيث يتم تحديثها مع الموارد الخارجية. بالطبع ، يجب أن تنعكس التغييرات التي تحدث داخل المنظمة في النموذج من قبل الشركة نفسها ، ولكن سيتم إعادة إنتاج تغييرات الصناعة في النموذج من قبل مورديها.

العامل الثالث هو الخبرة في تقييم المخاطر والنمذجة. يتطلب إنشاء نموذج بيانات الشركة موارد مؤهلة من كل من رجال الأعمال وموظفي تكنولوجيا المعلومات. كقاعدة عامة ، يدرك المديرون جيدًا إما عمل المنظمة ككل ، أو أنشطة قسم معين. قلة منهم لديهم معرفة واسعة (على مستوى الشركة) وعميقة (داخل الأقسام) بأعمالهم. يعرف معظم المديرين عادةً مجالًا واحدًا جيدًا. لذلك ، من أجل الحصول على الصورة العامة للشركة ، هناك حاجة إلى موارد تجارية كبيرة. يؤدي هذا أيضًا إلى زيادة الطلب على موظفي تكنولوجيا المعلومات. كلما زادت موارد الأعمال المطلوبة لإنشاء نموذج واختباره ، يجب أن يكون المحللون أكثر خبرة. يجب ألا يعرفوا فقط كيفية الحصول على المعلومات من موظفي الأعمال ، ولكن يجب أن يكونوا قادرين أيضًا على إيجاد وجهة نظر مشتركة في المناطق الخلافية وأن يكونوا قادرين على تقديم كل هذه المعلومات بطريقة متكاملة. يجب أن يتمتع الشخص الذي يقوم بإنشاء النموذج (في كثير من الحالات نفس المحلل) بمهارات عرض نماذج جيدة. يتطلب بناء نماذج منطق المؤسسة نمذجة "للمستقبل" والقدرة على تحويل الأعمال المعقدة حرفياً "إلى مربعات وخطوط".

من ناحية أخرى ، يسمح نموذج الصناعة بالخبرة الخارجية. يتم بناء النماذج المنطقية الخاصة بالصناعة باستخدام منهجيات النمذجة المثبتة وفرق من المهنيين ذوي الخبرة لتجنب المشاكل الشائعة والمكلفة التي يمكن أن تنشأ عند تطوير نماذج بيانات المؤسسة داخل المؤسسة.

العامل الرابع هو البنية التحتية للتطبيق الحالي وعلاقات الموردين. إذا كانت المنظمة تستخدم بالفعل العديد من الأدوات من نفس المورد وأقامت علاقات معه ، فمن المنطقي أن تطلب منه نموذج الصناعة. سيكون هذا النموذج قادرًا على العمل بحرية مع المنتجات الأخرى من نفس المورد.

العامل الخامس هو تبادل المعلومات داخل الصناعة. إذا احتاجت الشركة إلى التواصل مع المنظمات الأخرى العاملة في نفس المجال ، فيمكن أن يكون نموذج الصناعة مفيدًا جدًا في هذه الحالة. تستخدم المنظمات داخل نفس الصناعة مكونات ومصطلحات هيكلية مماثلة. في الوقت الحاضر ، في معظم الصناعات ، تضطر الشركات إلى تبادل البيانات من أجل إجراء الأعمال بنجاح.

الأكثر فعالية هي نماذج الصناعة التي يقدمها الموردون المحترفون. يتم تحقيق كفاءة عالية في استخدامها بسبب المستوى الكبير من التفاصيل والدقة لهذه النماذج. عادة ما تحتوي على العديد من سمات البيانات. بالإضافة إلى ذلك ، لا يتمتع مبتكرو هذه النماذج بخبرة واسعة في النمذجة فحسب ، بل يتمتعون أيضًا بخبرة جيدة في بناء النماذج الخاصة بصناعة معينة.

تزود نماذج بيانات الصناعة الشركات برؤية واحدة متكاملة لمعلومات أعمالها. تجد العديد من الشركات صعوبة في دمج بياناتها ، على الرغم من أن هذا شرط أساسي لمعظم المشاريع على مستوى المؤسسة. وفقًا لدراسة أجراها معهد تخزين البيانات (TDWI) ، وجدت أكثر من 69٪ من المؤسسات التي شملها الاستطلاع أن التكامل يمثل عائقًا كبيرًا أمام تبني التطبيقات الجديدة. على العكس من ذلك ، فإن تنفيذ تكامل البيانات يولد دخلًا ملموسًا للشركة.

يوفر نموذج بيانات الصناعة ، بالإضافة إلى الارتباط بالأنظمة الحالية ، فوائد عظيمة للمشاريع على مستوى المؤسسة مثل تخطيط موارد المؤسسات (ERP) ، وإدارة البيانات الرئيسية ، وذكاء الأعمال ، وتحسين جودة البيانات ، وتطوير الموظفين.

وبالتالي ، تعد نماذج البيانات المنطقية للصناعة أداة فعالة لدمج البيانات والحصول على نظرة شاملة للأعمال. يبدو أن استخدام النماذج المنطقية خطوة ضرورية نحو إنشاء مستودعات بيانات الشركة.

المنشورات

  1. ستيف هوبرمان. الاستفادة من نموذج البيانات المنطقية للصناعة كنموذج بيانات مؤسستك.
  2. كلوديا إمهوف. مشاريع تخزين البيانات وذكاء الأعمال سريعة التتبع من خلال نمذجة البيانات الذكية

قاعدة بيانات الشركة هي الرابط المركزي لنظام معلومات الشركة وتسمح لك بإنشاء مساحة معلومات واحدة للشركة. قواعد بيانات الشركات


شارك عملك على وسائل التواصل الاجتماعي

إذا لم يناسبك هذا العمل في أسفل الصفحة ، فهناك قائمة بالأعمال المماثلة. يمكنك أيضًا استخدام زر البحث

الموضوع الخامس. قواعد بيانات الشركات

الخامس .1. تنظيم البيانات في أنظمة الشركات. قواعد بيانات الشركات.

الخامس .2. نظم إدارة قواعد البيانات والحلول الهيكلية في أنظمة الشركات.

الخامس .3. تقنيات الإنترنت / الإنترانت وحلول الشركات للوصول إلى قاعدة البيانات.

الخامس .1. تنظيم البيانات في أنظمة الشركات. قواعد بيانات الشركات

قاعدة الشركات البيانات هي الرابط المركزي لنظام معلومات الشركة وتسمح لك بإنشاء مساحة معلومات واحدة للشركة. قواعد بيانات الشركات (الشكل 1.1).

هناك تعريفات مختلفة لقواعد البيانات.

تحت قاعدة البيانات (DB) فهم مجموعة من المعلومات المتصلة منطقيًا بطريقة تؤلف مجموعة واحدة من البيانات المخزنة في أجهزة ذاكرة الكمبيوتر. تعمل هذه المجموعة بمثابة البيانات الأولية للمهام التي تم حلها في عملية تشغيل أنظمة التحكم الآلي وأنظمة معالجة البيانات والمعلومات وأنظمة الحوسبة.

يمكن تلخيص مصطلح قاعدة البيانات كمجموعة من البيانات ذات الصلة منطقيًا والمخصصة للمشاركة.

تحت قاعدة البيانات تُفهم على أنها مجموعة من البيانات المخزنة جنبًا إلى جنب مع الحد الأدنى من التكرار الذي يسمح باستخدامها بالطريقة المثلى لتطبيق واحد أو أكثر.

الغرض من إنشاء قواعد البيانات كأشكال لتخزين البياناتبناء نظام بيانات لا يعتمد على الخوارزميات المعتمدة (البرمجيات) ، والوسائل التقنية المستخدمة ، والموقع المادي للبيانات في الكمبيوتر. تفترض قاعدة البيانات استخدامًا متعدد الأغراض (عدة مستخدمين والعديد من أشكال المستندات وطلبات مستخدم واحد).

المتطلبات الأساسية لقواعد البيانات:

  • اكتمال عرض البيانات. ينبغي أن تمثل البيانات الموجودة في قاعدة البيانات بشكل كافٍ جميع المعلومات المتعلقة بالشيء وأن تكون كافية لنظام الوثائق الرسمية.
  • تكامل قاعدة البيانات. يجب حفظ البيانات عند معالجة المواد المستنفدة للأوزون الخاصة بهم وفي أي مواقف تظهر أثناء العمل.
  • مرونة هيكل البيانات. يجب أن تسمح قاعدة البيانات بتغيير هياكل البيانات دون انتهاك سلامتها واكتمالها عندما تتغير الظروف الخارجية.
  • جدوى. هذا يعني أنه يجب أن يكون هناك تمثيل موضوعي للكائنات المختلفة وخصائصها وعلاقاتها.
  • التوفر. من الضروري توفير تحديد الوصول إلى البيانات.
  • وفرة. يجب أن تحتوي قاعدة البيانات على حد أدنى من التكرار في تمثيل البيانات حول أي كائن.

المعرفة تعني مجموعة من الحقائق والأنماط والقواعد الإرشادية التي يمكن استخدامها لحل المشكلة.

قاعدة المعرفة (KB)  مجموعة من قواعد البيانات والقواعد المستخدمة تم الحصول عليها من صانعي القرار. قاعدة المعرفة هي عنصر من عناصر الأنظمة الخبيرة.

يميز طرق مختلفة لعرض البيانات.

بيانات فيزيائية - هي البيانات المخزنة في ذاكرة الكمبيوتر.

تمثيل البيانات المنطقية يتوافق مع عرض مخصص للبيانات المادية. الفرق بين التمثيلات المنطقية المادية والمطابقة للبيانات هو أن الأخير يعكس بعض العلاقات المهمة بين البيانات المادية.

تحت قاعدة بيانات الشركة فهم قاعدة البيانات التي توحد بشكل أو بآخر جميع البيانات والمعرفة الضرورية حول المؤسسة التي يتم تشغيلها آليًا. في أنظمة معلومات الشركات ، مثل هذا المفهوم مثلقواعد بيانات متكاملة, حيث يتم تنفيذ مبدأ المدخل الفردي والاستخدام المتكرر للمعلومات.

أرز. 1.1 هيكل تفاعل الإدارات مع مصادر المعلومات للمؤسسة.

قواعد بيانات الشركات هي مركزة (مركزية) وتوزيعها.

قاعدة بيانات مجمعة (مركزية) هي قاعدة بيانات ، يتم تخزين بياناتها فعليًا في أجهزة التخزين بجهاز كمبيوتر واحد. في التين. 1.2 رسم تخطيطي لتطبيق الخادم للوصول إلى قواعد البيانات في مختلف المنصات.

الشكل 1.2. مخطط غير متجانس قاعدة بيانات مركزية

جعلت مركزية معالجة المعلومات من الممكن القضاء على عيوب أنظمة الملفات التقليدية مثل عدم الاتساق وعدم الاتساق والتكرار في البيانات. ومع ذلك ، مع نمو قواعد البيانات ، وخاصة عند استخدامها في المنظمات المتفرقة جغرافيا ، تنشأ المشاكل. على سبيل المثال ، بالنسبة لقواعد البيانات المركزة الموجودة في عقدة شبكة الاتصالات السلكية واللاسلكية ، والتي بمساعدة إدارات مختلفة في المنظمة تحصل على الوصول إلى البيانات ، مع نمو حجم المعلومات وعدد المعاملات ، تنشأ الصعوبات التالية:

  • تدفق كبير لتبادل البيانات ؛
  • حركة مرور عالية على الشبكة ؛
  • موثوقية منخفضة
  • ضعف الأداء العام.

في حين أنه من الأسهل ضمان أمان المعلومات وتكاملها واتساقها أثناء التحديثات في قاعدة بيانات مركزة ، فإن هذه المشكلات تطرح تحديات معينة. تم اقتراح لامركزية البيانات كحل ممكن لهذه المشاكل. تحقق اللامركزية:

  • درجة عالية من التزامن في المعالجة بسبب موازنة التحميل ؛
  • تحسين استخدام البيانات في الميدان عند إجراء استعلامات عن بُعد (عن بُعد) ؛
  • انخفاض التكاليف
  • سهولة إدارة قواعد البيانات المحلية.

تكاليف إنشاء شبكة ، في العقد التي توجد بها محطات العمل (أجهزة الكمبيوتر الصغيرة) ، أقل بكثير من تكاليف إنشاء نظام مماثل باستخدام كمبيوتر كبير. يوضح الشكل 1.3 الرسم التخطيطي المنطقي لقاعدة البيانات الموزعة.

الشكل 1.3. قاعدة بيانات الشركة الموزعة.

دعونا نعطي التعريف التالي لقاعدة البيانات الموزعة.

قاعدة البيانات الموزعة - إنها مجموعة من المعلومات والملفات (العلاقات) المخزنة في عقد مختلفة لشبكة المعلومات ومتصلة منطقيًا بطريقة تشكل مجموعة واحدة من البيانات (يمكن أن يكون الاتصال وظيفيًا أو من خلال نسخ من نفس الملف). وبالتالي ، فهي مجموعة من قواعد البيانات المترابطة منطقيًا ، ولكنها موجودة فعليًا على العديد من الأجهزة التي تعد جزءًا من شبكة الكمبيوتر نفسها.

أهم متطلبات الأداء لقاعدة البيانات الموزعة هي:

  • قابلية التوسع؛
  • التوافق
  • دعم نماذج البيانات المختلفة ؛
  • قابلية التنقل؛
  • شفافية الموقع
  • استقلالية عقد قاعدة البيانات الموزعة (استقلالية الموقع) ؛
  • معالجة الطلبات الموزعة ؛
  • تنفيذ المعاملات الموزعة.
  • دعم نظام أمان متجانس.

تتيح شفافية الموقع للمستخدمين التفاعل مع قواعد البيانات دون معرفة أي شيء عن مواقعهم. يعني استقلالية عقد قاعدة البيانات الموزعة أنه يمكن الحفاظ على كل قاعدة بيانات بشكل مستقل عن الآخرين. الاستعلام الموزع هو استعلام (عبارة SQL) أثناء تنفيذ أي كائنات (جداول أو طرق عرض) لقواعد بيانات مختلفة يتم الوصول إليها. عند تنفيذ المعاملات الموزعة ، يتم تنفيذ التحكم في التزامن لجميع قواعد البيانات المعنية. يستخدم Oracle7 تقنية نقل المعلومات على مرحلتين لإجراء المعاملات الموزعة.

لا يجب أن تكون قواعد البيانات التي تشكل قاعدة بيانات موزعة متجانسة (أي يتم صيانتها بواسطة DBMS واحد) أو معالجتها في بيئة نظام التشغيل نفسه و / أو على أجهزة كمبيوتر من نفس النوع. على سبيل المثال ، يمكن أن تكون قاعدة بيانات واحدة قاعدة بيانات Oracle على جهاز SUN يعمل بنظام التشغيل SUN OS (UNIX) ، ويمكن استضافة قاعدة بيانات ثانية بواسطة قاعدة بيانات DB2 على حاسوب مركزي IBM 3090 مع نظام تشغيل MVS ، ويمكن صيانة قاعدة بيانات ثالثة بواسطة SQL / DS أيضًا على حاسب IBM المركزي ، ولكن مع نظام التشغيل VM. مطلوب شرط واحد فقط - يجب أن تكون جميع الأجهزة التي تحتوي على قواعد بيانات متاحة عبر الشبكة التي تشكل جزءًا منها.

المهمة الرئيسية لقاعدة البيانات الموزعة - توزيع البيانات عبر الشبكة وإتاحة الوصول إليها. هناك الطرق التالية لحل هذه المشكلة:

  • تقوم كل عقدة بتخزين واستخدام مجموعة البيانات الخاصة بها والمتوفرة للاستعلامات عن بُعد. هذا التوزيع مقسم.
  • قد يتم تكرار بعض البيانات المستخدمة بشكل متكرر في المواقع البعيدة. يسمى هذا التوزيع مكرر جزئيًا.
  • يتم تكرار جميع البيانات في كل عقدة. يسمى هذا التوزيع مكرر بالكامل.
  • يمكن تقسيم بعض الملفات أفقيًا (يتم تحديد مجموعة فرعية من السجلات) أو رأسياً (يتم تحديد مجموعة فرعية من حقول السمات) ، بينما يتم تخزين المجموعات الفرعية المحددة في عقد مختلفة مع البيانات غير المنقسمة. يسمى هذا التوزيع منقسم (مجزأ).

عند إنشاء قاعدة بيانات موزعة ، على المستوى المفاهيمي ، عليك حل المهام التالية:

  • من الضروري أن يكون لديك مخطط مفاهيمي واحد للشبكة بأكملها. سيوفر هذا شفافية منطقية للبيانات للمستخدم ، ونتيجة لذلك سيكون قادرًا على تقديم طلب إلى قاعدة البيانات بأكملها ، كونه خلف محطة طرفية منفصلة (يبدو أنه يعمل مع قاعدة بيانات مركزية).
  • هناك حاجة إلى مخطط لتحديد موقع البيانات على الشبكة. سيوفر هذا شفافية وضع البيانات ، وبفضل ذلك لا يتعين على المستخدم تحديد مكان إرسال الطلب للحصول على البيانات المطلوبة.
  • من الضروري حل مشكلة عدم تجانس قواعد البيانات الموزعة. يمكن أن تكون قواعد البيانات الموزعة متجانسة أو غير متجانسة من حيث الأجهزة والبرامج. من السهل نسبيًا حل مشكلة عدم التجانس إذا كانت قاعدة البيانات الموزعة غير متجانسة من حيث الأجهزة ، ولكنها متجانسة من حيث البرنامج (نفس نظام إدارة قواعد البيانات في العقد). إذا تم استخدام أنظمة DBMS مختلفة في عقد النظام الموزع ، فإن وسائل تحويل هياكل البيانات واللغات مطلوبة. يجب أن يوفر هذا شفافية التحويل عبر عقد قاعدة البيانات الموزعة.
  • من الضروري حل مشكلة إدارة القاموس. لتوفير جميع أنواع الشفافية في قاعدة بيانات موزعة ، فأنت بحاجة إلى برامج تدير العديد من القواميس والكتب المرجعية.
  • تحتاج إلى تحديد طرق لتنفيذ الاستعلامات في قاعدة بيانات موزعة. تختلف طرق تنفيذ الاستعلامات في قاعدة بيانات موزعة عن تلك الموجودة في قواعد البيانات المركزية ، حيث يجب تنفيذ الأجزاء الفردية من الاستعلامات في موقع البيانات ذات الصلة ويجب تمرير النتائج الجزئية إلى العقد الأخرى ؛ في الوقت نفسه ، يجب ضمان تنسيق جميع العمليات.
  • من الضروري حل مشكلة تنفيذ الاستعلام المتوازي. تتطلب قاعدة البيانات الموزعة آلية تحكم متزامنة معقدة ، والتي ، على وجه الخصوص ، يجب أن تضمن التزامن عند تحديث المعلومات ، مما يضمن اتساق البيانات.
  • مطلوب منهجية مطورة لتوزيع ووضع البيانات ، بما في ذلك التقسيم ، هو أحد المتطلبات الرئيسية لقاعدة البيانات الموزعة.

أحد المجالات الجديدة التي يتم تطويرها بنشاط في هندسة أنظمة الحوسبة ، والتي تعد أداة قوية لمعالجة المعلومات غير الرقمية ، هي آلات قواعد البيانات... تُستخدم آلات قواعد البيانات لحل المهام غير الرقمية مثل تخزين المستندات والحقائق والبحث فيها وتحويلها والعمل مع الكائنات. بعد تعريف البيانات كمعلومات رقمية ورسومية حول كائنات العالم المحيط ، يتم تضمين محتوى مختلف في مفهوم البيانات في المعالجة العددية وغير العددية. تستخدم المعالجة العددية كائنات مثل المتغيرات والمتجهات والمصفوفات والمصفوفات متعددة الأبعاد والثوابت وما إلى ذلك ، بينما تستخدم المعالجة غير الرقمية كائنات مثل الملفات والسجلات والحقول والتسلسلات الهرمية والشبكات والعلاقات وما إلى ذلك. مباشرة في المعلومات حول الأشياء (على سبيل المثال ، موظف معين أو مجموعة من الموظفين) ، وليس في ملف الموظفين على هذا النحو. لم يتم فهرسة ملف الموظفين هنا لاختيار شخص معين ؛ هنا محتوى الإدخال المطلوب هو أكثر إثارة للاهتمام. عادة ما تخضع كميات كبيرة من المعلومات للمعالجة غير العددية. في العديد من التطبيقات ، يمكنك القيام ، على سبيل المثال ، بالعمليات التالية على هذه البيانات:

  • زيادة رواتب جميع موظفي الشركة ؛
  • حساب الفائدة المصرفية على حسابات جميع العملاء ؛
  • إجراء تغييرات على قائمة جميع السلع الموجودة في المخازن ؛
  • العثور على الملخص المطلوب من جميع النصوص المخزنة في المكتبة أو في نظام استرجاع المعلومات الببليوغرافية ؛
  • العثور على وصف للعقد المطلوب في ملف يحتوي على وثائق قانونية ؛
  • ابحث في جميع الملفات التي تحتوي على أوصاف لبراءات الاختراع وابحث عن براءة اختراع (إن وجدت) مماثلة للبراءة المقترحة مرة أخرى.

لتنفيذ محرك قاعدة البيانات المتوازي والرابطي العمارة كبديل للمعالج أحاديفون نيومانهيكل ، مما يسمح بالعمل مع كميات كبيرة من المعلومات في الوقت الحقيقي.

تكتسب آلات قواعد البيانات أهمية فيما يتعلق بالبحث وتطبيق مفاهيم الذكاء الاصطناعي مثل تمثيل المعرفة ، والأنظمة الخبيرة ، والاستدلال ، والتعرف على الأنماط ، وما إلى ذلك.

مخازن المعلومات. اليوم ، يعترف الكثيرون أنه في الوقت الحالي ، تقوم معظم الشركات بتشغيل العديد من قواعد البيانات ، ولعمل ناجح مع المعلومات ، لا يلزم فقط أنواع مختلفة من قواعد البيانات ، ولكن هناك أجيال مختلفة من نظم إدارة قواعد البيانات. وفقًا للإحصاءات ، تستخدم كل منظمة في المتوسط ​​2.5 من نظم إدارة قواعد البيانات المختلفة. أصبح من الواضح الحاجة إلى "عزل" عمل الشركات ، أو بالأحرى الأشخاص المشاركين في هذا العمل ، من الميزات التكنولوجية لقواعد البيانات ، لتزويد المستخدمين برؤية واحدة لمعلومات الشركة ، بغض النظر عن مكان تخزينها فعليًا. حفز هذا ظهور تكنولوجيا تخزين المعلومات (تخزين البيانات ، DW).

الهدف الرئيسي لـ DW هو إنشاء تمثيل منطقي واحد للبيانات الواردة في أنواع مختلفة من قواعد البيانات ، أو بعبارة أخرى ، نموذج بيانات شركة واحد.

أصبحت الجولة الجديدة من تطوير DW ممكنة بسبب تحسين تقنيات المعلومات بشكل عام ، على وجه الخصوص ، ظهور أنواع جديدة من قواعد البيانات القائمة على معالجة الاستعلام المتوازي ، والتي اعتمدت بدورها على التقدم في مجال أجهزة الكمبيوتر الموازية. خلقوا بناة الاستعلامبواجهة رسومية سهلة الاستخدام ، مما سهّل إنشاء استعلامات معقدة لقاعدة البيانات. برامج مختلفةالطبقة الوسطى (برمجيات وسطية)قدمت اتصالابين قواعد البيانات غير المتجانسة، وأخيرا انخفض بشكل حادأجهزة التخزين.

قد يكون بنك البيانات موجودًا في هيكل الشركة.

قاعدة البيانات - مكون وظيفي وتنظيمي في أنظمة التحكم الآلي وأنظمة المعلومات والحوسبة ، مما يوفر دعمًا للمعلومات المركزية لفريق من المستخدمين أو مجموعة من المهام التي تم حلها في النظام.

قاعدة البيانات يعتبر نظامًا للمعلومات والمرجعية ، والغرض الرئيسي منه هو:

  • في التراكم والصيانة بترتيب عمل لمجموعة من المعلومات التي تشكل قاعدة المعلومات للنظام الآلي بأكمله أو مجموعة معينة من المهام التي تم حلها فيه ؛
  • في إصدار البيانات التي تتطلبها المهمة أو المستخدم ؛
  • في توفير الوصول الجماعي إلى المعلومات المخزنة ؛
  • في ضمان الإدارة اللازمة لاستخدام المعلومات الواردة في قاعدة المعلومات.

وبالتالي ، فإن بنك البيانات الحديث هو مجمع معقد للبرامج والأجهزة ، والذي يتضمن الأدوات التقنية والنظم والشبكات وقواعد البيانات ونظام إدارة قواعد البيانات وأنظمة استرجاع المعلومات لأغراض مختلفة.

الخامس .2. نظم إدارة قواعد البيانات والحلول الهيكلية في أنظمة الشركات

نظم إدارة قواعد البيانات والمعرفة

من المكونات المهمة لأنظمة المعلومات الحديثة أنظمة إدارة قواعد البيانات (DBMS).

نظم إدارة قواعد البيانات - مجموعة من البرامج والأدوات اللغوية المعدة لإنشاء قواعد البيانات وصيانتها واستخدامها.

يوفر نظام إدارة قواعد البيانات وصول أنظمة معالجة البيانات إلى قواعد البيانات. كما لوحظ بالفعل ، تكتسب نظم إدارة قواعد البيانات (DBMS) دورًا مهمًا في إنشاء أنظمة معلومات الشركة ، كما تلعب دورًا مهمًا بشكل خاص ، في إنشاء أنظمة المعلومات باستخدام موارد المعلومات الموزعة على أساس تقنيات الكمبيوتر الحديثة للشبكة.

الميزة الرئيسية لنظام DBMS الحديث هي أن تقنيات دعم DBMS الحديثة مثل:

  • تقنية العميل / الخادم.
  • دعم لغات قاعدة البيانات. هو - هيلغة تعريف المخطط DB (SDL - لغة تعريف المخطط) ،لغة معالجة البيانات (DML) ، لغات متكاملة SQL (لغة قائمة الانتظار الهيكلية) و QDB (الاستعلام - حسب - مثال) و QMF (تسهيل إدارة الاستعلام ) عبارة عن مواصفات استعلام طرفية متقدمة وأداة إعداد تقارير لـ DB 2 ، إلخ ؛
  • إدارة البيانات المباشرة في الذاكرة الخارجية.
  • إدارة المخازن المؤقتة لذاكرة الوصول العشوائي.
  • ادارة العمليات التجارية. OLTP - التكنولوجيا (معالجة المعاملات عبر الإنترنت) ، OLAP -تقنية (معالجة التحليل عبر الإنترنت)لـ DW.
  • ضمان حماية البيانات وسلامتها. يُسمح باستخدام النظام فقط للمستخدمين الذين لديهم الحق في الوصول إلى البيانات. عندما يقوم المستخدمون بعمليات على البيانات ، يتم الحفاظ على اتساق البيانات المخزنة (تكاملها). هذا مهم في أنظمة معلومات الشركات متعددة المستخدمين.
  • يوميات.

يجب أن يضمن DBMS الحديث الامتثال لمتطلبات قاعدة البيانات المذكورة أعلاه. بالإضافة إلى ذلك ، يجب أن تمتثل للمبادئ التالية:

  • استقلالية البيانات.
  • براعه. يجب أن يتمتع نظام DBMS بدعم نموذج بيانات مفاهيمي قوي لعرض طرق العرض المنطقية المخصصة.
  • التوافق. يجب أن يظل نظام DBMS قيد التشغيل مع تطوير البرامج والأجهزة.
  • تكرار البيانات. على عكس أنظمة الملفات ، يجب أن تكون قاعدة البيانات عبارة عن مجموعة واحدة من البيانات المتكاملة.
  • حماية البيانات. يجب أن يوفر نظام DBMS الحماية ضد الوصول غير المصرح به.
  • تكامل البيانات. يجب أن يمنع DBMS المستخدمين من كسر قاعدة البيانات.
  • إدارة العمل المتزامن. يجب أن يحمي نظام DBMS قاعدة البيانات من التناقضات في وضع الوصول المشترك. لضمان حالة متسقة لقاعدة البيانات ، يجب تنفيذ جميع طلبات المستخدم (المعاملات) بترتيب معين.
  • يجب أن يكون نظام DBMS عالميًا. يجب أن تدعم نماذج البيانات المختلفة على أساس منطقي ومادي واحد.
  • يجب أن يدعم نظام DBMS كلاً من قواعد البيانات المركزية والموزعة ، وبالتالي يصبح رابطًا مهمًا في شبكات الكمبيوتر.

بالنظر إلى نظام إدارة قواعد البيانات (DBMS) كفئة من منتجات البرامج التي تركز على الحفاظ على قواعد البيانات في الأنظمة الآلية ، يمكننا التمييز بين أهم ميزتين أساسيتين تحددان أنواع نظم إدارة قواعد البيانات. وفقًا لهم ، يمكن عرض نظام DBMS من وجهتي نظر:

  • قدراتها فيما يتعلق بقواعد البيانات الموزعة (الشركات) ؛
  • علاقتها بنوع نموذج البيانات المطبق في نظام إدارة قواعد البيانات.

فيما يتعلق بقواعد بيانات الشركة (الموزعة) ، يمكن تمييز الأنواع التالية من نظم إدارة قواعد البيانات بشكل تقليدي:

  • نظام إدارة قواعد البيانات "المكتبي". تركز هذه المنتجات بشكل أساسي على التعامل مع البيانات الشخصية (بيانات "سطح المكتب"). لديهم مجموعات أوامر لمشاركة قواعد البيانات المشتركة ، لكنها صغيرة الحجم (مثل مكتب صغير). بادئ ذي بدء ، إنه نظام إدارة قواعد البيانات (DBMS) مثل التقييم ، و dBASE ، و Paradox ، و EohPgo. لماذا تقييم ، dBASE ، Paradox ، EohPgo لديهم وصول ضعيف إلى بيانات الشركة. النقطة المهمة هي أنه لا توجد طريقة سهلة للتغلب على الحاجز بين البيانات الشخصية وبيانات الشركة. والنقطة ليست حتى أن آلية نظام DBMS للبيانات الشخصية (أو المكتب الصغير) تركز على الوصول إلى البيانات من خلال العديد من البوابات ، ومنتجات الإنترنت ، وما إلى ذلك. تكمن المشكلة في أن هذه الآليات ترتبط عادةً بعمليات نقل الملفات الكاملة ونقص دعم الفهرس المتشعب ، مما يؤدي إلى توقف قوائم انتظار الخادم عمليًا على الأنظمة الكبيرة.
  • نظم إدارة قواعد البيانات المتخصصة عالية الأداء ومتعددة المستخدمين. تتميز نظم إدارة قواعد البيانات هذه بوجود نواة نظام متعددة المستخدمين ولغة معالجة البيانات والوظائف التالية النموذجية لنظم إدارة قواعد البيانات متعددة المستخدمين المطورة:
  • تنظيم تجمع عازلة.
  • وجود نظام لمعالجة قوائم انتظار المعاملات ؛
  • وجود آليات لقفل بيانات متعدد المستخدمين ؛
  • تسجيل المعاملات
  • توافر آليات التحكم في الوصول.

هذه أنظمة DBMS مثل Oracle و DB2 و SQL / Server و Informix و Sybase و ADABAS و Titanium وغيرها توفر خدمة واسعة لمعالجة قواعد بيانات الشركة.

عند العمل مع قواعد البيانات ، يتم استخدام آلية المعاملات.

عملية تجارية هي وحدة منطقية للعمل.

عملية تجارية عبارة عن سلسلة من عبارات معالجة البيانات المنفذةككل(الكل أو لا شيء) وترجمة قاعدة البياناتمن حالة كلية إلى حالة كلية أخرى.

للمعاملة أربع خصائص مهمة تُعرف بخصائص ASID:

  • (أ) الذرية ... يتم تنفيذ المعاملة كعملية صغيرة - إما أن يتم تنفيذ المعاملة بالكامل ، أو لا يتم تنفيذها بالكامل.
  • (ج) الاتساق... تنقل المعاملة قاعدة بيانات من حالة متسقة (متسقة) إلى حالة أخرى متسقة (متسقة). ضمن الصفقة ، يمكن انتهاك اتساق قاعدة البيانات.
  • (ط) العزل ... يجب ألا تتداخل معاملات المستخدمين المختلفين مع بعضهم البعض (على سبيل المثال ، كما لو تم تنفيذها بشكل صارم).
  • (هـ) المتانة... إذا اكتملت المعاملة ، فيجب حفظ نتائج عملها في قاعدة البيانات ، حتى لو تعطل النظام في اللحظة التالية.

تبدأ المعاملة عادةً تلقائيًا من لحظة اتصال المستخدم بنظام DBMS وتستمر حتى حدوث أحد الأحداث التالية:

  • صدر أمر COMMIT WORK.
  • تم إصدار الأمر ROLLBACK WORK.
  • قطع المستخدم اتصاله بنظام إدارة قواعد البيانات.
  • كان هناك فشل في النظام.

بالنسبة للمستخدم ، فإنها ترتدي عادة الطابع الذري... في الواقع ، هذا مستخدم معقد (تطبيق) - آلية تفاعل قاعدة البيانات. يستخدم برنامج أنظمة المؤسسات محرك معالجة المعاملات في الوقت الفعلي (أنظمة معالجة المعاملات عبر الإنترنت ، OLTP) ، ولا سيما برامج المحاسبة ، وبرامج تلقي طلبات العملاء ومعالجتها ، والتطبيقات المالية ، تنتج الكثير من المعلومات. تم تصميم هذه الأنظمة (وتحسينها بشكل مناسب) للتعامل مع كميات كبيرة من البيانات والمعاملات المعقدة وعمليات القراءة / الكتابة المكثفة.

لسوء الحظ ، فإن المعلومات الموضوعة في قواعد بيانات أنظمة OLTP ليست مناسبة جدًا للاستخدام من قبل المستخدمين العاديين (نظرًا لارتفاع درجة تطبيع الجداول وتنسيقات عرض البيانات المحددة وعوامل أخرى). لذلك ، يتم إرسال البيانات من خطوط أنابيب المعلومات المختلفة (بمعنى نسخها) إلى مستودع التخزينوالفرز والتسليم اللاحق للمستهلك. في تكنولوجيا المعلومات ، يتم لعب دور المستودعاتمخازن المعلومات.

تسليم المعلومات إلى المستخدم النهائي - أنظمة معالجة البيانات التحليلية في الوقت الحقيقي (معالجة تحليلية عبر الإنترنت ، OLAP)التي توفر وصولاً سهلاً للغاية إلى البيانات من خلال وسائل ملائمة لتوليد الاستعلامات وتحليل النتائج. في أنظمة OLAP ، تزداد قيمة منتج المعلومات بسبب استخدام طرق مختلفة للتحليل والمعالجة الإحصائية. بالإضافة إلى ذلك ، تم تحسين هذه الأنظمة من حيث سرعة استخراج البيانات ، وجمع المعلومات المعممة وتستهدف المستخدمين العاديين (لديهم واجهة سهلة الاستخدام). لونظام OLTP يقدم إجابات لأسئلة بسيطة مثل "ما هو مستوى مبيعات المنتج N في المنطقة M في يناير 199x؟" ، إذنأنظمة OLAP جاهز لطلبات المستخدم الأكثر تعقيدًا ، على سبيل المثال: "تقديم تحليل لمبيعات المنتج N في جميع المناطق وفقًا لخطة الربع الثاني مقارنة بالعامين السابقين".

هيكل العميل / الخادم

في الأنظمة الحديثة معالجة المعلومات الموزعة، التكنولوجيا تحتل مركز الصدارةخدمة الزبائن. في النظام بنية خادم العميلتنقسم معالجة البيانات بين كمبيوتر العميل وجهاز الكمبيوتر الخادم ، ويتم الاتصال بينهما عبر الشبكة. يعتمد هذا الفصل في معالجة البيانات على تجميع الوظائف. عادة ، يتم تخصيص كمبيوتر خادم قاعدة البيانات لإجراء عمليات قاعدة البيانات ، ويقوم كمبيوتر العميل بتشغيل برامج التطبيقات. يوضح الشكل 2.1 نظامًا بسيطًا لهندسة العميل والخادم يتضمن جهاز كمبيوتر يعمل كخادم وحاسوب آخر يعمل كعميل له. كل آلة تؤدي وظائف مختلفة ولها مواردها الخاصة.

قاعدة البيانات

كمبيوتر الخادم

شبكة الاتصال

كمبيوتر متوافق مع IBM

كمبيوتر متوافق مع IBM

كمبيوتر متوافق مع IBM

التطبيقات

أرز. 2.1. نظام هندسة العميل والخادم

تتمثل الوظيفة الرئيسية لجهاز الكمبيوتر العميل في تنفيذ التطبيق (واجهة المستخدم ومنطق العرض التقديمي) والتواصل مع الخادم عند طلب التطبيق.

الخادم هو كائن (كمبيوتر) يقدم خدمات لأشياء أخرى بناءً على طلبهم.

على النحو التالي من المصطلح نفسه ، فإن الوظيفة الرئيسية لجهاز كمبيوتر الخادم هي تلبية احتياجات العميل. يستخدم المصطلح "Server" للإشارة إلى مجموعتين مختلفتين من الوظائف: خادم الملفات وخادم قاعدة البيانات (فيما يلي ، تعني هذه المصطلحات ، اعتمادًا على السياق ، إما البرنامج الذي ينفذ مجموعات الوظائف المحددة ، أو أجهزة الكمبيوتر باستخدام هذا البرنامج). خوادم الملفات ليست مصممة لأداء عمليات قاعدة البيانات ، وظيفتها الرئيسية هي مشاركة الملفات بين عدة مستخدمين ، أي توفير الوصول المتزامن للعديد من المستخدمين إلى الملفات الموجودة على جهاز الكمبيوتر - خادم الملفات. مثال على خادم الملفات هو نظام التشغيل NetWare الخاص بشركة Novell. يمكن تثبيت خادم قاعدة البيانات وتشغيله على كمبيوتر خادم الملفات. يتم تنفيذ Oracle DBMS في شكل NLM (الوحدة النمطية القابلة للتحميل على الشبكة) في بيئة NetWare على خادم الملفات.

يجب أن يمتلك خادم الشبكة المحلية الموارد المناسبة لغرضه الوظيفي واحتياجات الشبكة. لاحظ أنه فيما يتعلق بالتركيز على نهج الأنظمة المفتوحة ، فمن الأصح التحدث عن الخوادم المنطقية (بمعنى مجموعة من الموارد والبرامج التي تقدم خدمات عبر هذه الموارد) ، والتي لا توجد بالضرورة على أجهزة كمبيوتر مختلفة. من ميزات الخادم المنطقي في نظام مفتوح أنه إذا كان من المستحسن ، لأسباب تتعلق بالكفاءة ، نقل الخادم إلى كمبيوتر منفصل ، فيمكن القيام بذلك دون الحاجة إلى أي تعديل ، سواء من تلقاء نفسه أو في التطبيقات التي تستخدمه.

أحد متطلبات الخادم المهمة هو أن نظام التشغيل الذي يستضيف خادم قاعدة البيانات يجب أن يكون متعدد المهام (ويفضل ، ولكن ليس بالضرورة متعدد المستخدمين). على سبيل المثال ، لا يمكن استخدام Oracle DBMS المثبت على جهاز كمبيوتر شخصي مع نظام تشغيل MS-DOS (أو PC-DOS) لا يلبي متطلبات تعدد المهام كخادم قاعدة بيانات. ويمكن أن تكون نفس قاعدة بيانات Oracle المثبتة على جهاز كمبيوتر به نظام تشغيل OS / 2 متعدد المهام (وإن لم يكن متعدد المستخدمين) خادم قاعدة بيانات. العديد من نكهات UNIX و MVS و VM وبعض أنظمة التشغيل الأخرى متعددة المهام ومتعددة المستخدمين.

الحوسبة الموزعة

غالبًا ما يستخدم مصطلح "الحوسبة الموزعة" للإشارة إلى مفهومين مختلفين ، وإن كانا متكاملين:

  • قاعدة بيانات موزعة ؛
  • معالجة البيانات الموزعة.

يتيح تطبيق هذه المفاهيم تنظيم الوصول إلى المعلومات المخزنة على أجهزة متعددة للمستخدمين النهائيين باستخدام وسائل مختلفة.

هناك أنواع عديدة من الخوادم:

  • خادم قاعدة البيانات؛
  • ملقم الطباعة؛
  • خادم الوصول عن بعد ؛
  • خادم الفاكس
  • خادم الويب ، إلخ.

العميل / الخادم هو جوهر التقنية الأساسية هي تقنيات أساسية مثل:

  • تقنيات أنظمة التشغيل ، مفهوم تفاعل الأنظمة المفتوحة ، إنشاء بيئات موجهة للكائنات لتشغيل البرامج ؛
  • تقنيات الاتصالات؛
  • تقنيات الشبكة؛
  • تقنيات واجهة المستخدم الرسومية (واجهة المستخدم الرسومية) ؛
  • إلخ.

مزايا تقنية خادم العميل:

  • تسمح تقنية العميل / الخادم بالحوسبة في بيئات الحوسبة غير المتجانسة. استقلالية النظام الأساسي: الوصول إلى بيئات الشبكة غير المتجانسة التي تتضمن أنواعًا مختلفة من أجهزة الكمبيوتر ذات أنظمة التشغيل المختلفة.
  • الاستقلال عن مصادر البيانات: الوصول إلى المعلومات من قواعد البيانات غير المتجانسة. ومن أمثلة هذه الأنظمة DB2 و SQL / DS و Oracle و Sybase.
  • توازن التحميل بين العميل والخادم.
  • إجراء العمليات الحسابية حيث تكون أكثر كفاءة ؛
  • توفير القدرة على القياس بكفاءة ؛
  • الحوسبة عبر الأنظمة الأساسية... يتم تعريف الحوسبة عبر الأنظمة الأساسية ببساطة على أنها تنفيذ التقنيات في بيئات الحوسبة غير المتجانسة. يجب توفير الاحتمالات التالية هنا:
  • يجب أن يعمل التطبيق على منصات متعددة ؛
  • على جميع الأنظمة الأساسية ، يجب أن يكون لها نفس الواجهة ومنطق العمل ؛
  • يجب أن يتكامل التطبيق مع بيئة التشغيل الأصلية ؛
  • يجب أن تتصرف بنفس الطريقة على جميع الأنظمة الأساسية ؛
  • يجب تقديم دعم بسيط ومتسق لذلك.

الحوسبة الموزعة. تتضمن الحوسبة الموزعة توزيع العمل بين العديد من أجهزة الكمبيوتر (على الرغم من أن الحوسبة الموزعة هي مفهوم أوسع).

تقليص. تقليص الحجم هو نقل تطبيقات الحاسبات المركزية إلى منصات الكمبيوتر الصغيرة.

  • انخفاض تكاليف البنية التحتية والأجهزة. فعالة من حيث التكلفة: إن توافر معدات الحوسبة منخفضة التكلفة والانتشار المتزايد لشبكات المنطقة المحلية يجعل تكنولوجيا الخادم والعميل أكثر فعالية من حيث التكلفة من تقنيات معالجة البيانات الأخرى. يمكن ترقية المعدات بمجرد ظهور الحاجة.

تقليل وقت التنفيذ الكلي للتطبيق ؛

تقليل استخدام ذاكرة العميل ؛

تقليل حركة مرور الشبكة.

  • القدرة على العمل مع الوسائط المتعددة: حتى الآن ، تم إنشاء العديد من برامج الوسائط المتعددة للكمبيوتر الشخصي. لا توجد مثل هذه البرامج لتكوين Terminal-host ، أو أنها باهظة الثمن.
  • القدرة على جذب موارد حوسبة كبيرة لعمليات قاعدة البيانات: نظرًا لأن التطبيقات يتم تنفيذها على أجهزة الكمبيوتر العميلة ، يتم تحرير موارد إضافية (مقارنة بتكوين مضيف المحطة الطرفية) على كمبيوتر الخادم لعمليات قاعدة البيانات ، مثل موارد الحوسبة للمعالج المركزي و الذاكرة التشغيلية.
  • إنتاجية أفضل للمبرمجين: يتم زيادة إنتاجية المبرمج باستخدام أدوات مثل SQL * Forms و CASE ، والتي تسمح لك بتطوير التطبيقات بشكل أسرع من لغات البرمجة مثل C أو PL1 أو COBOL.
  • زيادة إنتاجية المستخدم النهائي: في الوقت الحالي ، أتقن العديد من المستخدمين النهائيين أنظمة مثل Lotus و Paradox و Word Perfect و Harvard Graphics والمزيد.

تحديد الواجهة من جانب الخادم وثابتة. لذلك ، من الممكن إنشاء أجزاء جديدة للعميل من نظام موجود (مثال على قابلية التشغيل البيني على مستوى النظام).

أرز. 2.2. رسم توضيحي لوصول العميل إلى مشاركة الخادم.

كيفية تنفيذ تقنية خادم العميل

تتم مناقشة تثبيت نظام قائم على تقنية خادم العميل وقادر على تنفيذ معالجة البيانات الموزعة أدناه. أجهزة وبرامج الكمبيوتر التالية مطلوبة:

  • كمبيوتر خادم قاعدة البيانات ؛
  • أجهزة كمبيوتر العميل
  • شبكة اتصال؛
  • برامج الشبكة
  • تطبيق البرمجيات.

لغة SQL ... لغة الاستعلام عالية المستوى - SQL (لغة الاستعلام الهيكلية ) يعمل على تنفيذ استعلامات لقواعد البيانات ، مثل YAMD و YOD و PNP ويتم اعتماده كمعيار. لغة SQL تم اعتمادها في الأصل كلغة بيانات لمنتجات برامج الشركةآي بي إم و YAMD نظم إدارة قواعد البيانات العلائقية SYSTEM R من شركة IBM ... ميزة مهمة للغة SQL يكمن في حقيقة أن نفس اللغة يتم تمثيلها من خلال واجهتين مختلفتين ، وهما: من خلال واجهة تفاعلية ومن خلال واجهة برمجة التطبيقات (ديناميكية SQL). ديناميكية SQL يتكون من العديد من ميزات اللغة المضمنة SQL ، يتم توفيرها خصيصًا لبناء التطبيقات التفاعلية ، حيث يُفهم التطبيق التفاعلي على أنه برنامج مكتوب لدعم الوصول إلى قاعدة بيانات المستخدم النهائي الذي يعمل على الجهاز التفاعلي. لغة SQL يوفر وظائف تعريف ومعالجة وإدارة بيانات قاعدة البيانات وهو شفاف للمستخدم من وجهة نظر نظام إدارة قواعد البيانات المنفذ.

أرز. 2.3 مخطط لتنفيذ استعلامات المستخدم لقواعد البيانات الموزعة.

يتم تحديد الهيكل الداخلي لقواعد البيانات من خلال نماذج البيانات المستخدمة. يحتوي النموذج المفاهيمي على قدرات تجريدية أكثر ودلالات أكثر ثراءً من النماذج الخارجية. غالبًا ما يشار إلى النماذج الخارجية على أنها نماذج نحوية أو تشغيلية ، في إشارة إلى الطبيعة النحوية للتحكم والاستخدام كوسيلة لتفاعل المستخدم مع قاعدة البيانات. في نمذجة المعلومات ، هناك مستويات مختلفة من التجريد ، من النموذج المفاهيمي إلى نموذج البيانات المادية ، والتي تؤثر على بنية نظام إدارة قواعد البيانات.

يتكون نموذج البيانات من ثلاثة مكونات:

  • هيكل البيانات المراد تمثيله من وجهة نظر المستخدم لقاعدة البيانات.
  • يتم تنفيذ العمليات الصالحة على هيكل البيانات. من الضروري أن تكون قادرًا على العمل مع هذا الهيكل باستخدام عمليات مختلفة لـ NOD و NAM. لا قيمة للبنية الغنية إذا لم يكن هناك طريقة للتلاعب بمحتوياتها.
  • قيود مراقبة النزاهة. يجب تزويد نموذج البيانات بوسائل للحفاظ على سلامته وحمايته. كمثال ، ضع في اعتبارك الشرطين التاليين:
  • يجب أن تحتوي كل شجرة فرعية على عقدة مصدر. لا يمكن لقواعد البيانات الهرمية تخزين العقد التابعة بدون عقدة مصدر.
  • فيما يتعلق بقاعدة البيانات العلائقية ، لا يمكن أن تكون هناك مجموعات متطابقة. بالنسبة للملف ، يتطلب هذا المطلب أن تكون جميع السجلات فريدة.

إحدى أهم خصائص نظام إدارة قواعد البيانات (DBMS) هي القدرة على ربط الأشياء.

هناك أنواع الروابط التالية بين الكائنات:

  • واحد لواحد (1: 1)... يمكن ربط كائن واحد من مجموعة مع كائن واحد من مجموعة أخرى.
  • واحد لأكثر (1: M)... يمكن ربط كائن واحد من مجموعة واحدة بالعديد من كائنات مجموعة أخرى.
  • كثير إلى كثير (M: N)... يمكن ربط كائن واحد من مجموعة واحدة بالعديد من كائنات مجموعة أخرى ، ولكن في نفس الوقت يمكن ربط كائن واحد من مجموعة أخرى بالعديد من كائنات المجموعة الأولى.
  • متشعب ... يمكن ربط كائن واحد من مجموعة واحدة بأشياء من مجموعات عديدة.
  • العودية ... يمكن ربط كائن واحد من مجموعة معينة بكائن من نفس المجموعة.

توجد نماذج البيانات الأساسية التالية:

  • نموذج البيانات العلائقية.
  • نموذج البيانات الهرمي.
  • نموذج بيانات شبكة غير مكتمل.
  • نموذج بيانات CODASYL.
  • نموذج بيانات الشبكة الموسعة.

الخامس .3. تقنيات الإنترنت / الإنترنت وحلول الوصول إلى قواعد البيانات الخاصة بالشركات

تكمن المشكلة الرئيسية للأنظمة القائمة على بنية خادم العميل في أنه وفقًا لمفهوم الأنظمة المفتوحة ، يجب أن تكون متحركة في أوسع فئة ممكنة من حلول الأجهزة والبرامج للأنظمة المفتوحة. حتى لو قصرنا أنفسنا على شبكات المنطقة المحلية المستندة إلى UNIX ، فإن الشبكات المختلفة تستخدم بروتوكولات اتصال ومعدات مختلفة. تؤدي محاولات إنشاء أنظمة تدعم جميع البروتوكولات الممكنة إلى تحميلها الزائد بتفاصيل الشبكة على حساب الوظيفة.

يرتبط جانب أكثر تعقيدًا من هذه المشكلة بإمكانية استخدام تمثيلات مختلفة للبيانات في عقد مختلفة لشبكة محلية غير متجانسة. قد تحتوي أجهزة الكمبيوتر المختلفة على عناوين مختلفة ، وتمثيل رقم ، وترميز أحرف ، وما إلى ذلك. هذا مهم بشكل خاص للخوادم عالية المستوى: الاتصالات السلكية واللاسلكية والحوسبة وقواعد البيانات.

يتمثل أحد الحلول الشائعة لمشكلة التنقل في الأنظمة القائمة على بنية خادم العميل في الاعتماد على حزم البرامج التي تنفذ بروتوكولات استدعاء الإجراء البعيد (RPC). باستخدام هذه الأدوات ، تبدو المكالمة إلى خدمة في موقع بعيد وكأنها استدعاء إجراء عادي. تقوم أدوات RPC ، التي تحتوي بشكل طبيعي على جميع المعلومات حول تفاصيل أجهزة الشبكة المحلية وبروتوكولات الشبكة ، بترجمة المكالمة إلى سلسلة من تفاعلات الشبكة. وبالتالي ، فإن تفاصيل بيئة الشبكة والبروتوكولات مخفية عن مبرمج التطبيق.

عندما يتم استدعاء إجراء عن بعد ، تقوم برامج RPC بتحويل تنسيقات بيانات العميل إلى تنسيقات وسيطة مستقلة عن الجهاز ثم تحويلها إلى تنسيقات بيانات الخادم. عند تمرير معلمات الاستجابة ، يتم إجراء تحويلات مماثلة.

أعمال أخرى مشابهة قد تهمك Wshm>

6914. مفهوم قاعدة البيانات 11.56 كيلو بايت
يتم تقديم قاعدة البيانات في شكل موضوعي ، وهي مجموعة من المواد المستقلة لمقالات حسابات الأفعال المعيارية لقرارات المحكمة وغيرها من المواد المماثلة المنظمة بطريقة يمكن من خلالها العثور على هذه المواد ومعالجتها باستخدام قانون إلكتروني مدني للكمبيوتر الروسي اتحاد الفن. قاعدة البيانات المنظمة وفقًا لقواعد معينة والمحفوظة في ذاكرة الكمبيوتر هي مجموعة من البيانات التي تميز الحالة الحالية لبعض ...
8064. قواعد البيانات الموزعة 43.66 كيلو بايت
قواعد البيانات الموزعة يُفهم قاعدة البيانات الموزعة RDB على أنها مجموعة من البيانات المشتركة المترابطة منطقيًا والتي يتم توزيعها فعليًا عبر عقد مختلفة لشبكة الكمبيوتر. يجب ألا يعتمد الوصول إلى البيانات على وجود أو عدم وجود نسخ متماثلة للبيانات. يجب أن يحدد النظام تلقائيًا طرق إجراء اتصال دمج البيانات ، وقناة الشبكة قادرة على التعامل مع كمية المعلومات المرسلة ، كما أن العقدة لديها طاقة معالجة كافية للانضمام إلى الجداول. يجب أن يكون نظام RDBMS قادرًا على ...
20319. قواعد البيانات وحمايتها 102.86 كيلوبايت
ظهرت قواعد البيانات على الإنترنت في منتصف الستينيات. تمت معالجة العمليات في قواعد البيانات التشغيلية بشكل تفاعلي باستخدام المحطات الطرفية. سرعان ما تطورت منظمات السجلات المتسلسلة ذات الفهرس البسيط إلى نموذج سجل أكثر قوة. حصل تشارلز باخمان على جائزة تورينج لقيادته مجموعة مهام قاعدة البيانات (DBTG) ، التي طورت لغة قياسية لوصف البيانات ومعالجة البيانات.
5031. مكتبة تطوير قواعد البيانات 11.72 م
تكنولوجيا تصميم قواعد البيانات. تحديد العلاقات بين الكيانات وإنشاء نموذج بيانات. تستند الأفكار الرئيسية لتكنولوجيا المعلومات الحديثة إلى المفهوم الذي يجب تنظيم البيانات بموجبه في قواعد بيانات من أجل عكس العالم الحقيقي المتغير بشكل مناسب وتلبية احتياجات المستخدمين من المعلومات. يتم إنشاء قواعد البيانات هذه وتشغيلها تحت سيطرة أنظمة برمجية خاصة تسمى أنظمة إدارة قواعد البيانات DBMS.
13815. نموذج قاعدة البيانات الهرمية 81.62 كيلوبايت
تستند الأفكار الرئيسية لتكنولوجيا المعلومات الحديثة إلى مفهوم قواعد البيانات ، والتي بموجبها أساس تكنولوجيا المعلومات هو البيانات المنظمة في قواعد البيانات التي تعكس بشكل كاف حالة مجال موضوع معين وتزود المستخدم بالمعلومات ذات الصلة في هذا المجال. يجب الاعتراف بأن البيانات ...
14095. تطوير قاعدة بيانات المكتبة 11.72 م
أدت الزيادة في الحجم والتعقيد الهيكلي للبيانات المخزنة ، واتساع دائرة مستخدمي أنظمة المعلومات إلى انتشار استخدام نظم إدارة قواعد البيانات (DBMS) الأكثر ملاءمة وسهولة نسبيًا في الفهم.
5061. إنشاء قاعدة بيانات العيادات 2.4 ميجا بايت
لقد أتاح تطوير تكنولوجيا الكمبيوتر وتكنولوجيا المعلومات فرصًا لإنشاء أنظمة المعلومات المؤتمتة (AIS) واستخدامها على نطاق واسع لأغراض مختلفة. يجري تطوير وتنفيذ نظم معلومات لإدارة المرافق الاقتصادية والتقنية
13542. قواعد بيانات المعلومات الجيولوجية 20.73 كيلوبايت
في الآونة الأخيرة ، كان إدخال تقنيات الكمبيوتر ، ولا سيما قواعد البيانات ، في المجال العلمي مستمرًا بسرعة. هذه العملية لا تتخطى الجيولوجيا أيضًا ، لأنه في العلوم الطبيعية هناك حاجة لتخزين ومعالجة كميات كبيرة من المعلومات.
9100. قاعدة البيانات. مفاهيم أساسية 26.28 كيلو بايت
قاعدة البيانات هي عبارة عن مجموعة من المعلومات حول كائنات محددة من العالم الحقيقي في أي مجال من مجالات الاقتصاد والإدارة والكيمياء وما إلى ذلك. الغرض من نظام المعلومات ليس فقط تخزين البيانات حول الكائنات ، ولكن أيضًا التلاعب بهذه البيانات مع مراعاة الروابط بين الأشياء. يتميز كل كائن بمجموعة من بيانات الخصائص ، والتي تسمى سمات في قاعدة البيانات.
5240. إنشاء قاعدة البيانات "مكتب العميد" 1.57 ميجا بايت
قاعدة البيانات (DB) هي مجموعة من البيانات المترابطة المخزنة معًا على وسائط تخزين خارجية للكمبيوتر ، مع مثل هذه المنظمة والحد الأدنى من التكرار الذي يسمح باستخدامها بطريقة مثالية لتطبيق واحد أو عدة تطبيقات

الغرض من المحاضرة

بعد دراسة مادة هذه المحاضرة ستعرف:

  • ماذا او ما نموذج بيانات المؤسسة ;
  • كيفية التحويل نموذج بيانات المؤسسةفي نموذج مستودع البيانات ؛
  • العناصر الرئيسية نموذج بيانات الشركة ;
  • طبقات العرض لنموذج بيانات الشركة ;
  • خوارزمية لتحويل نموذج بيانات المؤسسة إلى نموذج مستودع بيانات متعدد الأبعاد ;

وتعلم:

  • تطوير نماذج مستودعات البيانات بناءً على نموذج بيانات الشركةالمنظمات ؛
  • تصميم مخطط نجمي باستخدام أدوات CASE ؛
  • جداول التقسيم نموذج متعدد الأبعادباستخدام أدوات CASE.

نموذج بيانات المؤسسة

مقدمة

جوهر أي HD هو نموذج البيانات الخاص به. بدون نموذج بيانات ، سيكون من الصعب جدًا تنظيم البيانات في HD. لذلك ، يجب على مطوري الأقراص المضغوطة قضاء الوقت والجهد في تطوير مثل هذا النموذج. يقع تطوير نموذج HD على أكتاف مصمم HD.

بالمقارنة مع تصميم أنظمة OLTP ، فإن منهجية تصميم القرص المضغوط لديها عدد من الميزات المميزة المرتبطة بتوجيه هياكل بيانات التخزين لحل مشاكل التحليل ودعم المعلومات لعملية صنع القرار. يجب أن يوفر نموذج بيانات HD حلاً فعالاً لهذه المشاكل على وجه التحديد.

يمكن أن تكون نقطة البداية في تصميم القرص المضغوط هي ما يسمى ب نموذج بيانات المؤسسة(نموذج بيانات الشركة أو نموذج بيانات المؤسسة ، EDM) ، والذي تم إنشاؤه في عملية تصميم أنظمة OLTP للمؤسسة. عند التصميم نموذج بيانات الشركةعادة ما يتم إجراء محاولة لإنشاء هيكل بيانات يعتمد على العمليات التجارية التي من شأنها أن تجمع وتوليف جميع احتياجات المعلومات للمؤسسة.

هكذا، نموذج بيانات المؤسسةيحتوي على المعلومات اللازمة لبناء نموذج قرص مضغوط. لذلك ، في المرحلة الأولى ، إذا كان مثل هذا النموذج موجودًا في المنظمة ، يمكن لمصمم HD بدء تصميم HD من خلال حل مشكلة التحول نموذج بيانات الشركة في نموذج HD.

نموذج بيانات المؤسسة

كيفية حل مشكلة التحول نموذج بيانات الشركةفي نموذج HD؟ لحل هذه المشكلة ، يجب أن يكون لديك هذا النموذج ، أي نموذج بيانات الشركةيجب أن يبنى و موثقة... وأنت بحاجة إلى أن تفهم ماذا او مامن هذا النموذج و كيفإلى نموذج HD.

دعونا نوضح المفهوم من وجهة نظر مصمم الأقراص المدمجة نموذج بيانات الشركة. تحت نموذج بيانات الشركةفهم وصف منظم متعدد المستويات لمجالات موضوع المنظمة ، وهياكل بيانات مجال الموضوع ، وعمليات الأعمال وإجراءات الأعمال ، وتدفقات البيانات التنظيمية ، ومخططات الحالة ، ومصفوفات معالجة البيانات ، وتمثيلات النماذج الأخرى المستخدمة في أنشطة المؤسسة. وهكذا ، بالمعنى الأوسع للكلمة ، نموذج بيانات المؤسسةهي مجموعة من النماذج من مختلف المستويات التي تميز (نموذج على مستوى مجرد) أنشطة المنظمة ، أي المحتوى نموذج الشركةيعتمد بشكل مباشر على الإنشاءات النموذجية التي تم تضمينها فيه في منظمة معينة.

العناصر الرئيسية نموذج بيانات الشركةنكون:

  • وصف المجالات الموضوعية للمنظمة (تعريف مجالات النشاط) ؛
  • العلاقات بين مجالات الموضوع المحددة أعلاه ؛
  • نموذج بيانات المعلومات (نموذج ERD أو نموذج علاقة الكيان) ؛
  • وصف لكل مجال موضوع:
    • مفاتيح الكيان
    • سمات الكيان;
    • الأنواع الفرعية والأنماط الفوقية.
    • العلاقات بين الكيانات ؛
    • سمات التجمع
    • العلاقات بين المجالات الخاضعة ؛
  • نموذج العملية الوظيفية أو التجارية ؛
  • مخططات تدفق البيانات ؛
  • مخططات الدولة
  • نماذج أخرى.

هكذا، نموذج بيانات المؤسسةيحتوي على الكيانات والسمات والعلاقات التي تمثل احتياجات المعلومات للمؤسسة. في التين. يظهر الشكل 16.1 العناصر الرئيسية نموذج بيانات الشركة.

مستويات العرض لنموذج بيانات المؤسسة

يتم تقسيم نموذج بيانات المؤسسة وفقًا لمجالات الموضوعات ، والتي تمثل مجموعات من الكيانات ذات الصلة بدعم احتياجات العمل المحددة. قد تغطي بعض المجالات الموضوعية وظائف عمل محددة مثل إدارة العقود ، في حين أن البعض الآخر قد يشمل الكيانات التي تصف المنتجات أو الخدمات.

يجب أن يتوافق كل نموذج منطقي مع المجال الحالي نموذج بيانات الشركة... إذا كان النموذج المنطقي لا يلبي هذا المطلب ، فيجب إضافة نموذج المجال إليه.

عادة ما يحتوي نموذج بيانات المؤسسة على عدة مستويات من العرض. حقيقة مستوى عال(مستوى عال) نموذج بيانات الشركةهناك وصف لمجالات الموضوعات الرئيسية للمنظمة وعلاقاتها على مستوى الكيان. في التين. 16.2 هو مقتطف نموذج بيانات الشركةافضل مستوى.

أرز. 16.2.

يعرض الرسم البياني الموضح في الشكل أربعة مجالات موضوعية: "المشتري" ( عميل)، "التحقق من" ( الحساب)، "ترتيب" ( ترتيب) و "المنتج" ( المنتج). كقاعدة عامة فقط اتصالات مباشرةبين المجالات ، والتي ، على سبيل المثال ، تسجل الحقيقة التالية: يدفع المشتري فاتورة طلب البضائع. التفاصيل والعلاقات غير المباشرة على هذا المستوى نموذج الشركةغير ظاهر.

في اليوم التالي ، مستوى متوسط(المستوى المتوسط) نموذج بيانات الشركةيتم عرض معلومات مفصلة حول كائنات مجالات الموضوع ، مثل المفاتيح و سمات الكيانوعلاقاتهم وأنواعهم الفرعية وأنماطهم الفائقة ، إلخ. لكل مجال من نموذج المستوى الأعلى ، هناك نموذج واحد من المستوى المتوسط. في التين. يظهر الشكل 16.3 المستوى الأوسط للعرض التقديمي نموذج الشركةلجزء من مجال موضوع "الطلب".

من التين. 16.3 يمكن ملاحظة أن مجال الموضوع "ترتيب" ( ترتيب) يشمل عدة كيانات ، حددت من خلال سماتها ، والعلاقات فيما بينها. يسمح لك النموذج المقدم بالإجابة على أسئلة مثل تاريخ الطلب ، ومن الذي قدم الطلب ، ومن أرسل الطلب ، ومن الذي استلم الطلب ، وعدد من الأسئلة الأخرى. من الرسم البياني أعلاه ، يمكن ملاحظة أنه يوجد في هذه المنظمة نوعان من الطلبات - أوامر الترويج ( تجاري) وأوامر البيع بالتجزئة ( التجزئه).

لاحظ أن نموذج بيانات المؤسسةيمكن أن تمثل جوانب مختلفة من أنشطة المنظمة وبدرجات متفاوتة من التفاصيل والاكتمال. لو نموذج الشركةيمثل جميع جوانب أنشطة المنظمة ، ويسمى أيضًا نموذج بيانات المنظمة(نموذج بيانات المؤسسة).

من وجهة نظر تصميم قرص مضغوط ، عامل مهم في تقرير إنشاء نموذج قرص مضغوط منه نموذج بيانات الشركةهي الدولة اكتمال نموذج بيانات الشركة.

نموذج بيانات الشركة للمؤسسة له خاصية التطور ، أي إنها تتطور وتتحسن باستمرار. بعض المجالات نموذج بيانات الشركةقد يكون متطورًا بشكل جيد ، فبالنسبة لبعض العمل ربما لم يبدأ بعد. إذا لم يتم العمل على جزء من مجال الموضوع في نموذج بيانات الشركة، فلا توجد طريقة لاستخدام هذا النموذج كنقطة انطلاق لتصميم القرص المضغوط.

درجة الإنجاز نموذج الشركةيمكن تسويتها في تصميم القرص المضغوط على النحو التالي. نظرًا لأن عملية تطوير HD عادةً ما يتم تقسيمها في الوقت المناسب إلى سلسلة من المراحل ، يمكن مزامنة عملية تصميمها معها عملية الإنجازتطوير الأجزاء الفردية نموذج بيانات الشركةالمنظمات.

في أدنى المستويات طبقة العرض لنموذج بيانات الشركةمعلومات حول الخصائص الفيزيائية لكائنات قاعدة البيانات المقابلة لـ نموذج البيانات المنطقيوسط طبقة العرض لنموذج بيانات الشركة.

زايتسيف S.L. ، دكتوراه.

تكرار المجموعات

المجموعات المكررة هي السمات التي يمكن أن تحتوي مثيل واحد لكيان ما على أكثر من قيمة واحدة. على سبيل المثال ، يمكن أن يمتلك الشخص أكثر من مهارة. إذا احتجنا ، من حيث متطلبات العمل ، إلى معرفة مستوى المهارة لكل شخص ، وكان بإمكان كل شخص امتلاك مهارتين فقط ، فيمكننا إنشاء الكيان الموضح في الشكل. 1.6 هنا الكيان شخصمع سمتين لتخزين المهارات ومستوى المهارة لكل منهما.

أرز. 1.6 يستخدم هذا المثال مجموعات متكررة.

مشكلة تكرار المجموعات هي أننا لا نستطيع أن نعرف بالضبط عدد المهارات التي قد يمتلكها الشخص. في الحياة الواقعية ، يمتلك بعض الأشخاص مهارة واحدة ، والبعض الآخر يمتلك عدة مهارات ، والبعض الآخر لا يمتلك أي مهارة حتى الآن. يوضح الشكل 1.7 النموذج الذي تم تقليله إلى الشكل العادي الأول. لاحظ المضاف معرف المهارة التي يعرّفها كل منها بشكل فريد مهارة.

أرز. 1.7 نموذج مخفض إلى أول شكل عادي.

حقيقة واحدة في مكان واحد

إذا كانت السمة نفسها موجودة في أكثر من كيان واحد ولم تكن مفتاحًا خارجيًا ، فإن هذه السمة تعتبر زائدة عن الحاجة. يجب ألا يحتوي النموذج المنطقي على بيانات زائدة عن الحاجة.

يتطلب التكرار مساحة إضافية ، ولكن في حين أن كفاءة الذاكرة مهمة ، فإن المشكلة الحقيقية تكمن في مكان آخر. إن التأكد من مزامنة البيانات الزائدة عن الحاجة هو عبء ، وأنك دائمًا ما تخاطر بتعارض القيم.

في المثال السابق مهارةيعتمد على معرف الشخصو من معرف المهارة.هذا يعني أنك لن تمتلك مهارةحتى تظهر شخص،امتلاك هذه المهارة. هذا أيضًا يجعل من الصعب تغيير اسم المهارة. من الضروري العثور على كل إدخال باسم المهارة وتغييره لكل شخص يمتلك هذه المهارة.

يوضح الشكل 1.8 النموذج في الشكل العادي الثاني. لاحظ أن الكيان المضاف مهارة، والسمة لقبيتم نقل المهارة إلى هذا الكيان. بقي مستوى المهارة ، على التوالي ، عند التقاطع الأشخاص والمهارات.

أرز. 1.8 في الشكل العادي الثاني ، يتم نقل المجموعة المكررة إلى كيان آخر. يوفر هذا المرونة لإضافة العدد المطلوب من المهارات وتغيير اسم المهارة أو وصف المهارة في مكان واحد.

كل سمة تعتمد على المفتاح

يجب أن تعتمد كل سمة من سمات الكيان على المفتاح الأساسي لذلك الكيان. في المثال السابق اسم المدرسةو منطقة جغرافيةموجودة في الجدول شخصلكن لا تصف الشخص. لتحقيق النموذج العادي الثالث ، تحتاج إلى نقل السمات إلى الكيان ، حيث ستعتمد على المفتاح. الشكل 1.9. يظهر النموذج في الشكل العادي الثالث.

أرز. 1.9 في الشكل العادي الثالث اسم المدرسةو اقليم جوغرافيالمنقولة إلى الكيان ، حيث تعتمد قيمها على المفتاح.

علاقات كثير إلى كثير

صلة الكثير للكثيرينتعكس حقيقة العالم المحيط. لاحظ أنه في الشكل 1.9 ، توجد علاقة أطراف بأطراف بين شخصيةو مدرسة... الموقف يعكس بدقة حقيقة ذلك شخصيمكن أن تدرس في كثير المدارسو في مدرسةيمكن أن تتعلم الكثير شخص.لتحقيق النموذج العادي الرابع ، يتم إنشاء كيان ترابطي يلغي العلاقة الأحادية بأطراف من خلال إنشاء إدخال منفصل لكل مجموعة فريدة من المدرسة والشخص. يوضح الشكل 1.10 النموذج في الشكل الرابع العادي.

أرز. 1.10 في الشكل الرابع العادي ، علاقة أحادية بأطراف بين شخصيةو مدرسةيتم حلها من خلال إدخال كيان ترابط ، حيث يتم تخصيص إدخال منفصل لكل مجموعة فريدة المدارسو الأشخاص.

التعاريف الرسمية للأشكال العادية

قد تبدو التعاريف التالية للأشكال العادية شاقة. فكر فيهم ببساطة كصيغ لتحقيق التطبيع. تعتمد الأشكال العادية على الجبر العلائقي ويمكن تفسيرها على أنها تحويلات رياضية. على الرغم من أن هذا الكتاب ليس مخصصًا لمناقشة مفصلة للأشكال العادية ، إلا أنه يتم تشجيع المصممين على إلقاء نظرة أعمق على الموضوع.

في علاقة معينة R ، تعتمد السمة Y وظيفيًا على السمة X. في الشكل الرمزي ، RX -> RY (تُقرأ على أنها "RX تحدد وظيفيًا RY") - إذا وفقط إذا كانت كل قيمة X في R مرتبطة بالضبط Y واحدة القيمة في R (في أي وقت). السمتان X و Y يمكن أن تكونا مركبتين (Date CJ. مقدمة لأنظمة قواعد البيانات. الطبعة السادسة. Ed. Williams: 1999، 848 pp.).

تتوافق العلاقة R مع النموذج العادي الأول (1NF) إذا وفقط إذا كانت جميع المجالات التي تنتمي إليها تحتوي على قيم ذرية فقط (التاريخ ، المرجع نفسه).

العلاقة R تقابل النموذج العادي الثاني (2NF) إذا وفقط إذا كان يتوافق مع 1NF ، وكل سمة غير رئيسية تعتمد كليًا على المفتاح الأساسي (التاريخ ، المرجع نفسه).

تتوافق العلاقة R مع النموذج العادي الثالث (3NF) إذا وفقط إذا كان يتوافق مع 2NF ، ولا تعتمد كل سمة غير رئيسية بشكل انتقالي على المفتاح الأساسي (التاريخ ، المرجع نفسه).

تتوافق العلاقة R مع النموذج العادي Boyes-Codd (BCNF) إذا وفقط إذا كان كل محدد مرشحًا للاستخدام كمفتاح.

ملاحظة فيما يلي شرح موجز لبعض الاختصارات المستخدمة في تعريفات التاريخ.

MVD (التبعية متعددة القيم) هي تبعية متعددة القيم. يُستخدم فقط للكيانات التي تحتوي على ثلاث سمات أو أكثر. في التبعية متعددة القيم ، تعتمد قيمة السمة على جزء من المفتاح الأساسي فقط.

FD (التبعية الوظيفية) - التبعية الوظيفية. مع التبعية الوظيفية ، تعتمد قيمة السمة على قيمة سمة أخرى ليست جزءًا من المفتاح الأساسي.

JD (تبعية الانضمام) هي تبعية انضمام. مع تبعية الاتحاد ، يتم إرجاع المفتاح الأساسي للكيان الأصلي إلى أحفاد المستوى الثالث على الأقل ، مع الاحتفاظ بإمكانية استخدامه في الاتحاد بواسطة المفتاح الأصلي.

تتوافق النسبة مع النموذج العادي الرابع (4NF) إذا وفقط إذا كان هناك MVD في R ، على سبيل المثال A®B. في هذه الحالة ، تعتمد جميع سمات R وظيفيًا على A. وبعبارة أخرى ، لا يوجد في R سوى تبعيات (FD أو MVD) من النموذج K®X (أي الاعتماد الوظيفي للسمة X على المرشح للاستخدام كمفتاح K). وفقًا لذلك ، يلبي R متطلبات 4NF إذا كان يتوافق مع BCNF وجميع MVDs هي في الواقع FDs (التاريخ ، المرجع نفسه).

بالنسبة للصيغة العادية الخامسة ، تفي العلاقة R بالتبعية النقابية (JD) * (X ، Y ، ... ، Z) إذا وفقط إذا كانت R مكافئة لإسقاطاتها على X ، Y ، ... ، Z ، حيث X ، Y ،. .. ، Z هي مجموعة فرعية من مجموعة السمات R.

هناك العديد من النماذج العادية الأخرى لأنواع البيانات المعقدة والمواقف المحددة التي تقع خارج نطاق هذه المناقشة. أي متحمس لتطوير النموذج يود أن يتعلم الأشكال العادية الأخرى أيضًا.

أشكال العمل العادية

في كتابه Clive Finklestein (مقدمة لهندسة المعلومات: من التخطيط الاستراتيجي إلى نظم المعلومات ، القراءة ، ماساتشوستس: Addison-Wesley ، 1989) اتخذ نهجًا مختلفًا للتطبيع. إنه يحدد أشكال العمل العادية من حيث الإكراه لتلك الأشكال. يجد العديد من المصممين هذا النهج أكثر سهولة وواقعية.

يأخذ النموذج العادي الأول للأعمال (1BNF) المجموعات المكررة إلى كيان آخر. يحصل هذا الكيان على اسمه الخاص والسمات الأساسية (المركبة) الأساسية من الكيان الأصلي ومجموعة التكرار الخاصة به.

يستخرج النموذج العادي للأعمال الثاني (2BNF) السمات التي تعتمد جزئيًا على المفتاح الأساسي لكيان آخر. المفتاح الأساسي (المركب) لهذا الكيان هو المفتاح الأساسي للكيان الذي كان موجودًا فيه في الأصل ، إلى جانب المفاتيح الإضافية التي تعتمد عليها السمة بالكامل.

يأخذ النموذج العادي للأعمال الثالث (3BNF) سمات مستقلة عن المفتاح الأساسي إلى كيان آخر ، حيث تعتمد بشكل كامل على المفتاح الأساسي لهذا الكيان.

يأخذ النموذج العادي للأعمال الرابع (4BNF) سمات تعتمد على قيمة المفتاح الأساسي أو اختيارية لكيان ثانوي ، حيث تعتمد كليًا على قيمة المفتاح الأساسي ، أو حيث يجب (بالضرورة) أن تكون موجودة في ذلك شخصية.

يظهر النموذج العادي الخامس للأعمال (5BNF) ككيان هيكلي إذا كان هناك تبعية متكررة أو تبعية أخرى بين مثيلات كيان ثانوي ، أو في حالة وجود تبعية متكررة بين مثيلات كيانها الأساسي.

نموذج بيانات منطقي مكتمل

يجب أن يفي النموذج المنطقي المكتمل بمتطلبات نموذج العمل العادي الثالث وأن يشمل جميع الكيانات والسمات والعلاقات اللازمة لدعم متطلبات البيانات وقواعد العمل المرتبطة بالبيانات.

يجب أن يكون لجميع الكيانات أسماء تصف محتواها وأن يكون لها وصف أو تعريف واضح وموجز وكامل. ستغطي المنشور المستقبلي مجموعة أولية من الإرشادات للتكوين الصحيح لأسماء الكيانات وأوصافها.

يجب أن يكون للكيانات مجموعة كاملة من السمات ، بحيث يمكن تمثيل كل حقيقة عن كل كيان بسماته. يجب أن يكون لكل سمة اسم يعكس معناها ونوع بيانات منطقية ووصف أو تعريف واضح وقصير وكامل. في منشور مدونة مستقبلي ، سننظر في مجموعة أولية من الإرشادات للتنسيق الصحيح لأسماء السمات والأوصاف.

يجب أن تتضمن العلاقات بناء الفعل الذي يصف العلاقة بين الكيانات ، إلى جانب خصائص مثل التعددية وضرورة الوجود أو احتمال عدم وجود علاقة.

ملاحظة تعدد العلاقة تصف الحد الأقصى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل الكيان الأصلي.ضرورة الوجود أوإمكانية الغياب تُستخدم العلاقة لتحديد الحد الأدنى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل للكيان الأصلي.

نموذج البيانات المادية

بمجرد إنشاء نموذج منطقي كامل ومناسب ، فأنت على استعداد لاتخاذ قرار اختيار منصة التنفيذ. يعتمد اختيار النظام الأساسي على متطلبات استخدام البيانات والمبادئ الإستراتيجية لتشكيل بنية الشركة. اختيار المنصة هو قضية معقدة خارج نطاق هذا الكتاب.

في ERwin ، النموذج المادي هو تمثيل رسومي لقاعدة بيانات في العالم الحقيقي. ستتكون قاعدة البيانات المادية من جداول وأعمدة وعلاقات. يعتمد النموذج المادي على النظام الأساسي المختار للتنفيذ ومتطلبات استخدام البيانات. سيكون النموذج المادي لـ IMS مختلفًا تمامًا عن نموذج Sybase. سيبدو النموذج المادي لتقارير OLAP مختلفًا عن نموذج OLTP (معالجة المعاملات عبر الإنترنت).

يستخدم مصمم البيانات ومسؤول قاعدة البيانات (DBA) النموذج المنطقي ومتطلبات الاستخدام وسياسة بنية الشركة لتطوير نموذج بيانات مادي. يمكنك إلغاء تنسيق النموذج المادي لتحسين الأداء وإنشاء طرق عرض لدعم متطلبات الاستخدام. توضح الأقسام التالية بالتفصيل عملية إلغاء التسوية وإنشاء طرق العرض.

يقدم هذا القسم نظرة عامة على عملية بناء نموذج مادي ، وجمع متطلبات استخدام البيانات ، وتحديد مكونات النموذج المادي ، وتوفير الهندسة العكسية. في المنشورات التالية ، تمت تغطية هذه القضايا بمزيد من التفصيل.

جمع متطلبات استخدام البيانات

تقوم عادةً بجمع متطلبات استخدام البيانات مبكرًا أثناء المقابلات وجلسات العمل. في الوقت نفسه ، يجب أن تحدد المتطلبات بشكل كامل قدر الإمكان استخدام البيانات من قبل المستخدم. يمكن أن يؤدي الموقف السطحي والثغرات في النموذج المادي إلى تكاليف غير مخطط لها وتأخير في تنفيذ المشروع. تشمل متطلبات الاستخدام ما يلي:

    متطلبات الوصول والأداء

    الخصائص الحجمية (تقدير كمية البيانات المراد تخزينها) التي تسمح للمسؤول بتمثيل الحجم المادي لقاعدة البيانات

    تقدير عدد المستخدمين الذين يحتاجون إلى وصول متزامن إلى البيانات لمساعدتك في تصميم قاعدة البيانات الخاصة بك لمستويات أداء مقبولة

    التجميعات والمحور والبيانات الأخرى المحسوبة أو المشتقة التي يمكن اعتبارها مرشحة للتخزين في هياكل البيانات الثابتة

    متطلبات إعداد التقارير والاستعلامات القياسية لمساعدة مسؤول قاعدة البيانات في إنشاء الفهارس

    طرق العرض (المستمرة أو الافتراضية) التي ستساعد المستخدم عند إجراء عمليات تجميع البيانات أو التصفية.

بالإضافة إلى رئيس مجلس الإدارة والسكرتير والمستخدمين ، يجب أن يشارك مصمم النماذج ومسؤول قاعدة البيانات ومهندس قاعدة البيانات في جلسة متطلبات الاستخدام. يجب مناقشة متطلبات البيانات التاريخية للمستخدم. لطول الوقت الذي يتم فيه الاحتفاظ بالبيانات تأثير كبير على حجم قاعدة البيانات. في كثير من الأحيان ، يتم تخزين البيانات القديمة في نموذج عام ، ويتم أرشفة البيانات الذرية أو حذفها.

يجب على المستخدمين إحضار أمثلة للطلبات والتقارير معهم إلى الجلسة. يجب أن تكون التقارير محددة بدقة ويجب أن تتضمن القيم الذرية المستخدمة في أي حقول ملخص أو ملخص.

مكونات نموذج البيانات المادية

مكونات نموذج البيانات الفعلي هي الجداول والأعمدة والعلاقات. من المحتمل أن تصبح كيانات النموذج المنطقي جداول في النموذج المادي. تصبح السمات المنطقية أعمدة. ستصبح العلاقات المنطقية قيودًا على سلامة العلاقات. لا يمكن تنفيذ بعض العلاقات المنطقية في قاعدة بيانات فعلية.

الهندسة العكسية

عندما لا يتوفر نموذج منطقي ، يصبح من الضروري إعادة إنشاء النموذج من قاعدة البيانات الحالية. في إروين ، تسمى هذه العملية الهندسة العكسية. يمكن إجراء الهندسة العكسية بعدة طرق. يمكن للمصمم استكشاف هياكل البيانات في قاعدة البيانات وإعادة إنشاء الجداول في بيئة النمذجة المرئية. يمكنك استيراد لغة تعريفات البيانات (DDL) إلى أداة تدعم الهندسة العكسية (مثل Erwin). تتضمن الأدوات المتقدمة مثل ERwin وظائف توفر اتصال ODBC بقاعدة بيانات موجودة لإنشاء نموذج عن طريق قراءة هياكل البيانات مباشرة. ستتم مناقشة الهندسة العكسية مع ERwin بالتفصيل في منشور مستقبلي.

استخدام الحدود الوظيفية للشركة

عند بناء نموذج منطقي لمصمم عارض ، من المهم التأكد من أن النموذج الجديد متسق مع نموذج الشركة. يعني استخدام الحدود الوظيفية للشركة نمذجة البيانات من حيث المصطلحات المستخدمة داخل الشركة. تتغير طريقة استخدام البيانات في الشركة بشكل أسرع من البيانات نفسها. في كل نموذج منطقي ، يجب تقديم البيانات بطريقة شاملة ، بغض النظر عن مجال الأعمال الذي تدعمه. يجب أن تحدد الكيانات والسمات والعلاقات قواعد العمل على مستوى الشركة.

ملاحظة يشير بعض زملائي إلى هذه الحدود الوظيفية للشركات كنمذجة في العالم الحقيقي. تشجع النمذجة الواقعية المصمم على عرض المعلومات من حيث العلاقات والعلاقات المتأصلة بالفعل.

يوفر استخدام الحدود الوظيفية للشركة لنموذج البيانات الذي تم إنشاؤه بشكل مناسب الأساس لدعم احتياجات المعلومات لأي عدد من العمليات والتطبيقات ، مما يمكّن الشركة من استغلال أكثر أصولها قيمة - المعلومات.

ما هو نموذج بيانات المؤسسة؟

نموذج بيانات المؤسسة (EDM)يحتوي على الكيانات والسمات والعلاقات التي تمثل احتياجات المعلومات للشركة. عادةً ما يتم تصنيف EDM وفقًا لمجالات الموضوعات ، والتي تمثل مجموعات من الكيانات ذات الصلة بدعم احتياجات العمل المحددة. قد تغطي بعض المجالات الموضوعية وظائف عمل محددة مثل إدارة العقود ، في حين أن البعض الآخر قد يشمل الكيانات التي تصف المنتجات أو الخدمات.

يجب أن يتوافق كل نموذج منطقي مع المجال الحالي لنموذج بيانات الشركة. إذا كان النموذج المنطقي لا يلبي هذا المطلب ، فيجب إضافة نموذج المجال إليه. تضمن هذه المقارنة أن نموذج الشركة قد تم تحسينه أو تعديله وأن جميع جهود النمذجة المنطقية يتم تنسيقها داخل الشركة.

EDMيتضمن أيضًا كيانات محددة تحدد نطاق القيم للسمات الرئيسية. هذه الكيانات ليس لها آباء ويتم تعريفها على أنها مستقلة. غالبًا ما تستخدم الكيانات المستقلة للحفاظ على سلامة العلاقات. يتم تحديد هذه الكيانات بواسطة عدة أسماء مختلفة مثل جداول الرموز أو الجداول المرجعية أو جداول النوع أو جداول التصنيف. سوف نستخدم مصطلح "كائن أعمال الشركة". كائن أعمال المؤسسة هو كيان يحتوي على مجموعة من قيم السمات المستقلة عن أي كيان آخر. يجب استخدام كائنات أعمال الشركات باستمرار داخل الشركة.

بناء نموذج بيانات الشركة من خلال الزيادة

هناك منظمات تم فيها بناء نموذج الشركة من البداية إلى النهاية نتيجة جهد واحد منسق. من ناحية أخرى ، تبني معظم المؤسسات نماذج مؤسسية كاملة إلى حد ما من خلال التوسع.

البناء يعني بناء شيء بالتسلسل ، طبقة تلو الأخرى ، تمامًا كما ينمو المحار لؤلؤة. يوفر كل نموذج بيانات تم إنشاؤه مساهمة في تشكيل EDM. يتطلب بناء EDM بهذه الطريقة خطوات نمذجة إضافية لإضافة هياكل ومجالات بيانات جديدة أو زيادة هياكل البيانات الموجودة. هذا يجعل من الممكن بناء نموذج بيانات المؤسسة عن طريق زيادة مستويات التفاصيل والتحسين بشكل متكرر.

مفهوم منهجية النمذجة

هناك العديد من منهجيات نمذجة البيانات المرئية. يدعم ERwin اثنين:

    IDEF1X (تعريف التكامل لنمذجة المعلومات - وصف متكامل لنماذج المعلومات).

    IE (هندسة المعلومات).

IDEF1X هي منهجية جيدة واستخدام تدوينها واسع الانتشار

وصف متكامل لنماذج المعلومات

IDEF1X عبارة عن منهجية عالية التنظيم لنمذجة البيانات تعمل على توسيع منهجية IDEF1 المعتمدة كمعيار FIPS (معايير معالجة المعلومات الفيدرالية). يستخدم IDEF1X مجموعة شديدة التنظيم من أنواع إنشاءات النمذجة والنتائج في نموذج بيانات يتطلب فهم الطبيعة المادية للبيانات قبل إتاحة هذه المعلومات.

يجبر الهيكل الصلب لـ IDEF1X المصمم على تعيين خصائص للكيانات التي قد لا تتوافق مع حقائق العالم المحيط. على سبيل المثال ، يتطلب IDEF1X أن تكون جميع الأنواع الفرعية للكيانات حصرية. هذا يؤدي إلى حقيقة أن الشخص لا يمكن أن يكون عميلًا وموظفًا في نفس الوقت. بينما تخبرنا الممارسة الحقيقية بشكل مختلف.

هندسة المعلومات

غالبًا ما يشار إلى كليف فنكلستين على أنه أب هندسة المعلومات ، على الرغم من مشاركة مفاهيم مماثلة معه بواسطة جيمس مارتن (مارتن ، جيمس. إدارة بيئة قاعدة البيانات. نهر السرج العلوي ، نيو جيرسي: برنتيس هول ، 1983.). تستخدم هندسة المعلومات نهجًا مدفوعًا بالأعمال لإدارة المعلومات وتستخدم ترميزًا مختلفًا لتمثيل قواعد العمل. يعمل IE كامتداد وتطوير للتدوين والمفاهيم الأساسية لمنهجية التقارير الإلكترونية التي اقترحها بيتر تشين.

يوفر IE البنية التحتية لدعم متطلبات المعلومات من خلال دمج التخطيط الاستراتيجي المؤسسي مع أنظمة المعلومات التي يتم تطويرها. يسمح هذا التكامل لإدارة موارد المعلومات بأن تكون أكثر توافقاً مع الآفاق الإستراتيجية طويلة المدى للشركة. أدى هذا النهج القائم على الأعمال إلى قيام العديد من المصممين باختيار IE على المنهجيات الأخرى التي تميل إلى التركيز على تحديات التنمية قصيرة المدى.

يقترح IE سلسلة من الإجراءات التي تقود الشركة إلى تحديد جميع احتياجاتها من المعلومات لجمع البيانات وإدارتها وتحديد العلاقات بين كائنات المعلومات. ونتيجة لذلك ، يتم توضيح متطلبات المعلومات بوضوح بناءً على توجيهات الإدارة ويمكن ترجمتها مباشرةً إلى نظام معلومات إداري يدعم احتياجات المعلومات الاستراتيجية.

استنتاج

إن فهم كيفية استخدام أداة نمذجة البيانات مثل ERwin ليس سوى جزء من المشكلة. بالإضافة إلى ذلك ، يجب أن تفهم متى يتم حل مهام نمذجة البيانات وكيف يتم تجميع متطلبات المعلومات وقواعد العمل التي يجب تمثيلها في نموذج البيانات. يوفر إجراء جلسات العمل البيئة الأكثر ملاءمة لجمع متطلبات المعلومات في بيئة تشمل خبراء المجال والمستخدمين والمتخصصين في تكنولوجيا المعلومات.

يتطلب بناء نموذج بيانات جيد تحليل وبحث متطلبات المعلومات وقواعد العمل التي تم جمعها من خلال جلسات العمل والمقابلات. يجب مقارنة نموذج البيانات الناتج مع نموذج المؤسسة ، إن أمكن ، للتأكد من أنه لا يتعارض مع نماذج الكائن الحالية ويتضمن جميع الكائنات المطلوبة.

يتكون نموذج البيانات من نماذج منطقية ومادية تمثل متطلبات المعلومات وقواعد العمل. يجب تقليل النموذج المنطقي إلى النموذج العادي الثالث. يقوم النموذج العادي الثالث بتقييد وإضافة وتحديث وإزالة الانحرافات في بنية البيانات لدعم مبدأ "حقيقة واحدة في مكان واحد". يجب تحليل وبحث متطلبات المعلومات التي تم جمعها وقواعد العمل. يجب مقارنتها بنموذج المؤسسة لضمان عدم تعارضها مع نماذج الكائن الحالية وتضمين جميع الكائنات المطلوبة.

في ERwin ، يتضمن نموذج البيانات كلا من النماذج المنطقية والفيزيائية. يطبق ERwin نهج التقارير الإلكترونية ويسمح لك بإنشاء كائنات نموذج منطقي ومادي لتمثيل متطلبات المعلومات وقواعد العمل. تتضمن كائنات النموذج المنطقي الكيانات والسمات والعلاقات. تتضمن كائنات النموذج المادي الجداول والأعمدة والقيود على تكامل العلاقات.

سيغطي أحد المنشورات التالية قضايا تحديد الكيانات ، وتعريف أنواع الكيانات ، واختيار أسماء الكيانات والأوصاف ، بالإضافة إلى بعض الأساليب لتجنب أخطاء النمذجة الأكثر شيوعًا المرتبطة باستخدام الكيانات.

يجب أن يكون للكيانات مجموعة كاملة من السمات ، بحيث يمكن تمثيل كل حقيقة عن كل كيان بسماته. يجب أن يكون لكل سمة اسم يعكس معناها ونوع بيانات منطقية ووصف أو تعريف واضح وقصير وكامل. في منشور مدونة مستقبلي ، سننظر في مجموعة أولية من الإرشادات للتنسيق الصحيح لأسماء السمات والأوصاف. يجب أن تتضمن العلاقات بناء الفعل الذي يصف العلاقة بين الكيانات ، إلى جانب خصائص مثل التعددية وضرورة الوجود أو احتمال عدم وجود علاقة.

ملاحظة تعدد العلاقة تصف الحد الأقصى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل الكيان الأصلي.ضرورة الوجود أو احتمالية الغياب تعمل العلاقة على تحديد الحد الأدنى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل من الأصل

على نحو متزايد ، يوجه متخصصو تكنولوجيا المعلومات انتباههم إلى حلول إدارة البيانات استنادًا إلى نماذج بيانات الصناعة القياسية وقوالب قرارات الأعمال. تسمح لك نماذج البيانات المادية المعقدة الجاهزة للتنزيل وتقارير ذكاء الأعمال لمجالات نشاط معينة بتوحيد عنصر المعلومات للمؤسسة وتسريع تنفيذ العمليات التجارية بشكل كبير. تُمكِّن قوالب الحلول موفري الخدمات من الاستفادة من قوة المعلومات غير القياسية المخفية في الأنظمة الحالية ، وبالتالي تقليل المهل الزمنية للمشروع والتكاليف والمخاطر. على سبيل المثال ، تُظهر مشاريع العالم الحقيقي أن نماذج البيانات وقوالب قرارات الأعمال يمكن أن تقلل من جهود التطوير بنسبة 50٪.

النموذج المنطقي للصناعة هو عرض خاص بالمجال ومتكامل ومنظم منطقيًا لجميع المعلومات التي يجب أن تكون موجودة في مستودع بيانات المؤسسة للإجابة على أسئلة العمل الاستراتيجية والتكتيكية. الغرض الرئيسي من النماذج هو تسهيل التوجيه في مساحة البيانات والمساعدة في إبراز التفاصيل المهمة لتطوير الأعمال. في الظروف الحديثة ، من أجل عمل تجاري ناجح ، من الضروري أن يكون لديك فهم واضح للروابط بين المكونات المختلفة وأن يكون لديك فكرة جيدة عن الصورة العامة للمؤسسة. يتيح تحديد جميع التفاصيل والعلاقات باستخدام النماذج الاستخدام الأكثر كفاءة للوقت والأدوات لتنظيم عمل الشركة.

نماذج البيانات هي نماذج مجردة تصف كيفية تقديم البيانات والوصول إليها. تحدد نماذج البيانات عناصر البيانات والعلاقات بينها في منطقة معينة. نموذج البيانات هو أداة تنقل لكل من محترفي الأعمال وتكنولوجيا المعلومات يستخدم مجموعة محددة من الرموز والكلمات لشرح فئة معينة من معلومات العالم الحقيقي بدقة. هذا يسمح بتواصل أفضل داخل المنظمة وبالتالي يخلق بيئة تطبيق أكثر مرونة واستقرارًا.


مثال على نموذج "نظم المعلومات الجغرافية للحكومة والحكومة المحلية".

اليوم ، من المهم استراتيجيًا لمقدمي البرامج والخدمات أن يكونوا قادرين على الاستجابة بسرعة للتغيرات في الصناعة المرتبطة بالابتكارات التكنولوجية ، وإزالة القيود الحكومية وتعقيد سلاسل التوريد. إلى جانب التغييرات في نموذج الأعمال ، يزداد تعقيد وتكلفة تكنولوجيا المعلومات المطلوبة لدعم عمليات الشركة. تعتبر إدارة البيانات صعبة بشكل خاص في بيئة تتغير فيها أنظمة معلومات الشركات ، فضلاً عن المتطلبات الوظيفية والتجارية لها ، باستمرار.

تهدف نماذج بيانات الصناعة إلى المساعدة في تسهيل هذه العملية وتحسينها ، في نقل نهج تكنولوجيا المعلومات إلى المستوى الحديث.

نماذج بيانات الصناعة من الشركةEsri

نماذج بيانات Esri ArcGIS هي قوالب عاملة للاستخدام في مشاريع GIS ولإنشاء هياكل بيانات لمناطق تطبيق مختلفة. يتضمن بناء نموذج البيانات إنشاء تصميم مفاهيمي ، وبنية منطقية ومادية ، والتي يمكن استخدامها بعد ذلك لبناء قاعدة بيانات جغرافية شخصية أو مؤسسية. يوفر ArcGIS أدوات لإنشاء مخطط قاعدة البيانات وإدارتها ، ويتم استخدام قوالب نماذج البيانات لبدء تشغيل مشروع GIS بسرعة عبر مجموعة متنوعة من التطبيقات والصناعات. قضت Esri وقتًا طويلاً مع مجتمع المستخدمين لتطوير مجموعة من القوالب التي يمكن أن توفر بداية سريعة لتصميم قاعدة بيانات جغرافية للمؤسسة. هذه المشاريع موصوفة وموثقة على support.esri.com/datamodels. يوجد أدناه ، بالترتيب الذي تظهر به على هذا الموقع ، ترجمة دلالية لأسماء نماذج صناعة Esri:

  • سجل العنوان
  • الزراعة
  • علم الارصاد الجوية
  • البيانات المكانية الأساسية
  • التنوع البيولوجي
  • المساحة الداخلية للمباني
  • محاسبة غازات الاحتباس الحراري
  • الحفاظ على الحدود الإدارية
  • مؤسسة عسكرية. خدمة ذكية
  • الطاقة (بما في ذلك بروتوكول ArcGIS MultiSpeak الجديد)
  • الهياكل البيئية
  • وزارة حالات الطوارئ. كتيبة الإطفاء
  • جرد الغابات
  • الحراجة
  • جيولوجيا
  • المستوى الوطني GIS (الحكومة الإلكترونية)
  • المياه الجوفية ومياه الصرف الصحي
  • الرعاىة الصحية
  • علم الآثار والحفاظ على المواقع التذكارية
  • الأمن القومي
  • الهيدرولوجيا
  • المنظمة الهيدروغرافية الدولية (IHO). تنسيق S-57 لـ ENC
  • الري
  • تسجيل الأرض
  • حكومة البلدية
  • الملاحة البحرية
  • السجل العقاري للدولة
  • هياكل النفط والغاز
  • خطوط الأنابيب
  • تخزين البيانات النقطية
  • قياس الأعماق ، وتخفيف قاع البحر
  • الإتصالات
  • المواصلات
  • إمدادات المياه والصرف الصحي والإسكان والخدمات المجتمعية

تحتوي هذه النماذج على جميع الميزات الضرورية لمعيار الصناعة ، وهي:

  • متاحة مجانًا ؛
  • غير مرتبطة بتكنولوجيا الشركة المصنعة "المختارة" ؛
  • تم إنشاؤه نتيجة لتنفيذ مشاريع حقيقية ؛
  • تم إنشاؤه بمشاركة خبراء الصناعة ؛
  • مصممة لتوفير تفاعل المعلومات بين مختلف المنتجات والتقنيات ؛
  • لا تتعارض مع المعايير واللوائح الأخرى ؛
  • تستخدم في المشاريع المنجزة في جميع أنحاء العالم ؛
  • مصممة للعمل مع المعلومات طوال دورة الحياة الكاملة للنظام الذي يتم إنشاؤه ، وليس المشروع نفسه ؛
  • قابلة للتوسيع وفقًا لاحتياجات العميل دون فقدان التوافق مع المشاريع و / أو النماذج الأخرى ؛
  • مصحوبة بمواد وأمثلة إضافية ؛
  • تستخدم في المبادئ التوجيهية والمواد التقنية لمختلف الشركات الصناعية ؛
  • مجتمع كبير من المشاركين ، في حين أن الوصول إلى المجتمع مفتوح للجميع ؛
  • عدد كبير من الإشارات إلى نماذج البيانات في المنشورات في السنوات الأخيرة.

تعد Esri جزءًا من مجموعة خبراء من الهيئات المستقلة التي توصي بنماذج صناعية مختلفة ، مثل PODS (معايير البيانات المفتوحة لخط الأنابيب - معيار مفتوح لصناعة النفط والغاز ؛ يتم حاليًا تنفيذ PODS كقاعدة بيانات جغرافية Esri PODS Esri Spatial 5.1.1 ) أو قاعدة بيانات جغرافية (قاعدة بيانات جغرافية) من ArcGIS for Aviation ، والتي تأخذ في الاعتبار توصيات ICAO و FAA ، بالإضافة إلى معيار تبادل بيانات الملاحة AIXM 5.0. بالإضافة إلى ذلك ، هناك نماذج موصى بها تلتزم بشكل صارم بمعايير الصناعة الحالية ، مثل S-57 و ArcGIS for Maritime (الميزات البحرية والساحلية) ، بالإضافة إلى النماذج التي تم إنشاؤها من العمل الذي تؤديه Esri Professional Services وهي معايير فعلية في المنطقة المقابلة. على سبيل المثال ، أثرت نظم المعلومات الجغرافية للأمة والحكومة المحلية على معايير NSDI و INSPIRE ، وتستخدم المياه الجوفية والمياه الجوفية (الهيدرولوجيا والمياه الجوفية) بكثافة في مجموعة ArcHydro الاحترافية المتاحة مجانًا والمنتجات التجارية. وتجدر الإشارة إلى أن Esri تدعم أيضًا المعايير الواقعية مثل NHDI. جميع نماذج البيانات المقترحة موثقة وجاهزة للاستخدام في عمليات تكنولوجيا المعلومات في المؤسسة. تشمل المواد المصاحبة للنماذج ما يلي:

  • مخططات UML لعلاقات الكيانات ؛
  • هياكل البيانات والمجالات والأدلة ؛
  • قوالب قاعدة البيانات الجغرافية الجاهزة بتنسيق ArcGIS GDB ؛
  • بيانات العينة وتطبيقات العينة ؛
  • أمثلة على نصوص تحميل البيانات ، أمثلة على أدوات التحليل المساعدة ؛
  • كتب مرجعية حول هيكل البيانات المقترح.

تجمع Esri خبرتها في بناء نماذج الصناعة في شكل كتب وتوطين المواد المنشورة. تم ترجمة الكتب التالية ونشرها بواسطة Esri CIS:

  • العمارة الموجهة للخدمات الجغرافية المكانية (SOA) ؛
  • تصميم قواعد جغرافية للنقل ؛
  • نظم المعلومات الجغرافية للشركات ؛
  • نظم المعلومات الجغرافية: طاقة جديدة لشركات الكهرباء والغاز ؛
  • النفط والغاز على خريطة رقمية ؛
  • نمذجة عالمنا. دليل تصميم قاعدة البيانات الجغرافية Esri ؛
  • التفكير في نظم المعلومات الجغرافية. تخطيط نظم المعلومات الجغرافية: دليل للمديرين.
  • نظم المعلومات الجغرافية. الأساسيات
  • نظم المعلومات الجغرافية للإدارة الإدارية والاقتصادية؛
  • نظم المعلومات الجغرافية على شبكة الإنترنت. المبادئ والتطبيقات ؛
  • استراتيجيات تصميم النظم ، الإصدار السادس والعشرون ؛
  • 68 عددًا من مجلة ArcReview مع منشورات الشركات ومستخدمي أنظمة GIS ؛
  • ... والعديد من المذكرات والمنشورات الموضوعية الأخرى.

على سبيل المثال ، الكتاب " نمذجة عالمنا ..."(الترجمة) هي دليل ومرجع شامل لنمذجة بيانات نظم المعلومات الجغرافية بشكل عام ، ونموذج بيانات قاعدة البيانات الجغرافية على وجه الخصوص. يوضح الكتاب كيفية التوصل إلى قرارات نمذجة البيانات الصحيحة ، والقرارات التي تشارك في كل جانب من جوانب مشروع نظم المعلومات الجغرافية ، من تصميم قاعدة البيانات إلى جمع البيانات والبيانات إلى التحليل المكاني والتصور يصف بالتفصيل كيفية تصميم قاعدة بيانات جغرافية مناسبة لمشروع ما ، وتكوين وظيفة قاعدة البيانات بدون برمجة ، وإدارة سير العمل في المشاريع المعقدة ، ونمذجة مجموعة متنوعة من هياكل الشبكة مثل النهر والنقل أو الشبكات الكهربائية ، ودمج صور الأقمار الصناعية في عملية التحليل والعرض الجغرافيين ، وإنشاء نماذج ثلاثية الأبعاد لبيانات نظم المعلومات الجغرافية. كتاب " تصميم قواعد جغرافية للنقل"يحتوي على مناهج منهجية تم اختبارها على عدد كبير من المشاريع وتتوافق تمامًا مع المتطلبات التشريعية لأوروبا والولايات المتحدة ، بالإضافة إلى المعايير الدولية. وفي الكتاب" نظم المعلومات الجغرافية: طاقة جديدة لمحطات الكهرباء والغاز"باستخدام أمثلة من العالم الواقعي ، فإنه يُظهر الفوائد التي يمكن أن توفرها نظم المعلومات الجغرافية للشركات لموردي الطاقة ، بما في ذلك جوانب مثل خدمة العملاء وعمليات الشبكة والعمليات التجارية الأخرى.


بعض الكتب ، مترجمة وأصلية ، نُشرت باللغة الروسية عن طريق Esri CIS و DATA +. أنها تتناول كلا من القضايا المفاهيمية المتعلقة بتكنولوجيا نظم المعلومات الجغرافية والعديد من الجوانب التطبيقية لنمذجة ونشر نظم المعلومات الجغرافية من مختلف الأحجام والأغراض.

سننظر في تطبيق نماذج الصناعة باستخدام مثال BISDM (نموذج بيانات الفضاء الداخلي للمبنى ، نموذج معلومات المساحة الداخلية للمبنى) الإصدار 3.0. BISDM هو تطوير لنموذج BIM (نموذج معلومات البناء) الأكثر عمومية وهو مخصص للاستخدام في تصميم وبناء وتشغيل وإيقاف تشغيل المباني والهياكل. تُستخدم في برامج نظم المعلومات الجغرافية ، فهي تتيح لك تبادل البيانات الجغرافية بكفاءة مع الأنظمة الأساسية الأخرى والتفاعل معها. يشير إلى المجموعة العامة لمهام FM (إدارة البنية التحتية للمؤسسة). دعنا ندرج المزايا الرئيسية لنموذج BISDM ، والذي يسمح استخدامه بما يلي:

  • تنظيم تبادل المعلومات في بيئة غير متجانسة وفقًا لقواعد موحدة ؛
  • الحصول على تجسيد "مادي" لمفهوم BIM والقواعد الموصى بها لإدارة مشروع البناء ؛
  • الاحتفاظ عن طريق نظام المعلومات الجغرافية بمستودع واحد طوال دورة الحياة الكاملة للمبنى (من التصميم إلى إيقاف التشغيل) ؛
  • تنسيق عمل مختلف المتخصصين في المشروع ؛
  • تصور الجدول الزمني المخطط ومراحل البناء لجميع المشاركين ؛
  • إعطاء تقدير أولي للتكلفة ووقت البناء (بيانات 4D و 5 D) ؛
  • مراقبة تقدم المشروع ؛
  • ضمان تشغيل المبنى بجودة عالية ، بما في ذلك الصيانة والإصلاحات ؛
  • أن تصبح جزءًا من نظام إدارة الأصول ، بما في ذلك وظائف تحليل كفاءة استخدام المساحة (التأجير ، المستودعات ، إدارة الموظفين) ؛
  • حساب وإدارة أهداف كفاءة الطاقة للمبنى ؛
  • محاكاة حركة التدفقات البشرية.

يحدد BISDM قواعد العمل مع البيانات المكانية على مستوى المباني الداخلية في المبنى ، بما في ذلك الغرض والاستخدامات ، والاتصالات الموضوعة ، والمعدات المثبتة ، والمحاسبة عن الإصلاحات والصيانة ، وحوادث التسجيل ، والعلاقات مع أصول الشركة الأخرى. يساعد النموذج في إنشاء مستودع موحد للبيانات الجغرافية وغير الجغرافية. تم استخدام تجربة الشركات الرائدة في العالم لعزل الكيانات والنماذج على مستوى قاعدة البيانات الجغرافية (قاعدة البيانات الجغرافية) للعلاقات المكانية والمنطقية لجميع العناصر المادية التي تشكل المبنى نفسه ومبانيه الداخلية. يمكن أن يؤدي اتباع مبادئ BISDM إلى تبسيط مهام التكامل مع الأنظمة الأخرى بشكل كبير. عادة ما تكون المرحلة الأولى هي تكامل CAD. ثم ، أثناء تشغيل المبنى ، يتم استخدام تبادل البيانات مع أنظمة ERP و EAM (SAP ، TRIRIGA ، Maximo ، إلخ).


تصور عناصر BISDM الهيكلية باستخدام ArcGIS.

في حالة استخدام BISDM ، يتلقى العميل / مالك المنشأة تبادلًا شاملاً للمعلومات من فكرة إنشاء كائن إلى تطوير مشروع كامل ، والتحكم في البناء مع الحصول على المعلومات ذات الصلة من قبل الوقت الذي يتم فيه تشغيل المرفق ، والتحكم في المعلمات أثناء التشغيل ، وحتى أثناء إعادة بناء أو إيقاف تشغيل المنشأة. باتباع نموذج BISDM ، تصبح GIS وقاعدة البيانات الجغرافية التي تم إنشاؤها بمساعدتها مستودع بيانات مشترك للأنظمة ذات الصلة. غالبًا ما يحتوي GDB على بيانات تم إنشاؤها وتشغيلها بواسطة أنظمة تابعة لجهات خارجية. يجب أن يؤخذ ذلك في الاعتبار عند تصميم بنية النظام الذي يتم إنشاؤه.

في مرحلة معينة ، تسمح لك "الكتلة الحرجة" المتراكمة من المعلومات بالانتقال إلى مستوى جودة جديد. على سبيل المثال ، عند الانتهاء من مرحلة التصميم لمبنى جديد ، من الممكن تصور نماذج المسح ثلاثية الأبعاد تلقائيًا في نظام المعلومات الجغرافية ، وتجميع قائمة بالمعدات المثبتة ، وحساب الأميال التي سيتم توفيرها للمرافق ، وإجراء عدد من عمليات الفحص وحتى إعطاء تقدير مالي أولي لتكلفة المشروع.

مرة أخرى ، نلاحظ أنه عند استخدام BISDM و ArcGIS معًا ، يصبح من الممكن إنشاء نماذج ثلاثية الأبعاد تلقائيًا من البيانات المتراكمة ، نظرًا لأن قاعدة البيانات الجغرافية تحتوي على وصف كامل للكائن ، بما في ذلك الإحداثيات z ، وعضوية الطابق ، وأنواع اتصالات العنصر ، وطرق تركيب المعدات ، والمواد ، وحركة المسارات المتاحة للأفراد ، والغرض الوظيفي لكل عنصر ، إلخ. إلخ. وتجدر الإشارة إلى أنه بعد الاستيراد الأولي لجميع مواد التصميم إلى BISDM GDB ، هناك حاجة لمحتوى معلومات إضافي من أجل:

  • وضع نماذج ثلاثية الأبعاد للأشياء والمعدات في أماكن مخصصة ؛
  • جمع المعلومات حول تكلفة المواد وإجراءات وضعها وتركيبها ؛
  • التحكم في النفاذية وفقًا لأبعاد المعدات غير القياسية المثبتة.

نظرًا لاستخدام ArcGIS ، فمن الأسهل استيراد كائنات ومراجع ثلاثية الأبعاد إضافية من مصادر خارجية ، لأن تتيح لك إمكانية التشغيل التفاعلي للبيانات ArcGIS إنشاء إجراءات لاستيراد مثل هذه البيانات ووضعها بشكل صحيح داخل النموذج. يتم دعم جميع التنسيقات المستخدمة في الصناعة ، بما في ذلك IFC و AutoCAD Revit و Bentlye Microstation.

نماذج بيانات الصناعة من شركة IBM

توفر شركة IBM مجموعة من أدوات ونماذج إدارة التخزين لمجموعة متنوعة من مجالات العمل:

  • مستودع بيانات IBM Banking and Financial Markets (المالية)
  • مستودع بيانات IBM Banking
  • نماذج الخدمات والعمليات المصرفية لشركة IBM
  • نموذج بيانات IBM Health Plan (الرعاية الصحية)
  • مستودع معلومات التأمين لشركة IBM (التأمين)
  • عمليات التأمين ونماذج الخدمة لشركة IBM
  • مستودع بيانات التجزئة لشركة IBM (البيع بالتجزئة)
  • مستودع بيانات اتصالات IBM (اتصالات)
  • حزمة مستودع InfoSphere:
    - من أجل رؤية العميل (لفهم العملاء)
    - رؤى السوق والحملة (لفهم الشركة والسوق)
    - لـ Supply Chain Insight (لفهم الموردين).

على سبيل المثال ، النموذج آي بي إمالخدمات المصرفيةوالأمور الماليةالأسواقالبياناتمستودعتم تصميمه لمعالجة المشاكل المحددة للصناعة المصرفية من حيث البيانات ، و آي بي إمالخدمات المصرفيةمعالجةوخدمةعارضات ازياء- من حيث العمليات و SOA (الهندسة المعمارية الموجهة للخدمة). بالنسبة لصناعة الاتصالات ، يتم تقديم النماذج آي بي إممعلومةإطار العمل (IFW)و آي بي إمالإتصالاتالبياناتمستودع (TDW)... إنها تساعد على تسريع عملية إنشاء أنظمة تحليلية بشكل كبير ، فضلاً عن تقليل المخاطر المرتبطة بتطوير تطبيقات ذكاء الأعمال وإدارة بيانات الشركات وتنظيم مستودعات البيانات ، مع مراعاة خصوصيات صناعة الاتصالات. تغطي قدرات IBM TDW النطاق الكامل لسوق الاتصالات السلكية واللاسلكية - من مزودي الإنترنت ومشغلي شبكات الكابلات الذين يقدمون خدمات الاتصالات الهاتفية السلكية واللاسلكية ونقل البيانات ومحتوى الوسائط المتعددة ، إلى الشركات متعددة الجنسيات التي تقدم خدمات الهاتف والأقمار الصناعية والاتصالات بعيدة المدى والدولية ، مثل وكذلك المنظمات والشبكات العالمية. يتم استخدام TDW اليوم من قبل مقدمي الخدمات السلكية واللاسلكية الكبيرة والصغيرة حول العالم.

أداة تسمى حزمة مستودع InfoSphere لـ Customer Insightيوفر محتوى أعمال منظم وسهل النشر لعدد متزايد من المشاريع والصناعات التجارية ، بما في ذلك البنوك والتأمين والتمويل والتأمين الصحي والاتصالات والبيع بالتجزئة والتوزيع. لمستخدمي الأعمال حزمة مستودع InfoSphere لإحصاءات السوق والحملةيساعد على زيادة كفاءة أنشطة تحليل السوق والحملات التسويقية من خلال عملية تدريجية لتطوير ومراعاة خصوصيات الأعمال. باستخدام حزمة مستودع InfoSphere لـ Supply Chain Insightالمنظمات لديها القدرة على تلقي المعلومات الحالية عن عمليات سلسلة التوريد.


موقع Esri داخل بنية حلول IBM.

وتجدر الإشارة بشكل خاص إلى نهج IBM في المرافق والمرافق. لتلبية الطلبات المتزايدة للمستهلكين ، تحتاج المرافق إلى بنية أكثر مرونة من تلك المستخدمة اليوم ، بالإضافة إلى نموذج كائن قياسي في الصناعة لتسهيل التدفق الحر للمعلومات. سيؤدي ذلك إلى زيادة قدرات الاتصال للمرافق من خلال تمكين إمكانية التشغيل البيني الأكثر فعالية من حيث التكلفة وتزويد الأنظمة الجديدة برؤية أفضل لجميع الموارد المطلوبة ، بغض النظر عن مكان وجودها داخل المنظمة. أساس هذا النهج هو SOA (الهندسة المعمارية الموجهة للخدمة) ، وهو نموذج مكون يرسم وظائف الإدارات والخدمات للتطبيقات المختلفة التي يمكن إعادة استخدامها. تقوم "خدمات" هذه المكونات بتبادل البيانات من خلال واجهات دون ربط صارم ، مما يخفي عن المستخدم كل تعقيدات الأنظمة التي تقف وراءها. في هذا الوضع ، يمكن للمؤسسات بسهولة إضافة تطبيقات جديدة بغض النظر عن بائع البرنامج أو نظام التشغيل أو لغة البرمجة أو أي خصائص جوهرية أخرى للبرنامج. على أساس الخدمية ، يتم تنفيذ المفهوم آمنة (هندسة الحلول للطاقة) ، فهي تسمح لشركة المرافق بالحصول على نظرة شاملة قائمة على المعايير لبنيتها التحتية.

Esri ArcGIS® هي منصة برمجية معترف بها عالميًا لأنظمة المعلومات الجغرافية (GIS) ، والتي توفر إنشاء وإدارة الأصول الرقمية للطاقة الكهربائية ونقل الغاز والتوزيع وشبكات الاتصالات. يتيح لك ArcGIS إجراء المخزون الأكثر اكتمالاً لمكونات شبكة التوزيع الكهربائي ، مع مراعاة موقعها المكاني. يقوم ArcGIS بتوسيع بنية IBM SAFE بشكل كبير من خلال توفير الأدوات والتطبيقات ومهام سير العمل والتحليلات وإمكانيات تكامل المعلومات اللازمة لإدارة مؤسسة الطاقة الذكية. يسمح لك ArcGIS في إطار عمل IBM SAFE بتلقي معلومات من مصادر مختلفة حول منشآت البنية التحتية والأصول والعملاء والموظفين ببيانات دقيقة حول مواقعهم ، بالإضافة إلى إنشاء وتخزين ومعالجة معلومات مرجعية جغرافية حول أصول المؤسسة (الدعامات وخطوط الأنابيب والأسلاك والمحولات وقنوات الكابلات وما إلى ذلك). ArcGIS داخل البنية التحتية الآمنة بشكل ديناميكي يربط تطبيقات الأعمال الأساسية من خلال دمج البيانات من أنظمة GIS و SCADA وأنظمة خدمة العملاء مع المعلومات الخارجية مثل كثافة حركة المرور أو ظروف الطقس أو صور القمر الصناعي. تستخدم المرافق هذه المعلومات المجمعة لمجموعة متنوعة من الأغراض ، من S.O.R. (الصورة العامة لبيئة التشغيل) لتفتيش الموقع والصيانة وتحليل الشبكة والتخطيط.

يمكن نمذجة مكونات المعلومات لشركة المرافق باستخدام عدة مستويات تتراوح من المستوى الأدنى ، المادي ، إلى الأعلى ، والأكثر تعقيدًا لمنطق الأعمال. يمكن دمج هذه الطبقات لتلبية متطلبات الصناعة النموذجية مثل تسجيل القياس الآلي والتحكم الإشرافي وإدارة الحصول على البيانات (SCADA). من خلال بناء بنية SAFE ، تخطو المرافق خطوات كبيرة في الترويج لنموذج كائن مفتوح على مستوى الصناعة يسمى نموذج المعلومات المشتركة (CIM) للطاقة والمرافق. يوفر هذا النموذج الإطار اللازم لتحريك العديد من المؤسسات نحو بنية موجهة نحو الخدمة حيث يشجع على استخدام المعايير المفتوحة لهيكلة البيانات والأشياء. نظرًا لحقيقة أن جميع الأنظمة تستخدم نفس الكائنات ، سيتم تقليل الارتباك وعدم المرونة المرتبطين بالتطبيقات المختلفة لنفس الكائنات إلى الحد الأدنى. وبالتالي ، سيتم توحيد تعريف كائن العميل وكائنات الأعمال المهمة الأخرى عبر جميع أنظمة شركة الإمداد بالطاقة. الآن ، مع CIM ، يمكن لمقدمي الخدمات ومستهلكي الخدمة مشاركة بنية بيانات مشتركة ، مما يسهل الاستعانة بمصادر خارجية لمكونات الأعمال عالية القيمة حيث ينشئ CIM قاعدة مشتركة لبناء تبادل المعلومات عليها.

استنتاج

توفر نماذج بيانات الصناعة الشاملة للشركات عرضًا واحدًا ومتكاملًا لمعلومات الأعمال الخاصة بهم. تجد العديد من الشركات صعوبة في دمج بياناتها ، على الرغم من أن هذا شرط أساسي لمعظم المشاريع على مستوى المؤسسة. وفقًا لدراسة أجراها معهد تخزين البيانات (TDWI) ، وجدت أكثر من 69٪ من المؤسسات التي شملها الاستطلاع أن التكامل يمثل عائقًا كبيرًا أمام تبني التطبيقات الجديدة. على العكس من ذلك ، فإن تنفيذ تكامل البيانات يجلب للشركة دخلًا ملموسًا ويزيد من الكفاءة.

يحدد النموذج المصمم جيدًا بشكل فريد معنى البيانات ، والتي تكون في هذه الحالة بيانات منظمة (على عكس البيانات غير المنظمة مثل صورة أو ملف ثنائي أو نص ، حيث يمكن أن يكون المعنى غامضًا). الأكثر فعالية هي نماذج الصناعة التي يقدمها البائعون المحترفون مثل Esri و IBM. يتم تحقيق العائد المرتفع على استخدام نماذجهم بسبب المستوى الكبير من التفاصيل والدقة. عادة ما تحتوي على العديد من سمات البيانات. بالإضافة إلى ذلك ، يتمتع كل من Esri و IBM بخبرة واسعة في النمذجة ومتمرسين في بناء نماذج خاصة بالصناعة.


هندسة DB

مخطط KMD هو وصف لهيكل نموذج البيانات من وجهة نظر المسؤول.

مخطط AMD هو وصف لنموذج داخلي أو مادي. هذا هو المكان الذي يتم فيه تخزين وصف الموقع الفعلي للبيانات الموجودة على الوسائط. يخزن المخطط مؤشرات مباشرة لموقع البيانات في الذاكرة (وحدات التخزين والأقراص).

يصف مخطط KMD بنية البيانات والسجلات والحقول.

تدعم جميع نظم إدارة قواعد البيانات ثلاثة أنواع رئيسية من نماذج البيانات:

1. نموذج هرمي. يفترض نوعًا من إدخال الجذر. الفروع تأتي من الجذور.

لم يتم وصف جميع الكائنات بشكل ملائم بهذه الطريقة. لا توجد روابط في التسلسل الهرمي وهناك وفرة كبيرة في المعلومات.

2. نموذج الشبكة. يسمح لك بعرض جميع تعقيدات العلاقات بشكل صحيح.

يعتبر النموذج مناسبًا لتمثيل الروابط مع البيانات من البيئة الخارجية ، ولكنه أقل ملاءمة لوصفه في قاعدة البيانات ، مما يؤدي إلى عمل إضافي للمستخدم لدراسة التنقل من خلال الروابط.

3. النموذج العلائقي. وهو يقوم على المصطلح الرياضي العلاقة - علاقة ، وببساطة - جدول. على سبيل المثال ، مستطيل ثنائي الأبعاد.

تم تطوير بنية البيانات العلائقية في أواخر الستينيات من قبل عدد من الباحثين ، وكان من بين أهم المساهمات التي قدمها الموظف في شركة IBM Edgar Codd. مع النهج العلائقي ، يتم تقديم البيانات في شكل جداول ثنائية الأبعاد - الأكثر طبيعية للبشر. في الوقت نفسه ، من أجل معالجة البيانات ، اقترح Codd استخدام جهاز نظرية المجموعات - الاتحاد ، التقاطع ، الاختلاف ، المنتج الديكارتي.

نوع البيانات- هذا المفهوم له نفس المعنى كما في لغات البرمجة (على سبيل المثال ، يحدد نوع البيانات التمثيل الداخلي في ذاكرة الكمبيوتر وطريقة تخزين مثيل البيانات ، بالإضافة إلى مجموعة القيم التي يمكن لمثيل البيانات استخدامها خذ ومجموعة عمليات البيانات الصحيحة). تدعم جميع قواعد البيانات الحديثة الموجودة أنواع البيانات الخاصة المصممة لتخزين البيانات من نوع العدد الصحيح ، والفاصلة العائمة الكسرية ، والأحرف والسلاسل ، وتواريخ التقويم. العديد من خوادم قواعد البيانات لها أنواع أخرى مطبقة ، على سبيل المثال ، يحتوي خادم Interbase على نوع بيانات خاص لتخزين مصفوفات كبيرة من المعلومات الثنائية (BLOB).

اختصاصهي مجموعة محتملة من القيم لنوع بيانات بسيط ، وهي تشبه نوع بيانات فرعي في بعض لغات البرمجة. يتم تحديد المجال بواسطة عنصرين - نوع البيانات والتعبير المنطقي الذي يتم تطبيقه على البيانات. إذا تم تقييم هذا التعبير إلى صحيح ، فإن مثيل البيانات ينتمي إلى المجال.

سلوكهو جدول ثنائي الأبعاد من نوع خاص ، يتكون من رأس وجسم.

عنوانهي مجموعة ثابتة من السمات ، يتم تعريف كل منها في مجال ما ، وهناك تطابق واحد لواحد بين السمات والمجالات المحددة.


يتم تحديد كل سمة في مجالها الخاص. المجال هو نوع البيانات الصحيح ، والشرط المنطقي هو n> 0. العنوان لم يتغير بمرور الوقت ، على عكس جوهر العلاقة. هيئة العلاقةهي مجموعة مجموعات، كل منها عبارة عن زوج من السمة والقيمة.

قوة العلاقةهو عدد مجموعاتها و درجة الموقف- عدد السمات.

درجة النسبة ثابتة بالنسبة لنسبة معينة ، بينما تتغير قوة النسبة بمرور الوقت. تسمى قوة العلاقة أيضًا بالرقم الأساسي.

المفاهيم المذكورة أعلاه نظرية وتستخدم في تطوير أدوات اللغة وأنظمة برمجيات نظم إدارة قواعد البيانات العلائقية. في العمل اليومي ، يتم استخدام معادلاتها غير الرسمية بدلاً من ذلك:

سلوك - طاولة؛

ينسب - عمود أو حقل ؛

tuple - سجل أو سلسلة.

وبالتالي ، فإن درجة النسبة هي عدد الأعمدة في الجدول ، والرقم الأساسي هو عدد الصفوف.

نظرًا لأن العلاقة هي مجموعة ، وفي نظرية المجموعة الكلاسيكية ، بحكم التعريف ، لا يمكن أن تحتوي المجموعة على عناصر متطابقة ، لا يمكن أن تحتوي العلاقة على مجموعتين متطابقتين. لذلك ، بالنسبة لعلاقة معينة ، هناك دائمًا مجموعة من السمات التي تحدد المجموعة بشكل فريد. تسمى هذه المجموعة من السمات مفتاح.

يجب أن يفي المفتاح بالمتطلبات التالية:

· يجب أن يكون فريدًا ؛

· يجب أن يكون الحد الأدنى ، أي إزالة أي سمة من المفتاح يؤدي إلى انتهاك التفرد.

كقاعدة عامة ، يكون عدد السمات في المفتاح أقل من درجة العلاقة ، ومع ذلك ، كحل أخير ، يمكن أن يحتوي المفتاح على جميع السمات ، نظرًا لأن مجموعة جميع السمات تفي بشرط التفرد. عادة ، العلاقة لها مفاتيح متعددة. من بين جميع مفاتيح العلاقة (وتسمى أيضًا "المفاتيح الممكنة") ، يتم اختيار واحد على أنه المفتاح الأساسي... عند الاختيار المفتاح الأساسييفضل عادة المفتاح الذي يحتوي على أقل عدد من السمات. من غير العملي أيضًا استخدام مفاتيح ذات قيم سلسلة طويلة.

في الممارسة العملية ، غالبًا ما يتم استخدام سمة رقمية خاصة ، صفر تزايدي تلقائي ، كمفتاح أساسي ، يمكن إنشاء قيمته بواسطة المشغل (المشغل هو إجراء خاص يسمى عند إجراء تغييرات على قاعدة البيانات) أو بواسطة الوسائل الخاصة المحددة في محرك DBMS.

المفاهيم الأساسية الموضحة في هذا الفصل ليست خاصة بأي تطبيق معين لقاعدة البيانات ، ولكنها مشتركة بينها جميعًا. وبالتالي ، فإن هذه المفاهيم هي أساس نموذج عام معين ، والذي يسمى نموذج البيانات العلائقية.

أثبت مؤسس النهج العلائقي ، Date أن النموذج العلائقي يتكون من ثلاثة أجزاء:

· الهيكلي؛

· متلاعبة.

· كلي.

في الجزء الهيكلي من النموذج ، يتم إصلاح العلاقات باعتبارها بنية البيانات الوحيدة المستخدمة في النموذج العلائقي.

في جزء المعالجة ، تم إصلاح آليتين أساسيتين لمعالجة القواعد العلائقية - الجبر العلائقي وحساب التفاضل والتكامل.

يُفهم جزء لا يتجزأ على أنه آلية معينة لضمان عدم إتلاف البيانات. يشتمل الجزء المتكامل على متطلبين أساسيين لتكامل قواعد البيانات العلائقية - تكامل الكيان والتكامل المرجعي.

المتطلبات سلامة الكيانهو أن أي مجموعة لأي علاقة يجب أن تكون مميزة عن أي مجموعة أخرى لهذه العلاقة ، أي بمعنى آخر ، يجب أن يكون لأي علاقة مفتاح أساسي. يجب استيفاء هذا المطلب إذا تم استيفاء الخصائص الأساسية للعلاقة.

في لغة معالجة البيانات ، وكذلك في لغة الاستعلام ، يتم تنفيذ جهاز رياضي يسمى جبر العلاقات ، ويتم تحديد الإجراءات التالية:

1. العمليات القياسية: - التقاطع ، - الاتحاد ، \ - الفرق ، X - المنتج الديكارتي.

2. محددة: الإسقاط ، والقيود ، والاتصال ، والانقسام.

أ. اتحاد.

ShD SHM EI NR

R 1 (رقم الجزء ، رقم المادة ، وحدة القياس ، معدل الاستهلاك)

ص 2 (ШД، ШМ، ЕИ، НР)

تحتاج لتجد

يفترض إرفاق المجموعتين R 1 و R 2. في هذه العملية ، يتم الحفاظ على الدرجة ، ويتم تعيين مجموعة النتائج الأساسية

ب. تداخل.

قم بتمييز خطوط المطابقة.

ج. فرق.

التخلص من الصفوف من R 1 التي تتوافق مع R 2.

د. المنتج الديكارتي.

هذا هو المكان الذي يتم فيه تسلسل المجموعات.

كل سطر من مجموعة واحدة يتسلسل مع كل سطر من الآخر.

يتم إعطاء مجموعتين:

المنتج الديكارتي كالتالي:

في هذه الحالة ، فإن الدرجة S تساوي ، و ، أي تحصل على 12 صفًا و 5 أعمدة.

قاعدة بيانات الشركة هي الرابط المركزي لنظام معلومات الشركة وتسمح لك بإنشاء مساحة معلومات واحدة للشركة. قواعد بيانات الشركات


شارك عملك على وسائل التواصل الاجتماعي

إذا لم يناسبك هذا العمل في أسفل الصفحة ، فهناك قائمة بالأعمال المماثلة. يمكنك أيضًا استخدام زر البحث

الموضوع الخامس. قواعد بيانات الشركات

الخامس .1. تنظيم البيانات في أنظمة الشركات. قواعد بيانات الشركات.

الخامس .2. نظم إدارة قواعد البيانات والحلول الهيكلية في أنظمة الشركات.

الخامس .3. تقنيات الإنترنت / الإنترانت وحلول الشركات للوصول إلى قاعدة البيانات.

الخامس .1. تنظيم البيانات في أنظمة الشركات. قواعد بيانات الشركات

قاعدة الشركات البيانات هي الرابط المركزي لنظام معلومات الشركة وتسمح لك بإنشاء مساحة معلومات واحدة للشركة. قواعد بيانات الشركات (الشكل 1.1).

هناك تعريفات مختلفة لقواعد البيانات.

تحت قاعدة البيانات (DB) فهم مجموعة من المعلومات المتصلة منطقيًا بطريقة تؤلف مجموعة واحدة من البيانات المخزنة في أجهزة ذاكرة الكمبيوتر. تعمل هذه المجموعة بمثابة البيانات الأولية للمهام التي تم حلها في عملية تشغيل أنظمة التحكم الآلي وأنظمة معالجة البيانات والمعلومات وأنظمة الحوسبة.

يمكن تلخيص مصطلح قاعدة البيانات كمجموعة من البيانات ذات الصلة منطقيًا والمخصصة للمشاركة.

تحت قاعدة البيانات تُفهم على أنها مجموعة من البيانات المخزنة جنبًا إلى جنب مع الحد الأدنى من التكرار الذي يسمح باستخدامها بالطريقة المثلى لتطبيق واحد أو أكثر.

الغرض من إنشاء قواعد البيانات كأشكال لتخزين البياناتبناء نظام بيانات لا يعتمد على الخوارزميات المعتمدة (البرمجيات) ، والوسائل التقنية المستخدمة ، والموقع المادي للبيانات في الكمبيوتر. تفترض قاعدة البيانات استخدامًا متعدد الأغراض (عدة مستخدمين والعديد من أشكال المستندات وطلبات مستخدم واحد).

المتطلبات الأساسية لقواعد البيانات:

  • اكتمال عرض البيانات. ينبغي أن تمثل البيانات الموجودة في قاعدة البيانات بشكل كافٍ جميع المعلومات المتعلقة بالشيء وأن تكون كافية لنظام الوثائق الرسمية.
  • تكامل قاعدة البيانات. يجب حفظ البيانات عند معالجة المواد المستنفدة للأوزون الخاصة بهم وفي أي مواقف تظهر أثناء العمل.
  • مرونة هيكل البيانات. يجب أن تسمح قاعدة البيانات بتغيير هياكل البيانات دون انتهاك سلامتها واكتمالها عندما تتغير الظروف الخارجية.
  • جدوى. هذا يعني أنه يجب أن يكون هناك تمثيل موضوعي للكائنات المختلفة وخصائصها وعلاقاتها.
  • التوفر. من الضروري توفير تحديد الوصول إلى البيانات.
  • وفرة. يجب أن تحتوي قاعدة البيانات على حد أدنى من التكرار في تمثيل البيانات حول أي كائن.

المعرفة تعني مجموعة من الحقائق والأنماط والقواعد الإرشادية التي يمكن استخدامها لحل المشكلة.

قاعدة المعرفة (KB)  مجموعة من قواعد البيانات والقواعد المستخدمة تم الحصول عليها من صانعي القرار. قاعدة المعرفة هي عنصر من عناصر الأنظمة الخبيرة.

يميز طرق مختلفة لعرض البيانات.

بيانات فيزيائية - هي البيانات المخزنة في ذاكرة الكمبيوتر.

تمثيل البيانات المنطقية يتوافق مع عرض مخصص للبيانات المادية. الفرق بين التمثيلات المنطقية المادية والمطابقة للبيانات هو أن الأخير يعكس بعض العلاقات المهمة بين البيانات المادية.

تحت قاعدة بيانات الشركة فهم قاعدة البيانات التي توحد بشكل أو بآخر جميع البيانات والمعرفة الضرورية حول المؤسسة التي يتم تشغيلها آليًا. في أنظمة معلومات الشركات ، مثل هذا المفهوم مثلقواعد بيانات متكاملة, حيث يتم تنفيذ مبدأ المدخل الفردي والاستخدام المتكرر للمعلومات.

أرز. 1.1 هيكل تفاعل الإدارات مع مصادر المعلومات للمؤسسة.

قواعد بيانات الشركات هي مركزة (مركزية) وتوزيعها.

قاعدة بيانات مجمعة (مركزية) هي قاعدة بيانات ، يتم تخزين بياناتها فعليًا في أجهزة التخزين بجهاز كمبيوتر واحد. في التين. 1.2 رسم تخطيطي لتطبيق الخادم للوصول إلى قواعد البيانات في مختلف المنصات.

الشكل 1.2. مخطط غير متجانس قاعدة بيانات مركزية

جعلت مركزية معالجة المعلومات من الممكن القضاء على عيوب أنظمة الملفات التقليدية مثل عدم الاتساق وعدم الاتساق والتكرار في البيانات. ومع ذلك ، مع نمو قواعد البيانات ، وخاصة عند استخدامها في المنظمات المتفرقة جغرافيا ، تنشأ المشاكل. على سبيل المثال ، بالنسبة لقواعد البيانات المركزة الموجودة في عقدة شبكة الاتصالات السلكية واللاسلكية ، والتي بمساعدة إدارات مختلفة في المنظمة تحصل على الوصول إلى البيانات ، مع نمو حجم المعلومات وعدد المعاملات ، تنشأ الصعوبات التالية:

  • تدفق كبير لتبادل البيانات ؛
  • حركة مرور عالية على الشبكة ؛
  • موثوقية منخفضة
  • ضعف الأداء العام.

في حين أنه من الأسهل ضمان أمان المعلومات وتكاملها واتساقها أثناء التحديثات في قاعدة بيانات مركزة ، فإن هذه المشكلات تطرح تحديات معينة. تم اقتراح لامركزية البيانات كحل ممكن لهذه المشاكل. تحقق اللامركزية:

  • درجة عالية من التزامن في المعالجة بسبب موازنة التحميل ؛
  • تحسين استخدام البيانات في الميدان عند إجراء استعلامات عن بُعد (عن بُعد) ؛
  • انخفاض التكاليف
  • سهولة إدارة قواعد البيانات المحلية.

تكاليف إنشاء شبكة ، في العقد التي توجد بها محطات العمل (أجهزة الكمبيوتر الصغيرة) ، أقل بكثير من تكاليف إنشاء نظام مماثل باستخدام كمبيوتر كبير. يوضح الشكل 1.3 الرسم التخطيطي المنطقي لقاعدة البيانات الموزعة.

الشكل 1.3. قاعدة بيانات الشركة الموزعة.

دعونا نعطي التعريف التالي لقاعدة البيانات الموزعة.

قاعدة البيانات الموزعة - إنها مجموعة من المعلومات والملفات (العلاقات) المخزنة في عقد مختلفة لشبكة المعلومات ومتصلة منطقيًا بطريقة تشكل مجموعة واحدة من البيانات (يمكن أن يكون الاتصال وظيفيًا أو من خلال نسخ من نفس الملف). وبالتالي ، فهي مجموعة من قواعد البيانات المترابطة منطقيًا ، ولكنها موجودة فعليًا على العديد من الأجهزة التي تعد جزءًا من شبكة الكمبيوتر نفسها.

أهم متطلبات الأداء لقاعدة البيانات الموزعة هي:

  • قابلية التوسع؛
  • التوافق
  • دعم نماذج البيانات المختلفة ؛
  • قابلية التنقل؛
  • شفافية الموقع
  • استقلالية عقد قاعدة البيانات الموزعة (استقلالية الموقع) ؛
  • معالجة الطلبات الموزعة ؛
  • تنفيذ المعاملات الموزعة.
  • دعم نظام أمان متجانس.

تتيح شفافية الموقع للمستخدمين التفاعل مع قواعد البيانات دون معرفة أي شيء عن مواقعهم. يعني استقلالية عقد قاعدة البيانات الموزعة أنه يمكن الحفاظ على كل قاعدة بيانات بشكل مستقل عن الآخرين. الاستعلام الموزع هو استعلام (عبارة SQL) أثناء تنفيذ أي كائنات (جداول أو طرق عرض) لقواعد بيانات مختلفة يتم الوصول إليها. عند تنفيذ المعاملات الموزعة ، يتم تنفيذ التحكم في التزامن لجميع قواعد البيانات المعنية. يستخدم Oracle7 تقنية نقل المعلومات على مرحلتين لإجراء المعاملات الموزعة.

لا يجب أن تكون قواعد البيانات التي تشكل قاعدة بيانات موزعة متجانسة (أي يتم صيانتها بواسطة DBMS واحد) أو معالجتها في بيئة نظام التشغيل نفسه و / أو على أجهزة كمبيوتر من نفس النوع. على سبيل المثال ، يمكن أن تكون قاعدة بيانات واحدة قاعدة بيانات Oracle على جهاز SUN يعمل بنظام التشغيل SUN OS (UNIX) ، ويمكن استضافة قاعدة بيانات ثانية بواسطة قاعدة بيانات DB2 على حاسوب مركزي IBM 3090 مع نظام تشغيل MVS ، ويمكن صيانة قاعدة بيانات ثالثة بواسطة SQL / DS أيضًا على حاسب IBM المركزي ، ولكن مع نظام التشغيل VM. مطلوب شرط واحد فقط - يجب أن تكون جميع الأجهزة التي تحتوي على قواعد بيانات متاحة عبر الشبكة التي تشكل جزءًا منها.

المهمة الرئيسية لقاعدة البيانات الموزعة - توزيع البيانات عبر الشبكة وإتاحة الوصول إليها. هناك الطرق التالية لحل هذه المشكلة:

  • تقوم كل عقدة بتخزين واستخدام مجموعة البيانات الخاصة بها والمتوفرة للاستعلامات عن بُعد. هذا التوزيع مقسم.
  • قد يتم تكرار بعض البيانات المستخدمة بشكل متكرر في المواقع البعيدة. يسمى هذا التوزيع مكرر جزئيًا.
  • يتم تكرار جميع البيانات في كل عقدة. يسمى هذا التوزيع مكرر بالكامل.
  • يمكن تقسيم بعض الملفات أفقيًا (يتم تحديد مجموعة فرعية من السجلات) أو رأسياً (يتم تحديد مجموعة فرعية من حقول السمات) ، بينما يتم تخزين المجموعات الفرعية المحددة في عقد مختلفة مع البيانات غير المنقسمة. يسمى هذا التوزيع منقسم (مجزأ).

عند إنشاء قاعدة بيانات موزعة ، على المستوى المفاهيمي ، عليك حل المهام التالية:

  • من الضروري أن يكون لديك مخطط مفاهيمي واحد للشبكة بأكملها. سيوفر هذا شفافية منطقية للبيانات للمستخدم ، ونتيجة لذلك سيكون قادرًا على تقديم طلب إلى قاعدة البيانات بأكملها ، كونه خلف محطة طرفية منفصلة (يبدو أنه يعمل مع قاعدة بيانات مركزية).
  • هناك حاجة إلى مخطط لتحديد موقع البيانات على الشبكة. سيوفر هذا شفافية وضع البيانات ، وبفضل ذلك لا يتعين على المستخدم تحديد مكان إرسال الطلب للحصول على البيانات المطلوبة.
  • من الضروري حل مشكلة عدم تجانس قواعد البيانات الموزعة. يمكن أن تكون قواعد البيانات الموزعة متجانسة أو غير متجانسة من حيث الأجهزة والبرامج. من السهل نسبيًا حل مشكلة عدم التجانس إذا كانت قاعدة البيانات الموزعة غير متجانسة من حيث الأجهزة ، ولكنها متجانسة من حيث البرنامج (نفس نظام إدارة قواعد البيانات في العقد). إذا تم استخدام أنظمة DBMS مختلفة في عقد النظام الموزع ، فإن وسائل تحويل هياكل البيانات واللغات مطلوبة. يجب أن يوفر هذا شفافية التحويل عبر عقد قاعدة البيانات الموزعة.
  • من الضروري حل مشكلة إدارة القاموس. لتوفير جميع أنواع الشفافية في قاعدة بيانات موزعة ، فأنت بحاجة إلى برامج تدير العديد من القواميس والكتب المرجعية.
  • تحتاج إلى تحديد طرق لتنفيذ الاستعلامات في قاعدة بيانات موزعة. تختلف طرق تنفيذ الاستعلامات في قاعدة بيانات موزعة عن تلك الموجودة في قواعد البيانات المركزية ، حيث يجب تنفيذ الأجزاء الفردية من الاستعلامات في موقع البيانات ذات الصلة ويجب تمرير النتائج الجزئية إلى العقد الأخرى ؛ في الوقت نفسه ، يجب ضمان تنسيق جميع العمليات.
  • من الضروري حل مشكلة تنفيذ الاستعلام المتوازي. تتطلب قاعدة البيانات الموزعة آلية تحكم متزامنة معقدة ، والتي ، على وجه الخصوص ، يجب أن تضمن التزامن عند تحديث المعلومات ، مما يضمن اتساق البيانات.
  • مطلوب منهجية مطورة لتوزيع ووضع البيانات ، بما في ذلك التقسيم ، هو أحد المتطلبات الرئيسية لقاعدة البيانات الموزعة.

أحد المجالات الجديدة التي يتم تطويرها بنشاط في هندسة أنظمة الحوسبة ، والتي تعد أداة قوية لمعالجة المعلومات غير الرقمية ، هي آلات قواعد البيانات... تُستخدم آلات قواعد البيانات لحل المهام غير الرقمية مثل تخزين المستندات والحقائق والبحث فيها وتحويلها والعمل مع الكائنات. بعد تعريف البيانات كمعلومات رقمية ورسومية حول كائنات العالم المحيط ، يتم تضمين محتوى مختلف في مفهوم البيانات في المعالجة العددية وغير العددية. تستخدم المعالجة العددية كائنات مثل المتغيرات والمتجهات والمصفوفات والمصفوفات متعددة الأبعاد والثوابت وما إلى ذلك ، بينما تستخدم المعالجة غير الرقمية كائنات مثل الملفات والسجلات والحقول والتسلسلات الهرمية والشبكات والعلاقات وما إلى ذلك. مباشرة في المعلومات حول الأشياء (على سبيل المثال ، موظف معين أو مجموعة من الموظفين) ، وليس في ملف الموظفين على هذا النحو. لم يتم فهرسة ملف الموظفين هنا لاختيار شخص معين ؛ هنا محتوى الإدخال المطلوب هو أكثر إثارة للاهتمام. عادة ما تخضع كميات كبيرة من المعلومات للمعالجة غير العددية. في العديد من التطبيقات ، يمكنك القيام ، على سبيل المثال ، بالعمليات التالية على هذه البيانات:

  • زيادة رواتب جميع موظفي الشركة ؛
  • حساب الفائدة المصرفية على حسابات جميع العملاء ؛
  • إجراء تغييرات على قائمة جميع السلع الموجودة في المخازن ؛
  • العثور على الملخص المطلوب من جميع النصوص المخزنة في المكتبة أو في نظام استرجاع المعلومات الببليوغرافية ؛
  • العثور على وصف للعقد المطلوب في ملف يحتوي على وثائق قانونية ؛
  • ابحث في جميع الملفات التي تحتوي على أوصاف لبراءات الاختراع وابحث عن براءة اختراع (إن وجدت) مماثلة للبراءة المقترحة مرة أخرى.

لتنفيذ محرك قاعدة البيانات المتوازي والرابطي العمارة كبديل للمعالج أحاديفون نيومانهيكل ، مما يسمح بالعمل مع كميات كبيرة من المعلومات في الوقت الحقيقي.

تكتسب آلات قواعد البيانات أهمية فيما يتعلق بالبحث وتطبيق مفاهيم الذكاء الاصطناعي مثل تمثيل المعرفة ، والأنظمة الخبيرة ، والاستدلال ، والتعرف على الأنماط ، وما إلى ذلك.

مخازن المعلومات. اليوم ، يعترف الكثيرون أنه في الوقت الحالي ، تقوم معظم الشركات بتشغيل العديد من قواعد البيانات ، ولعمل ناجح مع المعلومات ، لا يلزم فقط أنواع مختلفة من قواعد البيانات ، ولكن هناك أجيال مختلفة من نظم إدارة قواعد البيانات. وفقًا للإحصاءات ، تستخدم كل منظمة في المتوسط ​​2.5 من نظم إدارة قواعد البيانات المختلفة. أصبح من الواضح الحاجة إلى "عزل" عمل الشركات ، أو بالأحرى الأشخاص المشاركين في هذا العمل ، من الميزات التكنولوجية لقواعد البيانات ، لتزويد المستخدمين برؤية واحدة لمعلومات الشركة ، بغض النظر عن مكان تخزينها فعليًا. حفز هذا ظهور تكنولوجيا تخزين المعلومات (تخزين البيانات ، DW).

الهدف الرئيسي لـ DW هو إنشاء تمثيل منطقي واحد للبيانات الواردة في أنواع مختلفة من قواعد البيانات ، أو بعبارة أخرى ، نموذج بيانات شركة واحد.

أصبحت الجولة الجديدة من تطوير DW ممكنة بسبب تحسين تقنيات المعلومات بشكل عام ، على وجه الخصوص ، ظهور أنواع جديدة من قواعد البيانات القائمة على معالجة الاستعلام المتوازي ، والتي اعتمدت بدورها على التقدم في مجال أجهزة الكمبيوتر الموازية. خلقوا بناة الاستعلامبواجهة رسومية سهلة الاستخدام ، مما سهّل إنشاء استعلامات معقدة لقاعدة البيانات. برامج مختلفةالطبقة الوسطى (برمجيات وسطية)قدمت اتصالابين قواعد البيانات غير المتجانسة، وأخيرا انخفض بشكل حادأجهزة التخزين.

قد يكون بنك البيانات موجودًا في هيكل الشركة.

قاعدة البيانات - مكون وظيفي وتنظيمي في أنظمة التحكم الآلي وأنظمة المعلومات والحوسبة ، مما يوفر دعمًا للمعلومات المركزية لفريق من المستخدمين أو مجموعة من المهام التي تم حلها في النظام.

قاعدة البيانات يعتبر نظامًا للمعلومات والمرجعية ، والغرض الرئيسي منه هو:

  • في التراكم والصيانة بترتيب عمل لمجموعة من المعلومات التي تشكل قاعدة المعلومات للنظام الآلي بأكمله أو مجموعة معينة من المهام التي تم حلها فيه ؛
  • في إصدار البيانات التي تتطلبها المهمة أو المستخدم ؛
  • في توفير الوصول الجماعي إلى المعلومات المخزنة ؛
  • في ضمان الإدارة اللازمة لاستخدام المعلومات الواردة في قاعدة المعلومات.

وبالتالي ، فإن بنك البيانات الحديث هو مجمع معقد للبرامج والأجهزة ، والذي يتضمن الأدوات التقنية والنظم والشبكات وقواعد البيانات ونظام إدارة قواعد البيانات وأنظمة استرجاع المعلومات لأغراض مختلفة.

الخامس .2. نظم إدارة قواعد البيانات والحلول الهيكلية في أنظمة الشركات

نظم إدارة قواعد البيانات والمعرفة

من المكونات المهمة لأنظمة المعلومات الحديثة أنظمة إدارة قواعد البيانات (DBMS).

نظم إدارة قواعد البيانات - مجموعة من البرامج والأدوات اللغوية المعدة لإنشاء قواعد البيانات وصيانتها واستخدامها.

يوفر نظام إدارة قواعد البيانات وصول أنظمة معالجة البيانات إلى قواعد البيانات. كما لوحظ بالفعل ، تكتسب نظم إدارة قواعد البيانات (DBMS) دورًا مهمًا في إنشاء أنظمة معلومات الشركة ، كما تلعب دورًا مهمًا بشكل خاص ، في إنشاء أنظمة المعلومات باستخدام موارد المعلومات الموزعة على أساس تقنيات الكمبيوتر الحديثة للشبكة.

الميزة الرئيسية لنظام DBMS الحديث هي أن تقنيات دعم DBMS الحديثة مثل:

  • تقنية العميل / الخادم.
  • دعم لغات قاعدة البيانات. هو - هيلغة تعريف المخطط DB (SDL - لغة تعريف المخطط) ،لغة معالجة البيانات (DML) ، لغات متكاملة SQL (لغة قائمة الانتظار الهيكلية) و QDB (الاستعلام - حسب - مثال) و QMF (تسهيل إدارة الاستعلام ) عبارة عن مواصفات استعلام طرفية متقدمة وأداة إعداد تقارير لـ DB 2 ، إلخ ؛
  • إدارة البيانات المباشرة في الذاكرة الخارجية.
  • إدارة المخازن المؤقتة لذاكرة الوصول العشوائي.
  • ادارة العمليات التجارية. OLTP - التكنولوجيا (معالجة المعاملات عبر الإنترنت) ، OLAP -تقنية (معالجة التحليل عبر الإنترنت)لـ DW.
  • ضمان حماية البيانات وسلامتها. يُسمح باستخدام النظام فقط للمستخدمين الذين لديهم الحق في الوصول إلى البيانات. عندما يقوم المستخدمون بعمليات على البيانات ، يتم الحفاظ على اتساق البيانات المخزنة (تكاملها). هذا مهم في أنظمة معلومات الشركات متعددة المستخدمين.
  • يوميات.

يجب أن يضمن DBMS الحديث الامتثال لمتطلبات قاعدة البيانات المذكورة أعلاه. بالإضافة إلى ذلك ، يجب أن تمتثل للمبادئ التالية:

  • استقلالية البيانات.
  • براعه. يجب أن يتمتع نظام DBMS بدعم نموذج بيانات مفاهيمي قوي لعرض طرق العرض المنطقية المخصصة.
  • التوافق. يجب أن يظل نظام DBMS قيد التشغيل مع تطوير البرامج والأجهزة.
  • تكرار البيانات. على عكس أنظمة الملفات ، يجب أن تكون قاعدة البيانات عبارة عن مجموعة واحدة من البيانات المتكاملة.
  • حماية البيانات. يجب أن يوفر نظام DBMS الحماية ضد الوصول غير المصرح به.
  • تكامل البيانات. يجب أن يمنع DBMS المستخدمين من كسر قاعدة البيانات.
  • إدارة العمل المتزامن. يجب أن يحمي نظام DBMS قاعدة البيانات من التناقضات في وضع الوصول المشترك. لضمان حالة متسقة لقاعدة البيانات ، يجب تنفيذ جميع طلبات المستخدم (المعاملات) بترتيب معين.
  • يجب أن يكون نظام DBMS عالميًا. يجب أن تدعم نماذج البيانات المختلفة على أساس منطقي ومادي واحد.
  • يجب أن يدعم نظام DBMS كلاً من قواعد البيانات المركزية والموزعة ، وبالتالي يصبح رابطًا مهمًا في شبكات الكمبيوتر.

بالنظر إلى نظام إدارة قواعد البيانات (DBMS) كفئة من منتجات البرامج التي تركز على الحفاظ على قواعد البيانات في الأنظمة الآلية ، يمكننا التمييز بين أهم ميزتين أساسيتين تحددان أنواع نظم إدارة قواعد البيانات. وفقًا لهم ، يمكن عرض نظام DBMS من وجهتي نظر:

  • قدراتها فيما يتعلق بقواعد البيانات الموزعة (الشركات) ؛
  • علاقتها بنوع نموذج البيانات المطبق في نظام إدارة قواعد البيانات.

فيما يتعلق بقواعد بيانات الشركة (الموزعة) ، يمكن تمييز الأنواع التالية من نظم إدارة قواعد البيانات بشكل تقليدي:

  • نظام إدارة قواعد البيانات "المكتبي". تركز هذه المنتجات بشكل أساسي على التعامل مع البيانات الشخصية (بيانات "سطح المكتب"). لديهم مجموعات أوامر لمشاركة قواعد البيانات المشتركة ، لكنها صغيرة الحجم (مثل مكتب صغير). بادئ ذي بدء ، إنه نظام إدارة قواعد البيانات (DBMS) مثل التقييم ، و dBASE ، و Paradox ، و EohPgo. لماذا تقييم ، dBASE ، Paradox ، EohPgo لديهم وصول ضعيف إلى بيانات الشركة. النقطة المهمة هي أنه لا توجد طريقة سهلة للتغلب على الحاجز بين البيانات الشخصية وبيانات الشركة. والنقطة ليست حتى أن آلية نظام DBMS للبيانات الشخصية (أو المكتب الصغير) تركز على الوصول إلى البيانات من خلال العديد من البوابات ، ومنتجات الإنترنت ، وما إلى ذلك. تكمن المشكلة في أن هذه الآليات ترتبط عادةً بعمليات نقل الملفات الكاملة ونقص دعم الفهرس المتشعب ، مما يؤدي إلى توقف قوائم انتظار الخادم عمليًا على الأنظمة الكبيرة.
  • نظم إدارة قواعد البيانات المتخصصة عالية الأداء ومتعددة المستخدمين. تتميز نظم إدارة قواعد البيانات هذه بوجود نواة نظام متعددة المستخدمين ولغة معالجة البيانات والوظائف التالية النموذجية لنظم إدارة قواعد البيانات متعددة المستخدمين المطورة:
  • تنظيم تجمع عازلة.
  • وجود نظام لمعالجة قوائم انتظار المعاملات ؛
  • وجود آليات لقفل بيانات متعدد المستخدمين ؛
  • تسجيل المعاملات
  • توافر آليات التحكم في الوصول.

هذه أنظمة DBMS مثل Oracle و DB2 و SQL / Server و Informix و Sybase و ADABAS و Titanium وغيرها توفر خدمة واسعة لمعالجة قواعد بيانات الشركة.

عند العمل مع قواعد البيانات ، يتم استخدام آلية المعاملات.

عملية تجارية هي وحدة منطقية للعمل.

عملية تجارية عبارة عن سلسلة من عبارات معالجة البيانات المنفذةككل(الكل أو لا شيء) وترجمة قاعدة البياناتمن حالة كلية إلى حالة كلية أخرى.

للمعاملة أربع خصائص مهمة تُعرف بخصائص ASID:

  • (أ) الذرية ... يتم تنفيذ المعاملة كعملية صغيرة - إما أن يتم تنفيذ المعاملة بالكامل ، أو لا يتم تنفيذها بالكامل.
  • (ج) الاتساق... تنقل المعاملة قاعدة بيانات من حالة متسقة (متسقة) إلى حالة أخرى متسقة (متسقة). ضمن الصفقة ، يمكن انتهاك اتساق قاعدة البيانات.
  • (ط) العزل ... يجب ألا تتداخل معاملات المستخدمين المختلفين مع بعضهم البعض (على سبيل المثال ، كما لو تم تنفيذها بشكل صارم).
  • (هـ) المتانة... إذا اكتملت المعاملة ، فيجب حفظ نتائج عملها في قاعدة البيانات ، حتى لو تعطل النظام في اللحظة التالية.

تبدأ المعاملة عادةً تلقائيًا من لحظة اتصال المستخدم بنظام DBMS وتستمر حتى حدوث أحد الأحداث التالية:

  • صدر أمر COMMIT WORK.
  • تم إصدار الأمر ROLLBACK WORK.
  • قطع المستخدم اتصاله بنظام إدارة قواعد البيانات.
  • كان هناك فشل في النظام.

بالنسبة للمستخدم ، فإنها ترتدي عادة الطابع الذري... في الواقع ، هذا مستخدم معقد (تطبيق) - آلية تفاعل قاعدة البيانات. يستخدم برنامج أنظمة المؤسسات محرك معالجة المعاملات في الوقت الفعلي (أنظمة معالجة المعاملات عبر الإنترنت ، OLTP) ، ولا سيما برامج المحاسبة ، وبرامج تلقي طلبات العملاء ومعالجتها ، والتطبيقات المالية ، تنتج الكثير من المعلومات. تم تصميم هذه الأنظمة (وتحسينها بشكل مناسب) للتعامل مع كميات كبيرة من البيانات والمعاملات المعقدة وعمليات القراءة / الكتابة المكثفة.

لسوء الحظ ، فإن المعلومات الموضوعة في قواعد بيانات أنظمة OLTP ليست مناسبة جدًا للاستخدام من قبل المستخدمين العاديين (نظرًا لارتفاع درجة تطبيع الجداول وتنسيقات عرض البيانات المحددة وعوامل أخرى). لذلك ، يتم إرسال البيانات من خطوط أنابيب المعلومات المختلفة (بمعنى نسخها) إلى مستودع التخزينوالفرز والتسليم اللاحق للمستهلك. في تكنولوجيا المعلومات ، يتم لعب دور المستودعاتمخازن المعلومات.

تسليم المعلومات إلى المستخدم النهائي - أنظمة معالجة البيانات التحليلية في الوقت الحقيقي (معالجة تحليلية عبر الإنترنت ، OLAP)التي توفر وصولاً سهلاً للغاية إلى البيانات من خلال وسائل ملائمة لتوليد الاستعلامات وتحليل النتائج. في أنظمة OLAP ، تزداد قيمة منتج المعلومات بسبب استخدام طرق مختلفة للتحليل والمعالجة الإحصائية. بالإضافة إلى ذلك ، تم تحسين هذه الأنظمة من حيث سرعة استخراج البيانات ، وجمع المعلومات المعممة وتستهدف المستخدمين العاديين (لديهم واجهة سهلة الاستخدام). لونظام OLTP يقدم إجابات لأسئلة بسيطة مثل "ما هو مستوى مبيعات المنتج N في المنطقة M في يناير 199x؟" ، إذنأنظمة OLAP جاهز لطلبات المستخدم الأكثر تعقيدًا ، على سبيل المثال: "تقديم تحليل لمبيعات المنتج N في جميع المناطق وفقًا لخطة الربع الثاني مقارنة بالعامين السابقين".

هيكل العميل / الخادم

في الأنظمة الحديثة معالجة المعلومات الموزعة، التكنولوجيا تحتل مركز الصدارةخدمة الزبائن. في النظام بنية خادم العميلتنقسم معالجة البيانات بين كمبيوتر العميل وجهاز الكمبيوتر الخادم ، ويتم الاتصال بينهما عبر الشبكة. يعتمد هذا الفصل في معالجة البيانات على تجميع الوظائف. عادة ، يتم تخصيص كمبيوتر خادم قاعدة البيانات لإجراء عمليات قاعدة البيانات ، ويقوم كمبيوتر العميل بتشغيل برامج التطبيقات. يوضح الشكل 2.1 نظامًا بسيطًا لهندسة العميل والخادم يتضمن جهاز كمبيوتر يعمل كخادم وحاسوب آخر يعمل كعميل له. كل آلة تؤدي وظائف مختلفة ولها مواردها الخاصة.

قاعدة البيانات

كمبيوتر الخادم

شبكة الاتصال

كمبيوتر متوافق مع IBM

كمبيوتر متوافق مع IBM

كمبيوتر متوافق مع IBM

التطبيقات

أرز. 2.1. نظام هندسة العميل والخادم

تتمثل الوظيفة الرئيسية لجهاز الكمبيوتر العميل في تنفيذ التطبيق (واجهة المستخدم ومنطق العرض التقديمي) والتواصل مع الخادم عند طلب التطبيق.

الخادم هو كائن (كمبيوتر) يقدم خدمات لأشياء أخرى بناءً على طلبهم.

على النحو التالي من المصطلح نفسه ، فإن الوظيفة الرئيسية لجهاز كمبيوتر الخادم هي تلبية احتياجات العميل. يستخدم المصطلح "Server" للإشارة إلى مجموعتين مختلفتين من الوظائف: خادم الملفات وخادم قاعدة البيانات (فيما يلي ، تعني هذه المصطلحات ، اعتمادًا على السياق ، إما البرنامج الذي ينفذ مجموعات الوظائف المحددة ، أو أجهزة الكمبيوتر باستخدام هذا البرنامج). خوادم الملفات ليست مصممة لأداء عمليات قاعدة البيانات ، وظيفتها الرئيسية هي مشاركة الملفات بين عدة مستخدمين ، أي توفير الوصول المتزامن للعديد من المستخدمين إلى الملفات الموجودة على جهاز الكمبيوتر - خادم الملفات. مثال على خادم الملفات هو نظام التشغيل NetWare الخاص بشركة Novell. يمكن تثبيت خادم قاعدة البيانات وتشغيله على كمبيوتر خادم الملفات. يتم تنفيذ Oracle DBMS في شكل NLM (الوحدة النمطية القابلة للتحميل على الشبكة) في بيئة NetWare على خادم الملفات.

يجب أن يمتلك خادم الشبكة المحلية الموارد المناسبة لغرضه الوظيفي واحتياجات الشبكة. لاحظ أنه فيما يتعلق بالتركيز على نهج الأنظمة المفتوحة ، فمن الأصح التحدث عن الخوادم المنطقية (بمعنى مجموعة من الموارد والبرامج التي تقدم خدمات عبر هذه الموارد) ، والتي لا توجد بالضرورة على أجهزة كمبيوتر مختلفة. من ميزات الخادم المنطقي في نظام مفتوح أنه إذا كان من المستحسن ، لأسباب تتعلق بالكفاءة ، نقل الخادم إلى كمبيوتر منفصل ، فيمكن القيام بذلك دون الحاجة إلى أي تعديل ، سواء من تلقاء نفسه أو في التطبيقات التي تستخدمه.

أحد متطلبات الخادم المهمة هو أن نظام التشغيل الذي يستضيف خادم قاعدة البيانات يجب أن يكون متعدد المهام (ويفضل ، ولكن ليس بالضرورة متعدد المستخدمين). على سبيل المثال ، لا يمكن استخدام Oracle DBMS المثبت على جهاز كمبيوتر شخصي مع نظام تشغيل MS-DOS (أو PC-DOS) لا يلبي متطلبات تعدد المهام كخادم قاعدة بيانات. ويمكن أن تكون نفس قاعدة بيانات Oracle المثبتة على جهاز كمبيوتر به نظام تشغيل OS / 2 متعدد المهام (وإن لم يكن متعدد المستخدمين) خادم قاعدة بيانات. العديد من نكهات UNIX و MVS و VM وبعض أنظمة التشغيل الأخرى متعددة المهام ومتعددة المستخدمين.

الحوسبة الموزعة

غالبًا ما يستخدم مصطلح "الحوسبة الموزعة" للإشارة إلى مفهومين مختلفين ، وإن كانا متكاملين:

  • قاعدة بيانات موزعة ؛
  • معالجة البيانات الموزعة.

يتيح تطبيق هذه المفاهيم تنظيم الوصول إلى المعلومات المخزنة على أجهزة متعددة للمستخدمين النهائيين باستخدام وسائل مختلفة.

هناك أنواع عديدة من الخوادم:

  • خادم قاعدة البيانات؛
  • ملقم الطباعة؛
  • خادم الوصول عن بعد ؛
  • خادم الفاكس
  • خادم الويب ، إلخ.

العميل / الخادم هو جوهر التقنية الأساسية هي تقنيات أساسية مثل:

  • تقنيات أنظمة التشغيل ، مفهوم تفاعل الأنظمة المفتوحة ، إنشاء بيئات موجهة للكائنات لتشغيل البرامج ؛
  • تقنيات الاتصالات؛
  • تقنيات الشبكة؛
  • تقنيات واجهة المستخدم الرسومية (واجهة المستخدم الرسومية) ؛
  • إلخ.

مزايا تقنية خادم العميل:

  • تسمح تقنية العميل / الخادم بالحوسبة في بيئات الحوسبة غير المتجانسة. استقلالية النظام الأساسي: الوصول إلى بيئات الشبكة غير المتجانسة التي تتضمن أنواعًا مختلفة من أجهزة الكمبيوتر ذات أنظمة التشغيل المختلفة.
  • الاستقلال عن مصادر البيانات: الوصول إلى المعلومات من قواعد البيانات غير المتجانسة. ومن أمثلة هذه الأنظمة DB2 و SQL / DS و Oracle و Sybase.
  • توازن التحميل بين العميل والخادم.
  • إجراء العمليات الحسابية حيث تكون أكثر كفاءة ؛
  • توفير القدرة على القياس بكفاءة ؛
  • الحوسبة عبر الأنظمة الأساسية... يتم تعريف الحوسبة عبر الأنظمة الأساسية ببساطة على أنها تنفيذ التقنيات في بيئات الحوسبة غير المتجانسة. يجب توفير الاحتمالات التالية هنا:
  • يجب أن يعمل التطبيق على منصات متعددة ؛
  • على جميع الأنظمة الأساسية ، يجب أن يكون لها نفس الواجهة ومنطق العمل ؛
  • يجب أن يتكامل التطبيق مع بيئة التشغيل الأصلية ؛
  • يجب أن تتصرف بنفس الطريقة على جميع الأنظمة الأساسية ؛
  • يجب تقديم دعم بسيط ومتسق لذلك.

الحوسبة الموزعة. تتضمن الحوسبة الموزعة توزيع العمل بين العديد من أجهزة الكمبيوتر (على الرغم من أن الحوسبة الموزعة هي مفهوم أوسع).

تقليص. تقليص الحجم هو نقل تطبيقات الحاسبات المركزية إلى منصات الكمبيوتر الصغيرة.

  • انخفاض تكاليف البنية التحتية والأجهزة. فعالة من حيث التكلفة: إن توافر معدات الحوسبة منخفضة التكلفة والانتشار المتزايد لشبكات المنطقة المحلية يجعل تكنولوجيا الخادم والعميل أكثر فعالية من حيث التكلفة من تقنيات معالجة البيانات الأخرى. يمكن ترقية المعدات بمجرد ظهور الحاجة.

تقليل وقت التنفيذ الكلي للتطبيق ؛

تقليل استخدام ذاكرة العميل ؛

تقليل حركة مرور الشبكة.

  • القدرة على العمل مع الوسائط المتعددة: حتى الآن ، تم إنشاء العديد من برامج الوسائط المتعددة للكمبيوتر الشخصي. لا توجد مثل هذه البرامج لتكوين Terminal-host ، أو أنها باهظة الثمن.
  • القدرة على جذب موارد حوسبة كبيرة لعمليات قاعدة البيانات: نظرًا لأن التطبيقات يتم تنفيذها على أجهزة الكمبيوتر العميلة ، يتم تحرير موارد إضافية (مقارنة بتكوين مضيف المحطة الطرفية) على كمبيوتر الخادم لعمليات قاعدة البيانات ، مثل موارد الحوسبة للمعالج المركزي و الذاكرة التشغيلية.
  • إنتاجية أفضل للمبرمجين: يتم زيادة إنتاجية المبرمج باستخدام أدوات مثل SQL * Forms و CASE ، والتي تسمح لك بتطوير التطبيقات بشكل أسرع من لغات البرمجة مثل C أو PL1 أو COBOL.
  • زيادة إنتاجية المستخدم النهائي: في الوقت الحالي ، أتقن العديد من المستخدمين النهائيين أنظمة مثل Lotus و Paradox و Word Perfect و Harvard Graphics والمزيد.

تحديد الواجهة من جانب الخادم وثابتة. لذلك ، من الممكن إنشاء أجزاء جديدة للعميل من نظام موجود (مثال على قابلية التشغيل البيني على مستوى النظام).

أرز. 2.2. رسم توضيحي لوصول العميل إلى مشاركة الخادم.

كيفية تنفيذ تقنية خادم العميل

تتم مناقشة تثبيت نظام قائم على تقنية خادم العميل وقادر على تنفيذ معالجة البيانات الموزعة أدناه. أجهزة وبرامج الكمبيوتر التالية مطلوبة:

  • كمبيوتر خادم قاعدة البيانات ؛
  • أجهزة كمبيوتر العميل
  • شبكة اتصال؛
  • برامج الشبكة
  • تطبيق البرمجيات.

لغة SQL ... لغة الاستعلام عالية المستوى - SQL (لغة الاستعلام الهيكلية ) يعمل على تنفيذ استعلامات لقواعد البيانات ، مثل YAMD و YOD و PNP ويتم اعتماده كمعيار. لغة SQL تم اعتمادها في الأصل كلغة بيانات لمنتجات برامج الشركةآي بي إم و YAMD نظم إدارة قواعد البيانات العلائقية SYSTEM R من شركة IBM ... ميزة مهمة للغة SQL يكمن في حقيقة أن نفس اللغة يتم تمثيلها من خلال واجهتين مختلفتين ، وهما: من خلال واجهة تفاعلية ومن خلال واجهة برمجة التطبيقات (ديناميكية SQL). ديناميكية SQL يتكون من العديد من ميزات اللغة المضمنة SQL ، يتم توفيرها خصيصًا لبناء التطبيقات التفاعلية ، حيث يُفهم التطبيق التفاعلي على أنه برنامج مكتوب لدعم الوصول إلى قاعدة بيانات المستخدم النهائي الذي يعمل على الجهاز التفاعلي. لغة SQL يوفر وظائف تعريف ومعالجة وإدارة بيانات قاعدة البيانات وهو شفاف للمستخدم من وجهة نظر نظام إدارة قواعد البيانات المنفذ.

أرز. 2.3 مخطط لتنفيذ استعلامات المستخدم لقواعد البيانات الموزعة.

يتم تحديد الهيكل الداخلي لقواعد البيانات من خلال نماذج البيانات المستخدمة. يحتوي النموذج المفاهيمي على قدرات تجريدية أكثر ودلالات أكثر ثراءً من النماذج الخارجية. غالبًا ما يشار إلى النماذج الخارجية على أنها نماذج نحوية أو تشغيلية ، في إشارة إلى الطبيعة النحوية للتحكم والاستخدام كوسيلة لتفاعل المستخدم مع قاعدة البيانات. في نمذجة المعلومات ، هناك مستويات مختلفة من التجريد ، من النموذج المفاهيمي إلى نموذج البيانات المادية ، والتي تؤثر على بنية نظام إدارة قواعد البيانات.

يتكون نموذج البيانات من ثلاثة مكونات:

  • هيكل البيانات المراد تمثيله من وجهة نظر المستخدم لقاعدة البيانات.
  • يتم تنفيذ العمليات الصالحة على هيكل البيانات. من الضروري أن تكون قادرًا على العمل مع هذا الهيكل باستخدام عمليات مختلفة لـ NOD و NAM. لا قيمة للبنية الغنية إذا لم يكن هناك طريقة للتلاعب بمحتوياتها.
  • قيود مراقبة النزاهة. يجب تزويد نموذج البيانات بوسائل للحفاظ على سلامته وحمايته. كمثال ، ضع في اعتبارك الشرطين التاليين:
  • يجب أن تحتوي كل شجرة فرعية على عقدة مصدر. لا يمكن لقواعد البيانات الهرمية تخزين العقد التابعة بدون عقدة مصدر.
  • فيما يتعلق بقاعدة البيانات العلائقية ، لا يمكن أن تكون هناك مجموعات متطابقة. بالنسبة للملف ، يتطلب هذا المطلب أن تكون جميع السجلات فريدة.

إحدى أهم خصائص نظام إدارة قواعد البيانات (DBMS) هي القدرة على ربط الأشياء.

هناك أنواع الروابط التالية بين الكائنات:

  • واحد لواحد (1: 1)... يمكن ربط كائن واحد من مجموعة مع كائن واحد من مجموعة أخرى.
  • واحد لأكثر (1: M)... يمكن ربط كائن واحد من مجموعة واحدة بالعديد من كائنات مجموعة أخرى.
  • كثير إلى كثير (M: N)... يمكن ربط كائن واحد من مجموعة واحدة بالعديد من كائنات مجموعة أخرى ، ولكن في نفس الوقت يمكن ربط كائن واحد من مجموعة أخرى بالعديد من كائنات المجموعة الأولى.
  • متشعب ... يمكن ربط كائن واحد من مجموعة واحدة بأشياء من مجموعات عديدة.
  • العودية ... يمكن ربط كائن واحد من مجموعة معينة بكائن من نفس المجموعة.

توجد نماذج البيانات الأساسية التالية:

  • نموذج البيانات العلائقية.
  • نموذج البيانات الهرمي.
  • نموذج بيانات شبكة غير مكتمل.
  • نموذج بيانات CODASYL.
  • نموذج بيانات الشبكة الموسعة.

الخامس .3. تقنيات الإنترنت / الإنترنت وحلول الوصول إلى قواعد البيانات الخاصة بالشركات

تكمن المشكلة الرئيسية للأنظمة القائمة على بنية خادم العميل في أنه وفقًا لمفهوم الأنظمة المفتوحة ، يجب أن تكون متحركة في أوسع فئة ممكنة من حلول الأجهزة والبرامج للأنظمة المفتوحة. حتى لو قصرنا أنفسنا على شبكات المنطقة المحلية المستندة إلى UNIX ، فإن الشبكات المختلفة تستخدم بروتوكولات اتصال ومعدات مختلفة. تؤدي محاولات إنشاء أنظمة تدعم جميع البروتوكولات الممكنة إلى تحميلها الزائد بتفاصيل الشبكة على حساب الوظيفة.

يرتبط جانب أكثر تعقيدًا من هذه المشكلة بإمكانية استخدام تمثيلات مختلفة للبيانات في عقد مختلفة لشبكة محلية غير متجانسة. قد تحتوي أجهزة الكمبيوتر المختلفة على عناوين مختلفة ، وتمثيل رقم ، وترميز أحرف ، وما إلى ذلك. هذا مهم بشكل خاص للخوادم عالية المستوى: الاتصالات السلكية واللاسلكية والحوسبة وقواعد البيانات.

يتمثل أحد الحلول الشائعة لمشكلة التنقل في الأنظمة القائمة على بنية خادم العميل في الاعتماد على حزم البرامج التي تنفذ بروتوكولات استدعاء الإجراء البعيد (RPC). باستخدام هذه الأدوات ، تبدو المكالمة إلى خدمة في موقع بعيد وكأنها استدعاء إجراء عادي. تقوم أدوات RPC ، التي تحتوي بشكل طبيعي على جميع المعلومات حول تفاصيل أجهزة الشبكة المحلية وبروتوكولات الشبكة ، بترجمة المكالمة إلى سلسلة من تفاعلات الشبكة. وبالتالي ، فإن تفاصيل بيئة الشبكة والبروتوكولات مخفية عن مبرمج التطبيق.

عندما يتم استدعاء إجراء عن بعد ، تقوم برامج RPC بتحويل تنسيقات بيانات العميل إلى تنسيقات وسيطة مستقلة عن الجهاز ثم تحويلها إلى تنسيقات بيانات الخادم. عند تمرير معلمات الاستجابة ، يتم إجراء تحويلات مماثلة.

أعمال أخرى مشابهة قد تهمك Wshm>

6914. مفهوم قاعدة البيانات 11.56 كيلو بايت
يتم تقديم قاعدة البيانات في شكل موضوعي ، وهي مجموعة من المواد المستقلة لمقالات حسابات الأفعال المعيارية لقرارات المحكمة وغيرها من المواد المماثلة المنظمة بطريقة يمكن من خلالها العثور على هذه المواد ومعالجتها باستخدام قانون إلكتروني مدني للكمبيوتر الروسي اتحاد الفن. قاعدة البيانات المنظمة وفقًا لقواعد معينة والمحفوظة في ذاكرة الكمبيوتر هي مجموعة من البيانات التي تميز الحالة الحالية لبعض ...
8064. قواعد البيانات الموزعة 43.66 كيلو بايت
قواعد البيانات الموزعة يُفهم قاعدة البيانات الموزعة RDB على أنها مجموعة من البيانات المشتركة المترابطة منطقيًا والتي يتم توزيعها فعليًا عبر عقد مختلفة لشبكة الكمبيوتر. يجب ألا يعتمد الوصول إلى البيانات على وجود أو عدم وجود نسخ متماثلة للبيانات. يجب أن يحدد النظام تلقائيًا طرق إجراء اتصال دمج البيانات ، وقناة الشبكة قادرة على التعامل مع كمية المعلومات المرسلة ، كما أن العقدة لديها طاقة معالجة كافية للانضمام إلى الجداول. يجب أن يكون نظام RDBMS قادرًا على ...
20319. قواعد البيانات وحمايتها 102.86 كيلوبايت
ظهرت قواعد البيانات على الإنترنت في منتصف الستينيات. تمت معالجة العمليات في قواعد البيانات التشغيلية بشكل تفاعلي باستخدام المحطات الطرفية. سرعان ما تطورت منظمات السجلات المتسلسلة ذات الفهرس البسيط إلى نموذج سجل أكثر قوة. حصل تشارلز باخمان على جائزة تورينج لقيادته مجموعة مهام قاعدة البيانات (DBTG) ، التي طورت لغة قياسية لوصف البيانات ومعالجة البيانات.
5031. مكتبة تطوير قواعد البيانات 11.72 م
تكنولوجيا تصميم قواعد البيانات. تحديد العلاقات بين الكيانات وإنشاء نموذج بيانات. تستند الأفكار الرئيسية لتكنولوجيا المعلومات الحديثة إلى المفهوم الذي يجب تنظيم البيانات بموجبه في قواعد بيانات من أجل عكس العالم الحقيقي المتغير بشكل مناسب وتلبية احتياجات المستخدمين من المعلومات. يتم إنشاء قواعد البيانات هذه وتشغيلها تحت سيطرة أنظمة برمجية خاصة تسمى أنظمة إدارة قواعد البيانات DBMS.
13815. نموذج قاعدة البيانات الهرمية 81.62 كيلوبايت
تستند الأفكار الرئيسية لتكنولوجيا المعلومات الحديثة إلى مفهوم قواعد البيانات ، والتي بموجبها أساس تكنولوجيا المعلومات هو البيانات المنظمة في قواعد البيانات التي تعكس بشكل كاف حالة مجال موضوع معين وتزود المستخدم بالمعلومات ذات الصلة في هذا المجال. يجب الاعتراف بأن البيانات ...
14095. تطوير قاعدة بيانات المكتبة 11.72 م
أدت الزيادة في الحجم والتعقيد الهيكلي للبيانات المخزنة ، واتساع دائرة مستخدمي أنظمة المعلومات إلى انتشار استخدام نظم إدارة قواعد البيانات (DBMS) الأكثر ملاءمة وسهولة نسبيًا في الفهم.
5061. إنشاء قاعدة بيانات العيادات 2.4 ميجا بايت
لقد أتاح تطوير تكنولوجيا الكمبيوتر وتكنولوجيا المعلومات فرصًا لإنشاء أنظمة المعلومات المؤتمتة (AIS) واستخدامها على نطاق واسع لأغراض مختلفة. يجري تطوير وتنفيذ نظم معلومات لإدارة المرافق الاقتصادية والتقنية
13542. قواعد بيانات المعلومات الجيولوجية 20.73 كيلوبايت
في الآونة الأخيرة ، كان إدخال تقنيات الكمبيوتر ، ولا سيما قواعد البيانات ، في المجال العلمي مستمرًا بسرعة. هذه العملية لا تتخطى الجيولوجيا أيضًا ، لأنه في العلوم الطبيعية هناك حاجة لتخزين ومعالجة كميات كبيرة من المعلومات.
9100. قاعدة البيانات. مفاهيم أساسية 26.28 كيلو بايت
قاعدة البيانات هي عبارة عن مجموعة من المعلومات حول كائنات محددة من العالم الحقيقي في أي مجال من مجالات الاقتصاد والإدارة والكيمياء وما إلى ذلك. الغرض من نظام المعلومات ليس فقط تخزين البيانات حول الكائنات ، ولكن أيضًا التلاعب بهذه البيانات مع مراعاة الروابط بين الأشياء. يتميز كل كائن بمجموعة من بيانات الخصائص ، والتي تسمى سمات في قاعدة البيانات.
5240. إنشاء قاعدة البيانات "مكتب العميد" 1.57 ميجا بايت
قاعدة البيانات (DB) هي مجموعة من البيانات المترابطة المخزنة معًا على وسائط تخزين خارجية للكمبيوتر ، مع مثل هذه المنظمة والحد الأدنى من التكرار الذي يسمح باستخدامها بطريقة مثالية لتطبيق واحد أو عدة تطبيقات

نماذج بيانات الصناعة

الغرض الرئيسي من النماذج هو تسهيل التوجيه في مساحة البيانات والمساعدة في إبراز التفاصيل المهمة لتطوير الأعمال. في بيئة اليوم ، من أجل عمل تجاري ناجح ، من الضروري أن يكون لديك فهم واضح للروابط بين المكونات المختلفة وأن يكون لديك فكرة جيدة عن الصورة العامة للمؤسسة. يتيح تحديد جميع التفاصيل والعلاقات باستخدام النماذج الاستخدام الأكثر كفاءة للوقت والأدوات لتنظيم عمل الشركة.

نماذج البيانات هي نماذج مجردة تصف كيفية تقديم البيانات والوصول إليها. تحدد نماذج البيانات عناصر البيانات والعلاقات بينها في منطقة معينة. نموذج البيانات هو أداة تنقل لكل من محترفي الأعمال وتكنولوجيا المعلومات يستخدم مجموعة محددة من الرموز والكلمات لشرح فئة معينة من معلومات العالم الحقيقي بدقة. هذا يسمح بتواصل أفضل داخل المنظمة وبالتالي يخلق بيئة تطبيق أكثر مرونة واستقرارًا.

يحدد نموذج البيانات بشكل فريد معنى البيانات ، والتي تكون في هذه الحالة بيانات منظمة (على عكس البيانات غير المنظمة مثل ، على سبيل المثال ، صورة أو ملف ثنائي أو نص ، حيث يمكن أن يكون المعنى غامضًا).

كقاعدة عامة ، يتم تمييز النماذج ذات المستوى الأعلى (والأكثر عمومية في المحتوى) والمستوى الأدنى (على التوالي ، الأكثر تفصيلاً). المستوى العلوي من النمذجة هو ما يسمى ب نماذج البيانات المفاهيمية(نماذج البيانات المفاهيمية) ، والتي تعطي الصورة الأكثر عمومية لعمل مؤسسة أو مؤسسة. يتضمن النموذج المفاهيمي المفاهيم الرئيسية أو المجالات الموضوعية التي تعتبر حاسمة لعمل المنظمة ؛ عادة لا يتجاوز عددهم 12-15. يصف هذا النموذج فئات الكيانات المهمة للمؤسسة (كائنات الأعمال) ، وخصائصها (سماتها) ، والارتباطات بين أزواج هذه الفئات (أي العلاقات). نظرًا لأن المصطلحات في نمذجة الأعمال لم تستقر بعد بشكل نهائي ، في مصادر مختلفة باللغة الإنجليزية ، يمكن أيضًا تسمية نماذج البيانات المفاهيمية بنموذج مجال الموضوع (والذي يمكن ترجمته كنماذج مجال) أو نموذج بيانات المؤسسة الخاضعة (بيانات الشركة الخاضعة) عارضات ازياء).

المستوى الهرمي التالي هو نماذج البيانات المنطقية(نماذج البيانات المنطقية). يمكن أيضًا أن يطلق عليها نماذج بيانات المؤسسة أو نماذج الأعمال. تحتوي هذه النماذج على هياكل البيانات وخصائصها وقواعد العمل الخاصة بها ، وتمثل المعلومات التي تستخدمها المؤسسة من منظور الأعمال. في مثل هذا النموذج ، يتم تنظيم البيانات في شكل كيانات وعلاقات فيما بينها. يقدم النموذج المنطقي البيانات بطريقة تسهل على مستخدمي الأعمال فهمها. في النموذج المنطقي ، يمكن تمييز قاموس البيانات - قائمة بجميع الكيانات مع تعريفاتها الدقيقة ، والتي تسمح لفئات مختلفة من المستخدمين بالحصول على فهم مشترك لجميع تدفقات المدخلات والمخرجات الخاصة بالنموذج. المستوى التالي ، الأدنى من النمذجة هو التنفيذ المادي للنموذج المنطقي باستخدام برامج محددة ومنصات تقنية.

يحتوي النموذج المنطقي على قرار عمل مؤسسي مفصل ، والذي عادة ما يأخذ شكل نموذج عادي. التطبيع هو عملية تضمن أن كل عنصر بيانات في نموذج له قيمة واحدة فقط ويعتمد بشكل كامل وفريد ​​على المفتاح الأساسي. يتم تنظيم عناصر البيانات في مجموعات وفقًا لتعريفها الفريد. يجب دمج قواعد العمل التي تحكم عناصر البيانات بشكل كامل في النموذج الموحد مع التحقق المسبق من الصحة والتحقق من الصحة. على سبيل المثال ، من المحتمل أن يتم تقسيم عنصر بيانات مثل اسم العميل إلى الاسم الأول واسم العائلة وتجميعه مع عناصر البيانات الأخرى ذات الصلة في كيان عميل بمعرف العميل الأساسي الأساسي.

نموذج البيانات المنطقية مستقل عن تقنيات التطبيق مثل قواعد البيانات أو تقنيات الشبكات أو أدوات إعداد التقارير ووسائل تنفيذها المادي. يمكن أن يكون هناك نموذج بيانات مؤسسي واحد فقط في المؤسسة. تتضمن النماذج المنطقية عادةً آلاف الكيانات والعلاقات والسمات. على سبيل المثال ، يمكن أن يحتوي نموذج البيانات لمؤسسة مالية أو شركة اتصالات على حوالي 3000 مفهوم صناعي.

من المهم التمييز بين نموذج البيانات المنطقي والدلالي. يمثل نموذج البيانات المنطقية حل أعمال المؤسسة ، ويمثل نموذج البيانات الدلالية حلاً عمليًا تطبيقيًا. يمكن تنفيذ نفس نموذج البيانات المنطقية للشركة باستخدام نماذج دلالية مختلفة ، أي يمكن النظر إلى النماذج الدلالية على أنها المستوى التالي من النمذجة التي تقترب من النماذج المادية. علاوة على ذلك ، سيمثل كل من هذه النماذج "شريحة" منفصلة من نموذج بيانات الشركة وفقًا لمتطلبات التطبيقات المختلفة. على سبيل المثال ، في نموذج البيانات المنطقية للشركة ، سيتم تطبيع كيان العميل تمامًا ، وفي النموذج الدلالي لسوق البيانات ، يمكن تمثيله كهيكل متعدد الأبعاد.

يمكن أن يكون لدى الشركة طريقتان لإنشاء نموذج بيانات منطقي للشركة: بنائه بشكل مستقل أو استخدام نموذج جاهز. نموذج الصناعة(نموذج بيانات منطقي للصناعة). في هذه الحالة ، فإن الاختلافات في المصطلحات تعكس فقط مناهج مختلفة لبناء نفس النموذج المنطقي. في حالة قيام شركة ما بشكل مستقل بتطوير وتنفيذ نموذج البيانات المنطقي الخاص بها ، فإن هذا النموذج ، كقاعدة عامة ، يسمى ببساطة النموذج المنطقي للشركة. إذا قررت إحدى المؤسسات استخدام منتج جاهز من مورد محترف ، فيمكننا التحدث عن نموذج بيانات منطقي للصناعة. هذا الأخير عبارة عن نموذج بيانات منطقي جاهز يعكس أداء صناعة معينة بدرجة عالية من الدقة. نموذج منطق الصناعة هو عرض متكامل خاص بالمجال لجميع المعلومات التي يجب أن تكون موجودة في مستودع بيانات المؤسسة للإجابة على أسئلة العمل الإستراتيجية والتكتيكية. مثل أي نموذج بيانات منطقي ، فإن نموذج الصناعة مستقل عن قرارات التطبيق. كما أنه لا يشمل البيانات المشتقة أو غيرها من العمليات الحسابية لاستعادة البيانات بشكل أسرع. كقاعدة عامة ، تتجسد معظم الهياكل المنطقية لهذا النموذج جيدًا في تنفيذه المادي الفعال. تم تطوير هذه النماذج من قبل العديد من الموردين لمجموعة واسعة من مجالات النشاط: التمويل والتصنيع والسياحة والرعاية الصحية والتأمين ، إلخ.

يحتوي نموذج البيانات المنطقية للصناعة على معلومات شائعة في الصناعة ، وبالتالي لا يمكن أن يكون حلاً شاملاً لشركة. يتعين على معظم الشركات تنمية النموذج بمعدل 25٪ عن طريق إضافة عناصر البيانات وتوسيع التعريفات. تحتوي النماذج الجاهزة على عناصر بيانات أساسية فقط ، ويجب إضافة باقي العناصر إلى كائنات الأعمال المقابلة أثناء تثبيت النموذج في الشركة.

تحتوي نماذج البيانات المنطقية للصناعة على قدر كبير من التجريد. تعني التجريدات اتحاد المفاهيم المتشابهة تحت أسماء شائعة مثل حدث أو مشارك. هذا يضيف المرونة والتوحيد لنماذج الصناعة. وبالتالي ، فإن مفهوم الحدث ينطبق على جميع الصناعات.

يحدد المتخصص في استخبارات الأعمال ستيف هوبرمان خمسة عوامل يجب مراعاتها عند اتخاذ قرار بالحصول على نموذج بيانات الصناعة. الأول هو الوقت والمال اللازمين لبناء النموذج. إذا احتاجت المنظمة إلى تحقيق النتائج بسرعة ، فسيكون نموذج الصناعة مفيدًا. قد لا يوفر استخدام نموذج الصناعة صورة للمؤسسة بأكملها على الفور ، ولكن يمكن أن يوفر قدرًا كبيرًا من الوقت. بدلاً من النمذجة نفسها ، سيتم إنفاق الوقت في ربط الهياكل الحالية بنموذج الصناعة ومناقشة أفضل السبل لتخصيصها لاحتياجات المنظمة (على سبيل المثال ، التعريفات التي يجب تغييرها وعناصر البيانات التي يجب إضافتها).

العامل الثاني هو الوقت والمال اللازمين للحفاظ على النموذج في حالة عمل جيدة. إذا لم يكن نموذج بيانات المؤسسة جزءًا من منهجية تسمح لك بمراقبة الامتثال لدقته وامتثاله للمعايير الحديثة ، فسيصبح هذا النموذج قديمًا بسرعة كبيرة. يمكن لنموذج بيانات الصناعة منع حدوث هذه المخاطر حيث يتم تحديثها مع الموارد الخارجية. بالطبع ، يجب أن تنعكس التغييرات التي تحدث داخل المنظمة في النموذج من قبل الشركة نفسها ، ولكن سيتم إعادة إنتاج تغييرات الصناعة في النموذج من قبل مورديها.

العامل الثالث هو الخبرة في تقييم المخاطر والنمذجة. يتطلب إنشاء نموذج بيانات الشركة موارد مؤهلة من كل من رجال الأعمال وموظفي تكنولوجيا المعلومات. كقاعدة عامة ، يدرك المديرون جيدًا إما عمل المنظمة ككل ، أو أنشطة قسم معين. قلة منهم لديهم معرفة واسعة (على مستوى الشركة) وعميقة (داخل الأقسام) بأعمالهم. يعرف معظم المديرين عادةً مجالًا واحدًا جيدًا. لذلك ، من أجل الحصول على الصورة العامة للشركة ، هناك حاجة إلى موارد تجارية كبيرة. يؤدي هذا أيضًا إلى زيادة الطلب على موظفي تكنولوجيا المعلومات. كلما زادت موارد الأعمال المطلوبة لإنشاء نموذج واختباره ، يجب أن يكون المحللون أكثر خبرة. يجب ألا يعرفوا فقط كيفية الحصول على المعلومات من موظفي الأعمال ، ولكن يجب أن يكونوا قادرين أيضًا على إيجاد وجهة نظر مشتركة في المناطق الخلافية وأن يكونوا قادرين على تقديم كل هذه المعلومات بطريقة متكاملة. يجب أن يتمتع الشخص الذي يقوم بإنشاء النموذج (في كثير من الحالات نفس المحلل) بمهارات عرض نماذج جيدة. يتطلب بناء نماذج منطق المؤسسة نمذجة "للمستقبل" والقدرة على تحويل الأعمال المعقدة حرفياً "إلى مربعات وخطوط".

من ناحية أخرى ، يسمح نموذج الصناعة بالخبرة الخارجية. يتم بناء النماذج المنطقية الخاصة بالصناعة باستخدام منهجيات النمذجة المثبتة وفرق من المهنيين ذوي الخبرة لتجنب المشاكل الشائعة والمكلفة التي يمكن أن تنشأ عند تطوير نماذج بيانات المؤسسة داخل المؤسسة.

العامل الرابع هو البنية التحتية للتطبيق الحالي وعلاقات الموردين. إذا كانت المنظمة تستخدم بالفعل العديد من الأدوات من نفس المورد وأقامت علاقات معه ، فمن المنطقي أن تطلب منه نموذج الصناعة. سيكون هذا النموذج قادرًا على العمل بحرية مع المنتجات الأخرى من نفس المورد.

العامل الخامس هو تبادل المعلومات داخل الصناعة. إذا احتاجت الشركة إلى التواصل مع المنظمات الأخرى العاملة في نفس المجال ، فيمكن أن يكون نموذج الصناعة مفيدًا جدًا في هذه الحالة. تستخدم المنظمات داخل نفس الصناعة مكونات ومصطلحات هيكلية مماثلة. في الوقت الحاضر ، في معظم الصناعات ، تضطر الشركات إلى تبادل البيانات من أجل إجراء الأعمال بنجاح.

الأكثر فعالية هي نماذج الصناعة التي يقدمها الموردون المحترفون. يتم تحقيق كفاءة عالية في استخدامها بسبب المستوى الكبير من التفاصيل والدقة لهذه النماذج. عادة ما تحتوي على العديد من سمات البيانات. بالإضافة إلى ذلك ، لا يتمتع مبتكرو هذه النماذج بخبرة واسعة في النمذجة فحسب ، بل يتمتعون أيضًا بخبرة جيدة في بناء النماذج الخاصة بصناعة معينة.

تزود نماذج بيانات الصناعة الشركات برؤية واحدة متكاملة لمعلومات أعمالها. تجد العديد من الشركات صعوبة في دمج بياناتها ، على الرغم من أن هذا شرط أساسي لمعظم المشاريع على مستوى المؤسسة. وفقًا لدراسة أجراها معهد تخزين البيانات (TDWI) ، وجدت أكثر من 69٪ من المؤسسات التي شملها الاستطلاع أن التكامل يمثل عائقًا كبيرًا أمام تبني التطبيقات الجديدة. على العكس من ذلك ، فإن تنفيذ تكامل البيانات يولد دخلًا ملموسًا للشركة.

يوفر نموذج بيانات الصناعة ، بالإضافة إلى الارتباط بالأنظمة الحالية ، فوائد عظيمة للمشاريع على مستوى المؤسسة مثل تخطيط موارد المؤسسات (ERP) ، وإدارة البيانات الرئيسية ، وذكاء الأعمال ، وتحسين جودة البيانات ، وتطوير الموظفين.

وبالتالي ، تعد نماذج البيانات المنطقية للصناعة أداة فعالة لدمج البيانات والحصول على نظرة شاملة للأعمال. يبدو أن استخدام النماذج المنطقية خطوة ضرورية نحو إنشاء مستودعات بيانات الشركة.

المنشورات

  1. ستيف هوبرمان. الاستفادة من نموذج البيانات المنطقية للصناعة كنموذج بيانات مؤسستك.
  2. كلوديا إمهوف. مشاريع تخزين البيانات وذكاء الأعمال سريعة التتبع من خلال نمذجة البيانات الذكية

زايتسيف S.L. ، دكتوراه.

تكرار المجموعات

المجموعات المكررة هي السمات التي يمكن أن تحتوي مثيل واحد لكيان ما على أكثر من قيمة واحدة. على سبيل المثال ، يمكن أن يمتلك الشخص أكثر من مهارة. إذا احتجنا ، من حيث متطلبات العمل ، إلى معرفة مستوى المهارة لكل شخص ، وكان بإمكان كل شخص امتلاك مهارتين فقط ، فيمكننا إنشاء الكيان الموضح في الشكل. 1.6 هنا الكيان شخصمع سمتين لتخزين المهارات ومستوى المهارة لكل منهما.

أرز. 1.6 يستخدم هذا المثال مجموعات متكررة.

مشكلة تكرار المجموعات هي أننا لا نستطيع أن نعرف بالضبط عدد المهارات التي قد يمتلكها الشخص. في الحياة الواقعية ، يمتلك بعض الأشخاص مهارة واحدة ، والبعض الآخر يمتلك عدة مهارات ، والبعض الآخر لا يمتلك أي مهارة حتى الآن. يوضح الشكل 1.7 النموذج الذي تم تقليله إلى الشكل العادي الأول. لاحظ المضاف معرف المهارة التي يعرّفها كل منها بشكل فريد مهارة.

أرز. 1.7 نموذج مخفض إلى أول شكل عادي.

حقيقة واحدة في مكان واحد

إذا كانت السمة نفسها موجودة في أكثر من كيان واحد ولم تكن مفتاحًا خارجيًا ، فإن هذه السمة تعتبر زائدة عن الحاجة. يجب ألا يحتوي النموذج المنطقي على بيانات زائدة عن الحاجة.

يتطلب التكرار مساحة إضافية ، ولكن في حين أن كفاءة الذاكرة مهمة ، فإن المشكلة الحقيقية تكمن في مكان آخر. إن التأكد من مزامنة البيانات الزائدة عن الحاجة هو عبء ، وأنك دائمًا ما تخاطر بتعارض القيم.

في المثال السابق مهارةيعتمد على معرف الشخصو من معرف المهارة.هذا يعني أنك لن تمتلك مهارةحتى تظهر شخص،امتلاك هذه المهارة. هذا أيضًا يجعل من الصعب تغيير اسم المهارة. من الضروري العثور على كل إدخال باسم المهارة وتغييره لكل شخص يمتلك هذه المهارة.

يوضح الشكل 1.8 النموذج في الشكل العادي الثاني. لاحظ أن الكيان المضاف مهارة، والسمة لقبيتم نقل المهارة إلى هذا الكيان. بقي مستوى المهارة ، على التوالي ، عند التقاطع الأشخاص والمهارات.

أرز. 1.8 في الشكل العادي الثاني ، يتم نقل المجموعة المكررة إلى كيان آخر. يوفر هذا المرونة لإضافة العدد المطلوب من المهارات وتغيير اسم المهارة أو وصف المهارة في مكان واحد.

كل سمة تعتمد على المفتاح

يجب أن تعتمد كل سمة من سمات الكيان على المفتاح الأساسي لذلك الكيان. في المثال السابق اسم المدرسةو منطقة جغرافيةموجودة في الجدول شخصلكن لا تصف الشخص. لتحقيق النموذج العادي الثالث ، تحتاج إلى نقل السمات إلى الكيان ، حيث ستعتمد على المفتاح. الشكل 1.9. يظهر النموذج في الشكل العادي الثالث.

أرز. 1.9 في الشكل العادي الثالث اسم المدرسةو اقليم جوغرافيالمنقولة إلى الكيان ، حيث تعتمد قيمها على المفتاح.

علاقات كثير إلى كثير

صلة الكثير للكثيرينتعكس حقيقة العالم المحيط. لاحظ أنه في الشكل 1.9 ، توجد علاقة أطراف بأطراف بين شخصيةو مدرسة... الموقف يعكس بدقة حقيقة ذلك شخصيمكن أن تدرس في كثير المدارسو في مدرسةيمكن أن تتعلم الكثير شخص.لتحقيق النموذج العادي الرابع ، يتم إنشاء كيان ترابطي يلغي العلاقة الأحادية بأطراف من خلال إنشاء إدخال منفصل لكل مجموعة فريدة من المدرسة والشخص. يوضح الشكل 1.10 النموذج في الشكل الرابع العادي.

أرز. 1.10 في الشكل الرابع العادي ، علاقة أحادية بأطراف بين شخصيةو مدرسةيتم حلها من خلال إدخال كيان ترابط ، حيث يتم تخصيص إدخال منفصل لكل مجموعة فريدة المدارسو الأشخاص.

التعاريف الرسمية للأشكال العادية

قد تبدو التعاريف التالية للأشكال العادية شاقة. فكر فيهم ببساطة كصيغ لتحقيق التطبيع. تعتمد الأشكال العادية على الجبر العلائقي ويمكن تفسيرها على أنها تحويلات رياضية. على الرغم من أن هذا الكتاب ليس مخصصًا لمناقشة مفصلة للأشكال العادية ، إلا أنه يتم تشجيع المصممين على إلقاء نظرة أعمق على الموضوع.

في علاقة معينة R ، تعتمد السمة Y وظيفيًا على السمة X. في الشكل الرمزي ، RX -> RY (تُقرأ على أنها "RX تحدد وظيفيًا RY") - إذا وفقط إذا كانت كل قيمة X في R مرتبطة بالضبط Y واحدة القيمة في R (في أي وقت). السمتان X و Y يمكن أن تكونا مركبتين (Date CJ. مقدمة لأنظمة قواعد البيانات. الطبعة السادسة. Ed. Williams: 1999، 848 pp.).

تتوافق العلاقة R مع النموذج العادي الأول (1NF) إذا وفقط إذا كانت جميع المجالات التي تنتمي إليها تحتوي على قيم ذرية فقط (التاريخ ، المرجع نفسه).

العلاقة R تقابل النموذج العادي الثاني (2NF) إذا وفقط إذا كان يتوافق مع 1NF ، وكل سمة غير رئيسية تعتمد كليًا على المفتاح الأساسي (التاريخ ، المرجع نفسه).

تتوافق العلاقة R مع النموذج العادي الثالث (3NF) إذا وفقط إذا كان يتوافق مع 2NF ، ولا تعتمد كل سمة غير رئيسية بشكل انتقالي على المفتاح الأساسي (التاريخ ، المرجع نفسه).

تتوافق العلاقة R مع النموذج العادي Boyes-Codd (BCNF) إذا وفقط إذا كان كل محدد مرشحًا للاستخدام كمفتاح.

ملاحظة فيما يلي شرح موجز لبعض الاختصارات المستخدمة في تعريفات التاريخ.

MVD (التبعية متعددة القيم) هي تبعية متعددة القيم. يُستخدم فقط للكيانات التي تحتوي على ثلاث سمات أو أكثر. في التبعية متعددة القيم ، تعتمد قيمة السمة على جزء من المفتاح الأساسي فقط.

FD (التبعية الوظيفية) - التبعية الوظيفية. مع التبعية الوظيفية ، تعتمد قيمة السمة على قيمة سمة أخرى ليست جزءًا من المفتاح الأساسي.

JD (تبعية الانضمام) هي تبعية انضمام. مع تبعية الاتحاد ، يتم إرجاع المفتاح الأساسي للكيان الأصلي إلى أحفاد المستوى الثالث على الأقل ، مع الاحتفاظ بإمكانية استخدامه في الاتحاد بواسطة المفتاح الأصلي.

تتوافق النسبة مع النموذج العادي الرابع (4NF) إذا وفقط إذا كان هناك MVD في R ، على سبيل المثال A®B. في هذه الحالة ، تعتمد جميع سمات R وظيفيًا على A. وبعبارة أخرى ، لا يوجد في R سوى تبعيات (FD أو MVD) من النموذج K®X (أي الاعتماد الوظيفي للسمة X على المرشح للاستخدام كمفتاح K). وفقًا لذلك ، يلبي R متطلبات 4NF إذا كان يتوافق مع BCNF وجميع MVDs هي في الواقع FDs (التاريخ ، المرجع نفسه).

بالنسبة للصيغة العادية الخامسة ، تفي العلاقة R بالتبعية النقابية (JD) * (X ، Y ، ... ، Z) إذا وفقط إذا كانت R مكافئة لإسقاطاتها على X ، Y ، ... ، Z ، حيث X ، Y ،. .. ، Z هي مجموعة فرعية من مجموعة السمات R.

هناك العديد من النماذج العادية الأخرى لأنواع البيانات المعقدة والمواقف المحددة التي تقع خارج نطاق هذه المناقشة. أي متحمس لتطوير النموذج يود أن يتعلم الأشكال العادية الأخرى أيضًا.

أشكال العمل العادية

في كتابه Clive Finklestein (مقدمة لهندسة المعلومات: من التخطيط الاستراتيجي إلى نظم المعلومات ، القراءة ، ماساتشوستس: Addison-Wesley ، 1989) اتخذ نهجًا مختلفًا للتطبيع. إنه يحدد أشكال العمل العادية من حيث الإكراه لتلك الأشكال. يجد العديد من المصممين هذا النهج أكثر سهولة وواقعية.

يأخذ النموذج العادي الأول للأعمال (1BNF) المجموعات المكررة إلى كيان آخر. يحصل هذا الكيان على اسمه الخاص والسمات الأساسية (المركبة) الأساسية من الكيان الأصلي ومجموعة التكرار الخاصة به.

يستخرج النموذج العادي للأعمال الثاني (2BNF) السمات التي تعتمد جزئيًا على المفتاح الأساسي لكيان آخر. المفتاح الأساسي (المركب) لهذا الكيان هو المفتاح الأساسي للكيان الذي كان موجودًا فيه في الأصل ، إلى جانب المفاتيح الإضافية التي تعتمد عليها السمة بالكامل.

يأخذ النموذج العادي للأعمال الثالث (3BNF) سمات مستقلة عن المفتاح الأساسي إلى كيان آخر ، حيث تعتمد بشكل كامل على المفتاح الأساسي لهذا الكيان.

يأخذ النموذج العادي للأعمال الرابع (4BNF) سمات تعتمد على قيمة المفتاح الأساسي أو اختيارية لكيان ثانوي ، حيث تعتمد كليًا على قيمة المفتاح الأساسي ، أو حيث يجب (بالضرورة) أن تكون موجودة في ذلك شخصية.

يظهر النموذج العادي الخامس للأعمال (5BNF) ككيان هيكلي إذا كان هناك تبعية متكررة أو تبعية أخرى بين مثيلات كيان ثانوي ، أو في حالة وجود تبعية متكررة بين مثيلات كيانها الأساسي.

نموذج بيانات منطقي مكتمل

يجب أن يفي النموذج المنطقي المكتمل بمتطلبات نموذج العمل العادي الثالث وأن يشمل جميع الكيانات والسمات والعلاقات اللازمة لدعم متطلبات البيانات وقواعد العمل المرتبطة بالبيانات.

يجب أن يكون لجميع الكيانات أسماء تصف محتواها وأن يكون لها وصف أو تعريف واضح وموجز وكامل. ستغطي المنشور المستقبلي مجموعة أولية من الإرشادات للتكوين الصحيح لأسماء الكيانات وأوصافها.

يجب أن يكون للكيانات مجموعة كاملة من السمات ، بحيث يمكن تمثيل كل حقيقة عن كل كيان بسماته. يجب أن يكون لكل سمة اسم يعكس معناها ونوع بيانات منطقية ووصف أو تعريف واضح وقصير وكامل. في منشور مدونة مستقبلي ، سننظر في مجموعة أولية من الإرشادات للتنسيق الصحيح لأسماء السمات والأوصاف.

يجب أن تتضمن العلاقات بناء الفعل الذي يصف العلاقة بين الكيانات ، إلى جانب خصائص مثل التعددية وضرورة الوجود أو احتمال عدم وجود علاقة.

ملاحظة تعدد العلاقة تصف الحد الأقصى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل الكيان الأصلي.ضرورة الوجود أوإمكانية الغياب تُستخدم العلاقة لتحديد الحد الأدنى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل للكيان الأصلي.

نموذج البيانات المادية

بمجرد إنشاء نموذج منطقي كامل ومناسب ، فأنت على استعداد لاتخاذ قرار اختيار منصة التنفيذ. يعتمد اختيار النظام الأساسي على متطلبات استخدام البيانات والمبادئ الإستراتيجية لتشكيل بنية الشركة. اختيار المنصة هو قضية معقدة خارج نطاق هذا الكتاب.

في ERwin ، النموذج المادي هو تمثيل رسومي لقاعدة بيانات في العالم الحقيقي. ستتكون قاعدة البيانات المادية من جداول وأعمدة وعلاقات. يعتمد النموذج المادي على النظام الأساسي المختار للتنفيذ ومتطلبات استخدام البيانات. سيكون النموذج المادي لـ IMS مختلفًا تمامًا عن نموذج Sybase. سيبدو النموذج المادي لتقارير OLAP مختلفًا عن نموذج OLTP (معالجة المعاملات عبر الإنترنت).

يستخدم مصمم البيانات ومسؤول قاعدة البيانات (DBA) النموذج المنطقي ومتطلبات الاستخدام وسياسة بنية الشركة لتطوير نموذج بيانات مادي. يمكنك إلغاء تنسيق النموذج المادي لتحسين الأداء وإنشاء طرق عرض لدعم متطلبات الاستخدام. توضح الأقسام التالية بالتفصيل عملية إلغاء التسوية وإنشاء طرق العرض.

يقدم هذا القسم نظرة عامة على عملية بناء نموذج مادي ، وجمع متطلبات استخدام البيانات ، وتحديد مكونات النموذج المادي ، وتوفير الهندسة العكسية. في المنشورات التالية ، تمت تغطية هذه القضايا بمزيد من التفصيل.

جمع متطلبات استخدام البيانات

تقوم عادةً بجمع متطلبات استخدام البيانات مبكرًا أثناء المقابلات وجلسات العمل. في الوقت نفسه ، يجب أن تحدد المتطلبات بشكل كامل قدر الإمكان استخدام البيانات من قبل المستخدم. يمكن أن يؤدي الموقف السطحي والثغرات في النموذج المادي إلى تكاليف غير مخطط لها وتأخير في تنفيذ المشروع. تشمل متطلبات الاستخدام ما يلي:

    متطلبات الوصول والأداء

    الخصائص الحجمية (تقدير كمية البيانات المراد تخزينها) التي تسمح للمسؤول بتمثيل الحجم المادي لقاعدة البيانات

    تقدير عدد المستخدمين الذين يحتاجون إلى وصول متزامن إلى البيانات لمساعدتك في تصميم قاعدة البيانات الخاصة بك لمستويات أداء مقبولة

    التجميعات والمحور والبيانات الأخرى المحسوبة أو المشتقة التي يمكن اعتبارها مرشحة للتخزين في هياكل البيانات الثابتة

    متطلبات إعداد التقارير والاستعلامات القياسية لمساعدة مسؤول قاعدة البيانات في إنشاء الفهارس

    طرق العرض (المستمرة أو الافتراضية) التي ستساعد المستخدم عند إجراء عمليات تجميع البيانات أو التصفية.

بالإضافة إلى رئيس مجلس الإدارة والسكرتير والمستخدمين ، يجب أن يشارك مصمم النماذج ومسؤول قاعدة البيانات ومهندس قاعدة البيانات في جلسة متطلبات الاستخدام. يجب مناقشة متطلبات البيانات التاريخية للمستخدم. لطول الوقت الذي يتم فيه الاحتفاظ بالبيانات تأثير كبير على حجم قاعدة البيانات. في كثير من الأحيان ، يتم تخزين البيانات القديمة في نموذج عام ، ويتم أرشفة البيانات الذرية أو حذفها.

يجب على المستخدمين إحضار أمثلة للطلبات والتقارير معهم إلى الجلسة. يجب أن تكون التقارير محددة بدقة ويجب أن تتضمن القيم الذرية المستخدمة في أي حقول ملخص أو ملخص.

مكونات نموذج البيانات المادية

مكونات نموذج البيانات الفعلي هي الجداول والأعمدة والعلاقات. من المحتمل أن تصبح كيانات النموذج المنطقي جداول في النموذج المادي. تصبح السمات المنطقية أعمدة. ستصبح العلاقات المنطقية قيودًا على سلامة العلاقات. لا يمكن تنفيذ بعض العلاقات المنطقية في قاعدة بيانات فعلية.

الهندسة العكسية

عندما لا يتوفر نموذج منطقي ، يصبح من الضروري إعادة إنشاء النموذج من قاعدة البيانات الحالية. في إروين ، تسمى هذه العملية الهندسة العكسية. يمكن إجراء الهندسة العكسية بعدة طرق. يمكن للمصمم استكشاف هياكل البيانات في قاعدة البيانات وإعادة إنشاء الجداول في بيئة النمذجة المرئية. يمكنك استيراد لغة تعريفات البيانات (DDL) إلى أداة تدعم الهندسة العكسية (مثل Erwin). تتضمن الأدوات المتقدمة مثل ERwin وظائف توفر اتصال ODBC بقاعدة بيانات موجودة لإنشاء نموذج عن طريق قراءة هياكل البيانات مباشرة. ستتم مناقشة الهندسة العكسية مع ERwin بالتفصيل في منشور مستقبلي.

استخدام الحدود الوظيفية للشركة

عند بناء نموذج منطقي لمصمم عارض ، من المهم التأكد من أن النموذج الجديد متسق مع نموذج الشركة. يعني استخدام الحدود الوظيفية للشركة نمذجة البيانات من حيث المصطلحات المستخدمة داخل الشركة. تتغير طريقة استخدام البيانات في الشركة بشكل أسرع من البيانات نفسها. في كل نموذج منطقي ، يجب تقديم البيانات بطريقة شاملة ، بغض النظر عن مجال الأعمال الذي تدعمه. يجب أن تحدد الكيانات والسمات والعلاقات قواعد العمل على مستوى الشركة.

ملاحظة يشير بعض زملائي إلى هذه الحدود الوظيفية للشركات كنمذجة في العالم الحقيقي. تشجع النمذجة الواقعية المصمم على عرض المعلومات من حيث العلاقات والعلاقات المتأصلة بالفعل.

يوفر استخدام الحدود الوظيفية للشركة لنموذج البيانات الذي تم إنشاؤه بشكل مناسب الأساس لدعم احتياجات المعلومات لأي عدد من العمليات والتطبيقات ، مما يمكّن الشركة من استغلال أكثر أصولها قيمة - المعلومات.

ما هو نموذج بيانات المؤسسة؟

نموذج بيانات المؤسسة (EDM)يحتوي على الكيانات والسمات والعلاقات التي تمثل احتياجات المعلومات للشركة. عادةً ما يتم تصنيف EDM وفقًا لمجالات الموضوعات ، والتي تمثل مجموعات من الكيانات ذات الصلة بدعم احتياجات العمل المحددة. قد تغطي بعض المجالات الموضوعية وظائف عمل محددة مثل إدارة العقود ، في حين أن البعض الآخر قد يشمل الكيانات التي تصف المنتجات أو الخدمات.

يجب أن يتوافق كل نموذج منطقي مع المجال الحالي لنموذج بيانات الشركة. إذا كان النموذج المنطقي لا يلبي هذا المطلب ، فيجب إضافة نموذج المجال إليه. تضمن هذه المقارنة أن نموذج الشركة قد تم تحسينه أو تعديله وأن جميع جهود النمذجة المنطقية يتم تنسيقها داخل الشركة.

EDMيتضمن أيضًا كيانات محددة تحدد نطاق القيم للسمات الرئيسية. هذه الكيانات ليس لها آباء ويتم تعريفها على أنها مستقلة. غالبًا ما تستخدم الكيانات المستقلة للحفاظ على سلامة العلاقات. يتم تحديد هذه الكيانات بواسطة عدة أسماء مختلفة مثل جداول الرموز أو الجداول المرجعية أو جداول النوع أو جداول التصنيف. سوف نستخدم مصطلح "كائن أعمال الشركة". كائن أعمال المؤسسة هو كيان يحتوي على مجموعة من قيم السمات المستقلة عن أي كيان آخر. يجب استخدام كائنات أعمال الشركات باستمرار داخل الشركة.

بناء نموذج بيانات الشركة من خلال الزيادة

هناك منظمات تم فيها بناء نموذج الشركة من البداية إلى النهاية نتيجة جهد واحد منسق. من ناحية أخرى ، تبني معظم المؤسسات نماذج مؤسسية كاملة إلى حد ما من خلال التوسع.

البناء يعني بناء شيء بالتسلسل ، طبقة تلو الأخرى ، تمامًا كما ينمو المحار لؤلؤة. يوفر كل نموذج بيانات تم إنشاؤه مساهمة في تشكيل EDM. يتطلب بناء EDM بهذه الطريقة خطوات نمذجة إضافية لإضافة هياكل ومجالات بيانات جديدة أو زيادة هياكل البيانات الموجودة. هذا يجعل من الممكن بناء نموذج بيانات المؤسسة عن طريق زيادة مستويات التفاصيل والتحسين بشكل متكرر.

مفهوم منهجية النمذجة

هناك العديد من منهجيات نمذجة البيانات المرئية. يدعم ERwin اثنين:

    IDEF1X (تعريف التكامل لنمذجة المعلومات - وصف متكامل لنماذج المعلومات).

    IE (هندسة المعلومات).

IDEF1X هي منهجية جيدة واستخدام تدوينها واسع الانتشار

وصف متكامل لنماذج المعلومات

IDEF1X عبارة عن منهجية عالية التنظيم لنمذجة البيانات تعمل على توسيع منهجية IDEF1 المعتمدة كمعيار FIPS (معايير معالجة المعلومات الفيدرالية). يستخدم IDEF1X مجموعة شديدة التنظيم من أنواع إنشاءات النمذجة والنتائج في نموذج بيانات يتطلب فهم الطبيعة المادية للبيانات قبل إتاحة هذه المعلومات.

يجبر الهيكل الصلب لـ IDEF1X المصمم على تعيين خصائص للكيانات التي قد لا تتوافق مع حقائق العالم المحيط. على سبيل المثال ، يتطلب IDEF1X أن تكون جميع الأنواع الفرعية للكيانات حصرية. هذا يؤدي إلى حقيقة أن الشخص لا يمكن أن يكون عميلًا وموظفًا في نفس الوقت. بينما تخبرنا الممارسة الحقيقية بشكل مختلف.

هندسة المعلومات

غالبًا ما يشار إلى كليف فنكلستين على أنه أب هندسة المعلومات ، على الرغم من مشاركة مفاهيم مماثلة معه بواسطة جيمس مارتن (مارتن ، جيمس. إدارة بيئة قاعدة البيانات. نهر السرج العلوي ، نيو جيرسي: برنتيس هول ، 1983.). تستخدم هندسة المعلومات نهجًا مدفوعًا بالأعمال لإدارة المعلومات وتستخدم ترميزًا مختلفًا لتمثيل قواعد العمل. يعمل IE كامتداد وتطوير للتدوين والمفاهيم الأساسية لمنهجية التقارير الإلكترونية التي اقترحها بيتر تشين.

يوفر IE البنية التحتية لدعم متطلبات المعلومات من خلال دمج التخطيط الاستراتيجي المؤسسي مع أنظمة المعلومات التي يتم تطويرها. يسمح هذا التكامل لإدارة موارد المعلومات بأن تكون أكثر توافقاً مع الآفاق الإستراتيجية طويلة المدى للشركة. أدى هذا النهج القائم على الأعمال إلى قيام العديد من المصممين باختيار IE على المنهجيات الأخرى التي تميل إلى التركيز على تحديات التنمية قصيرة المدى.

يقترح IE سلسلة من الإجراءات التي تقود الشركة إلى تحديد جميع احتياجاتها من المعلومات لجمع البيانات وإدارتها وتحديد العلاقات بين كائنات المعلومات. ونتيجة لذلك ، يتم توضيح متطلبات المعلومات بوضوح بناءً على توجيهات الإدارة ويمكن ترجمتها مباشرةً إلى نظام معلومات إداري يدعم احتياجات المعلومات الاستراتيجية.

استنتاج

إن فهم كيفية استخدام أداة نمذجة البيانات مثل ERwin ليس سوى جزء من المشكلة. بالإضافة إلى ذلك ، يجب أن تفهم متى يتم حل مهام نمذجة البيانات وكيف يتم تجميع متطلبات المعلومات وقواعد العمل التي يجب تمثيلها في نموذج البيانات. يوفر إجراء جلسات العمل البيئة الأكثر ملاءمة لجمع متطلبات المعلومات في بيئة تشمل خبراء المجال والمستخدمين والمتخصصين في تكنولوجيا المعلومات.

يتطلب بناء نموذج بيانات جيد تحليل وبحث متطلبات المعلومات وقواعد العمل التي تم جمعها من خلال جلسات العمل والمقابلات. يجب مقارنة نموذج البيانات الناتج مع نموذج المؤسسة ، إن أمكن ، للتأكد من أنه لا يتعارض مع نماذج الكائن الحالية ويتضمن جميع الكائنات المطلوبة.

يتكون نموذج البيانات من نماذج منطقية ومادية تمثل متطلبات المعلومات وقواعد العمل. يجب تقليل النموذج المنطقي إلى النموذج العادي الثالث. يقوم النموذج العادي الثالث بتقييد وإضافة وتحديث وإزالة الانحرافات في بنية البيانات لدعم مبدأ "حقيقة واحدة في مكان واحد". يجب تحليل وبحث متطلبات المعلومات التي تم جمعها وقواعد العمل. يجب مقارنتها بنموذج المؤسسة لضمان عدم تعارضها مع نماذج الكائن الحالية وتضمين جميع الكائنات المطلوبة.

في ERwin ، يتضمن نموذج البيانات كلا من النماذج المنطقية والفيزيائية. يطبق ERwin نهج التقارير الإلكترونية ويسمح لك بإنشاء كائنات نموذج منطقي ومادي لتمثيل متطلبات المعلومات وقواعد العمل. تتضمن كائنات النموذج المنطقي الكيانات والسمات والعلاقات. تتضمن كائنات النموذج المادي الجداول والأعمدة والقيود على تكامل العلاقات.

سيغطي أحد المنشورات التالية قضايا تحديد الكيانات ، وتعريف أنواع الكيانات ، واختيار أسماء الكيانات والأوصاف ، بالإضافة إلى بعض الأساليب لتجنب أخطاء النمذجة الأكثر شيوعًا المرتبطة باستخدام الكيانات.

يجب أن يكون للكيانات مجموعة كاملة من السمات ، بحيث يمكن تمثيل كل حقيقة عن كل كيان بسماته. يجب أن يكون لكل سمة اسم يعكس معناها ونوع بيانات منطقية ووصف أو تعريف واضح وقصير وكامل. في منشور مدونة مستقبلي ، سننظر في مجموعة أولية من الإرشادات للتنسيق الصحيح لأسماء السمات والأوصاف. يجب أن تتضمن العلاقات بناء الفعل الذي يصف العلاقة بين الكيانات ، إلى جانب خصائص مثل التعددية وضرورة الوجود أو احتمال عدم وجود علاقة.

ملاحظة تعدد العلاقة تصف الحد الأقصى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل الكيان الأصلي.ضرورة الوجود أو احتمالية الغياب تعمل العلاقة على تحديد الحد الأدنى لعدد مثيلات الكيان الثانوي التي يمكن إقرانها بمثيل من الأصل

إرسال عملك الجيد في قاعدة المعرفة أمر بسيط. استخدم النموذج أدناه

سيكون الطلاب وطلاب الدراسات العليا والعلماء الشباب الذين يستخدمون قاعدة المعرفة في دراساتهم وعملهم ممتنين جدًا لك.

نشر على http://www.allbest.ru/

  • 1. نموذج البيانات العلائقية
    • 1.1 نموذج البيانات العلائقية. التعاريف الأساسية
    • 1.2 العمليات على العلاقات
  • 2. نظم معلومات الشركات
  • فهرس

1. نموذج البيانات العلائقية

1.1 نموذج البيانات العلائقية. التعاريف الأساسية

في التخصصات الرياضية ، يتوافق مفهوم "الجدول" مع مفهوم "العلاقة" (العلاقة). يعكس الجدول كائنًا من العالم الحقيقي - كيان ، ويعكس كل سطر من سطوره مثيلًا محددًا للكيان. كل عمود له اسم فريد في الجدول. السلاسل ليس لها أسماء ، وترتيبها غير محدد ، والرقم غير محدود منطقيًا. إحدى المزايا الرئيسية لنموذج البيانات العلائقية هي التجانس (كل صف في الجدول له نفس التنسيق). الأمر متروك للمستخدم ليقرر ما إذا كانت الكيانات المعنية متجانسة. هذا يحل مشكلة ملاءمة النموذج.

مفاهيم أساسية:

* العلاقة هي جدول ثنائي الأبعاد يحتوي على بعض البيانات.

* الكيان - كائن من أي طبيعة ، يتم تخزين البيانات عنه في قاعدة البيانات. السمات هي الخصائص التي تميز الكيان (الأعمدة).

* درجة العلاقة هي عدد الأعمدة.

* مخطط العلاقة - قائمة بأسماء السمات ، على سبيل المثال ، الموظف (الرقم ، الاسم الكامل ، سنة الميلاد ، المنصب ، القسم).

* المجال - مجموعة من قيم سمات العلاقة (نوع البيانات).

* المجموعة هي صف جدول.

* العلاقة الأساسية (العلاقة الأساسية) - عدد الصفوف في الجدول.

* المفتاح الأساسي هو سمة تحدد بشكل فريد صفوف العلاقة. يسمى المفتاح الأساسي متعدد السمات المفتاح الأساسي المركب. لا يمكن أن يكون المفتاح الأساسي فارغًا كليًا أو جزئيًا (فارغًا). تسمى المفاتيح التي يمكن استخدامها كمفاتيح أساسية بالمفاتيح المحتملة أو البديلة.

* المفتاح الخارجي هو سمة (سمات) لجدول ما يمكن أن تكون بمثابة مفتاح أساسي لجدول آخر. يشير إلى المفتاح الأساسي لجدول آخر.

التطبيع هو عملية تهدف إلى تقليل تكرار المعلومات في قاعدة البيانات. بالإضافة إلى البيانات نفسها ، يمكن أيضًا تسوية العديد من الأسماء وأسماء الكائنات والتعبيرات في قاعدة البيانات.

تحتوي قاعدة البيانات غير المقيسة على معلومات في جدول واحد أو أكثر ؛ يعطي هذا انطباعًا بأن تضمين البيانات في جدول معين لا يرجع إلى أي أسباب واضحة. يمكن أن يكون لهذه الحالة تأثير سلبي على أمان البيانات ، والاستخدام الفعال لمساحة القرص ، وسرعة الاستعلام ، وكفاءة تحديث قاعدة البيانات ، وربما الأهم من ذلك ، سلامة المعلومات المخزنة. قاعدة البيانات قبل التطبيع هي بنية لم يتم تقسيمها منطقياً إلى جداول أصغر يمكن إدارتها حتى الآن.

النموذج العادي هو نوع من المؤشرات لمستوى أو عمق تسوية قاعدة البيانات. يتوافق مستوى تسوية قاعدة البيانات مع النموذج العادي الذي توجد به.

1.2 العمليات على العلاقات

لإحضار الجدول إلى النموذج العادي الأول (1NF) ، يجب مراعاة قاعدتين:

1. الذرية أو عدم القابلية للتجزئة. يجب أن يحتوي كل عمود على قيمة واحدة غير قابلة للتجزئة.

2. يجب ألا يحتوي الجدول على أعمدة مكررة أو مجموعات بيانات.

على سبيل المثال ، إذا كان الجدول يحتوي في حقل واحد على العنوان الكامل لشخص ما (شارع ، مدينة ، رمز بريدي) ، فلن يفي بقواعد 1NF ، لأنه سيحتوي على قيم مختلفة في عمود واحد ، مما يعد انتهاكًا للقاعدة الذرية. أو إذا كانت قاعدة البيانات تحتوي على بيانات حول الأفلام وتحتوي على الأعمدة Actor1 و Actor2 و Actor3 ، فلن تتوافق أيضًا مع القواعد ، حيث ستتكرر البيانات.

يجب أن تبدأ التسوية بفحص بنية قاعدة البيانات من أجل التوافق مع 1NF. يجب تقسيم جميع الأعمدة غير الذرية إلى الأعمدة المكونة لها. إذا كانت هناك أعمدة مكررة في الجدول ، فعليهم تحديد جدول منفصل.

لإحضار الجدول إلى النموذج العادي الأول ، يجب عليك:

* ابحث عن جميع الحقول التي تحتوي على أجزاء متعددة من المعلومات.

* يجب وضع البيانات التي يمكن تقسيمها إلى أجزاء مكونة في حقول منفصلة.

* نقل البيانات المكررة إلى جدول منفصل.

* تحقق مما إذا كانت جميع الجداول تتطابق مع شروط النموذج العادي الأول.

لإحضار الجداول إلى النموذج العادي الثاني (2NF) ، يجب أن تكون الجداول موجودة بالفعل في 1NF. يجب أن تستمر عملية التطبيع بالترتيب.

الآن ، في النموذج العادي الثاني ، يجب استيفاء الشرط - أي عمود ليس مفتاحًا (بما في ذلك الخارجي) يجب أن يعتمد على المفتاح الأساسي. عادةً ما يسهل التعرف على هذه الأعمدة التي تحتوي على قيم مستقلة عن المفتاح. إذا كانت البيانات الموجودة في العمود غير مرتبطة بالمفتاح الذي يصف الصف ، فيجب فصلها في جدول منفصل خاص بها. يجب إرجاع المفتاح الأساسي إلى الجدول القديم.

لإحضار القاعدة إلى النموذج العادي الثاني ، تحتاج إلى:

* حدد جميع الأعمدة التي لا تعتمد بشكل مباشر على المفتاح الأساسي لهذا الجدول.

* إنشاء الحقول المطلوبة في جداول المستخدمين والمنتديات ، أو الاختيار من الحقول الموجودة أو إنشاء مفاتيح أساسية من الحقول الجديدة.

* يحتاج كل جدول إلى مفتاحه الأساسي

* إنشاء مفاتيح خارجية وتعيين علاقاتها بين الجداول. ستكون الخطوة الأخيرة للتطبيع مع 2NF هي تخصيص مفاتيح خارجية للاتصال بالجداول المرتبطة. يجب أن يكون المفتاح الأساسي لأحد الجداول هو مفتاح خارجي في آخر.

تلميحات:

هناك طريقة أخرى لتحويل مخطط قاعدة بيانات إلى 2NF وهي النظر إلى العلاقات بين الجداول. من الناحية المثالية ، قم بإنشاء جميع العلاقات الفردية. تحتاج علاقات كثير إلى كثير إلى إعادة الهيكلة.

لن يحتوي الجدول الذي تم تسويته بشكل صحيح على صفوف مكررة (صفان أو أكثر لا تمثل قيمهما مفاتيح وتحتويان على نفس البيانات).

ستكون قاعدة البيانات في النموذج العادي الثالث إذا تم تحويلها إلى النموذج العادي الثاني وكل عمود ليس به مفتاح مستقل عن الآخر. إذا اتبعت عملية التطبيع بشكل صحيح حتى هذه النقطة ، فقد لا تكون هناك أسئلة حول التحويل إلى 3NF. يجب أن تدرك أنه يتم انتهاك 3NF إذا تطلب تغيير القيمة في عمود واحد تغييرًا في العمود الآخر.

لإحضار القاعدة إلى النموذج العادي الثالث ، فأنت بحاجة إلى:

* تحديد الحقول التي تحتوي على ترابطات ، أي الحقول التي تعتمد على بعضها البعض أكثر مما تعتمد على الصف ككل.

* إنشاء جداول مطابقة. إذا كان هناك عمود به مشكلة في الخطوة 1 ، فقم بإنشاء جداول مقسمة له.

* إنشاء أو تخصيص المفاتيح الأساسية. يجب أن يحتوي كل جدول على مفتاح أساسي.

* إنشاء المفاتيح الخارجية المطلوبة التي تشكل أي من العلاقات.

في الشكل الرابع العادي ، هناك قاعدة إضافية وهي أنه من الضروري استبعاد التبعيات متعددة القيم. بمعنى آخر ، يجب أن تكون جميع الصفوف في الجدول مستقلة عن بعضها البعض. لا ينبغي أن يعني وجود بعض الصفوف X أن الصف Y موجود أيضًا في مكان ما في هذا الجدول.

2. نظم معلومات الشركات

نظام بيانات النموذج العلائقي

النظام (من النظام اليوناني - الكل ، مركب مكون من أجزاء) هو مجموعة من العناصر التي تتفاعل مع بعضها البعض ، وتشكل تكاملًا ووحدة معينة. فيما يلي بعض المفاهيم التي تُستخدم غالبًا لوصف النظام.

1. عنصر النظام هو جزء من نظام له غرض وظيفي محدد. غالبًا ما تسمى العناصر المعقدة للأنظمة ، التي تتكون من عناصر مترابطة أبسط ، بالنظم الفرعية.

2. تنظيم النظام - النظام الداخلي ، واتساق تفاعل عناصر النظام ، والذي يتجلى ، على وجه الخصوص ، في الحد من تنوع حالات العناصر داخل النظام.

3. هيكل النظام - تكوين وترتيب ومبادئ تفاعل عناصر النظام ، والتي تحدد الخصائص الأساسية للنظام. إذا كانت العناصر الفردية للنظام متباعدة عبر مستويات مختلفة وكانت الاتصالات الداخلية بين العناصر منظمة فقط من المستويات الأعلى إلى الأدنى والعكس صحيح ، فإننا نتحدث عن الهيكل الهرمي للنظام. الهياكل الهرمية البحتة نادرة عمليًا ، لذلك ، يتم توسيع هذا المفهوم إلى حد ما ، وعادة ما يُفهم الهيكل الهرمي على أنه مثل هذه الهياكل حيث ، من بين الروابط الأخرى ، العلاقات الهرمية ذات أهمية أساسية.

4. هندسة النظام - مجموعة من خصائص النظام الضرورية للمستخدم.

5. سلامة النظام - عدم الاختزال الأساسي لخصائص النظام إلى مجموع خصائص عناصره الفردية (ظهور الخصائص) ، وفي الوقت نفسه ، اعتماد خصائص كل عنصر على مكانه و تعمل داخل النظام.

نظام المعلومات هو مجموعة مترابطة من الوسائل والأساليب والأفراد المستخدمة لتخزين ومعالجة وإصدار المعلومات من أجل تحقيق الهدف المحدد "

ينص القانون الاتحادي "بشأن المعلومات والإعلام وحماية المعلومات" على التعريف التالي:

"نظام المعلومات هو مجموعة مرتبة تنظيميًا من المستندات (صفائف المستندات) وتقنيات المعلومات ، بما في ذلك استخدام تكنولوجيا الكمبيوتر والاتصالات التي تنفذ عمليات المعلومات"

تصنيف المقياس

من حيث الحجم ، تنقسم أنظمة المعلومات إلى المجموعات التالية:

* غير مرتبطة؛

* مجموعة؛

* شركة كبرى.

نظام معلومات الشركة هو نظام قابل للتطوير مصمم للأتمتة المتكاملة لجميع أنواع الأنشطة الاقتصادية للمؤسسات الكبيرة والمتوسطة الحجم ، بما في ذلك الشركات التي تتكون من مجموعة من الشركات التي تتطلب إدارة موحدة.

يمكن اعتبار نظام معلومات الشركة نظامًا يقوم بأتمتة أكثر من 80٪ من أقسام المؤسسة.

في الآونة الأخيرة ، في العديد من المنشورات المخصصة لاستخدام تكنولوجيا المعلومات في إدارة الأشياء الاقتصادية ، غالبًا ما يستخدم مصطلح "أنظمة معلومات الشركات" ، والتي تعني فيها أنظمة المعلومات الآلية الفعلية للأشياء الاقتصادية.

نظام المعلومات الآلي (AIS) هو مزيج من أنواع مختلفة من الدعم ، بالإضافة إلى المتخصصين المصممين لأتمتة معالجة المعلومات المحاسبية والتحليلية. كقاعدة عامة ، تكون أنواع الدعم متجانسة للأنظمة المختلفة في التكوين ، مما يجعل من الممكن تنفيذ مبدأ توافق الأنظمة أثناء تشغيلها. في عملية دراسة AIS كنظام معقد ، من الضروري تحديد الأجزاء والعناصر الفردية والنظر في ميزات استخدامها في مراحل الإنشاء والتشغيل.

تعد أنظمة معلومات الشركة بمثابة تطور لأنظمة مجموعات العمل ، فهي تركز على الشركات الكبيرة ويمكن أن تدعم العقد أو الشبكات المتفرقة جغرافيًا. في الأساس ، لديهم هيكل هرمي من عدة مستويات. تتميز هذه الأنظمة بهندسة العميل والخادم مع التخصص في الخوادم أو بنية متعددة المستويات. عند تطوير مثل هذه الأنظمة ، يمكن استخدام نفس خوادم قواعد البيانات كما هو الحال عند تطوير أنظمة معلومات المجموعة. ومع ذلك ، في أنظمة المعلومات الكبيرة ، فإن الخوادم الأكثر شيوعًا هي Oracle و DB2 و Microsoft SQL Server.

بالنسبة لأنظمة المجموعات والشركات ، يتم زيادة متطلبات موثوقية التشغيل وسلامة البيانات بشكل كبير. يتم الاحتفاظ بهذه الخصائص من خلال الحفاظ على البيانات والمراجع وتكامل المعاملات في خوادم قاعدة البيانات.

التصنيف حسب النطاق

وفقًا لنطاق التطبيق ، يتم عادةً تقسيم أنظمة المعلومات إلى أربع مجموعات:

* أنظمة تسيير التحويلات؛

* أنظمة صنع القرار.

* نظم المعلومات والمراجع.

* نظم المعلومات المكتبية.

فهرس

1. أغالتسوف ، ف. قاعدة البيانات. في مجلدين V. 2. قواعد البيانات الموزعة والبعيدة: Textbook / V.P. اجالتسوف. - م: ID FORUM، NITs INFRA-M، 2013.

2. Golitsyna، O. L. قواعد البيانات: Textbook / O.L. جوليتسينا ، نيفادا ماكسيموف ، أنا. بوبوف. - م: المنتدى ، 2012.

3. Karpova، I.P. قواعد البيانات: Textbook / I.P. كاربوف. - SPb .: بيتر ، 2013.

4. كيريلوف ، ف. مقدمة في قواعد البيانات العلائقية مقدمة في قواعد البيانات العلائقية. كيريلوف ، ج. جروموف. - SPb .: BHV-Petersburg، 2012.

5. بيروجوف ، ف. نظم المعلومات وقواعد البيانات: التنظيم والتصميم: كتاب مدرسي / V.Yu. بيروجوف. - SPb .: BHV-Petersburg، 2009.

6. G.N. فيدوروف. نظم المعلومات. - م: الأكاديمية ، 2013.

7. أ. ساتونينا ، لوس أنجلوس سيسوفا. إدارة مشروع نظام معلومات الشركة للمؤسسة. - م: المالية والإحصاء ، Infra-M ، 2009.

تم النشر في Allbest.ru

...

وثائق مماثلة

    جوهر وخصائص أنواع نماذج البيانات: الهرمية والشبكية والعلائقية. المفاهيم الأساسية لنموذج البيانات العلائقية. السمات ، مخطط علاقة قاعدة البيانات. شروط سلامة البيانات. العلاقات بين الجداول. الفهم العام لنموذج البيانات.

    ورقة المصطلح ، تمت إضافة 01/29/2011

    نظم معلومات الشركات وقواعد البيانات ، واستخدامها لتحسين وتصحيح الأعمال. تصنيف نظم معلومات الشركات. نظم معلومات فئة OLTP. المعالجة التحليلية السريعة.

    تمت إضافة ورقة مصطلح في 01/19/2011

    قواعد البيانات ذات الملفات ثنائية الأبعاد وأنظمة إدارة قواعد البيانات العلائقية (DBMS). إنشاء قاعدة بيانات ومعالجة الاستعلامات لهم باستخدام نظم إدارة قواعد البيانات. الأنواع الرئيسية لقواعد البيانات. المفاهيم الأساسية لقواعد البيانات العلائقية. الخصائص الأساسية للعلاقات.

    الملخص ، تمت الإضافة في 12/20/2010

    مفهوم نظام قواعد البيانات. النموذج العلائقي وخصائصه. النزاهة في النموذج العلائقي. الجبر العلائقي. قضايا تصميم قاعدة البيانات. الأشكال الطبيعية للعلاقات. تصميم قاعدة بيانات باستخدام طريقة علاقة الكيانات. مخططات ER. لغة SQL.

    تمت إضافة محاضرة بتاريخ 10/03/2008

    هيكل منطقي محدد للبيانات المخزنة في قاعدة بيانات. نماذج البيانات الأساسية. عناصر نموذج البيانات العلائقية. مثال على استخدام المفاتيح الخارجية. المتطلبات الأساسية لعلاقة نموذج البيانات العلائقية.

    تمت إضافة العرض بتاريخ 14/10/2013 م

    قواعد البيانات واستخدامها في الحوسبة. الميزات والوحدة البناءة الأساسية لنموذج بيانات الشبكة. النموذج الهرمي ، كائنات مجال الموضوع. النموذج العلائقي ، رؤيته ، عرض البيانات في شكل جدول.

    الملخص ، تمت الإضافة في 12/19/2011

    أنواع ووظائف نظام إدارة قاعدة بيانات Microsoft Access. نموذج هرمي ، شبكي ، علائقي لوصف قواعد البيانات. المفاهيم الأساسية لجدول قاعدة البيانات. ميزات إنشاء كائنات قاعدة البيانات والنماذج الأساسية. الوصول إلى الإنترنت في Access.

    الاختبار ، تمت إضافة 01/08/2011

    نظم إدارة قواعد البيانات الحديثة (DBMS). تحليل نموذج البيانات الهرمي. نموذج البيانات العلائقية. نموذج بيانات ما بعد العلائقية كنموذج علائقي موسع يزيل القيود المفروضة على عدم قابلية البيانات المخزنة في سجلات الجدول للتجزئة.

    عمل علمي ، أضيف بتاريخ 06/08/2010

    نماذج البيانات في إدارة قواعد البيانات. نماذج البيانات المفاهيمية. دور قواعد البيانات في نظم المعلومات. نموذج البيانات العلائقية. تعريف مجال الموضوع. بناء نموذج قاعدة بيانات لنظام معلومات "الحيوانات الأليفة".

    ورقة مصطلح ، تمت الإضافة بتاريخ 04/19/2011

    نموذج المعلومات في Access كنوع من البديل المبسط لكائن أو نظام حقيقي. الهياكل الأساسية التي تحدد تنظيم البيانات والعلاقات بينها ؛ نوع علائقي لتنظيم البيانات. مثال على قاعدة بيانات في الضرائب.