قائمة طعام
مجانا
تسجيل
بيت  /  الملاحون/ طرق وخوارزميات معالجة الصور. تنفيذ النظام

طرق وخوارزميات معالجة الصور. تنفيذ النظام

تمثيل الصورة

هناك نوعان رئيسيان من تمثيلات الصور - المتجه والنقطية.

في التمثيل المتجه ، يتم وصف الصورة بمجموعة من الخطوط (المتجهات) ، والتي تحتوي على إحداثيات نقطتي البداية والنهاية ، وانحناء الخطوط والخصائص الهندسية الأخرى ، وقواعد إنشاء مناطق مختلفة وخصائص اللون هي أيضًا وصفها. بمعنى آخر ، يتطلب التمثيل النقطي تشكيل بعض النماذج الرياضية. لذلك ، يتم استخدام التمثيل المتجه بشكل أساسي في حل مشاكل تركيب الصور. على الرغم من أن بعض خوارزميات التعرف على الصور تتطلب تمثيلًا متجهًا لعملها ، والذي يجب الحصول عليه من الصورة الأصلية.

الصورة النقطية هي مصفوفة واحدة أو أكثر تصف التوزيع المكاني لخصائص الصورة على شبكة إحداثيات ديكارتية معينة. في هذه الحالة ، يتم إنشاء الصورة من مجموعة من النقاط ولها بنية نقطية. العنصر الرئيسي في التمثيل النقطي للصورة هو البكسل (اختصار لعبارة "عناصر الصورة" - عناصر الصورة) ، والذي يحتوي على إحداثيات في نظام إحداثيات نقطية وبعض السمات (اللون والسطوع والشفافية وما إلى ذلك). يحدد عدد البكسل على طول إحداثيات X و Y (أفقيًا ورأسيًا) دقة (أبعاد) تمثيل الصورة. يتم تحديد لون البيكسل من خلال عمقها ، وهو عدد البتات المطلوبة لتحديد أي لون.

تنقسم الصور النقطية ، بناءً على طرق ضبط لون البكسل وخصائص الصورة الأصلية ، إلى:

الثنائية

نصفية

لوحة

بالألوان الكاملة

في التمثيل الثنائي ، يمكن أن يكون لون البكسل إما أبيض أو أسود ويتم ترميزه في بت واحد. الصورة عبارة عن مصفوفة. كل عنصر I (i، j) من هذه المصفوفة له قيمة إما 0 أو 1 ، حيث i هو رقم الصف ، ورقم عمود j للعنصر المقابل للبكسل المحدد (الشكل 1).

في الصور ذات التدرج الرمادي ، تمثل البيكسلات قيم السطوع المقابلة لظلال الرمادي. تحدد مؤشرات المصفوفة التي تصف صورة الألوان النصفية موضع البكسل على البيانات النقطية وقيمة عنصر المصفوفة

- يضبط سطوعه I (i، j) (الشكل 2).

يتم وصف صور اللوحة بواسطة مصفوفتين (الشكل 3). يخزن المرء قيم الفهارس ، التي تحدد الوصول إلى صف مصفوفة اللوحة. مصفوفة اللوحة عبارة عن خريطة ملونة. يحتوي على 3 مجموعات من الأعمدة - المقابلة للألوان الحمراء "R" والأخضر "G" والأزرق "B". يقومون بتعيين لون البكسل المقابل.

اللوح هو مصفوفة Nc 3 ، حيث Nc هو عدد الألوان.

خوارزميات المعالجة المسبقة للصور

الصور كاملة الألوان مدمجة بتنسيق RGB وتمثل ثلاث مصفوفات R (i، j)، G (i، j)، B (i، j). تحتوي العناصر المقابلة لكل مصفوفة على قيم كثافة الألوان الأحمر والأخضر والأزرق للبكسل المحدد بواسطة مؤشرات المصفوفة. وبالتالي ، لا تحتوي الصورة ذات الألوان الكاملة على خريطة ملونة ويتم تمثيل لون كل بكسل بثلاثة أرقام مأخوذة من المصفوفات المقابلة (الشكل 4).

يمكن أن يكون تنسيق الأرقام في المصفوفات إما عددًا صحيحًا أو فاصلة عائمة. تشير الحالة الأولى إلى ما يسمى بالصور الرقمية التي تم الحصول عليها باستخدام أجهزة مختلفة - الماسحات الضوئية والكاميرات الرقمية وكاميرات التلفزيون وما إلى ذلك. في هذا التنسيق يتم تخزين المعلومات حول الصور في ملفات الرسوم القياسية.

يستخدم الخيار الثاني للتمثيل الداخلي للصور أثناء معالجتها. في هذه الحالة ، من الملائم تسوية بيانات الكثافة إلى نطاق واحد ، على سبيل المثال ، إلى النطاق ، وإجراء عمليات حسابية مختلفة بأرقام عائمة ، ثم تحويل النتيجة إلى نموذج العدد الصحيح الأصلي. تسمح هذه الطريقة بتقليل أخطاء الحساب وتحسين دقة نتيجة المعالجة.

بالنسبة للصور ذات الألوان الكاملة ، فإن أحد الخيارات هو الحد الأقصى لعدد الألوان التي يمكن تمثيلها بهذا التنسيق. تحتوي الصور الأكثر استخدامًا على 16 و 256 و 65536 (ألوان عالية) و 10.7 مليون لون (لون حقيقي).

خوارزميات المعالجة المسبقة للصور

0 0 0 0 1 1 1 0 0

120 122 125 128 115 117 118

1 0 0 0 1 1 1 1 0

119 121 124 125 128 130 133

1 1 0 0 1 1 0 0 1

122 122 124 123 127 126 128

120 121 123 125 127 125 126

1 1 1 0 1 1 0 0 0

118 110 109 108 108 109 110

0 0 1 0 0 1 0 0 1

خوارزميات المعالجة المسبقة للصور

مصفوفة الفهرس

31 15 03 09

مصفوفة لوح الألوان

خوارزميات المعالجة المسبقة للصور

يمكن تمثيل الصورة بالألوان الكاملة ليس فقط بتنسيق RGB ، ولكن أيضًا باستخدام أنظمة ألوان أخرى.

في نظام HSB ، يتم تمثيل اللون بخصائص الألوان التالية: تدرج اللون - درجة اللون ؛

التشبع - التشبع سطوع - سطوع.

يُعتقد أن نظام الألوان هذا يتوافق مع خصوصيات الإدراك البشري للون.

في نظام LAB ، يُعتبر اللون مزيجًا من السطوع (الإضاءة) وقيمتين مستقلتين للتلوين ، والتي تحدد اللون الحقيقي للبكسل. اللونية أ - يتم تحديد مكون اللون في النطاق من اللون الأرجواني إلى الأخضر. اللونية B - يتم تحديد مكون اللون الثاني من النطاق من الأصفر إلى الأزرق.

هناك أنظمة أخرى لتمثيل الألوان. وبطبيعة الحال ، كلهم ​​متصلون ، ويمكن الحصول من تمثيل آخر. تنوع أنظمة الألوان يرجع إلى المهام التي تم حلها بمساعدتهم. على سبيل المثال ، من الأنسب إجراء تصحيح الألوان في نظام LAB ، لإعادة إنتاج الصورة على شاشة الشاشة في نظام RGB ، فمن الأفضل الطباعة ،

خوارزميات المعالجة المسبقة للصور

باستخدام تمثيل CMYK. ومع ذلك ، في أي حال ، عند معالجة الصور والتعرف عليها ، فإنها تعمل مع تمثيل نقطي للصور التي تحتوي على مصفوفة واحدة أو أكثر.

تصنيف خوارزميات المعالجة المسبقة

تنقسم خوارزميات المعالجة المسبقة للصور إلى مجموعات مختلفة اعتمادًا على ميزة التصنيف. يجب على جميع خوارزميات ما قبل المعالجة إما تحسين جودة الصور بمعنى ما ، أو تحويلها إلى الشكل الأكثر ملاءمة للمعالجة اللاحقة.

تسمى الخوارزميات التي تهدف إلى تحسين إعادة إنتاج ألوان الصورة بخوارزميات تصحيح الألوان. تتضمن هذه المجموعة أيضًا خوارزميات تعمل مع الصور الرمادية التي تغير سطوعها وخصائص التباين.

الخوارزميات التي تهدف إلى معالجة الخصائص المكانية للصور تسمى الخوارزميات التصفية المكانية.تتضمن هذه المجموعة خوارزميات قمع الضوضاء ، وخوارزميات التسوية المكانية وخوارزميات التضخيم المكاني ، وخوارزميات لقمع وتضخيم الترددات المكانية.

تسمى الخوارزميات التي تقوم بعمليات هندسية على صورة خوارزميات المعالجة الهندسية. وتشمل هذه:

خوارزميات المعالجة المسبقة للصور

اقتصاص صورة - اختيار جزء معين من شكل مستطيل من الصورة الأصلية ؛

تغيير حجم الصورة. تستخدم هذه الخوارزميات طرق استيفاء مختلفة إما لملء وحدات البكسل المفقودة في الصورة المكبرة بشكل صحيح ، أو إعادة حساب قيم البكسل عند تقليل الصورة.

تدوير الصورة. تقوم هذه الخوارزميات بتدوير الصورة الأصلية بزاوية معينة ، وإعادة حساب قيم البكسل بشكل صحيح باستخدام طرق الاستيفاء المختلفة.

تسمى الخوارزميات التي تقوم بالتحويلات من نظام ألوان إلى آخر خوارزميات تحويل اللون. وهي تتضمن أيضًا خوارزميات لتحويل الصور الملونة إلى خوارزميات التدرج الرمادي والثنائية التي تحول الصورة الأصلية إلى صورة ثنائية.

تسمى الخوارزميات التي تحدد بعض المناطق في الصورة الأصلية وفقًا لظروف مختلفة وغير رسمية في كثير من الأحيان بخوارزميات التجزئة. مثال على هذه الخوارزمية يمكن أن يكون ، على سبيل المثال ، خوارزمية يجب أن تبرز مناطق من النص والمعلومات الرسومية على صورة وثيقة أو خوارزمية تحدد مناطق في صورة نصية تنتمي إلى كلمات فردية.

خوارزميات المعالجة المسبقة للصور

خوارزميات التصفية المكانية

التصفية المكانية للصورة في شكل رياضي هي التفاف منفصل لصورة منفصلة مع بعض الاستجابة النبضية لمرشح مكاني

إذا (i، j)

أنا (أنا م ، ي ن) ح (م ، ن) ، حيث:

م N11 ن N21

Im ، إذا كانت مصفوفات الصور الأصلية والمفلترة ، h هي مصفوفة الاستجابة النبضية للمرشح ،

N 11 ، N 21 الحدود الدنيا والعليا لأعمدة الاستجابة النبضية ، N 12 ، N 22 الحدود اليسرى واليمنى لصفوف الاستجابة النبضية.

يمكن الحصول على مصفوفة الاستجابة النبضية عن طريق حساب المرشح المكاني من ضبط المعلمات. تم تخصيص قدر كبير من المؤلفات حول التصفية الرقمية لطرق حساب المرشحات المكانية ، على سبيل المثال. للحسابات العملية ، يمكنك استخدام الحزم الرياضية القياسية ، على سبيل المثال ، يتضمن نظام "MATLAB" نظام حساب مرشح "تصميم مرشح الصور".

لاحظ أنه يمكن أيضًا إجراء الترشيح في مجال التردد. في هذا

خوارزميات المعالجة المسبقة للصور

في هذه الحالة يكون ترتيب التصفية كما يلي:

تحويل الصورة من المجال المكاني إلى مجال التردد باستخدام تحويل فورييه المنفصل ثنائي الأبعاد

قم بإجراء الضرب حسب العنصر لمصفوفة تردد الصورة بواسطة مصفوفة تردد المرشح

يتم تحويل النتيجة التي تم الحصول عليها إلى مجال مكاني باستخدام تحويل فورييه المنفصل ثنائي الأبعاد المعكوس.

أنا (س ، ص)

ايم (و س ، و ص)

إذا (f x، f y) Im (f x، f y) H (f x، f y)

إذا (fx، f y)

إذا (س ، ص).

نادرًا ما يتم استخدام ترشيح الصور في مجال التردد نظرًا للكم الهائل من الحسابات. ومع ذلك ، تُستخدم طريقة التصفية هذه على نطاق واسع في الحسابات النظرية في تحليل خيارات معالجة الصور. يتيح لك تصور نوع التصفية المطلوب بوضوح تام. على سبيل المثال ، إذا كنت بحاجة إلى إبراز التغييرات الحادة في السطوع في الصورة ، فمن الواضح أنك بحاجة إلى استخدام مرشحات التمرير العالي. على العكس من ذلك ، إذا كنت بحاجة إلى التخلص من ضوضاء التردد المنخفض - الدوائر المرتعشة ، والقمم الفردية ، وما إلى ذلك ، فأنت بحاجة إلى استخدام مرشحات الترددات المنخفضة. يتم اختيار معلمات مرشح محددة بناءً على تحليل تردد التداخل وخصائص الصورة الأصلية.

رقمي علاج إشارات

الموضوع 17. معالجة الصور

لا يوجد شيء يفوق خيال الإنسان.

تيتوس لوكريتيوس. فيلسوف وشاعر روماني. القرن الأول قبل الميلاد ه.

الخيال شيء جيد. لكن لسحب بوم من الطابق السفلي ، اغسله ، حوّله إلى أبولو ، احزمه في علبة أعواد الثقاب وأرسله إلى صديق بريد إلكترونيجيد برنامج رسوماتسيفعل ما هو أفضل.

أناتولي بيشمينتسيف ، عالم جيوفيزيائي نوفوسيبيرسك من مدرسة الأورال. القرن ال 20

مقدمة.

1. مفاهيم أساسية. تمثيل رسوميالصور. تمثيل اللون في رسومات الحاسوب. نموذج لون RGB. نظام الألوان CIE XYZ.

2. التحولات الهندسية للصور النقطية. مجالات ومراحل التحول. أخذ العينات. سلسلة الإقحام لاستعادة الإشارة ثنائية الأبعاد. تردد التشوهات في الصور والقضاء عليها. إعادة تشكيل الصورة.

3. تصفية الصور. مرشحات الخط. تنعيم المرشحات. مرشحات التباين. مرشحات الفرق. التفاف دوري ثنائي الأبعاد. مرشحات غير خطية. تصفية العتبة. متوسط ​​التصفية. المرشحات المتطرفة.

4. ضغط الصور. خوارزميات ترميز طول التكرار (RLE). خوارزميات القاموس. خوارزميات الترميز الإحصائي. ضغط الصورة مع فقدان البيانات. تقدير فقدان الصورة. تحويل فورييه. تحول موجية.

مقدمة

ينمو نطاق البحث في مجال التصوير الرقمي بسرعة. وذلك لأن معالجة الصور هي معالجة إشارات متعددة الأبعاد ، ومعظم الإشارات في العالم الحقيقي متعددة الأبعاد.


الصورة في التمثيل الرياضي هي إشارة ثنائية الأبعاد تحمل قدرًا هائلاً من المعلومات. صورة ملونة 500 × 500 عنصر هي مجموعة من مئات الآلاف من البايتات. من الممكن معالجة هذه المعلومات فقط من خلال تنظيم عقلاني للحسابات. يمكنك استخدام ملفات طرق فعالةالمعالجة ، مع مراعاة ميزات وقيود هذه المهمة بالذات. ولكن إذا تحدثنا عن معالجة الصور لحل فئة واسعة من المشكلات ، فمن الضروري تحديد مجموعة من العمليات القياسية التي يمكن من خلالها بناء الخوارزميات لحل المشكلات التعسفية. وتشمل هذه التحولات الخطية ، والتفاف ثنائي الأبعاد ، وتحويلات فورييه المنفصلة ثنائية الأبعاد.

ولكن في معالجة الصور ، تُستخدم التحويلات غير الخطية أيضًا على نطاق واسع. خصوصية الصور هي أن العناصر الفردية للصورة مرتبطة ببعض العناصر المجاورة. لذلك ، فإن معظم خوارزميات تحويل الصور محلية بطبيعتها ، أي أنها تعالج الصور من خلال مجموعات من العناصر الموجودة في الحي حول المنطقة المحددة. تفي التحويلات الخطية بخاصية المنطقة وتسمح ببناء خوارزميات لا يعتمد تعقيدها الحسابي كثيرًا على حجم الحي المغطى. نفس الخصائص مطلوبة لعمليات تحويل الصور غير الخطية. تتضمن فئة هذه التحويلات الخوارزميات ، والتي تسمى خوارزميات تصفية الرتب ، بناءً على حساب إحصائيات صورة الرتبة المحلية. عند حساب إحصائيات الترتيب ومشتقاتها ، يمكن إجراء عمليات التبسيط المتعلقة بتكرار المعلومات للصور. الخوارزمية الأكثر شهرة في هذه الفئة هي خوارزمية التصفية الوسيطة. أمثلة أخرى لخوارزميات الترتيب هي خوارزميات التصفية القصوى التي تحل محل عنصر الصورة الذي تم تحليله بحد أقصى أو أدنى في المنطقة المجاورة. خاصية أخرى لخوارزميات الترتيب هي التكيف المحلي مع خصائص الصورة المعالجة وإمكانية استخدامها ليس فقط للتنعيم وتقليل التشويش ، ولكن أيضًا لاستخراج الميزات عندما التعرف التلقائيالصور.

في معالجة الصور ، تُستخدم طرق معالجة الإشارات أحادية البعد على نطاق واسع ، إذا كان من الممكن تعميمها على الإشارات متعددة الأبعاد. في الوقت نفسه ، يتعين على المرء أن يأخذ في الاعتبار أن الطرق الرياضية لوصف الأنظمة متعددة الأبعاد ليست كاملة. تتمتع الأنظمة متعددة الأبعاد بعدد كبير من درجات الحرية ، ويكتسب تصميمها مرونة ليست من سمات الأنظمة أحادية البعد. في الوقت نفسه ، لا يمكن تحليل كثيرات الحدود متعددة الأبعاد إلى عوامل بسيطة ، مما يعقد تحليل وتوليف الأنظمة متعددة الأبعاد.

17.1. مفاهيم أساسية

تمثيل رسومي للصور. لتمثيل المعلومات الرسومية على مستوى ثنائي الأبعاد (شاشة شاشة) ، يتم استخدام طريقتين: خطوط المسح والمتجه.

باستخدام نهج المتجه ، يتم وصف المعلومات الرسومية على أنها مجموعة من الكائنات الهندسية المجردة - خطوط مستقيمة ، ومقاطع ، ومنحنيات ، ومستطيلات ، وما إلى ذلك. يفترض وصف المتجه معرفة مسبقة بهيكل الصورة.

تعمل الرسومات النقطية على صور عشوائية في شكل صور نقطية. النقطية هي وصف لصورة على مستوى عن طريق تقسيمها (أخذ عينات) إلى عناصر متطابقة على طول شبكة منتظمة وتعيين لون خاص لكل عنصر وأي سمات أخرى. أبسط خطوط المسح هو مستطيل ، والأكثر اقتصادا من حيث عدد العينات لنقل الصور هو سداسي. رياضياً ، النقطية عبارة عن تقريب ثابت متعدد التعابير على مستوى دالة صورة متصلة.

عنصر النقطية يسمى بكسل. تحديد البكسل القياسي:


f (i، j) = (A (i، j)، C (i، j))، (17.1.1)

حيث A (i، j) Ì R2 - منطقة البكسل ، C (i، j) Î C - خاصية البكسل (اللون عادة). السمتان الأكثر استخدامًا هما:

C (i، j) = I (i، j) - شدة (سطوع) البكسل ؛

C (i، j) = (R (i، j)، G (i، j)، B (i، j)) - سمات اللون في نموذج ألوان RGB.

في شكل مصفوفة:

Mij ​​= (Aij ، Cij).

عند أخذ عينات من الصور المستمرة ، يمكن تعريف القيم Aij بطريقتين ، إما كقيم للنقاط Aij = (i ، j) التي تم تحديد سمات Cij لها ، أو كقيم المربعات Aij = (i، i + 1) × (j، j + 1) أو أي شكل آخر ، مع تعريف Cij بمتوسط ​​القيم ضمن هذا النموذج (الشكل 17.1.1).

في الممارسة العملية ، كقاعدة عامة ، X و Y عبارة عن مجموعات محدودة من الأعداد الصحيحة غير السالبة لخطوط نقطية مربعة أو مستطيلة مع نسبة عرض إلى ارتفاع (نسبة عرض إلى ارتفاع) من العرض إلى ارتفاع البيانات النقطية ، والتي تتم كتابتها على سبيل المثال ، "4: 3".

تمثيل اللون في رسومات الحاسوب. يعتمد مفهوم اللون على إدراك العين البشرية للموجات الكهرومغناطيسية في نطاق تردد معين. تصور من قبلنا ضوء النهارلها أطوال موجية λ من 400 نانومتر (بنفسجي) إلى 700 نانومتر (أحمر). يمكن أن يكون وصف تدفق الضوء هو وظيفته الطيفية I (λ). يسمى الضوء أحادي اللون إذا كان طيفه له طول موجي واحد فقط.

هناك نوعان من المستقبلات على شبكية العين: العصي والمخاريط. الحساسية الطيفية للعصي (الشكل 17.1.2) تتناسب طرديًا مع سطوع الضوء الساقط. تنقسم المخاريط إلى ثلاثة أنواع ، لكل منها حساسية معينة في نطاقات محدودة مع حد أقصى للألوان الأحمر والأخضر والأزرق ، وتفقد حساسيتها بشدة في الظلام. تكون حساسية العين للون الأزرق أقل بكثير من الأخريين. من الخصائص المهمة لإدراك الإنسان للضوء الخطية عند إضافة ألوان ذات أطوال موجية مختلفة.

نموذج لون RGB (أحمر ، أخضر ، أزرق - أحمر ، أخضر ، أزرق) في رسومات الكمبيوتر هو الأكثر شيوعًا حاليًا. في هذا النموذج ، يتم تمثيل الوظيفة الطيفية كمجموع منحنيات الحساسية لكل نوع من أنواع المخروط ذات معاملات الوزن غير السالبة (المقيسة من 0 إلى 1) ، والتي يُشار إليها بالرمز R و G و B. خاصية الإضافة للحصول على ألوان جديدة. على سبيل المثال ، تشفير الوظائف الطيفية:

أسود: fblack = 0، (R، G، B) = (0،0،0) ؛

البنفسجي البنفسجي = فريد + fblue ، (R ، G ، B) = (1،0،1) ؛

الأبيض fwhite = فريد + fgreen + fblue ، (R ، G ، B) = (1،1،1).

تظهر مساحة اللون ثلاثية الأبعاد لنموذج RGB في الشكل. 17.1.3. نظرًا لخصائص إدراك الضوء بواسطة المستقبلات ، ليست كل الألوان المرئية للبشر قابلة للتمثيل في هذا النموذج. ومع ذلك ، فإن نسبة الألوان القابلة لإعادة الإنتاج أكبر بكثير من نسبة الألوان التي لا يمكن تمثيلها في هذا النموذج.

نظام الألوان CIE XYZ. تم اعتماد معيار تمثيل الألوان الدولي CIE (CIE - Commission Internationale de l "Eclairage) في عام 1931 من قبل اللجنة الدولية للإضاءة. وهو يحدد ثلاث وظائف أساسية ρX (λ) ، ρY (λ) ، Z (λ) ، اعتمادًا على الطول الموجي ، والتركيبات الخطية التي لها معاملات غير سالبة (X ، Y ، و Z) تنتج جميع الألوان المرئية للإنسان ، وتأخذ هذه الوظائف في الاعتبار الإدراك النسبي لشدة الضوء من قبل مستقبلات العين. يشكل نظام الألوان مخروطًا في الربع الأول ويستخدم لعرض صور ملونة عالية الجودة.

17.2. التحولات الهندسية للصور النقطية

مجالات ومراحل التحول. يمكن تقسيم الصور إلى نصية ومفصلة. في صور النسيج ، تحمل جميع العينات (العناصر) معلومات (صورة على شاشة تلفزيون). الصورة التفصيلية هي صورة يمكن من خلالها تمييز العناصر المتداخلة والخلفية والأشياء المفيدة.

هناك ثلاث مجموعات رئيسية من خوارزميات معالجة الصور على أجهزة الكمبيوتر:

1. معالجة الصور الأولية (الأولية) لغرض الاستعادة ، والتنظيف من الضوضاء العشوائية ، وتحسين الجودة ، وتصحيح التشوهات الهندسية للأنظمة البصرية (إزالة الضبط البؤري ، والزيغ ، وما إلى ذلك).

2. وصف الصور ، التعرف على الأنماط. يتم تنفيذه لتحديد معلمات تفاصيل الصورة ويتضمن: العثور على مناطق من الصورة موحدة من حيث الإضاءة واللون ، وإبراز علامات شكل الصور ، وتحديد إحداثيات نقاط خاصة للكائنات ، إلخ.

3. كفاءة التشفير لتقليل كمية النقل والتخزين.

تعتمد معظم طرق المعالجة المسبقة على استخدام المرشحات الخطية الثابتة المكاني (LPI). يتم تنفيذ الخوارزميات الخطية باستخدام نظائرها ثنائية الأبعاد لمرشحات 1D FIR و IIR. يمكن استخدامها ، على سبيل المثال ، عند تنفيذ المرشحات لتقليل مستوى الضوضاء في الصور.

يتم تنفيذ مرشحات FIR باستخدام طريقة الالتواء. تتمثل ميزة مرشحات FIR ثنائية الأبعاد في الرؤية والبساطة والاستقرار المطلق. يتم تنفيذ مرشحات IIR باستخدام معادلات الفروق وتحويلات z. إنها أسرع من مرشحات FIR ، لكنها قد تكون غير مستقرة. يختلف تركيب مرشحات IIR ثنائية الأبعاد عن توليف المرشحات أحادية البعد ، لأنه بالنسبة للوظيفة ثنائية الأبعاد ، لا يمكن تحديد الأقطاب بشكل صريح.

قد تكون هناك حاجة أيضًا إلى الأساليب غير الخطية لاستعادة الصور وتحسين جودتها. لذلك ، على سبيل المثال ، من أجل قمع الضوضاء وفي نفس الوقت الحفاظ على الجزء المحيط بالصور ، من الضروري تطبيق مرشحات غير خطية أو خطية غير ثابتة مكانياً (SPNI) ، والتي يتم تنفيذها بواسطة خوارزميات الرتب. تعتمد جميع المرشحات غير الخطية المرتبة على خوارزميات سريعة لحساب الرسوم البيانية المحلية.

إحدى هذه الطرق هي الترشيح الوسيط. يعد استخدام المرشحات المتوسطة فعالًا في قمع أنواع معينة من الضوضاء والضوضاء الدورية دون تشويه الإشارة في نفس الوقت ، على سبيل المثال ، لقمع رشقات انبعاثات الضوضاء ، بما في ذلك انقطاع الخط. يمكن أيضًا استخدام الطريقة لحل المشكلات المتعلقة بالتعرف ، على سبيل المثال ، لإبراز الخطوط الرفيعة والأشياء الصغيرة المعزولة.

خوارزميات وصف الصور والتعرف على الصور ، كقاعدة عامة ، هي غير خطية وذات طبيعة إرشادية. عادةً ما تكون علامات الكائنات هي مساحة صورة الكائن ومحيط محيط الصورة ونسبة المساحة إلى مربع محيط الصورة. يمكن تمييز شكل الجسم بنصف قطر الدائرة المنقوشة في الصورة أو المحصورة حول صورة الكائن ، وطول الحد الأدنى والحد الأقصى لمتجه نصف القطر من "مركز الكتلة" للصورة.

أخذ العينات. يتم إجراء تحويلات الصور في الكمبيوتر وتخزين البيانات المعالجة في شكل منفصل. يتم استخدام أخذ العينات للحصول على تمثيل منفصل من الصور التناظرية المستمرة للعالم الحقيقي. في الممارسة العملية ، يتم تنفيذه بواسطة أجهزة الإدخال (الكاميرا الرقمية أو الماسح الضوئي أو غيرها). للإدراك البصري للصور المعالجة على أجهزة الإخراج (العرض ، الراسمة ، إلخ) ، يتم إعادة بناء الصورة التناظرية وفقًا لتمثيلها التقديري.

في أبسط حالات الصور بالأبيض والأسود ، لدينا مصفوفة ثنائية الأبعاد sa (x ، y). بالنسبة للصور الملونة في نموذج RGB ، مع مراعاة خاصية الجمع عند إضافة الألوان ، يمكن أيضًا اعتبار كل طبقة R و G و B ومعالجتها كمصفوفة ثنائية الأبعاد ، مع تجميع لاحق للنتائج.

من بين طرق تعميم التقدير الدوري أحادي البعد على الحالة ثنائية الأبعاد ، فإن أبسط الطرق هو التقدير الدوري في الإحداثيات المستطيلة:

s (n ، m) = sa (nDx ، mDy) ،

حيث Dx و Dy هما فترات أخذ العينات الأفقية والرأسية للإشارة المستمرة ثنائية الأبعاد sa (x ، y) بإحداثيات x و y المستمرة. أدناه ، قيم Dx و Dy ، كما في الحالة أحادية البعد ، تؤخذ مساوية لـ 1.

يؤدي تقديرك للإشارة ثنائية الأبعاد أيضًا إلى تحديد فترة طيفها والعكس صحيح. يتم أيضًا الحفاظ على حالة التكافؤ المعلوماتي للإحداثيات وتمثيلات التردد لإشارة منفصلة مع عدد متساوٍ من نقاط أخذ العينات في نطاقات الإشارة الرئيسية. بالنسبة للتقدير المستطيل ، يتم تحديد تحويلات فورييه المباشرة والمعكوسة بالتعبيرات:

S (ك ، ل) = ث (ن ، م) إكسب (-jn2pk / N-jm2pl / M) ، (17.2.1)

S (k، l) = exp (-jn2pk / N) s (n، m) exp (-jm2pl / M)، (17.2.1 ")

s (n ، m) = S (k ، l) exp (-jn2pk / N-jm2pl / M). (17.2.2)

s (n ، m) = exp (-jn2pk / N) S (k، l) exp (-jm2pl / M). (17.2.2 بوصة)

أرز. 17.2.1. فترة الطيف.

توضح هذه التعبيرات أنه يمكن حساب DFT ثنائي الأبعاد عبر بيانات نقطية لأخذ عينات بيانات مستطيلة باستخدام DFTs التسلسلية 1D. المجاميع الثانية من التعبيرات (17.2.1 ") و (17.2.2") هي DFTs أحادية البعد لأقسام الوظائف s (n ، m) و S (k ، l) على طول الخطين n و k ، على التوالي ، والمجاميع الأولى هي DFTs أحادية البعد للوظائف المحسوبة في الأقسام بواسطة m و l. بمعنى آخر ، يتم إعادة حساب المصفوفات الأولية للقيم s (n ، m) و S (k ، l) أولاً في المصفوفات الوسيطة باستخدام DFT بواسطة الصفوف (أو الأعمدة) ، ويتم إعادة حساب المصفوفات الوسيطة في المصفوفات النهائية باستخدام DFT حسب الأعمدة (أو بالصفوف على التوالي).

من أجل التكرار الدوري للطيف (الشكل 17.2.1) ، الناجم عن أخذ عينات من إشارة تناظرية بتردد Fx = 1 / Dx و Fy = 1 / Dy ، وليس لتغيير الطيف في التردد الرئيسي النطاق (فيما يتعلق بطيف الإشارة التناظرية الأصلية) ، من الضروري ويكفي ألا تتجاوز مكونات التردد الأقصى fmax في طيف الإشارة التناظرية ، في كل من الصفوف والأعمدة ، تردد Nyquist (fmax. x £ fN = Fx / 2، fmax. y £ fM = Fy / 2). وهذا يعني أن تردد أخذ العينات للإشارة يجب أن يكون على الأقل ضعف ارتفاع مكون التردد الأقصى في طيف الإشارة:

fx ³ 2fmax. x ، Fy ³ 2fmax. ذ ، (17.2.3)

مما يضمن وصول الوظائف الطيفية إلى قيم صفرية في نهايات النطاق الرئيسي للطيف.

سلسلة الإقحام لاستعادة الإشارة ثنائية الأبعاد. لو إشارة مستمرة sa (x ، y) هي إشارة محدودة الطيف ، ويتم اختيار فترات أخذ العينات صغيرة بما فيه الكفاية ولا تتداخل أطياف الفترات المجاورة:

Sa (Wx، Wy) = 0 لـ | Wx | p / Dx، | Wy | p / Dx ،

ثم ، كما في الحالة أحادية البعد ، يمكن إعادة بناء الإشارة sa (x ، y) من إشارة منفصلة باستخدام تناظرية ثنائية الأبعاد لسلسلة Kotelnikov-Shannon:

سا (س ، ص) = سن سم ث (ن ، م) . (17.2.4)

تردد التشوهات في الصور والقضاء عليها. يمكن أيضًا أخذ عينات من إشارة ذات طيف غير محدود ، ولكن في هذه الحالة يوجد تداخل في الأطياف في الفترات المجاورة ، في حين أن الترددات العالية ، الأعلى من ترددات نيكويست ، ستكون "مقنعة" ، كما في الحالة أحادية البعد ، تحت ترددات منخفضةالفترة الرئيسية. يعطي تأثير "الانعكاس" من حدود الفترة صورة أكثر تعقيدًا بسبب تداخل الترددات المنعكسة في إحداثيات مختلفة. سيحدث أيضًا تأثير مشابه ، يُعرف باسم التعرج ، عندما تكون الصور قليلة العينات. يمكن ملاحظة هذا التأثير بشكل خاص على التغييرات المتناقضة الحادة في السطوع.

لمكافحة مثل هذه الظواهر ، يتم استخدام التصفية المسبقة (الصقل) - وهو التفاف أولي للصورة التناظرية مع وظيفة مرشح الوزن التي تقطع المكونات عالية التردد التي يمكن أن تؤدي إلى التعرج. في الحالة ثنائية الأبعاد ، يتم وصف التصفية على النحو التالي:

z (x، y) = h (x "، y") ③③ s (x-x "، y-y"). (17.2.5)

وتجدر الإشارة إلى أن الصور التناظرية موجودة فقط في النطاق البصري ، على سبيل المثال ، في شكل عرض ضوئي على شاشة أو ورق فوتوغرافي أو فيلم فوتوغرافي ، ولكن لا يمكن أن توجد في ذاكرة الكمبيوتر. لذلك ، لا يمكن التنفيذ المادي للترشيح المسبق إلا عند تسجيل صورة عن طريق إلغاء تركيزها ، والتي ، كقاعدة عامة ، لا يتم استخدامها. يجب دائمًا تسجيل المعلومات الأساسية بأقصى قدر من الاكتمال والدقة ، وتنظيف المعلومات الأولية من التفاصيل غير الضرورية والتكرار هو مسألة معالجة بيانات لاحقة. لذلك ، فيما يتعلق بالمعادلة 17.2.5 ، لا يمكن أن تكون التصفية المسبقة ثنائية الأبعاد ، في تنفيذها العملي ، سوى ترشيح للصور التي تم أخذ عينات منها بهامش كبير فوق نطاق التردد الرئيسي (بدقة مفرطة) ، ويتم استخدامها ، كقاعدة عامة ، عند إعادة التشكيل لخطوة أكبر ، على سبيل المثال ، عند ضغط الصور. يمكن أيضًا تضمين التصفية المسبقة في خوارزميات التصوير.

على التين. 17.2.3 وأدناه ، يوضح الجدول 17.2.1 أمثلة على أكثر مرشحات الصقل أحادية البعد شيوعًا. يمكن أيضًا تنفيذها في شكل مرشحات تمثيلية ، ويتم استخدامها ، على سبيل المثال ، عند نقل خطوط التلفزيون للصور في شكل تمثيلي عبر قنوات الراديو (تنعيم أفقي). من حيث المبدأ ، يمكن إجراء عملية مماثلة على أعمدة (مكررة - صورة) ، وبعد جمع الصورة ، سيتم إجراء عملية كاملة لإزالة التعرجات ، لكن هذه الطريقة تنتمي أكثر إلى مجال البحث العلمي الخاص.

الجدول 17.2.1.

وظائف الوزن الأساسية

نافذة زمنية

وظيفة الوزن

تحويل فورييه

طبيعي (ف)

П (t) = 1 ، | t | £ t ؛ П (ر) = 0 ، | t |> ر

П (ث) = 2 طن سين

بارتليت (د)

ب (ث) = تي سين 2 (وزن / 2).

هينينج ، حنا

ع (ر) = 0.5

0.5p (w) + 0.25p (w + p / t) + 0.25p (w-p / t)

هامينغ

p (t) = 0.54 + 0.46 cos (pt / t)

0.54P (w) + 0.23P (w + p / t) + 0.23P (w-p / t)

كاريه (النافذة الثانية)

ع (ر) = ب (ر) سين (بت / ر)

t B (w) * P (w)، P (w) = 1 لـ | w |

لابلاس جاوس

p (t) = exp [-b2 (t / t) 2/2]

[(t / b) exp (-t2w2 / (2b2))] ③ P (w)

يتم إنشاء النظائر ثنائية الأبعاد للفلاتر أحادية البعد f1 (x) في متغيرين تناظر: أو كدالة لنصف القطر:

f2 (س ، ص) = f1 () ،

أو كعمل:

f2 (x، y) = f1 (x) × f1 (y).

الخيار الأول هو الأصح ، لكن الخيار الثاني له خاصية القابلية للفصل ، أي يمكن إجراء التفاف ثنائي الأبعاد بواسطة تلافيفين أحاديي البعد بالتتابع في الصفوف ذات f1 (x) وفي الأعمدة ذات f1 (y).

إعادة تشكيل الصورة أو إعادة التشكيل هو تغيير في معدل أخذ العينات للإشارة الرقمية. بالنسبة للصور الرقمية ، هذا يعني تغيير حجم الصورة.

هناك العديد من خوارزميات إعادة تشكيل الصورة. على سبيل المثال ، لزيادة الصورة بمقدار مرتين باستخدام طريقة الاستيفاء ثنائية الخطوط ، يتم الحصول على الأعمدة والصفوف الوسيطة عن طريق الاستيفاء الخطي لقيم الأعمدة والصفوف المجاورة. من الممكن الحصول على كل نقطة من الصورة الجديدة كمجموع مرجح لعدد أكبر من نقاط الصورة الأصلية (bicubic وأنواع أخرى من الاستيفاء). يتم الحصول على أعلى جودة لإعادة التشكيل عند استخدام الخوارزميات التي تأخذ في الاعتبار ليس فقط الوقت ولكن أيضًا مجال التردد للإشارة.

ضع في اعتبارك خوارزمية إعادة التشكيل مع أقصى قدر من الحفاظ على معلومات التردد للصورة. سننظر في تشغيل الخوارزمية على إشارات أحادية البعد ، حيث يمكن أولاً تمديد الصورة ثنائية الأبعاد أو ضغطها أفقيًا (في صفوف) ثم عموديًا (في الأعمدة) ، ويمكن إعادة تشكيل صورة ثنائية الأبعاد خفضت إلى إعادة تشكيل الإشارات أحادية البعد.

لنفترض أن لدينا إشارة أحادية البعد (الشكل 17.2.4) ، معطاة على الفاصل الزمني 0-T ومميزة بالخطوة Dt = 1 (فترات N). من الضروري "تمديد" الإشارة بمقدار م مرات. يتم حساب طيف الإشارة الموضحة في الشكل بواسطة تحويل فورييه السريع (FFT ، عدد عينات الطيف يساوي عدد عينات الإشارة) ويتم تقديمها في نطاق FFT الرئيسي (0-2p ، تردد Nyquist wN = p / Dt = p أو 0.5N طبقاً لترقيم عينات الطيف بخطوة على طول الطيف Df = 1 / T أو Dw = 2p / T). يتطلب التمدد خطوتين.

الخطوة الأولى هي الاستيفاء الصفري ، مما يزيد من طول الإشارة بمقدار m مرة. (الشكل 17.2.5). من الضروري مضاعفة جميع عينات الإشارة الأصلية في m ، ثم بعد كل عينة إشارة ، أدخل قيمة m-1 صفر. في الفاصل الزمني 0-T ، الذي تظل قيمته دون تغيير ، يوجد الآن فترات أخذ عينات أكثر بمقدار m مرة (mN) ، وستكون خطوة أخذ العينات الجديدة مساوية لـ Dx = Dt / m. وفقًا لذلك ، فإن تردد Nyquist الجديد لهذه الإشارة هو mp / Dt = mp. لكن القيمة المادية لخطوة الطيف بوحدات التردد هي معكوس القيمة المادية لفاصل ضبط الإشارة (Df = 1 / T) ، وبالتالي ، فإن FFT على نقاط إشارة mN ستحسب نقاط mN من الطيف في نطاق FFT الرئيسي من 0-2 مساءً مع خطوة الطيف للإشارة الأصلية ، والتي ستكون فيها فترات m من طيف الإشارة الأصلية (جانب رئيسي واحد وجانب m-1).

وتتمثل الخطوة الثانية في ترشيح النطاقات الجانبية للطيف باستخدام مرشح تمرير منخفض ، سواء في الوقت أو المجال الطيفي. على التين. في الشكل 17.2.6 ، تم مسح الطيف وتم إجراء تحويل فورييه العكسي ، ونتيجة لذلك تم الحصول على إشارة أطول بمرات من الإشارة الأصلية مع الحفاظ الكامل على جميع معلومات التردد.

وفقًا لمبدأ مماثل ، يمكن بناء خوارزمية لضغط (هلاك) إشارة بمقدار n مرة ، بينما يتم عكس ترتيب الخطوات. عند ضغط الإشارة ، يتم زيادة خطوة أخذ عينات الإشارة ، وبالتالي ، يتم تقليل تردد Nyquist ، بينما تنعكس الترددات العالية المقطوعة (الضوضاء والأجزاء غير المهمة عالية التردد من طيف الإشارة) من حدود النطاق الرئيسي وإضافتها إلى المعلومات الرئيسية ، مما يخلق تشوهات. للقضاء على هذه الظاهرة ، يتم أولاً تصفية الإشارة بتمرير منخفض بتردد قطع مساوٍ لتردد Nyquist الجديد (الصقل) ، وعندها فقط يتم إهلاك الإشارة من خلال التخفيف.

عند إجراء إعادة التشكيل فقط في المجال الزمني ، يتم عادةً دمج خوارزميات التمدد والضغط في عملية متسلسلة واحدة مع ضبط تغيير خطوة أخذ العينات في شكل نسبة m / n ، مما يسمح لك بتعيين قيم صحيحة لـ m و n للقيم الكسرية لتغيير خطوة أخذ العينات. هذا يبسط الخوارزميات بشكل كبير ويحسن كفاءة وجودة عملهم. على سبيل المثال ، عندما يتم شد الإشارة بمقدار 1.5 مرة عند m / n = 3/2 ، يتم تمديد الإشارة أولاً بمقدار 3 مرات (إضافة بسيطة وموحدة للأصفار لجميع العينات ، ثم يتم إجراء تصفية تمرير الترددات المنخفضة ، وبعد ذلك يتم القضاء على الإشارة بمعامل اثنين. لا يلزم مرشح مانع التعرج ، حيث يتداخل تردد القطع مع تردد أول مرشح تمرير منخفض. في عملية الضغط العكسي (على سبيل المثال ، m / n = 2/3 ) ، وبالمثل ، يتم استخدام مرشح الصقل فقط.

17.3. تصفية الصور

تصفية الصور هي عملية ينتج عنها صورة بنفس الحجم ، يتم الحصول عليها من الصورة الأصلية وفقًا لبعض القواعد. عادةً ما يتم تحديد شدة (لون) كل بكسل في الصورة الناتجة عن طريق شدة (ألوان) وحدات البكسل الموجودة في بعض المناطق المجاورة لها في الصورة الأصلية.

يمكن أن تكون قواعد التصفية متنوعة للغاية. تصفية الصور هي إحدى العمليات الأساسية لرؤية الكمبيوتر والتعرف على الأنماط ومعالجة الصور. تبدأ الغالبية العظمى من طرق معالجة الصور بتصفية واحدة أو أخرى للصور الأصلية.

مرشحات الخط لها وصف رياضي بسيط للغاية. سنفترض أن صورة الألوان النصفية الأصلية معطاة ، ونشير إلى شدة وحدات البكسل الخاصة بها بمقدار A (x ، y). يتم تعريف المرشح الخطي بواسطة دالة ذات قيمة حقيقية h (نواة المرشح) محددة على البيانات النقطية. يتم إجراء التصفية نفسها باستخدام عملية الالتواء المنفصل (الجمع الموزون):

B (x، y) = h (i، j) ③③A (x، y) = h (i، j) A (x-i، y-j). (17.3.1)

النتيجة هي الصورة B. عادةً ، تكون نواة المرشح غير صفرية فقط في بعض المناطق المجاورة N للنقطة (0 ، 0). خارج هذا الحي ، h (i، j) تساوي الصفر ، أو قريبة جدًا منه ، ويمكن إهمالها. يتم إجراء التجميع على (i ، j) н N ، ويتم تحديد قيمة كل بكسل B (x ، y) بواسطة وحدات البكسل للصورة A الموجودة في النافذة N المتمركزة عند النقطة (x ، y) ( يشار إليها هي المجموعة N (x ، y)). يمكن اعتبار نواة المرشح المحددة في حي مستطيل N على أنها مصفوفة m في n حيث أطوال الأضلاع عبارة عن أرقام فردية. عند تحديد النواة كمصفوفة ، يجب توسيطها. إذا كان البكسل (x ، y) موجودًا بالقرب من حواف الصورة ، فإن الإحداثيات A (x-i ، y-j) لبعض (i ، j) قد تتوافق مع وحدات البكسل غير الموجودة A خارج الصورة. يمكن حل هذه المشكلة بعدة طرق.

لا تقم بتصفية وحدات البكسل هذه عن طريق اقتصاص الصورة B عند الحواف ، أو تطبيق القيم الأصلية للصورة A لقيمها.

لا تقم بتضمين البكسل المفقود في المجموع بتوزيع وزنه h (i، j) بالتساوي بين وحدات البكسل الأخرى في المنطقة المجاورة N (x، y).

أعد تعريف قيم البكسل خارج حدود الصورة باستخدام الاستقراء.

أعد تحديد قيم البكسل خارج حدود الصورة ، باستخدام استمرار المرآة للصورة.

يتم اختيار الطريقة مع مراعاة ميزات المرشح والصورة المحددة.

تنعيم المرشحات. يتم إعطاء أبسط مرشح تجانس مستطيل نصف قطر r بواسطة مصفوفة (2r + 1) × (2r + 1) ، وجميع قيمها 1 / (2r + 1) 2 ، ومجموع القيم هو واحد. هذا هو التناظرية ثنائية الأبعاد لمرشح المتوسط ​​المتحرك على شكل حرف U أحادي التمرير منخفض التمرير. عند التصفية باستخدام مثل هذه النواة ، يتم استبدال قيمة البكسل بمتوسط ​​قيمة البكسل في مربع 2r + 1 حوله. مثال على قناع مرشح 3 × 3:

.

أحد تطبيقات المرشحات هو تقليل الضوضاء. يختلف التشويش بشكل مستقل من بكسل إلى بكسل ، وبشرط أن يكون التوقع الرياضي لقيمة الضوضاء صفراً ، فإن ضوضاء وحدات البكسل المجاورة ستلغي بعضها البعض عند جمعها. كلما زادت نافذة التصفية ، انخفض متوسط ​​شدة الضوضاء ، ومع ذلك ، سيحدث أيضًا التعتيم المقابل لتفاصيل الصورة المهمة. ستكون صورة نقطة بيضاء على خلفية سوداء أثناء التصفية (رد فعل على نبضة واحدة) مربعًا رماديًا بشكل موحد.

إن تقليل الضوضاء باستخدام مرشح مستطيل له عيب كبير: كل البكسلات في قناع المرشح في أي مسافة من تلك المعالجة لها نفس التأثير على النتيجة. يتم الحصول على نتيجة أفضل قليلاً عن طريق تعديل المرشح مع زيادة وزن النقطة المركزية:

.

يمكن تحقيق تقليل التشويش بشكل أكثر فعالية إذا انخفض تأثير البكسل على النتيجة مع زيادة المسافة من المعالجة. يمتلك مرشح غاوسي هذه الخاصية بنواة: h (i، j) = (1 / 2ps2) exp (- (i2 + j2) / 2s2). يحتوي مرشح Gaussian على نواة غير صفرية ذات حجم لانهائي. ومع ذلك ، فإن قيمة نواة المرشح تتناقص بسرعة كبيرة إلى n) ، وبالتالي ، في الممارسة العملية ، يمكن للمرء أن يقتصر على الالتواء مع نافذة صغيرة حول (0 ، 0) ، على سبيل المثال ، مع أخذ نصف قطر النافذة يساوي 3σ.

التصفية الغاوسية هي أيضًا عملية تنعيم. ومع ذلك ، على عكس المرشح المستطيل ، فإن صورة نقطة مع تصفية Gaussian ستكون بقعة ضبابية متناظرة ، مع انخفاض في السطوع من الوسط إلى الحواف. يتم تحديد درجة ضبابية الصورة بواسطة المعلمة σ.

مرشحات التباين . إذا كانت مرشحات التنعيم تقلل من التباين المحلي للصورة ، وتشوشها ، فإن المرشحات المعززة للتباين تنتج التأثير المعاكس ، وهي في جوهرها مرشحات ذات ترددات مكانية عالية. نواة مرشح التعزيز عند (0 ، 0) لها قيمة أكبر من 1 ، بمجموع إجمالي للقيم يساوي 1. على سبيل المثال ، مرشحات التعزيز عبارة عن مرشحات ذات نواة معطاة بواسطة المصفوفات:

. .

يظهر مثال لتطبيق المرشح في الشكل. 17.3.1. يتم تحقيق تأثير زيادة التباين بسبب حقيقة أن المرشح يؤكد الاختلاف بين شدة وحدات البكسل المجاورة ، مما يزيل هذه الشدة عن بعضها البعض. سيكون هذا التأثير أقوى ، كلما زادت قيمة المصطلح المركزي للنواة. تتمثل إحدى الميزات المميزة لفلتر تحسين التباين الخطي في الضوء الملحوظ والهالات الداكنة الأقل وضوحًا حول الحواف.

مرشحات الفرق هي مرشحات خطية محددة بالتقريب المنفصل للعوامل التفاضلية (بطريقة الفروق المحدودة). تلعب هذه المرشحات دورًا مهمًا في العديد من التطبيقات ، على سبيل المثال ، للبحث عن الحواف في الصورة.

أبسط عامل تفاضلي هو مشتق x d / dx ، والذي يتم تعريفه للوظائف المستمرة. المتغيرات الشائعة لمشغلات مماثلة للصور المنفصلة هي مرشحات Prewitt و Sobel:

. .

يتم الحصول على المرشحات التي تقترب من العامل المشتق فيما يتعلق بإحداثيات y / dy عن طريق تبديل المصفوفات.

أبسط خوارزمية لحساب معيار التدرج على ثلاث نقاط متجاورة:

G (س ، ص) = .

يتم أيضًا استخدام صيغة حسابية مبسطة:

حساب قاعدة التدرج اللوني على أربع نقاط متجاورة (مشغل روبرتس):

تستخدم خوارزمية سوبل ثماني عينات سطوع بالقرب من النقطة المركزية:

G (س ، ص) = ، G (س ، ص) @ ,

Gxx ، y = - ،

Gyx ، y = -.

بالإضافة إلى تعريف أكثر دقة لمعيار التدرج ، تتيح لك خوارزمية سوبيل أيضًا تحديد اتجاه متجه التدرج في مستوى تحليل الصورة في شكل زاوية j بين متجه التدرج واتجاه صفوف المصفوفة:

j (x ، y) = argtg (Gyx ، y / Gxx ، y).

على عكس مرشحات التنعيم وتحسين التباين التي لا تغير متوسط ​​كثافة الصورة ، نتيجة لتطبيق عوامل الاختلاف ، كقاعدة عامة ، يتم الحصول على صورة بمتوسط ​​قيمة بكسل قريبة من الصفر. تتوافق القطرات العمودية (الحدود) للصورة الأصلية مع وحدات البكسل بقيم نمطية كبيرة في الصورة الناتجة. لذلك ، تسمى مرشحات الاختلاف أيضًا مرشحات اكتشاف حدود الكائن.

على غرار المرشحات أعلاه ، يمكن استخدام طريقة الفروق المحدودة لتكوين مرشحات لعوامل تفاضلية أخرى. على وجه الخصوص ، يمكن تقريب عامل Laplace التفاضلي (Laplacian) D = 𝝏2 / 𝝏x2 + 𝝏2 / 𝝏y2 ، وهو أمر مهم للعديد من التطبيقات ، للصور المنفصلة بواسطة مرشح بمصفوفة (أحد الخيارات):

.

كما رأينا في الشكل. 17.3.2 ، نتيجة لتطبيق Laplacian المنفصل ، تتوافق القيم الكبيرة في القيمة المطلقة مع اختلافات السطوع الرأسي والأفقي. وبالتالي ، فإن المرشح هو مرشح يبحث عن حدود أي اتجاه. يمكن العثور على الحواف في صورة ما عن طريق تطبيق هذا المرشح وأخذ جميع وحدات البكسل التي تتجاوز قيمتها المطلقة حدًا معينًا.

ومع ذلك ، فإن هذه الخوارزمية لها عيوب كبيرة. العامل الرئيسي هو عدم اليقين في اختيار قيمة العتبة. لأجزاء مختلفة من الصورة ، عادة ما يتم الحصول على نتيجة مقبولة عند عتبات مختلفة بشكل كبير. بالإضافة إلى ذلك ، فإن المرشحات التفاضلية حساسة جدًا لضوضاء الصورة.

التفاف دوري ثنائي الأبعاد. كما هو الحال مع إشارات 1D ، يمكن إجراء التفاف ثنائي الأبعاد في مجال التردد المكاني باستخدام خوارزميات FFT وبضرب أطياف الصورة ثنائية الأبعاد ونواة المرشح. وهي أيضًا دورية ، وعادة ما يتم إجراؤها في شكل منزلق. مع الأخذ في الاعتبار الدورية ، لحساب النمط الثابت لطيف النواة ، يتم مضاعفة أبعاد قناع مرشح kernel على طول المحاور ومبطن بالأصفار ، ويتم استخدام نفس أبعاد القناع لتمييز النافذة المنزلقة فوق الصورة ، داخل الذي يتم تنفيذ FFT. يكون تنفيذ مرشح FIR باستخدام FFT فعالاً بشكل خاص إذا كان للمرشح منطقة مرجعية كبيرة.

مرشحات غير خطية . في معالجة الصور الرقمية ، تُستخدم الخوارزميات غير الخطية المستندة إلى إحصائيات الرتبة على نطاق واسع لاستعادة الصور التالفة من نماذج الضوضاء المختلفة. إنها تسمح لك بتجنب تشويه الصورة الإضافي عند إزالة الضوضاء ، فضلاً عن تحسين نتائج المرشحات على الصور بدرجة عالية من الضوضاء بشكل ملحوظ.

دعنا نقدم مفهوم الحي M لعنصر الصورة A (x ، y) ، وهو أمر أساسي لهذا الحي. في أبسط الحالات ، يحتوي حي M على N-pixels - وهي نقاط تقع في قناع المرشح ، بما في ذلك (أو لا يشمل) النقطة المركزية. يمكن ترتيب قيم عناصر N هذه في سلسلة متغيرة V (r) ، مرتبة بترتيب تصاعدي (أو تنازلي) ، ويمكن حساب لحظات معينة من هذه السلسلة ، على سبيل المثال ، متوسط ​​قيمة السطوع mN والتباين dN. يتم حساب قيمة إخراج المرشح ، الذي يحل محل العينة المركزية ، بواسطة الصيغة:

B (x، y) = aА (x، y) + (1-a) mN. (17.3.2)

ترتبط قيمة المعامل a = باعتماد معين مع إحصائيات العينات في نافذة المرشح ، على سبيل المثال:

أ = dN / (dN + k dS) ، (17.3.3)

حيث dS هو تباين الضوضاء على الصورة ككل أو فوق S- المجاورة لـ S> M و MнS ، k هو ثابت الثقة لتباين S- المجاورة. على النحو التالي من هذه الصيغة ، بالنسبة لـ k = 1 و dN »dS ، a» 0.5 تحدث ، والقيمة B (x ، y) = (A (x، y) + mN) / 2 ، أي أنها تضاف بالتساوي على قيم العينة المركزية ومتوسط ​​قيمة وحدات البكسل في حيها M. مع زيادة قيم dN ، تزداد مساهمة قيمة المرجع المركزي في النتيجة ؛ مع انخفاض ، قيمة mN. يمكن تغيير وزن مساهمة القيم المتوسطة على الجوار M بقيمة المعامل k.

يمكن أن يكون اختيار الوظيفة الإحصائية وطبيعة اعتماد المعامل a عليها متنوعًا تمامًا (على سبيل المثال ، وفقًا لتباينات الاختلافات في القراءات في الحي M مع قراءة مركزية) ، ويعتمد على كليهما حول حجم فتحة المرشح وطبيعة الصور والضوضاء. من حيث الجوهر ، يجب أن تحدد قيمة المعامل a درجة الضرر الذي يلحق بالعينة المركزية ، وبالتالي ، وظيفة الاقتراض لتصحيحها للعينات من الحي M.

إن أبسط أنواع المرشحات غير الخطية وأكثرها شيوعًا لمعالجة الصور هي مرشحات العتبة والمتوسطة.

تصفية العتبة على سبيل المثال ، على النحو التالي:

ب (س ، ص) =

قيمة صهي عتبة التصفية. إذا تجاوزت قيمة النقطة المركزية للمرشح متوسط ​​قيمة العينات mN في محيطها M بالقيمة الحدية ، فسيتم استبدالها بمتوسط ​​القيمة. يمكن أن تكون قيمة العتبة إما ثابتة أو تعتمد وظيفيًا على قيمة النقطة المركزية.

متوسط ​​التصفية تعرف على النحو التالي:

ب (س ، ص) = ميد (م (س ، ص)) ،

على سبيل المثال ، نتيجة التصفية هي القيمة المتوسطة لوحدات البكسل المجاورة ، والتي يتم تحديد شكلها بواسطة قناع المرشح. يمكن أن يؤدي التصفية المتوسطة إلى إزالة التشويش بشكل فعال من الصورة التي تؤثر بشكل مستقل على وحدات البكسل الفردية. على سبيل المثال ، تكون هذه التداخلات هي وحدات البكسل "المكسورة" أثناء التصوير الرقمي ، وضوضاء "الثلج" عند استبدال بعض وحدات البكسل بالبكسل بأقصى كثافة ، وما إلى ذلك. وتتمثل ميزة التصفية المتوسطة في أنه سيتم استبدال بكسل "ساخن" على خلفية داكنة مظلمة وغير "ملطخة" حول الحي.

يتميز الترشيح الوسيط بانتقائية واضحة فيما يتعلق بعناصر الصفيف ، والتي تعد مكونًا غير متوتر لسلسلة من الأرقام داخل فتحة المرشح. في الوقت نفسه ، يترك المرشح الوسيط المكون الرتيب للتسلسل دون تغيير. بسبب هذه الميزة ، تحافظ المرشحات المتوسطة ذات الفتحة المختارة بشكل مثالي على الحواف الحادة للكائنات دون تشويه ، وتقمع التشويش غير المترابط أو ضعيف الارتباط والتفاصيل الصغيرة الحجم.

مرشحات المتطرفة تحددها القواعد:

Bmin (x ، y) = min (M (x ، y)) ،

Bmax (س ، ص) = ماكس (م (س ، ص)) ،

بمعنى أن نتيجة التصفية هي قيم الحد الأدنى والحد الأقصى للبكسل في قناع المرشح. يتم تطبيق هذه المرشحات ، كقاعدة عامة ، للصور الثنائية.

17.4. ضغط الصورة

يبلغ حجم الصورة النموذجية التي تبلغ دقتها حوالي 3000 × 2000 بمعدل 24 بت لكل بكسل لنقل الألوان 17 ميغا بايت. بالنسبة للأجهزة الاحترافية ، يمكن أن يكون حجم الصورة النقطية الناتجة أكبر بكثير ، وعمق الألوان يصل إلى 48 بت لكل بكسل ، ويمكن أن يزيد حجم الصورة الواحدة عن 200 ميغا بايت. لذلك ، تعد خوارزميات ضغط الصور ذات صلة كبيرة لتقليل كمية البيانات التي تمثل الصورة.

هناك فئتان رئيسيتان من الخوارزميات:

1. ضغط بدون فقدان A (ضغط بدون خسارة) ، إذا كان هناك مثل هذه الخوارزمية العكسية A-1 بحيث يكون لدينا A-1 = h لأي صورة h A [h] = h1. يتم استخدام الضغط بدون فقد في تنسيقات الصور الرسومية مثل: GIF و PCX و PNG و TGA و TIFF ، ويتم استخدامه عند معالجة المعلومات الأساسية القيمة بشكل خاص (الصور الطبية والصور الجوية والفضائية وما إلى ذلك) ، حتى ولو كان أدنى تشويه غير مرغوب فيه

2. الضغط مع الفقد ، إذا لم يوفر القدرة على استعادة الصورة الأصلية بدقة. سيتم الإشارة إلى خوارزمية استعادة الصورة التقريبية المقترنة بـ A على أنها A *. يتم اختيار الزوج (A ، A *) لتوفير نسب ضغط عالية مع الحفاظ على جودة الصورة. يتم تطبيق ضغط الفقد في تنسيقات الرسوم: JPEG ، JPEG2000 ، إلخ.

تنطبق جميع الخوارزميات والبيانات على كل من الصور والتسلسلات التعسفية ، والتي يمكن أن تتخذ عناصرها عددًا محدودًا من القيم. في الوقت نفسه ، يجب أن يؤخذ في الاعتبار أنه لا توجد خوارزميات مثالية يمكنها ضغط أي مجموعة بيانات دون خسارة.

خوارزميات ترميز طول التكرار (RLE) تستند إلى مبدأ بسيط: استبدال مجموعات متكررة من عناصر التسلسل الأصلي بزوج (كمية ، عنصر) ، أو بكمية فقط.

مستوى بت. سننظر في البيانات الأصلية على مستوى سلسلة من البتات ، على سبيل المثال ، تمثل صورة بالأبيض والأسود. عادة ما يكون هناك عدة أصفار أو آحاد على التوالي ، ويمكن تشفير عدد الأرقام المتطابقة المتتالية. ولكن يجب أيضًا تشفير عدد التكرارات بالبتات. يمكن اعتبار أن كل عدد من التكرارات يتغير من 0 إلى 7 (كود 3 بت) ، بالتناوب في تسلسل أكواد الآحاد والأصفار. على سبيل المثال ، يمكن مقارنة التسلسلات بالأرقام 7 0 4 ، أي 7 آحاد ، 0 أصفار ، 4 آحاد ، بينما لدينا عام جديد - كلما طالت تسلسلات البتات المتطابقة ، زاد التأثير. إذن ، تسلسل مكون من 21 وحدة ، و 21 صفراً ، و 3 آحاد ، و 7 أصفار مشفر على النحو التالي: أي من التسلسل الأصلي المكون من 51 بتًا ، لدينا تسلسل من 36 بت.

مستوى البايت. لنفترض أن الإدخال عبارة عن صورة ذات تدرج رمادي ، حيث يتم تخصيص 1 بايت لقيمة كثافة البكسل ، بينما يتم تقليل توقع سلسلة طويلة من البتات المتطابقة بشكل كبير.

سنقوم بتقسيم دفق الإدخال إلى بايت (رمز من 0 إلى 255) وترميز البايتات المكررة كزوج (رقم ، حرف). لا يجوز تعديل بايت واحد. لذلك ، بايت ترميز AABBBCDAA (2A) (3B) (C) (D) (2A).

ومع ذلك ، نادرًا ما يتم استخدام تعديلات هذه الخوارزمية بمفردها (على سبيل المثال ، بتنسيق PCX) ، نظرًا لأن الفئة الفرعية للتسلسلات التي تكون الخوارزمية فعالة فيها ضيقة نسبيًا. غالبًا ما يتم استخدامها كإحدى مراحل خط أنابيب الضغط.

خوارزميات القاموس بدلاً من ترميز عنصر واحد فقط من التسلسل الوارد ، يتم تنفيذ تشفير سلسلة من العناصر. يستخدم هذا قاموسًا للسلاسل (تم إنشاؤه من تسلسل الإدخال) لتشفير سلاسل جديدة.

كانت خوارزمية LZ77 من أوائل الخوارزمية التي استخدمت القاموس. يتم استخدام العناصر N المشفرة بالفعل في التسلسل كقاموس. أثناء الضغط ، ينزلق القاموس التالي "الشرائح" فوق التسلسل الوارد. يتم ترميز سلسلة العناصر في الإخراج على النحو التالي: موضع الجزء المطابق لسلسلة العناصر المعالجة في القاموس - الإزاحة (بالنسبة إلى الموضع الحالي) ، الطول ، العنصر الأول الذي يلي الجزء المطابق من السلسلة. طول سلسلة المطابقة محدود من الأعلى بالرقم n. وفقًا لذلك ، تتمثل المهمة في العثور على أكبر سلسلة من القاموس تتطابق مع التسلسل المعالج. إذا لم تكن هناك مطابقات ، فسيتم كتابة تعويض الصفر والطول الأول والعنصر الأول من التسلسل غير المشفر.

مخطط الترميز الموصوف أعلاه يؤدي إلى مفهوم النافذة المنزلقة ، والتي تتكون من جزأين:

اللاحقة للعناصر المشفرة بالفعل ذات الطول N - القاموس - مخزن البحث المؤقت ؛

إن النتيجة اللاحقة للطول n من سلسلة العناصر التي ستُبذل محاولة لإيجاد تطابق لها هي المخزن المؤقت للنظر إلى الأمام.

فك تشفير تسلسل مضغوط هو فك تشفير الرموز المسجلة: تتم مطابقة كل إدخال بسلسلة من قاموس وعنصر مكتوب بشكل واضح ، وبعد ذلك يتم نقل القاموس. يتم إعادة إنشاء القاموس أثناء تشغيل خوارزمية فك التشفير.

هذه الخوارزمية هي سلف عائلة كاملة من الخوارزميات. تشمل مزاياها درجة مناسبة من الضغط على التسلسلات الكبيرة بما فيه الكفاية وفك الضغط السريع. تشمل العيوب سرعة ضغط بطيئة ونسبة ضغط أقل من الخوارزميات البديلة.

خوارزمية LZW. القاموس في هذه الخوارزمية هو جدول مليء بسلاسل من العناصر أثناء تشغيل الخوارزمية. تبحث عملية الضغط عن أطول سلسلة مكتوبة بالفعل في القاموس. في كل مرة لا يتم العثور على سلسلة جديدة من العناصر في القاموس ، تتم إضافتها إلى القاموس ، ويتم تسجيل رمز السلسلة. من الناحية النظرية ، لا يوجد حد لحجم الجدول ، لكن حد الحجم يحسن نسبة الضغط ، حيث تتراكم السلاسل غير الضرورية (غير المتحققة). كلما زاد عدد إدخالات الجدول ، زادت الحاجة إلى تخصيص المزيد من المعلومات لرموز المتجر.

يتكون فك التشفير من فك التشفير المباشر للرموز ، أي في بناء قاموس وإخراج السلاسل المقابلة. تتم تهيئة القاموس بنفس طريقة تهيئة المشفر. تشمل مزايا الخوارزمية درجة عالية من الضغط وسرعة عالية إلى حد ما ، سواء من الضغط أو فك التشفير.

خوارزميات ترميز الانتروبيا قم بتعيين رمز لكل عنصر من عناصر التسلسل بحيث يتوافق طوله مع احتمال حدوث العنصر. يحدث الضغط عن طريق استبدال عناصر التسلسل الأصلي التي لها نفس الطول (يحتل كل عنصر نفس العدد من البتات) بعناصر ذات أطوال مختلفة ، بما يتناسب مع اللوغاريتم السالب للاحتمال ، أي العناصر التي تحدث في كثير من الأحيان أكثر من العناصر الأخرى. كود أصغر.

تستخدم خوارزمية هوفمان رمز بادئة متغير الطول له خاصية خاصة: الرموز الأقصر لا تتطابق مع البادئة (الجزء الأولي) للرموز الأطول. مثل هذا الرمز يسمح بالترميز الفردي. تتكون عملية الضغط من استبدال كل عنصر من عناصر تسلسل الإدخال برمزه. عادة ما يتم إنشاء مجموعة من الرموز باستخدام ما يسمى ب أشجار الكود.

خوارزمية هوفمان ذات مسارين. يؤدي المرور الأول عبر الصورة إلى إنشاء جدول بأوزان العناصر ، وأثناء المرور الثاني ، يحدث الترميز. هناك تطبيقات لخوارزمية الجدول الثابت. غالبًا ما يحدث أن التوزيع الاحتمالي المسبق لعناصر الأبجدية غير معروف ، نظرًا لأن التسلسل بأكمله غير متاح في الحال ، بينما يتم استخدام التعديلات التكيفية لخوارزمية هوفمان.

ضغط الصورة مع فقدان البيانات. عادةً ما تكون كمية المعلومات المطلوبة لتخزين الصور كبيرة. الخوارزميات الكلاسيكية ، كونها خوارزميات للأغراض العامة ، لا تأخذ في الاعتبار أن المعلومات التي يتم ضغطها هي صورة - كائن ثنائي الأبعاد ، ولا توفر درجة كافية من الضغط.

يعتمد الضغط الخاسر على خصائص الإدراك البشري للصورة: أكبر حساسية في نطاق معين من موجات الألوان ، والقدرة على إدراك الصورة ككل ، وعدم ملاحظة التشوهات الصغيرة. الفئة الرئيسية للصور التي تركز عليها خوارزميات الضغط المفقودة هي الصور الفوتوغرافية والصور ذات الانتقالات اللونية السلسة.

تقدير فقدان الصورة. هناك العديد من المقاييس لتقدير الخسائر في الصور بعد استعادتها (فك تشفيرها) من الصور المضغوطة ، ومع ذلك ، بالنسبة لكل منهم ، يمكن اختيار صورتين بحيث يكون قياس الاختلاف بينهما كبيرًا بدرجة كافية ، ولكن الاختلافات ستكون غير محسوسة تقريبًا العين. والعكس صحيح - يمكنك التقاط صور تختلف اختلافًا كبيرًا بالعين ، ولكن لديك قدر ضئيل من الاختلاف.

عادةً ما يكون المقياس العددي القياسي للخسارة هو الانحراف المعياري (RMS) لقيم البكسل للصورة المعاد بناؤها من الصورة الأصلية. ومع ذلك ، فإن أهم "مقياس" لتقييم الخسارة هو رأي المراقب. كلما قلت الاختلافات (أو الأفضل ، غيابها) التي يكتشفها المراقب ، زادت جودة خوارزمية الضغط. غالبًا ما تسمح خوارزميات الضغط الخاسرة للمستخدم باختيار مقدار البيانات "المفقودة" ، أي الحق في الاختيار بين جودة وحجم الصورة المضغوطة. بطبيعة الحال ، كلما كانت الجودة المرئية أفضل بنسبة ضغط أعلى ، كانت الخوارزمية أفضل.

تحويل فورييه. في الحالة العامة ، يمكن اعتبار الصورة كدالة لمتغيرين محددين عند نقاط المسح النهائي. تشكل مجموعة هذه الوظائف على نقاط خطوط نقطية محدودة ثابتة مساحة إقليدية ذات أبعاد محدودة ، ويمكن تطبيق تحويل فورييه المنفصل ، أي التمثيل الطيفي للصورة ، عليها. أنه يوفر:

عدم الترابط واستقلالية معاملات الطيف ، أي أن دقة تمثيل معامل واحد لا تعتمد على أي معامل آخر.

- ضغط الطاقة. يخزن التحويل المعلومات الأساسية في عدد صغير من المعاملات. تظهر هذه الخاصية بشكل أكبر في الصور الواقعية.

معاملات التمثيل الطيفي هي اتساع الترددات المكانية للصورة. في حالة الصور ذات الانتقالات السلسة ، يتم تضمين معظم المعلومات في طيف التردد المنخفض.

خوارزمية الضغط المستخدمة في تنسيق JPEG، مبني على استخدام تحويل فورييه لجيب التمام المنفصل. مخطط الضغط في الخوارزمية عبارة عن خط أنابيب ، حيث يكون هذا التحول أحد المراحل فقط ، ولكنه أحد المراحل الرئيسية. تحتوي الخوارزمية على العمليات الرئيسية التالية:

1. انقل إلى مساحة اللون YCbCr. هنا Y هو مكون luma ، Cb و Cr هما مكونات التلوين. العين البشرية أكثر حساسية للسطوع من اللون. لذلك ، من المهم الحفاظ على دقة أكبر عند إرسال Y مقارنةً بنقل Cb و Cr.

2. تحويل جيب التمام المنفصل (DCT). الصورة مقسمة إلى كتل 8 × 8. يتم تطبيق تحويل جيب التمام المنفصل على كل كتلة (بشكل منفصل للمكونات Y و Cb و Cr).

3. تقليل المكونات عالية التردد في مصفوفات DCT. بالكاد تلاحظ العين البشرية التغييرات في المكونات عالية التردد ، وبالتالي ، يمكن تخزين المعاملات المسؤولة عن الترددات العالية بدقة أقل.

4. الترتيب المتعرج للمصفوفات. هذا تمريرة مصفوفة خاصة للحصول على تسلسل أحادي البعد. أولاً يأتي العنصر T00 ، ثم T01 ، T10 ، T1 ، علاوة على ذلك ، بالنسبة للصور الواقعية النموذجية ، سيكون هناك أولاً معاملات غير صفرية مقابلة لمكونات التردد المنخفض ، ثم الكثير من الأصفار (مكونات عالية التردد).

5. الضغط أولاً بطريقة RLE ، ثم بطريقة Huffman.

تعمل خوارزمية استعادة الصور بترتيب عكسي. تتراوح نسبة الضغط من 5 إلى 100 مرة أو أكثر. في الوقت نفسه ، تظل الجودة المرئية لمعظم الصور الواقعية عند مستوى جيد عند ضغطها حتى 15 مرة. تعد الخوارزمية والشكل الأكثر شيوعًا لنقل الصور بالألوان الكاملة وتخزينها.

تحول موجية الإشارات هي تعميم لتحويل فورييه الكلاسيكي. مصطلح "wavelet" (wavelet) في الترجمة من الإنجليزية يعني "موجة (قصيرة) صغيرة". المويجات هي اسم معمم لعائلات الوظائف الرياضية شكل معين، وهي محلية من حيث الوقت والتردد ، ويتم فيها الحصول على جميع الوظائف من وظيفة أساسية واحدة عن طريق تحولاتها وتمدداتها على طول محور الوقت.

في خوارزميات الضغط المفقودة ، كقاعدة عامة ، جميع عمليات خط أنابيب الضغط مع الاستبدال تحول منفصلفورييه على التحويل المويجي المنفصل. تحويلات المويجات لها توطين تردد-مكاني جيد للغاية وتتجاوز تحويلات فورييه التقليدية في هذا المؤشر. في هذه الحالة ، يصبح من الممكن تطبيق تكمية أقوى ، وتحسين خصائص التسلسل للضغط اللاحق. تعرض خوارزميات ضغط الصور المستندة إلى هذا التحويل ، مع نفس نسبة الضغط ، نتائج أفضل في الحفاظ على جودة الصورة.

الأدب

46. ​​وآخرون. خوارزميات سريعة في معالجة الصور الرقمية. - م: الراديو والاتصال 1984 - 224 ص.

47. سويفر معالجة الصور. الجزء 2. الأساليب والخوارزميات. - مجلة سوروس التعليمية رقم 3 ، 1996.

48. ضوضاء الغضاريف من الصور المعتمدة على خوارزميات غير خطية باستخدام إحصائيات الترتيب. - ياروسلافسكي جامعة الدولة, 2007.

49. اندريف أنظمة المراقبة التلفزيونية. الجزء الثاني. الحساب - الأسس المنطقية والخوارزميات. درس تعليمي. - سانت بطرسبرغ: سانت بطرسبرغ ، جيتمو ، 2005. - 88 ثانية.

51. مقدمة في معالجة الإشارات الرقمية (أسس رياضية). - م: جامعة موسكو الحكومية ، معمل رسومات الحاسوب والوسائط المتعددة ، 2002. - http: // pv. ***** / dsp / dspcourse. pdf ، http: // dsp-book. ***** / dspcourse. djvu ، http: // geogin. ***** / archiv / dsp / dsp4.pdf.

1 ط. وأسس حسابية أخرى للرسومات النقطية. - جامعة الإنترنت لتقنية المعلومات. - http: // www. ***** / الانتقال / الدورة / الرسم النقطي /

2 ط. أنظمة Lukin-Electronic: ملاحظات المحاضرة. ITMO ، 2004. - سانت بطرسبرغ ، ITMO IFF ، 2004. - http: // iff. ***** / kons / oes / KL. هتم

حول ما لوحظ من أخطاء واقتراحات للإضافات: ***** @ *** ru.

حقوق النشر© 2008دافيدوفأ.الخامس.

التشويش الرقمي هو عيب في الصورة ، وهو عبارة عن مناطق عشوائية قريبة من حجم البكسل وتختلف عن الصورة الأصلية في السطوع أو اللون. يلعب تقليل الضوضاء دورًا مهمًا في نقل ومعالجة وضغط تسلسلات الفيديو والصور.

يمكن أن تحدث ضوضاء الفيديو لعدة أسباب:

1. معدات التقاط فيديو غير كاملة.

2. ظروف التصوير السيئة - مثل التصوير الليلي / تصوير الفيديو ، والتصوير في الطقس العاصف.

3. التداخل أثناء الإرسال عبر القنوات التناظرية - التداخل من مصادر المجالات الكهرومغناطيسية ، والضوضاء الجوهرية للمكونات النشطة (مكبرات الصوت) لخط النقل. مثال على ذلك هو إشارة تلفزيونية.

4. ترشيح عدم الدقة عند استخراج إشارات النصوع واختلاف اللون من إشارة مركبة تمثيلية ، إلخ.

يمكن أن يتراوح مقدار التشويش في الصورة من بقعة غير محسوسة تقريبًا في صورة رقمية تم التقاطها في ضوء جيد ، إلى الصور الفلكية التي يخفي فيها الضجيج جزءًا كبيرًا من الصورة. معلومات مفيدة، والتي لا يمكن الحصول عليها إلا من خلال معالجة الصور الشاقة.

يمكن أن تكون الضوضاء من أنواع مختلفة ، اعتمادًا على طبيعة التوزيع العشوائي للضوضاء في الصورة. من الناحية العملية ، الأنواع الأكثر شيوعًا هي:

ضوضاء غاوسية بيضاء

أحد أكثر الضوضاء شيوعًا هو التشويش الغاوسي الإضافي ، والذي يتميز بإضافة قيم بالتوزيع الطبيعي والصفر المتوسط ​​لكل بكسل في الصورة. يعني مصطلح "مضافة" أن هذا النوع من الضوضاء يضاف إلى الإشارة المفيدة. يحدث عندما تكون ظروف استقبال الإشارة سيئة.

ضوضاء رقمية

غالبًا ما يرتبط سبب الضوضاء الرقمية بميزات المعدات المستخدمة للتصوير - عادةً مع حساسية الضوء غير الكافية للمصفوفة. يتميز هذا النوع من الضوضاء باستبدال بعض وحدات البكسل في الصورة بقيم متغير ثابت أو عشوائي. إذا كان سطوع النقاط متساويًا تقريبًا ، فإن الضوضاء الرقمية تسمى أيضًا "مندفعًا". إذا كانت شدة النقاط يمكن أن تتغير من الأسود إلى الأبيض ، فإن هذه الضوضاء تسمى ضوضاء الملح والفلفل.

عادةً ما يؤثر هذا النوع من التشويش على عدد قليل من وحدات البكسل في الصورة.

ضوضاء مجمعة

غالبًا ما تكون هناك حالات تكون فيها الصورة بحجم متساوٍ صاخبة مع ضوضاء Gaussian والنبضات العشوائية. هذه المجموعة تسمى الضوضاء المدمجة.

عيوب مسح الصور

قد تظهر أيضًا تأثيرات غريبة ، مثل التشققات والخدوش والكدمات ، على الصورة. لا تحتوي هذه القطع الأثرية على بنية متجانسة ، كما أن تحديد شكلها وموقعها يتجاوز التحليل الرياضي. لا يمكن مكافحة العيوب من هذا النوع إلا بمساعدة المعالجة اليدوية للصور ؛ وبالتالي ، لا يتم أخذها في الاعتبار في هذا البحث.

خوارزميات إزالة الضوضاء

يوجد عدد كبير من الخوارزميات لإزالة الضوضاء من الصور ، ويمكن استخدامها ليس فقط من خلال برامج المعالجة الخاصة ، ولكن أيضًا من خلال بعض كاميرات الصور والفيديو. على الرغم من ذلك ، لا توجد حتى الآن خوارزمية ترشيح عالمية ، لأنه عند معالجة صورة ، هناك دائمًا حاجة للاختيار بين درجة التخلص من التأثيرات غير المرغوب فيها والحفاظ على التفاصيل الصغيرة التي لها خصائص مشابهة للضوضاء. بالإضافة إلى ذلك ، يمكن للخوارزمية التي تتواءم بسهولة مع نوع واحد من الضوضاء أن تفسد الصورة بنوع آخر من الضوضاء.

دعنا نفكر في بعض خوارزميات تقليل تشويش الصور الأكثر شهرة.

متوسط ​​البكسل الخطي

إن أبسط فكرة لإزالة الضوضاء هي حساب متوسط ​​قيم البكسل في الحي المكاني. نظرًا لأن الضوضاء تختلف بشكل مستقل من بكسل إلى بكسل ، فإن ضوضاء وحدات البكسل المجاورة ستلغي بعضها البعض عند جمعها. يتم تعيين نافذة مستطيلة ، والتي يتم تركيبها على كل بكسل من الصورة بدوره. يتم حساب قيمة البكسل المركزي بناءً على تحليل كل وحدات البكسل المجاورة التي تقع داخل منطقة النافذة. وفقًا لذلك ، كلما كانت النافذة التي تم التقاطها أكبر ، سيتم الحصول على متوسط ​​قيمة أكبر في النهاية ، مما يؤدي إلى تأثير ضبابي قوي.

في أبسط إصدار ، يتمثل تحليل وحدات البكسل المجاورة في إيجاد الوسط الحسابي لها. لتقليل تأثير وحدات البكسل التي لا تنتمي إلى نفس المنطقة المحددة (على سبيل المثال ، كفاف داكن على خلفية فاتحة) ، يمكنك تقديم حد رقمي معين ومراعاة عند حساب الجيران الذين يختلفون عنهم فقط لا يتجاوز البكسل المركزي هذه العتبة. كلما زادت قيمة العتبة ، كان المتوسط ​​أقوى. يمكن أن يكون المتغير المدروس معقدًا من خلال إدخال معاملات الوزن لكل بكسل مجاور ، اعتمادًا على بعدهم عن مركز المنطقة قيد الدراسة.

يمكن أيضًا تطبيق هذه الطريقة في المجال الزمني عن طريق حساب متوسط ​​كل بكسل على الإطارات المجاورة لدفق الفيديو (سيتم حساب متوسط ​​كل بكسل على وحدات البكسل الموجودة في نفس الموضع في الإطارات المجاورة).

هذه الخوارزمية بسيطة للغاية ، لكنها لا تعطي نتيجة جيدة ، وفي نفس الوقت تؤدي إلى ضبابية قوية في تفاصيل الصورة.

مرشح جاوس

لها مبدأ تشغيل مشابه للطريقة السابقة وينتمي أيضًا إلى عدد مرشحات الصقل. ومع ذلك ، فإن تقليل الضوضاء باستخدام مرشح متوسط ​​خطي له عيب كبير: كل جيران البكسل المعالج لها نفس التأثير على النتيجة ، بغض النظر عن بعدهم عنها. يقوم مرشح Gaussian أيضًا بوضع متوسط ​​البكسل المركزي وجيرانه في منطقة معينة ، وهذا يحدث فقط وفقًا لقانون معين ، يتم تعيينه بواسطة دالة Gaussian.

حيث تحدد المعلمة y درجة التمويه ، وتوفر المعلمة A التسوية. نتيجة لذلك ، سيكون للبكسل المركزي للمنطقة قيد النظر أعلى قيمة تقابل ذروة التوزيع الغوسي. سيكون لقيم العناصر المتبقية تأثير أقل وأقل كلما ابتعدت عن المركز.

يُطلق على مرشح المصفوفة المحسوب بالصيغة المحددة اسم Gaussian ؛ كلما كان حجمه أكبر ، كلما كان التمويه أقوى (لـ y ثابت). نظرًا لأن هذا المرشح قابل للفصل ، يمكن تمثيله على النحو التالي:

ويترتب على ذلك أنه يمكن إجراء الالتفاف بالتتابع في صفوف وأعمدة ، مما يؤدي إلى تسريع كبير للطريقة لأحجام المرشحات الكبيرة.

خوارزمية 2Dcleaner

يستبدل كل بكسل في الصورة بمتوسط ​​قيمة وحدات البكسل المجاورة ، الملتقطة في منطقة محددة بنصف قطر. في هذه الحالة ، لا يتم أخذ جميع النقاط التي تقع ضمن نصف القطر في الاعتبار ، ولكن فقط تلك التي تختلف قيمتها عن البكسل المركزي بما لا يزيد عن بعض القيم المحددة مسبقًا (العتبة). نتيجة لذلك ، تصبح المناطق الملونة بشكل موحد أكثر ضبابية من الحواف الحادة للكائنات. يقلل هذا من مستوى التشويش المنخفض في الصورة مع الحفاظ على التفاصيل الدقيقة سليمة.

متوسط ​​التصفية

تبين أن الخوارزميات الخطية فعالة للغاية في قمع التشويش الغاوسي ، عندما تظل وحدات البكسل المجاورة ، على الرغم من أن لها بعض الانتشار العشوائي للقيم ، ضمن بعض خصائص القيمة المتوسطة للمنطقة التي تنتمي إليها. ومع ذلك ، في بعض الأحيان يتعين عليك التعامل مع الصور المشوهة بأنواع أخرى من التداخل. مثال على هذا التداخل هو التشويش النبضي ، والذي يتجلى في وجود نقاط مبعثرة عشوائياً للسطوع العشوائي في الصورة. إن حساب المتوسط ​​في هذه الحالة "لطخات" كل نقطة من هذه النقاط على وحدات البكسل المجاورة ، مما يؤدي إلى تدهور جودة الصورة.

الترشيح الوسيط هو الطريقة القياسية لقمع الضوضاء النبضية. تعمل طريقة معالجة الصور غير الخطية هذه على التخلص من الارتفاعات ولكن ، على عكس خوارزميات المتوسط ​​الخطي ، تترك تسلسلات البكسل الرتيبة سليمة. ونتيجة لذلك ، فإن المرشحات المتوسطة قادرة على الحفاظ على حدود الكائنات والاختلافات بين المناطق ذات السطوع المختلف دون تشويه ، مع منع التشويش غير المترابط والتفاصيل الصغيرة الحجم بشكل فعال.

مبدأ الترشيح: يتم تعيين نافذة معينة ذات حجم فردي ، متراكبة بالتتابع على كل بكسل من الصورة. من بين جميع وحدات البكسل التي تقع في المنطقة قيد النظر ، بما في ذلك النقطة المركزية ، يتم البحث عن القيمة المتوسطة ، والتي يتم تعيينها في النهاية إلى البكسل المركزي للمنطقة. الوسيط في هذه الحالة هو العنصر الأوسط لمجموعة قيم البكسل التي تم فرزها والتي تنتمي إلى المنطقة. يتم اختيار حجم النافذة الفردية بدقة لضمان وجود البكسل الأوسط.

من الممكن أيضًا استخدام مرشح متوسط ​​لقمع ضوضاء Gaussian البيضاء في الصورة. ومع ذلك ، فإن دراسة قمع الضوضاء باستخدام الترشيح المتوسط ​​تبين أن فعاليته في حل هذه المشكلة أقل من فعالية التصفية الخطية.

لا يخلو متوسط ​​الترشيح من عيب متأصل في معظم مرشحات تقليل التشويش - عند زيادة حجم القناع لتحسين درجة تقليل التشويش ، تنخفض حدة الصورة وتكون معالمها غير واضحة. ومع ذلك ، من الممكن تقليل التأثيرات السلبية عن طريق تطبيق ترشيح متوسط ​​مع حجم قناع ديناميكي (ترشيح متوسط ​​مضاف). يظل مبدأه كما هو ، ويمكن فقط تغيير حجم نافذة التصفية المنزلقة اعتمادًا على سطوع وحدات البكسل المجاورة.

شحذ الصورة

تؤدي جميع خوارزميات تقليل التشويش في الصورة تقريبًا إلى عدم وضوحها ، ونتيجة لذلك ، يتم فقد التفاصيل الصغيرة ، ويصعب إدراك الصورة. للتعويض جزئيًا عن هذا التأثير السلبي واستعادة التباين الكنتوري المفقود وانتقالات الألوان ، يمكن لمرشح شحذ الصورة. يمكن أن تعتمد الحدة أيضًا على العديد من العوامل الأخرى - على جودة العدسة ، وعلى الفتحة المستخدمة ، وعلى سمك مرشح مقاومة التموج الموجود في مصفوفة معظم الكاميرات الرقمية ، والذي يطمس الصورة بدرجات متفاوتة. أيضًا ، غالبًا ما يلزم زيادة حدة الصور بعد تقليل حجمها ، لأنه في هذه الحالة يتم فقد جزء من المعلومات بشكل حتمي ، ومعه يتم فقدان حدة الملامح.

Unsharp masking هي تقنية تعمل على تحسين الإدراك البصري بسبب زيادة التباين في التحولات بين الدرجات اللونية في صورة ما بسبب وهم الشحذ. في الواقع ، تظل الحدة على نفس المستوى ، لأنه من المستحيل من حيث المبدأ استعادة التفاصيل المفقودة للصورة ، لكن تحسين التباين بين مناطق السطوع المختلفة يؤدي إلى حقيقة أن الصورة تُنظر إليها على أنها أكثر وضوحًا.

الشكل 5.1 - رسم توضيحي لمفهوم "حدة الكفاف"

تعتمد حدة الصورة على مقدار الاختلاف في السطوع بين المناطق (W) التي تشكل معالمها ، وعلى حدة التغيير في هذا الاختلاف (H).

تم تطبيق تقنية اخفاء unsharp لأول مرة في معالجة صور الأفلام. تختلف الطريقة المُعدَّلة لمعالجة الصور الرقمية قليلاً عن الطريقة الأصلية: يُطرح ما يسمى بـ "قناع unsharp" من الصورة - نسختها غير الواضحة والمعكوسة. والنتيجة هي صورة جديدة تحتوي فقط على الخطوط العريضة المضيئة للأصل. يمكن الحصول على خطوط داكنة من خلال عكس النتيجة ببساطة.

إذا قمت بطرح الحواف الداكنة من الصورة الأصلية وإضافة حواف فاتحة ، فستحصل على زيادة كبيرة في التباين عند كل اختلاف في السطوع.

يمكن استخدام أي من مرشحات تقليل الضوضاء ، مثل مرشح Gaussian ، لطمس الصورة الأصلية للحصول على "قناع unsharp".

الشكل 5.2 - نتيجة تطبيق قناع unsharp

غالبًا ما تستخدم عملية الالتواء في معالجة الصور. بالإضافة إلى التوضيح ، يتم استخدامه للتعتيم وزيادة السطوع والسطوع وما إلى ذلك.

التفاف الصورة هو عملية حساب قيمة جديدة لبكسل معين ، والتي تأخذ في الاعتبار قيم وحدات البكسل المجاورة لها. بشكل عام ، يعني هذا المصطلح بعض الإجراءات التي يتم تنفيذها على كل جزء من الصورة.

العنصر الرئيسي للالتواء هو قناع الالتواء - وهي مصفوفة (ذات حجم تعسفي ونسبة عرض إلى ارتفاع). غالبًا ما يُطلق على هذا القناع اسم مرشح أو قلب أو قالب أو نافذة. عادة ما تسمى قيم عناصر المصفوفة بالمعاملات.

في أغلب الأحيان ، يتم استخدام المصفوفة المربعة كنواة الالتواء.

تحدث معالجة الصورة بواسطة عملية الالتواء على النحو التالي: يتم تراكب العنصر المركزي للمصفوفة ، المسمى "المرساة" ، على التوالي على كل بكسل من الصورة. يتم حساب القيمة الجديدة للبكسل المدروس كمجموع قيم البيكسلات المجاورة مضروبة في معاملات قناع الالتفاف الخاصة بها.

التأثير الناتج يعتمد على نواة الالتفاف المختارة.

نواة مرشح التعزيز لها قيمة أكبر من 1 عند النقطة (0 ، 0) ، مع المجموع الإجمالي لجميع القيم يساوي 1. على سبيل المثال ، مرشح التعزيز هو المرشحات ذات النواة المعطاة بواسطة المصفوفات:

يتم تحقيق تأثير زيادة التباين بسبب حقيقة أن المرشح يؤكد الاختلاف بين شدة وحدات البكسل المجاورة ، مما يزيل هذه الشدة عن بعضها البعض. سيكون هذا التأثير أقوى ، كلما زادت قيمة المصطلح المركزي للنواة.

يمكن أن يتسبب التصفية المحسّن التباين الخطي المعتمد على الالتفاف في ظهور هالات لونية مرئية حول حواف الصورة.

تعويض فرق الضوء

غالبًا ما تحدث مشكلات إضاءة الصورة عند دخول النوافذ أو الشمس أو مصادر الإضاءة الأخرى غير المنظمة إلى الإطار.

يُطلق على هذا الموقف "الضوء الزائد" ويؤدي إلى حقيقة أنه بسبب الإضاءة الساطعة للغاية للدعم ، تُفقد تفاصيل وألوان الكائنات الموجودة على خلفية الأجسام الساطعة للغاية ، ويصبح من الصعب تمييزها.

غالبًا ما يتم مواجهة حالة نقص الضوء. يمكن أن يكون ناتجًا عن التصوير في غرف مظلمة ذات إضاءة ضعيفة ، فضلاً عن نطاق حساسية محدود من معدات الفيديو.

خوارزمية Retinex ذات مقياس واحد

عندما تحاول تفتيح الصورة عن طريق زيادة سطوع كل بكسل ببعض القيمة الثابتة ، فقد تتحول مناطق الإضاءة في البداية إلى تعريض زائد تمامًا.

في مثل هذه الحالات ، يلزم تطبيق تصحيح الألوان "الذكي" ، والذي سيكون قادرًا على إخراج الإضاءة في الصورة ، ومعالجة مناطق الإضاءة بدرجة أقل من المناطق المظلمة.

يتم استيفاء هذه المتطلبات من خلال خوارزمية Retinex ذات المقياس الواحد بناءً على مبادئ مستقبلات الشبكية. الهدف الرئيسي للخوارزمية هو تقسيم الصورة إلى مكونات مسؤولة بشكل منفصل عن الإضاءة والتفاصيل. نظرًا لأن المشكلات في الصورة مرتبطة بإضاءة المشهد ، فعند استلام المكون المسؤول عن الإضاءة ، يصبح من الممكن تحويله بشكل منفصل عن الصورة ، وبالتالي زيادة جودتها بشكل كبير.

يمكن تمثيل أي صورة كمنتج لإشارة عالية التردد (انعكاس - R) وإشارة منخفضة التردد (إضاءة - I).

S (س ، ص) = أنا (س ، ص) * ص (س ، ص) (5.6)


الشكل 5.3 - تمثيل الصورة في خوارزمية Retinex.

يمكن الحصول على صورة تقريبية للإضاءة باستخدام ترشيح تمرير الترددات المنخفضة - وبعبارة أخرى ، قم ببساطة بطمس الصورة الأصلية ، على سبيل المثال ، باستخدام مرشح Gaussian.

حيث مرشح G - Gaussian

نظرًا لأن لوغاريتم الإشارة لا يغير التردد ، وبسبب خصائص الوظيفة اللوغاريتمية (لوغاريتم المنتج يساوي مجموع لوغاريتمات العوامل) ، يمكن أن تكون مهمة فصل ناتج الإشارات مبسطة لمشكلة فصل مجموع الإشارات.

بعد ذلك ، يبقى فقط أخذ الأس من الإشارة المستقبلة لإعادته إلى مقياس السعة الأصلي. يمكن إضافة مكون التردد العالي الناتج إلى الصورة الأصلية غير الواضحة والمشرقة ، والتي تعمل كنموذج إضاءة جديد.

قد يكون التأثير الذي تم الحصول عليه من معادلة الضوء قويًا جدًا (ستصبح المناطق المظلمة بنفس سطوع المناطق الفاتحة). لتقليل التأثير ، يمكنك ببساطة مزج الصورة التي تمت معالجتها مع الصورة الأصلية بنسبة معينة.

تصحيح اشعة جاما

الغرض الأصلي من تصحيح جاما هو التعويض عن الاختلافات في الألوان المعروضة على أجهزة الإخراج المختلفة بحيث تبدو الصورة متشابهة عند عرضها على شاشات مختلفة. نظرًا للشكل غير الخطي لوظيفة الطاقة المطبقة ، يتيح تصحيح جاما أيضًا زيادة تباين المناطق المظلمة في الصورة دون إبراز التفاصيل الساطعة ودون فقدان رؤية حدود كائنات الصورة.

معلومات السطوع في شكل تناظري في التلفزيون وكذلك بتنسيق في شكل رقميفي معظم تنسيقات الرسوم الشائعة ، المخزنة في مقياس غير خطي. يمكن اعتبار سطوع البكسل على شاشة العرض متناسبًا

حيث I هو سطوع البكسل على شاشة العرض (أو سطوع مكونات اللون ، الأحمر والأخضر والأزرق بشكل منفصل) ،

V هي قيمة لون رقمية من 0 إلى 1 ، و

r - مؤشر تصحيح جاما.

إذا كانت r أقل من 1 ، فإن خاصية نقل المستوى ستكون محدبة وستكون الصورة الناتجة أخف من الصورة الأصلية. إذا كانت r أكبر من 1 ، فإن خاصية نقل المستوى ستكون مقعرة وستكون الصورة الناتجة أغمق من الصورة الأصلية.

بشكل افتراضي ، تكون المعلمة r هي 1 ، والتي تتوافق مع إرسال خطي للمستويات ولا يوجد تصحيح جاما.

اختيار محيط الصورة

يمكن استخدام تحليل الكنتور لوصف الكائنات الرسومية الممثلة كمخططات خارجية والتعرف عليها ومقارنتها والبحث عنها. نظرًا لأن استخدام الخطوط العريضة يستبعد النقاط الداخلية للكائن من الاعتبار ، فإن هذا يمكن أن يقلل بشكل كبير من التعقيد الحسابي والخوارزمي لهذه العمليات.

الشكل 5.4 - تغيير نوع وظيفة الطاقة اعتمادًا على المعلمة r

المخطط التفصيلي للكائن هو قائمة بالنقاط التي تمثل منحنى في صورة تفصل الكائن عن الخلفية. غالبًا ما يكون هناك قفزة في السطوع أو اللون على طول المحيط.

لتبسيط البحث عن الخطوط العريضة في الصورة ، يمكنك جعلها ثنائية ثنائية مسبقًا.

يبرز مرشح Sobel حواف الكائنات بناءً على سطوعها. نظرًا لعدم أخذ مكون اللون في الاعتبار ، يجب أولاً تحويل الصور إلى درجات رمادية.

يتم تطبيق مرشح Sobel بالتسلسل على كل بكسل ، مع حساب القيمة التقريبية لتدرج السطوع الخاص به. التدرج اللوني لكل نقطة صورة (وظيفة السطوع) هو متجه ثنائي الأبعاد مكوناته هي المشتقات الأفقية والعمودية لسطوع الصورة.

في كل نقطة في الصورة ، يتم توجيه متجه التدرج في اتجاه أكبر زيادة في السطوع ، ويتوافق طوله مع مقدار التغيير في السطوع. تسمح لنا هذه البيانات بعمل افتراض حول احتمال العثور على نقطة مدروسة على حدود كائن معين ، وكذلك حول اتجاه هذه الحدود.

الذي - التي. ستكون نتيجة تشغيل مشغل Sobel عند نقطة في منطقة السطوع الثابت متجهًا صفريًا ، وعند نقطة تقع على حدود مناطق ذات سطوع مختلف - متجه يعبر الحدود في اتجاه زيادة السطوع.

لحساب القيم التقريبية للمشتقات في كل نقطة في الصورة ، يستخدم مرشح سوبيل الالتواء مع مصفوفة 3 × 3.

معاملات مصفوفة سوبل:

يتم حساب القيمة النهائية للتدرج اللوني بالتقريب وفقًا للصيغة:

| G | = | Gx | + | جي |

كاشف الحدود كيني

على الرغم من أن عمل كيني قد تم في الأيام الأولى للرؤية الحاسوبية (1986) ، لا يزال كاشف الحافة كيني أحد أفضل أجهزة الكشف اليوم. طريقة كيني هي خوارزمية متعددة المراحل ، وتتضمن الخطوات التالية:

1. تنظيف الصورة من الضوضاء والتفاصيل غير الضرورية.

2. تنظيف الصورة من التشويش والتفاصيل غير الضرورية.

3. ابحث عن تدرجات الصور ، على سبيل المثال ، باستخدام عامل تشغيل Sobel.

4. قمع غير الحد الأقصى. يتم تمييز الحدود القصوى المحلية فقط كحدود.

5. تصفية عتبة مزدوجة. يتم تحديد الحدود المحتملة بواسطة عتبات.

6. تتبع المسارات (ربط الحواف بالمسارات)

نظرًا لأن أدنى تشويش في الصورة يمكن أن يكسر سلامة معالمها ، يوصى بتصفية الصورة باستخدام أي طريقة لتقليل الضوضاء قبل بدء البحث. نظرًا لسرعة التشغيل العالية وسهولة التنفيذ ، غالبًا ما يتم استخدام مرشح Gaussian. يمكن أن تكون حواف الصورة في اتجاهات مختلفة ، لذلك تستخدم خوارزمية كيني أربعة مرشحات لاكتشاف الحواف الأفقية والعمودية والقطرية. باستخدام عامل اكتشاف الحواف (مثل مشغل Sobel) ، يحصل المرء على قيمة المشتق الأول في الاتجاه الأفقي (Gy) والاتجاه الرأسي (Gx). من هذا التدرج ، يمكنك الحصول على زاوية اتجاه الحد:

يتم تقريب زاوية اتجاه الحد إلى واحدة من أربع زوايا تمثل رأسيًا وأفقيًا وقطرين (على سبيل المثال ، 0 و 45 و 90 و 135 درجة). يتم الإعلان عن وحدات البكسل فقط كحدود ، حيث يتم الوصول إلى الحد الأقصى المحلي للتدرج اللوني في اتجاه متجه التدرج. يجب أن تكون قيمة الاتجاه من مضاعفات 45 درجة. بعد قمع عدم الحد الأقصى ، تصبح الحواف أكثر دقة ونحافة.

في الخطوة التالية ، تحدد تصفية العتبة لكل بكسل يتم اعتباره ما إذا كان ينتمي إلى حدود الصورة. كلما ارتفعت العتبة ، زادت اتساق الخطوط التي تم العثور عليها ، ومع ذلك ، يمكن تجاهل الحواف الضعيفة. من ناحية أخرى ، يؤدي تقليل العتبة إلى زيادة قابلية الخوارزمية للضوضاء. يستخدم اكتشاف حافة Kenny عتبة ترشيح: إذا كانت قيمة البكسل أعلى من الحد الأعلى ، فسيستغرق الأمر أقصى قيمة(تعتبر الحدود صالحة) ، إذا كانت أقل - يتم منع البكسل ، تأخذ النقاط ذات القيمة التي تقع في النطاق بين العتبات قيمة متوسطة ثابتة (سيتم تنقيحها في الخطوة التالية).

تتمثل المرحلة الأخيرة من معالجة الصور في ربط الحواف الفردية بخطوط موحدة. وحدات البكسل التي تلقت متوسط ​​القيمة في الخطوة السابقة إما أن يتم منعها (إذا لم تلمس أيًا من الحواف المكتشفة بالفعل) أو يتم إرفاقها بالمحيط المقابل.

تجزئة

معظم الصور التي تم الحصول عليها من معدات الصور والفيديو هي نقطية ، أي تتكون من نقاط ملونة مرتبة في شبكة مستطيلة. ومع ذلك ، ينظر الناس إلى العالم من حولهم على أنه مجموعة من الأشياء الصلبة ، وليس مصفوفة من النقاط. إن الدماغ البشري قادر على توحيد التفاصيل المتباينة للصورة في مناطق متجانسة ، ويقسمها بوضوح إلى أشياء على مستوى اللاوعي. تسمى هذه العملية التجزئة ، ويمكن تنفيذها في البرامج عند حل مشكلة تحليل صورة الكمبيوتر والتعرف على الأنماط. يتم إجراء التقسيم في المراحل الأولى من التحليل ، ويمكن أن يكون لجودة تنفيذه تأثير قوي على سرعته ودقته.

يمكن تقسيم طرق التجزئة إلى فئتين: تلقائي - لا يتطلب تفاعل المستخدم وتفاعلية - باستخدام مدخلات المستخدم مباشرة في العملية.

في الحالة الأولى ، لا يتم استخدام معلومات مسبقة حول خصائص المناطق ، ولكن يتم فرض بعض الشروط على قسم الصورة نفسه (على سبيل المثال ، يجب أن تكون جميع المناطق موحدة في اللون والملمس). نظرًا لأن صياغة مشكلة التجزئة هذه لا تستخدم معلومات مسبقة حول الكائنات المصورة ، فإن طرق هذه المجموعة عالمية وقابلة للتطبيق على أي صور.

للحصول على تقدير تقريبي لجودة طريقة ما في مهمة معينة ، عادةً ما يتم إصلاح العديد من الخصائص بحيث يجب أن يكون للتجزئة الجيدة:

§ تجانس المناطق (توحيد اللون أو الملمس) ؛

§ تباين المناطق المجاورة.

§ سلاسة حدود المنطقة.

§ عدد قليل من "الثقوب" الصغيرة داخل المناطق ؛

تجزئة العتبة

معالجة العتبة هي أبسط طريقة موجهة لمعالجة الصور ، حيث تختلف المناطق الفردية المتجانسة في متوسط ​​السطوع. ومع ذلك ، إذا كانت الصورة مضاءة بشكل غير متساوٍ ، فقد تتطابق بعض الكائنات مع شدة الخلفية ، مما يجعل تجزئة العتبة غير فعالة.

إن أبسط أنواع تجزئة العتبة المستخدمة بشكل متكرر وفي نفس الوقت هي التجزئة الثنائية ، عندما يتم تمييز نوعين فقط من المناطق المتجانسة في الصورة.

في هذه الحالة ، يتم إجراء تحويل كل نقطة من الصورة المصدر إلى صورة الإخراج وفقًا للقاعدة:

حيث x0 هي معلمة المعالجة الوحيدة التي تسمى العتبة. يمكن أن تكون مستويات سطوع المخرجات y0 و y1 عشوائية ، فهي تؤدي فقط وظائف العلامات ، والتي يتم من خلالها تحديد الخريطة الناتجة - تعيين نقاطها للفئتين K1 أو K2 ، على التوالي. إذا تم تحضير المستحضر الناتج للإدراك البصري ، فغالبًا ما تتوافق قيمها مع مستويات الأسود والأبيض. إذا كان هناك أكثر من فئتين ، فيجب تحديد عائلة من الحدود خلال العتبة ، مع فصل سطوع الفئات المختلفة عن بعضها البعض.

يعد تجزئة العتبة مناسبًا تمامًا لاختيار عدد صغير من الكائنات غير المتقاطعة في صورة ذات بنية موحدة وتبرز بشكل حاد من الخلفية. مع زيادة درجة عدم تجانس الصورة ، وبالتالي عدد المقاطع وتعقيدها ، يصبح هذا النوع من التجزئة غير فعال.

تجزئة على أساس تقسيم الرسم البياني

تعد طرق نظرية الرسم البياني واحدة من أكثر المجالات تطورًا في تجزئة الصور.

الفكرة العامة لأساليب هذه المجموعة هي كما يلي. يتم تمثيل الصورة كرسم بياني مرجح ، برؤوس عند نقاط الصورة. يعكس وزن حافة الرسم البياني تشابه النقاط بشكل ما (المسافة بين النقاط على طول بعض المقاييس). يتم نمذجة تقسيم الصورة بواسطة قطع الرسم البياني.

عادة ، في طرق نظرية الرسم البياني ، يتم إدخال وظيفة "تكلفة" مقطوعة ، مما يعكس جودة التجزئة الناتجة. وبالتالي ، فإن مشكلة تقسيم الصورة إلى مناطق متجانسة يتم تقليلها إلى مشكلة التحسين المتمثلة في إيجاد حد أدنى للتكلفة على الرسم البياني. يسمح هذا النهج ، بالإضافة إلى توحيد لون المقاطع وملمسها ، بالتحكم في شكل المقاطع وحجمها وتعقيد الحدود وما إلى ذلك.

يتم استخدام طرق مختلفة للعثور على الحد الأدنى لخفض التكلفة: الخوارزميات الجشعة (يتم اختيار الحافة في كل خطوة بحيث تكون التكلفة الإجمالية للقطع ضئيلة) ، وطرق البرمجة الديناميكية (يتم ضمان ذلك باختيار الحافة المثلى في كل خطوة ، سننتهي بالمسار الأمثل) ، خوارزمية Dijkstra ، إلخ.

إقحام

في رسومات الحاسوبغالبًا ما تُستخدم طريقة الاستيفاء في عملية إعادة قياس الصور. من خلال تغيير عدد وحدات البكسل في الصورة ، يساعد الاستيفاء على تجنب البيكسل المفرط للصورة عند تكبيرها أو فقدان التفاصيل المهمة عند تصغيرها.

أثناء عملية الاستيفاء ، يتم إدخال نقاط إضافية بين وحدات البكسل في الصورة ، ويتم حساب الدرجة اللونية واللون المقدرة باستخدام خوارزمية خاصة بناءً على تحليل البيانات المتاحة في المناطق المجاورة. لسوء الحظ ، نظرًا لأن أي استيفاء هو مجرد تقريب ، فإن الصورة ستفقد الجودة دائمًا كلما تم إقحامها.

أقرب الجار الاستيفاء

هذه الخوارزمية هي أبسط أنواع الاستيفاء ، فهي ببساطة تزيد كل بكسل من الصورة إلى الحجم المطلوب. يتطلب أقل وقت معالجة ، لكنه يؤدي إلى أسوأ النتائج.

استيفاء خطي

يتم إجراء هذا النوع من الاستيفاء لكل إحداثي للشبكة ثنائية الأبعاد. تعتبر الصورة كسطح ، لون - البعد الثالث. إذا كانت الصورة ملونة ، فسيتم إجراء الاستيفاء بشكل منفصل لثلاثة ألوان. لكل نقطة غير معروفة في الصورة الجديدة ، يعتبر الاستيفاء ثنائي الخطوط مربعًا من أربعة وحدات بكسل معروفة تحيط به. يتم استخدام المتوسط ​​المرجح لهذه البكسلات الأربعة كقيمة محرفة. نتيجة لذلك ، تبدو الصور أكثر سلاسة من نتيجة أقرب طريقة مجاورة.

يعمل الاستيفاء الخطي بشكل جيد مع القيم الكبيرة الصحيحة لعوامل القياس ، ومع ذلك ، فإنه يطمس الحواف الحادة للصورة كثيرًا.

يذهب الاستيفاء Bicubic خطوة واحدة أبعد من الخط الثنائي ، مع الأخذ في الاعتبار مصفوفة من 4 × 4 بكسل محيطة - إجمالي 16 بكسل. نظرًا لأنها تعمل مسافات مختلفةمن بكسل غير معروف ، تتلقى وحدات البكسل الأقرب وزنًا أكبر في الحساب. ينتج الاستيفاء Bicubic صورًا أكثر وضوحًا من الطريقتين السابقتين ويمكن القول إنه الأفضل من حيث وقت المعالجة وجودة الإخراج. لهذا السبب ، أصبح معيارًا في العديد من برامج تحرير الصور (بما في ذلك Adobe Photoshop) وبرامج تشغيل الطابعة والكاميرا المدمجة.

قد تصبح الصورة التي تم تغيير حجمها أقل حدة بشكل ملحوظ. خوارزميات الاستيفاء التي تحافظ بشكل أفضل على الحدة هي أيضًا أكثر عرضة للتموج في النسيج ، في حين أن تلك التي تقضي على تموج في النسيج تميل إلى إنتاج نتائج أكثر نعومة. لسوء الحظ ، لا يمكن تجنب هذه المقايضة الموسعة.

واحد من أفضل الطرقلمكافحة ذلك ، قم بتطبيق قناع unsharp فورًا بعد القياس ، حتى لو تم بالفعل شحذ الأصل.

5.2 الأساس المنطقي لاختيار الخوارزميات المستخدمة في النظام الفرعي

كان المطلب الرئيسي لحزمة البرامج المطورة هو تقليل تأخير تشغيل دفق الفيديو أثناء معالجتها الأولية على مجموعة الحوسبة. بالإضافة إلى ذلك ، يمكن أن يحدث التصوير في أي ظروف ، مما يعني أنه في وقت قصير كان من الضروري تنفيذ عدد كبير من المرشحات البسيطة لتحييد التأثيرات السلبية المختلفة. بالإضافة إلى ذلك ، كان من الضروري دراسة عدد كبير من العوامل السلبية التي تظهر على الفيديو في وقت قصير وتنفيذ مرشحات بسيطة لتحييدها. يجب أن تكون الخوارزميات التي تفي بالمتطلبات المقدمة سهلة الوصول إليها ، ومحسّنة جيدًا ، وذات موثوقية عالية ، وفي نفس الوقت ، تكون سهلة التنفيذ. وظائف مكتبة OpenCV لها مثل هذه الخصائص ، لذلك ، عند اختيار طرق محددة لتنفيذ مرشحات معالجة دفق الفيديو ، تم إعطاء الأولوية للخوارزميات الموجودة في هذه المكتبة بشكل أو بآخر.

تم تنفيذ جميع الخوارزميات التي تم النظر فيها في الجزء النظري من أعمال التأهيل النهائي في نموذج اختبار لمقارنة خصائصها في الممارسة العملية. على وجه الخصوص ، تم إعطاء الأفضلية للتسوية بين سرعة معالجة إطار دفق الفيديو وجودة النتيجة.

نتيجة لذلك ، تم اختيار الخوارزميات التالية لتنفيذ مرشحات معالجة دفق الفيديو على مجموعة الحوسبة:

1. تم اختيار خوارزمية Gaussian لإزالة الضوضاء "البيضاء المضافة". نظرًا لكونها أكثر طرق تقليل الضوضاء شيوعًا ، فهي مُحسَّنة جيدًا وبالتالي تتمتع بسرعة عالية.

2. تم اختيار خوارزمية Gaussian لإزالة الضوضاء "البيضاء المضافة". نظرًا لكونها أكثر طرق تقليل الضوضاء شيوعًا ، فقد تم تحسينها بشكل جيد جدًا وبالتالي تتميز بسرعة تشغيل عالية.

3. تم اختيار الترشيح المتوسط ​​لإزالة الضوضاء "النبضية". تم تحسين هذه الطريقة أيضًا بشكل جيد وتم تصميمها خصيصًا للتخلص من الضوضاء المندفعة والضوضاء الناتجة عن الملح والفلفل.

4. تم اختيار الالتفاف لزيادة وضوح الصورة ، حيث تعمل بشكل أسرع بكثير من التقنيع غير الواضح ، بينما تعطي في نفس الوقت نتائج مقبولة.

5. لا تحتوي مكتبة OpenCV على خوارزميات تصحيح الألوان - لذلك ، تقرر تنفيذ خوارزمية Retinex ذات المقياس الأحادي الأكثر شيوعًا وتوثيقًا. تتميز هذه الطريقة بكفاءة عالية جدًا ، ولكنها تتطلب تحسينًا لتسريع العمل.

6. تم اختيار خوارزمية كيني كطريقة لاكتشاف الحواف ، لأنها تعطي نتائج أفضل من مرشح سوبيل.

7. خوارزمية التجزئة الهرمية المعروضة في مكتبة OpenCV بطيئة للغاية ، لذلك تقرر استخدام خوارزمية التجزئة التي تم النظر فيها مسبقًا على الرسوم البيانية.

8. الاستيفاء - تم اختيار طريقة الاستيفاء bicubic باعتبارها الحل الوسط الأكثر منطقية بين سرعة العمل وجودة النتيجة.

تثبيت وتكوين البرنامج المستخدم.

كانت مجموعة الحوسبة المستخدمة تشغل GNU Linux (Ubuntu)

بعد تثبيت نظام التشغيل ، تحتاج إلى تثبيت العديد من المكتبات التي تدعم قراءة وكتابة ملفات الصور ، والرسم على الشاشة ، والعمل بالفيديو ، وما إلى ذلك.

تثبيت CMake

تم إنشاء المشروع باستخدام CMake (يتطلب الإصدار 2.6 أو أعلى). يمكنك تثبيته بالأمر:

apt-get install cmake

قد تحتاج أيضًا إلى المكتبات التالية:

build-basic libjpeg62-dev libtiff4-dev libjasper-dev libopenexr-dev libtbb-dev libeigen2-dev libfaac-dev libopencore-amrnb-dev libopencore-amrwb-dev libtheora-dev libvorbis-dev libxvidcore

تركيب ffmpeg

لكي يتمكن opencv من معالجة ملفات الفيديو بشكل صحيح ، تحتاج إلى تثبيت مكتبة ffmpeg. يتم ذلك باستخدام الأوامر التالية:

1) تنزيل الكود المصدري للمكتبة

wget http://ffmpeg.org/releases/ffmpeg-0.7-rc1.tar.gz

2) تفريغ الأرشيف برموز المصدر

tar -xvzf ffmpeg-0.7-rc1.tar.gz

3) تكوين المكتبة

قم بتكوين --enable-gpl --enable-version3 --enable-nonfree --enable-postproc

تمكين libfaac - تمكين- libopencore-amrnb - تمكين-libopencore-amrwb

Enable-libtheora --enable-libvorbis --enable-libxvid --enable-x11grab

تمكين swscale - تمكين المشاركة

4) بناء وتركيب المكتبة

تركيب GTK

يتطلب عرض نوافذ OpenCV تثبيت GTK + 2.x أو إصدار أعلى ، بما في ذلك ملفات الرأس(libgtk2.0-dev)

apt-get install libgtk2.0-dev

تثبيت Opencv

بعد تثبيت جميع المكتبات ذات الصلة ، يتم تثبيت opencv2.2 باستخدام الأوامر التالية:

1) تنزيل الكود المصدري لمكتبة OpenCV

http://downloads.sourceforge.net/project/opencvlibrary/opencv-unix/2.2/OpenCV-2.2.0.tar.bz2

2) تفريغ الأرشيف برموز المصدر

tar -xvf OpenCV-2.2.0.tar.bz2

3) توليد Makefile باستخدام CMake.

4) بناء وتركيب مكتبة OpenCV

5) قد تحتاج أيضًا إلى تعيين المسار إلى المكتبات

تصدير LD_LIBRARY_PATH = / usr / local / lib: $ LD_LIBRARY_PATH

تركيب وتصنيف حزمة البرامج المطورة

تحتاج إلى نسخ أكواد المصدربرامج من القرص المرفق بهذه المذكرة التفسيرية. انسخ ملف الدُفعات build_all.sh إلى نفس المجلد ثم قم بتشغيله. إذا تم تثبيت برنامج التحويل البرمجي لدول مجلس التعاون الخليجي على النظام ، فسيتم الإنشاء تلقائيًا.

يتمثل جوهر معالجة الصور في إحضار الصورة الأصلية للمشهد إلى شكل يسمح بحل مشكلة التعرف على كائناته.

الهدف النهائي من معالجة الصور في VS هو إعداد كائنات المشهد للتعرف عليها ، أي تعيين صورهم لبعض الفئات المحددة سلفًا. على الرغم من تنوع إجراءات تحويل المعلومات المقدمة ، عادةً ما يتم تمييز ثلاث مراحل معالجة رئيسية في VS:

1) معالجة الصور ؛

2) التجزئة.

3) الوصف.

المعالجة المسبقة ، بدورها ، لها مرحلتان أساسيتان: تكوين الصورة وترميزها (الضغط). تسلسل الخطوات ليس صارمًا ويعتمد على المهمة المحددة.

معالجة الصور

تنقسم جميع طرق المعالجة المسبقة للصور في VS إلى أساليب مكانية وترددية. الطرق المكانية هي الإجراءات التي تعمل مباشرة على وحدات البكسل في الصورة. يستخدم السطوع كسمة مميزة للصورة. ص (س ، ص).ترتبط طرق التردد بترجمة الصورة إلى المستوى المعقد باستخدام تحويل فورييه.

عند التفكير في إجراءات المعالجة المسبقة ، سنقتصر على ذلك فقط الطرق المكانية، وستُعتبر الصورة الأصلية ذات تدرج رمادي.

في المرحلة الأولى من المعالجة المسبقة ، تشكيل الصورة.تشكيل الصورة هو إجراء للحصول مباشرة على صورة في شكل مجموعة من العناصر المنفصلة الموجودة في ذاكرة معالج الفيديو - وحدات البكسل التي تشكل مصفوفة أو كفاف.

في STZ ، في مرحلة تكوين الصورة ، يتم تحديد عتبة السطوع عن طريق ضبط الإضاءة ويتم تصفية الصورة.

الترشيحالصورة هي أطول مراحل المعالجة المسبقة وأكثرها تعقيدًا. بشكل عام ، تحل التصفية المهام الرئيسية التالية:

تجانس (قمع الضوضاء عالية التردد مثل "الثلج") ؛

زيادة في المقابل

اختيار كفاف.

يتم تنفيذ إجراء التنعيم فورًا بعد تحديد حد السطوع. يكمن معناه في حساب متوسط ​​قيم دالة السطوع وفقًا لقاعدة معينة ص (س ، ص)داخل جزء الصورة التي تم تحليلها.

يتم استخدام مرشح الترددات المنخفضة لإزالة التداخل عالي التردد من النوع "الثلجي". عيب ترشيح تمرير منخفضهو تدهور في تباين الصورة.

تجزئة



نتيجة للمعالجة المسبقة ، تحتوي الصورة على تمثيل كفاف واحد أو أكثر للكائنات. يسمى الإجراء الخاص بفصل هذه الخطوط وربطها بأشياء معينة تجزئة.

إذا كان معروفًا مسبقًا أن الصورة تحتوي على عدة كائنات ، يتم تنفيذ إجراء التجزئة بعد استخراج الكنتور قبل مرحلة تشفير الصورة.

تعتمد خوارزميات التجزئة ، كقاعدة عامة ، على البحث عن الانقطاعات في الكفاف وتشابه المناطق. في الحالة الأولى ، يتم العثور على الكفاف ويتم تنفيذ تجاوز البرنامج وفقًا للقاعدة المعمول بها. إذا كان المحيط مغلقًا ، فيُعتبر أنه ينتمي إلى الكائن. في الحالة الثانية ، يتم تحديد مساحات الصورة التي لها خصائص مشتركة (على سبيل المثال ، نفس سطوع وحدات البكسل). عند العثور على مثل هذه المناطق ، يتم تخصيصها إما للخلفية أو للكائن.

ترميز الصورة

بالنسبة للأنظمة التي تعالج الصور ذات التدرج الرمادي بالطرق المكانية ، هناك طريقتان رئيسيتان للتشفير:

· ترميز الصورة نفسها بطريقة رموز طول التشغيل.

· ترميز محيط الصورة بواسطة كود سلسلة فريمان.

في كلتا الحالتين ، عند الترميز ، هناك انخفاض كبير في كمية البيانات التي تميز الصورة. يتم تحديد كفاءة التشفير حسب درجة ضغط الصورة.

جوهر الترميز بطريقة الكود طول السلسلة ،تم تنفيذه باستخدام خوارزمية RLE ، هو تمثيل الصورة كأجزاء متجانسة من خط المسح ، حيث يكون سطوع ولون البكسل متماثلين. بالإضافة إلى ذلك ، تتميز كل سلسلة بالقيمة المقابلة وطول السلسلة (عدد وحدات البكسل).

لتشفير محيط الصورة مباشرة ، غالبًا ما تستخدم السلسلة. كود فريمان(الشكل 6.22 ، ب).في هذه الحالة ، يُعطى محيط الكائن ، بدءًا من نقطة معينة ، من خلال سلسلة من المتجهات التي تأخذ قيمًا منفصلة ، مع زاوية ميل المعامل القابلة للقسمة على 45. قيمة المعامل هي 2 إذا كانت زاوية الميل المتجه 45 ، و 1 إذا كان في وضع عمودي أو أفقي. يعكس التغيير في اتجاه المتجه أثناء الانتقال من نقطة في المنحنى إلى أخرى طبيعة التغيير في المنحنى النموذجي.



وصف الصورة

تحت وصف يُفهم تعريف المعلمات المميزة لكائن ما - علامات(مميّزات) ضرورية لاختياره من بين كل ما يشكل المشهد.

وفقًا لطبيعتها المادية ، تنقسم العلامات إلى عالمية ومحلية. ميزة عالميةالصور هي ميزة يمكن حسابها لأي صورة لكائن.

علامات محليةتستخدم أقل إنهم لا يميزون الصورة بأكملها ، بل جزء منها فقط. يتضمن ذلك الزاوية بين خطي كفاف ، وعدد ومعلمات الثقوب في صورة الكائن ، إلخ.

التعرف على الصور

تعرُّفهي عملية يتم فيها تحديد انتمائها إلى فئة معينة ، على أساس مجموعة من سمات صورة معينة لكائن ما.

يقوم التعرف على وظيفة تحليل الصورة المرئية.

تقليديا ، يمكن تقسيم جميع طرق التعرف إلى مجموعتين: النظرية والهيكلية. تستخدم طرق التعرف النظري الأكثر شيوعًا مبادئ نظرية القرار.

من المستحيل تحديد القيمة الحقيقية لخصائص الكائن ، لأن القيم تختلف مع كل قياس. لذلك ، يتم طرح مهمة التعرف على النحو التالي: لتحديد احتمال أن كائن ما ينتمي إلى فئة معينة.

يرتبط أحد أكثر مجالات التعرف على الأنماط إثارة للاهتمام في VS بتطوير خوارزميات التعرف على الوجوه. خوارزمية التعرف (التحقق) قريبة من خوارزمية التسجيل. يتم دمج الميزات المستخرجة من الصورة الحالية في ناقل ميزة ، تتم مقارنة مكوناته بالمكونات المقابلة لجميع المتجهات الموجودة في قاعدة البيانات.

معمل رقم 1

خوارزميات معالجة الصور

عملية الالتواء

الالتفاف هو خوارزمية واسعة جدًا يمكن استخدامها في المعالجة المسبقة للصور وللتعرف على الأشياء وتحديدها. دع الصورة تعطى بواسطة مصفوفة سطوع ثنائية الأبعاد F" ، ومصفوفة الاستجابة النبضية ح. التواء مصفوفة رياضيًا Fمع جوهر حيمكن تحديده بالصيغة التالية:

أين M2xN2 - حجم مصفوفة نواة الالتفاف. حجم المصفوفة Fيساوي (M1 + M2-1) x (N1 + N2-1) ، حيث M1xN1 - حجم المصفوفة الأصلية F" . مصفوفة Fيتم الحصول عليها من الأصل بإضافة عناصر عند حواف المصفوفة وفقًا لبعض القواعد لإعادتها إلى الحجم المطلوب. عادةً ما تكون المصفوفة الأصلية مبطنة بالأصفار عند الحواف لنصف عرض المصفوفة. حاليسار واليمين ، وعلى التوالي ، نصف الارتفاع لأعلى ونفس الشيء لأسفل. ثم حجم المصفوفة الناتجة صستكون نفس المصفوفة F" .

يمكن حساب الالتفاف مباشرة عن طريق "تشغيل" مصفوفة واحدة على أخرى ، كما هو موضح أعلاه. على التين. يوضح الشكل 1 مخطط حساب الالتواء (يؤخذ حجم مصفوفة القناع مساوياً لـ 3 × 3). يمكن النظر إلى عامل الالتفاف كمصفوفة من المعاملات (الأقنعة) التي يتم ضربها عنصرًا بعنصر مع جزء الصورة المحدد ، متبوعًا بالتجميع للحصول على قيمة جديدة لعنصر الصورة المصفاة. يمكن أن تكون هذه المصفوفة ذات حجم تعسفي ، وليس بالضرورة أن تكون مربعة.

أرز. 1. تنفيذ عملية الالتواء.

يمارس

    قم بتنفيذ خوارزمية تؤدي عملية التفاف الصورة الأصلية باستخدام قناع مصفوفة.

    يتم تحديد حجم ونوع قناع المصفوفة من قبل المستخدم.

    استخدم مصفوفات القناع التالية لتنفيذ خوارزميات معالجة الصور المختلفة:

    • لتنعيم الضوضاء في الصورة وقمعها ، يتم استخدام قناع مصفوفة 3x3 بالشكل التالي:

    للتأكيد على الملامح ، يتم استخدام أقنعة المصفوفة بالشكل التالي:

1/9*

    يستخدم قناع النموذج التالي لتحديد معالم:

4. قم بتطبيق مرشح متوسط ​​، والذي يستخدم لقمع ضوضاء النقطة والاندفاع. يتم ترتيب بكسل الصورة وجيرانها في المنطقة قيد النظر في سلسلة متغيرة (في قيم بكسل تصاعدية أو تنازلية) ويتم تحديد القيمة المركزية لهذه السلسلة المتغيرة كقيمة بكسل جديدة. نتيجة التصفية المتوسطة هي أنه سيتم التخلص بشكل فعال من أي تشويش عشوائي موجود في الصورة. وذلك لأنه سيتم فرز أي تغيير عشوائي مفاجئ في كثافة البكسل داخل المنطقة قيد النظر ، أي سيتم وضعها إما في أعلى أو أسفل القيم التي تم فرزها في تلك المنطقة ولن يتم احتسابها حيث يتم دائمًا أخذ القيمة المركزية لقيمة العنصر الجديد.

5. تنفيذ خوارزمية النقش. يتم النقش بطريقة مشابهة لخوارزميات المتوسط ​​أو تحسين الحواف. تتم معالجة كل بكسل في الصورة بواسطة قلب نقش 3x3 (قناع مصفوفة). على سبيل المثال ، بصفتك قلبًا للنقش ، يمكنك أن تأخذ مصفوفة القناع التالية:

بعد أن تتم معالجة قيمة البكسل بواسطة محرك النقش ، يتم إضافة 128 إليها ، وبذلك تصبح قيمة بكسلات الخلفية هي متوسط ​​اللون الرمادي (الأحمر = 128 ، والأخضر = 128 ، والأزرق = 128). يمكن تقريب المبالغ الأكبر من 255 إلى 255.

في النسخة المنقوشة من الصورة ، تبدو الخطوط وكأنها منبثقة فوق السطح. يمكن تغيير اتجاه تمييز الصورة عن طريق تغيير المواضع 1 و -1 في النواة. على سبيل المثال ، إذا تم تبادل القيم 1 و -1 ، فسيتم عكس اتجاه الإضاءة الخلفية.

6. تلوين الصورة بالألوان المائية. يقوم مرشح الألوان المائية بتحويل الصورة ، وبعد معالجتها تبدو كما لو كانت مكتوبة بالألوان المائية:

    الخطوة الأولى في تطبيق مرشح الألوان المائية هي تنعيم الألوان في الصورة. تتمثل إحدى طرق التنعيم في تطبيق متوسط ​​اللون في كل نقطة. يتم ترتيب قيمة اللون لكل بكسل وجيرانه البالغ عددهم 24 (حجم قناع المصفوفة 5 × 5) في سلسلة متغيرة بترتيب تنازلي أو تصاعدي. يتم تعيين قيمة اللون المتوسطة (الثالثة عشرة) في سلسلة التباينات إلى البكسل المركزي.

    بعد تجانس الألوان ، تحتاج إلى تطبيق مرشح تحسين الحواف لإبراز حدود انتقالات اللون.