قائمة طعام
مجاني
التسجيل
الصفحة الرئيسية  /  تعليم/ كيف تراقبنا الكاميرات في شوارع المدن الروسية. وكيف تخدعهم

كيف تراقبنا الكاميرات في شوارع المدن الروسية. وكيف تخدعهم

بانتظام يحسد عليه ، تظهر مقالات في حبري تخبرنا عن طرق معينة للتعرف على الوجوه. قررنا ليس فقط دعم هذا الموضوع الرائع ، ولكن نشرنا وثيقتنا الداخلية ، والتي تغطي ، وإن لم تكن جميعها ، ولكن العديد من الأساليب للتعرف على الوجوه ونقاط قوتها وضعفها. قام بتجميعها Andrey Gusak ، مهندسنا ، للموظفين الشباب في قسم رؤية الآلة ، للأغراض التعليمية ، إذا جاز التعبير. اليوم نقدمها للجميع. في نهاية المقال - قائمة رائعة من المراجع لأكثر فضولاً.

لذا ، لنبدأ.
على الرغم من التنوع الكبير في الخوارزميات المقدمة ، يمكن للمرء أن يميزها الهيكل العامعملية التعرف على الوجوه:

العملية العامة لمعالجة صورة الوجه أثناء التعرف

في المرحلة الأولى ، يتم اكتشاف الوجه وتحديد موقعه في الصورة. في مرحلة التعرف ، تتم محاذاة صورة الوجه (هندسية وسطوع) ، ويتم حساب الميزات ويتم التعرف على نفسه - تتم مقارنة الميزات المحسوبة بالمعايير المخزنة في قاعدة البيانات. سيكون الاختلاف الرئيسي بين جميع الخوارزميات المقدمة هو حساب الميزات ومقارنة مجموعاتها مع بعضها البعض.

1. طريقة مطابقة الرسم البياني مرنة.

يتم تقليل جوهر الطريقة إلى مقارنة مرنة للرسوم البيانية التي تصف صور الوجه. يتم تمثيل الوجوه على شكل رسوم بيانية ذات رؤوس وحواف مرجحة. في مرحلة التعرف ، يظل أحد الرسوم البيانية - المرجع الأول - دون تغيير ، في حين أن الآخر مشوه من أجل أن يتلاءم مع الأول بشكل أفضل. في أنظمة التعرف هذه ، يمكن أن تمثل الرسوم البيانية كلاً من شبكة مستطيلة وهيكل يتكون من نقاط مميزة (قياس الجسم البشري) للوجه.

أ)

ب)

مثال على بنية الرسم البياني للتعرف على الوجوه: أ) شبكة منتظمة ب) رسم بياني يعتمد على النقاط الأنثروبومترية للوجه.

عند رؤوس الرسم البياني ، يتم حساب قيم الميزات ، وغالبًا ما تستخدم القيم المعقدة لمرشحات غابور أو مجموعاتها المرتبة - موجات غابور (أنظمة غابور) ، والتي يتم حسابها في بعض المناطق المحلية من قمة الرسم البياني محليًا بتحويل قيم سطوع البكسل باستخدام مرشحات Gabor.


ضبط (البنك ، طائرة) من مرشحات غابور


مثال على التفاف صورة الوجه مع مرشحين Gabor

يتم وزن حواف الرسم البياني بالمسافة بين الرؤوس المتجاورة. يتم حساب الفرق (المسافة ، الخاصية التمييزية) بين رسمين بيانيين باستخدام دالة معينة لتشوه السعر ، والتي تأخذ في الاعتبار كلاً من الاختلاف بين قيم الميزات المحسوبة عند الرؤوس ودرجة تشوه حواف الرسم البياني .
يحدث تشوه الرسم البياني عن طريق إزاحة كل رأس من رؤوسه بمسافة معينة في اتجاهات معينة بالنسبة إلى موقعه الأصلي واختيار مثل هذا الموضع ، حيث يكون الفرق بين قيم الميزات (استجابات مرشحات Gabor) عند قمة سيكون الرسم البياني المشوه والرأس المقابل للرسم البياني المرجعي في حده الأدنى. هذه العمليةيتم إجراؤها بالتناوب لجميع رؤوس الرسم البياني حتى يتم الوصول إلى أصغر فرق إجمالي بين ميزات الرسوم البيانية القابلة للتشوه والرسومات البيانية المرجعية. ستكون قيمة دالة تشوه السعر في هذا الموضع من الرسم البياني القابل للتشوه مقياسًا للاختلاف بين صورة وجه الإدخال والرسم البياني المرجعي. يجب تنفيذ إجراء تشوه "الاسترخاء" هذا لجميع الوجوه المرجعية المخزنة في قاعدة بيانات النظام. نتيجة التعرف على النظام هي معيار ذو أفضل قيمة لوظيفة تشوه السعر.


مثال على تشوه الرسم البياني في شكل شبكة منتظمة

تشير بعض المنشورات إلى كفاءة التعرف بنسبة 95-97٪ حتى في وجود تعبيرات عاطفية مختلفة وتغيير زاوية الوجه حتى 15 درجة. ومع ذلك ، فإن مطوري أنظمة المقارنة المرنة على الرسوم البيانية يستشهدون بتكاليف حسابية عالية. هذا النهج... على سبيل المثال ، لمقارنة صورة وجه الإدخال بـ 87 صورة مرجعية ، استغرق الأمر حوالي 25 ثانية عند العمل على كمبيوتر موازٍ به 23 محولًا (ملاحظة: المنشور مؤرخ في 1993). في المنشورات الأخرى حول هذا الموضوع ، إما لم يتم الإشارة إلى الوقت ، أو يقال إنه طويل.

سلبيات:درجة عالية من التعقيد الحسابي لإجراء التعرف. انخفاض قابلية التصنيع عند حفظ المعايير الجديدة. الاعتماد الخطي لوقت التشغيل على حجم قاعدة بيانات الوجه.

2. الشبكات العصبية

يوجد حاليًا حوالي عشرة أنواع من الشبكات العصبية (NN). أحد أكثر الخيارات استخدامًا هو الشبكة القائمة على منظور متعدد الطبقات ، والذي يسمح لك بتصنيف صورة / إشارة الإدخال وفقًا للإعداد المسبق / تدريب الشبكة.
يتم تدريب الشبكات العصبية باستخدام مجموعة من الأمثلة التدريبية. ينبع جوهر التدريب من ضبط أوزان الوصلات الداخلية في عملية حل مشكلة التحسين باستخدام طريقة الانحدار. في عملية تعليم الشبكة العصبية ، يتم استخراج الميزات الرئيسية تلقائيًا ، ويتم تحديد أهميتها وبناء العلاقات بينها. من المفترض أن NN المدربة ستكون قادرة على تطبيق الخبرة المكتسبة في عملية التعلم على صور غير معروفة بسبب قدرات التعميم.
تم عرض أفضل النتائج في مجال التعرف على الوجوه (وفقًا لنتائج تحليل المنشورات) من خلال الشبكة العصبية التلافيفية أو الشبكة العصبية التلافيفية (يشار إليها فيما يلي باسم CNN) ، والتي تعد تطورًا منطقيًا لأفكار هذه الشبكات العصبية. مثل cognitron و neocognitron. يرجع النجاح إلى القدرة على مراعاة الهيكل ثنائي الأبعاد للصورة ، على عكس منظور متعدد الطبقات.
السمات المميزة لـ SNS هي حقول المستقبلات المحلية (توفر اتصالًا محليًا ثنائي الأبعاد للخلايا العصبية) ، والأوزان الإجمالية (توفر الكشف عن بعض الميزات في أي مكان في الصورة) والتنظيم الهرمي مع أخذ العينات الفرعية المكانية. بفضل هذه الابتكارات ، توفر SNS مقاومة جزئية للتغييرات في الحجم والإزاحة والدوران وتغيير المنظور والتشوهات الأخرى.


تمثيل تخطيطي للعمارة التلافيفية الشبكة العصبية

أظهر اختبار SNS استنادًا إلى قاعدة بيانات ORL ، التي تحتوي على صور لوجوه مع تغييرات طفيفة في الإضاءة والمقياس والدوران المكاني والموضع والعواطف المختلفة ، دقة التعرف بنسبة 96 ٪.
حصلت SNS على تطورها في تطوير DeepFace ، الذي تم الحصول عليه بواسطة
فيسبوك يتعرف على وجوه مستخدمي شبكته الاجتماعية. جميع الميزات المعمارية مغلقة.


كيف يعمل DeepFace

عيوب الشبكات العصبية:تتطلب إضافة شخص مرجعي جديد إلى قاعدة البيانات إعادة تدريب كاملة للشبكة على المجموعة المتاحة بالكامل (إجراء طويل إلى حد ما ، اعتمادًا على حجم العينة ، من ساعة واحدة إلى عدة أيام). المشاكل ذات الطبيعة الرياضية المرتبطة بالتدريب: الدخول إلى المستوى المحلي الأمثل ، واختيار خطوة التحسين المثلى ، وإعادة التدريب ، وما إلى ذلك. من الصعب إضفاء الطابع الرسمي على مرحلة اختيار بنية الشبكة (عدد الخلايا العصبية ، الطبقات ، طبيعة الاتصالات). بتلخيص كل ما سبق ، يمكننا أن نستنتج أن NS عبارة عن "صندوق أسود" مع نتائج عمل يصعب تفسيرها.

3. نماذج ماركوف المخفية (CMM ، HMM)

إحدى الطرق الإحصائية للتعرف على الوجوه هي نماذج ماركوف المخفية (HMM) ذات الوقت المنفصل. يستخدم HMM الخصائص الإحصائية للإشارات ويأخذ في الاعتبار خصائصها المكانية مباشرة. عناصر النموذج هي: مجموعة من الحالات المخفية ، مجموعة من الحالات المرصودة ، مصفوفة احتمالات الانتقال ، الاحتمال الأولي للحالات. لكل منها نموذج ماركوف الخاص بها. عند التعرف على كائن ، يتم التحقق من نماذج ماركوف التي تم إنشاؤها لقاعدة معينة من الكائنات ويتم البحث عن أقصى احتمالية يمكن ملاحظتها في تسلسل الملاحظات من أجل من هذا الكائنتم إنشاؤها بواسطة النموذج المقابل.
حتى الآن ، لم يكن من الممكن العثور على مثال لتطبيق تجاري لـ SMM للتعرف على الوجوه.

سلبيات:
- من الضروري تحديد معلمات النموذج لكل قاعدة بيانات ؛
- لا تتمتع HMM بقدرة تمييزية ، أي أن خوارزمية التعلم تزيد فقط من استجابة كل صورة لنموذجها الخاص ، ولكنها لا تقلل من الاستجابة للنماذج الأخرى.

4. تحليل المكون الرئيسي (PCA)

واحدة من أكثر الطرق شهرة وتطوراً هي طريقة تحليل المكونات الرئيسية (PCA) ، بناءً على تحويل Karunen-Loev.
في البداية ، بدأ تطبيق تحليل المكون الرئيسي في الإحصائيات لتقليل مساحة الميزة دون فقدان كبير للمعلومات. في مشكلة التعرف على الوجوه ، يتم استخدامه بشكل أساسي لتمثيل صورة وجه ذات متجه ذي أبعاد منخفضة (المكونات الأساسية) ، والتي تتم مقارنتها بعد ذلك بالمتجهات المرجعية المخزنة في قاعدة البيانات.
الهدف الرئيسي لطريقة المكون الرئيسي هو تقليل أبعاد مساحة الميزة بشكل كبير بطريقة تصف بأفضل صورة ممكنة الصور "النموذجية" التي تنتمي إلى العديد من الأشخاص. باستخدام هذه الطريقة ، من الممكن تحديد المتغيرات المختلفة في مجموعة التدريب لصور الوجوه ووصف هذا التباين في أساس العديد من النواقل المتعامدة ، والتي تسمى eigenfaces.

يتم استخدام مجموعة المتجهات الذاتية التي تم الحصول عليها مرة واحدة في مجموعة التدريب لصور الوجه لتشفير جميع صور الوجه الأخرى ، والتي يتم تمثيلها من خلال مجموعة مرجحة من هذه المتجهات الذاتية. باستخدام عدد محدود من المتجهات الذاتية ، من الممكن الحصول على تقريب مضغوط لصورة وجه الإدخال ، والتي يمكن تخزينها بعد ذلك في قاعدة البيانات كمتجه للمعاملات ، والتي تعمل في نفس الوقت كمفتاح بحث في قاعدة بيانات الوجه.

جوهر طريقة المكون الرئيسي على النحو التالي. أولاً ، يتم تحويل مجموعة الوجوه التدريبية بأكملها إلى مصفوفة بيانات مشتركة واحدة ، حيث يمثل كل صف مثيلًا واحدًا لصورة الوجه المتحللة إلى صف واحد. يجب تصغير جميع أوجه مجموعة التدريب إلى نفس الحجم ومع رسوم بيانية موحدة.


تحويل مجموعة الوجوه التدريبية إلى مصفوفة واحدة مشتركة X

ثم يتم تطبيع البيانات ويتم تقليل الصفوف إلى المتوسط ​​0 والتباين الأول ، ويتم حساب مصفوفة التغاير. بالنسبة لمصفوفة التغاير التي تم الحصول عليها ، تم حل مشكلة تحديد القيم الذاتية والمتجهات الذاتية المقابلة (القيم الذاتية). بعد ذلك ، يتم فرز المتجهات الذاتية بترتيب تنازلي لقيم eigenvalues ​​ويتم ترك متجهات k الأولى فقط وفقًا للقاعدة:




خوارزمية PCA


مثال على المتجهات الذاتية العشرة الأولى (قيم eigenvalues) التي تم الحصول عليها على مجموعة الوجوه المدربة

= 0.956*-1.842*+0.046

مثال على بناء (تركيب) وجه بشري باستخدام مزيج من الوجوه والمكونات الرئيسية


مبدأ اختيار الأساس من أول أفضل المتجهات الذاتية


مثال على تعيين وجه في فضاء متري ثلاثي الأبعاد ، تم الحصول عليه من ثلاثة وجوه خاصة ومزيد من التعرف

أثبت تحليل المكون الرئيسي نفسه جيدًا في التطبيقات العملية. ومع ذلك ، في الحالات التي تحدث فيها تغييرات كبيرة في الإضاءة أو تعبيرات الوجه في صورة الوجه ، تنخفض فعالية الطريقة بشكل كبير. النقطة المهمة هي أن PCA تختار فضاءًا فرعيًا مع مثل هذا الهدف لتقريب مجموعة بيانات الإدخال قدر الإمكان ، وعدم التمييز بين فئات الأشخاص.

في حل لهذه المشكلة تم اقتراح استخدام مميز فيشر الخطي (يوجد في الأدبيات اسم "Eigen-Fisher" ، "Fisherface" ، LDA). يختار LDA مساحة جزئية خطية تزيد من النسبة:

أين

مصفوفة تشتت Interclass و

مصفوفة التشتت داخل الطبقة ؛ م هو عدد الفئات في قاعدة البيانات.

يبحث LDA عن إسقاط بيانات يجعل الفئات قابلة للفصل خطيًا قدر الإمكان (انظر الشكل أدناه). للمقارنة ، يبحث PCA عن إسقاط بيانات يزيد من الانتشار عبر قاعدة بيانات الوجه بالكامل (باستثناء الفئات). أظهرت التجارب ذات الخزان القوي والظلال السفلية لصور الوجه أن Fisherface فعال بنسبة 95 ٪ مقارنة بـ 53 ٪ لـ Eigenface.


الفرق الأساسي بين تشكيل الإسقاطات PCA و LDA

الفرق بين PCA و LDA

5. نماذج المظهر النشط (AAM) ونماذج الأشكال النشطة (ASM) ()
نماذج المظهر النشط (AAM)
نماذج المظهر النشط (AAM) هي نماذج صور إحصائية يمكن تعديلها لتلائم الصورة الحقيقية من خلال التشوهات المختلفة. تم اقتراح هذا النوع من النموذج ثنائي الأبعاد بواسطة Tim Coots و Chris Taylor في عام 1998. في البداية ، تم استخدام نماذج المظهر النشط لتقدير معاملات صور الوجه.
يحتوي نموذج المظهر النشط على نوعين من المعلمات: المعلمات المتعلقة بالشكل (معلمات الشكل) والمعلمات المتعلقة بنموذج البكسل الإحصائي لصورة أو نسيج (معلمات المظهر). قبل الاستخدام ، يجب تدريب النموذج على مجموعة من الصور المحددة مسبقًا. يتم تمييز الصور يدويًا. كل علامة لها رقمها الخاص وتحدد نقطة مميزة يجب أن يجدها النموذج أثناء التكيف مع صورة جديدة.


مثال على صورة وجه تحدد من 68 نقطة تشكل شكل AAM.

يبدأ روتين تدريب AAM بتطبيع الأشكال في الصور المعينة للتعويض عن الاختلافات في المقياس والإمالة والإزاحة. لهذا الغرض ، يتم استخدام ما يسمى بتحليل Procrustian المعمم.


إحداثيات نقاط شكل الوجه قبل وبعد التطبيع

ثم يتم استخراج المكونات الرئيسية من المجموعة الكاملة للنقاط المقيسة باستخدام طريقة PCA.


يتكون نموذج شكل AAM من شبكة مثلثية s0 ومجموعة خطية من عمليات الإزاحة si بالنسبة لـ s0

علاوة على ذلك ، يتم تكوين مصفوفة من وحدات البكسل الموجودة داخل المثلثات المكونة من نقاط الشكل ، بحيث يحتوي كل عمود من أعمدتها على قيم البكسل للنسيج المقابل. من الجدير بالذكر أن الأنسجة المستخدمة للتدريب يمكن أن تكون إما قناة واحدة (تدرج الرمادي) أو متعددة القنوات (على سبيل المثال ، مساحة ألوان RGB أو غير ذلك). في حالة الأنسجة متعددة القنوات ، يتم تشكيل متجهات البكسل بشكل منفصل لكل قناة ، ثم يتم تجميعها. بعد العثور على المكونات الرئيسية لمصفوفة النسيج ، يعتبر نموذج AAM مدربًا.

يتكون نموذج مظهر AAM من طريقة عرض أساسية A0 محددة بالبكسل داخل شبكة أساسية s0 ومجموعة خطية من إزاحات Ai بالنسبة إلى A0

مثال على تجسيد AAM. متجه معلمة الشكل
p = (p_1، p_2، 〖…، p〗 _m) ^ T = (- 54،10، -9.1، ...) ^ يستخدم T لتجميع نموذج من النموذج s ، ومتجه المعلمة λ = (λ_1 ، λ_2، 〖…، λ〗 _m) ^ T = (3559،351، -256،…) ^ T لتركيب مظهر النموذج. يتم الحصول على نموذج الوجه النهائي 〖M (W (x ؛ p))〗 ^ كمزيج من نموذجين - الشكل والمظهر.

يتم إجراء ملاءمة النموذج مع صورة وجه معينة في عملية حل مشكلة تحسين ، وجوهرها هو تقليل الوظائف الوظيفية

طريقة نزول التدرج. ستعكس معلمات النموذج الموجودة في هذه الحالة موضع النموذج على صورة معينة.




مثال على ملاءمة نموذج لصورة معينة في 20 تكرارًا لإجراء نزول التدرج اللوني.

يمكن استخدام AAM لمحاكاة صور الكائنات المعرضة للتشوه الصلب وغير الصلب. يتكون AAM من مجموعة من المعلمات ، بعضها يمثل شكل الوجه ، والبقية تحدد نسيجها. عادة ما تُفهم التشوهات على أنها تحول هندسي في شكل ترجمة وتناوب وتكوين تحجيم. عند حل مشكلة توطين الوجه في صورة ما ، يتم إجراء البحث عن معلمات AAM (الموقع والشكل والملمس) ، والتي تمثل الصورة المركبة الأقرب إلى الصورة المرصودة. بناءً على قرب AAM من الصورة المعدلة ، يتم اتخاذ قرار ما إذا كان هناك وجه أم لا.

نماذج الشكل النشط (ASM)

يتمثل جوهر طريقة ASM في مراعاة العلاقات الإحصائية بين موقع النقاط البشرية. في العينة المتاحة من صور الوجه ، تم التقاطها في المنظر الأمامي. على الصورة ، يشير الخبير إلى موقع النقاط البشرية. في كل صورة ، يتم ترقيم النقاط بنفس الترتيب.




مثال لتمثيل شكل الوجه باستخدام 68 نقطة

من أجل إحضار الإحداثيات على جميع الصور إلى نظام موحدعادة ما يسمى ب. تحليل التمرير المعمم ، ونتيجة لذلك يتم إحضار جميع النقاط إلى نفس المقياس وتوسيطها. علاوة على ذلك ، بالنسبة لمجموعة الصور بأكملها ، يتم حساب متوسط ​​الشكل ومصفوفة التغاير. بناءً على مصفوفة التغاير ، يتم حساب المتجهات الذاتية ، والتي يتم فرزها بعد ذلك بترتيب تنازلي لقيمها الذاتية المقابلة. يتم تعريف ASM بواسطة مصفوفة Φ ومتجه شكل متوسط ​​s.
ثم يمكن وصف أي شكل باستخدام نموذج ومعلمات:

يتم توطين نموذج ASM على صورة جديدة غير مدرجة في عينة التدريب في عملية حل مشكلة التحسين.


ا ب ت ث)
رسم توضيحي لعملية توطين نموذج ASM على صورة معينة: أ) الموضع الأولي ب) بعد 5 تكرارات ج) بعد 10 تكرارات د) تم تقارب النموذج

ومع ذلك ، فإن الهدف الرئيسي لـ AAM و ASM ليس التعرف على الوجوه ، ولكن التحديد الدقيق للوجه ونقاط القياسات البشرية في الصورة لمزيد من المعالجة.

في جميع الخوارزميات تقريبًا ، تكون الخطوة الإلزامية التي تسبق التصنيف هي المحاذاة ، مما يعني محاذاة صورة الوجه مع الموضع الأمامي بالنسبة للكاميرا أو إحضار مجموعة من الوجوه (على سبيل المثال ، في عينة تدريب لتدريب المصنف) إلى نظام إحداثيات واحد. لتنفيذ هذه المرحلة ، من الضروري تحديد موقع النقاط الأنثروبومترية المميزة لجميع الوجوه على الصورة - غالبًا ما تكون هذه مراكز التلاميذ أو زوايا العين. يميز باحثون مختلفون مجموعات مختلفة من هذه النقاط. من أجل تقليل التكاليف الحسابية لأنظمة الوقت الفعلي ، لا يخصص المطورون أكثر من 10 نقاط من هذا القبيل.

تم تصميم نماذج AAM و ASM لتحديد مواقع هذه النقاط البشرية بدقة في صورة الوجه.

6. المشاكل الرئيسية المرتبطة بتطوير أنظمة التعرف على الوجوه

مشكلة الإضاءة

مشكلة وضع الرأس (الوجه ، بعد كل شيء ، كائن ثلاثي الأبعاد).

من أجل تقييم فعالية خوارزميات التعرف على الوجوه المقترحة ، قامت وكالة DARPA ومختبر أبحاث الجيش الأمريكي بتطوير برنامج FERET (تقنية التعرف على الوجوه).

في الاختبارات واسعة النطاق لبرنامج FERET ، تم المشاركة في الخوارزميات القائمة على المقارنة المرنة للرسوم البيانية والتعديلات المختلفة لتحليل المكون الرئيسي (PCA). كانت كفاءة جميع الخوارزميات متماثلة تقريبًا. في هذا الصدد ، من الصعب أو حتى المستحيل التمييز بوضوح بين الاثنين (خاصة إذا تم الاتفاق على مواعيد الاختبار). بالنسبة للصور الأمامية التي تم التقاطها في نفس اليوم ، فإن دقة التعرف المقبولة عادة ما تكون 95٪. بالنسبة للصور الملتقطة بأجهزة مختلفة وتحت ظروف إضاءة مختلفة ، تنخفض الدقة عادةً إلى 80٪. بالنسبة للصور التي تم التقاطها بفارق عام واحد ، كانت دقة التعرف حوالي 50٪. وتجدر الإشارة إلى أنه حتى نسبة 50 في المائة تعتبر أكثر من دقة مقبولة لهذا النوع من الأنظمة.

تنشر FERET تقرير اختبار مقارن سنويًا الأنظمة الحديثةالتعرف على الوجوه على أساس وجوه أكثر من مليون. لسوء الحظ ، لا تكشف التقارير الأخيرة عن مبادئ أنظمة التعرف على المباني ، ولكن يتم نشر نتائج تشغيل الأنظمة التجارية فقط. اليوم ، النظام الرائد هو نظام NeoFace الذي طورته شركة NEC.

المراجع (googled في الرابط الأول)
1. التعرف على الوجوه المعتمد على الصور - القضايا والطرق
2. كشف الوجه A Survey.pdf
3. التعرف على الوجوه مسح أدبي
4. مسح لتقنيات التعرف على الوجوه
5. مسح لكشف الوجوه واستخراجها والتعرف عليها
6. نظرة عامة على طرق تحديد الأشخاص بناءً على صور الوجه
7. طرق التعرف على الشخص عن طريق صورة الوجه
8. تحليل مقارن لخوارزميات التعرف على الوجوه
9. تقنيات التعرف على الوجه
10. حول نهج واحد لتوطين النقاط الأنثروبومترية.
11. التعرف على الوجوه في صور المجموعة باستخدام خوارزميات التجزئة
12. تقرير بحثي المرحلة الثانية عن التعرف على الوجوه
13. التعرف على الوجه عن طريق مطابقة الرسوم البيانية المرنة
14. خوارزميات للتعرف على الشخص من صورة تعتمد على التحولات الهندسية. فرضية.
15. التعرف على الكائن الثابت التشويه في بنية الارتباط الديناميكي
16. التعرف على الوجه باستخدام نماذج الأشكال النشطة ، والتصحيحات المحلية وآلات المتجهات الداعمة
17. التعرف على الوجه باستخدام نماذج المظهر النشط
18. نماذج المظهر النشط للتعرف على الوجوه
19. محاذاة الوجه باستخدام نموذج الشكل النشط وآلة الدعم المتجه
20. نماذج الشكل النشط - تدريبهم وتطبيقهم
21. فيشر فيكتور وجوه في البرية
22 ـ إيجينفايسس ضد. التعرف على واجهات الصيد باستخدام الإسقاط الخطي الخاص بفئة معينة
23. Eigenfaces و fishfaces
24. تخفيض الأبعاد
25. ICCV 2011 تعليمي حول التسجيل التشوه القائم على الأجزاء
26. النموذج المحلي المقيد لمحاذاة الوجه ، تعليمي
27. من أنت - تعلم المصنفات الخاصة بشخص ما من الفيديو
28. التعرف على الشخص عن طريق صورة الوجه باستخدام طرق الشبكة العصبية
29. التعرف على الوجه نهج الشبكة العصبية التلافيفية
30. التعرف على الوجوه باستخدام الشبكة العصبية التلافيفية والمصنف اللوجستي البسيط
31. تحليل صورة الوجه مع الشبكات العصبية التلافيفية
32. طرق التعرف على الوجوه على أساس عمليات ماركوف المخفية. الكاتب فرات
33. تطبيق نماذج ماركوف المخفية للتعرف على الوجوه
34. كشف الوجه والتعرف عليه باستخدام نماذج ماركوف المخفية
35. التعرف على الوجوه مع GNU Octave-MATLAB
36. التعرف على الوجوه مع بايثون
37. التعرف على الوجوه الأنثروبومترية ثلاثية الأبعاد
38.3D التعرف على الوجوه
39. التعرف على الوجوه على أساس تركيب نموذج قابل للتحويل ثلاثي الأبعاد
40. التعرف على الوجوه
41. التعرف القوي على الوجوه عن طريق التمثيل المتناثر
42. منهجية تقييم FERET لخوارزميات التعرف على الوجوه
43. ابحث عن الوجوه في المجموعات الإلكترونية للصور التاريخية
44. تصميم وتنفيذ وتقييم أنظمة رؤية الأجهزة المخصصة للتعرف على الوجوه في الوقت الحقيقي
45. مقدمة إلى مشكلة التعرف على الوجه الجيد والسيئ والقبيح
46. ​​بحث وتطوير طرق كشف الوجه البشري على الصور الرقمية. شهادة دبلوم
47. DeepFace يسد الفجوة في الأداء على مستوى الإنسان في التحقق من الوجه
48. التخلص من التسمية الآلية للشخصيات في الفيديو التلفزيوني
49. نحو نظام عملي للتعرف على الوجوه محاذاة قوية وإضاءة بتمثيل متناثر
50. خوارزميات لكشف وجه الشخص لحل المشاكل التطبيقية لتحليل الصور ومعالجتها
51. كشف الوجه والتعريب في الصورة
52. تعديل تعديل فيولا جونز
53. تطوير وتحليل الخوارزميات للكشف عن الأشياء وتصنيفها بناءً على طرق التعلم الآلي
54. نظرة عامة على التحدي الكبير للتعرف على الوجوه
55. اختبار بائع التعرف على الوجوه (FRVT)
56. حول كفاءة استخدام خوارزمية SURF في مشكلة تحديد هوية الأشخاص

تم توصيل أكثر من ثلاثة آلاف كاميرا فيديو لشبكة المراقبة بالفيديو بالمدينة بنظام التعرف على الوجوه. يتم تحليل صورة الفيديو تلقائيًا في الوقت الفعلي: يمكن للنظام التعرف على الشخص الموجود في الفيديو وجنسه وعمره.

تم تعليم نظام المراقبة بالفيديو في موسكو التعرف على الوجوه. بفضل خوارزمية تعتمد على استخدام الشبكات العصبية ، يتم تحليل تسجيلات الفيديو من كاميرات المدينة في الوقت الفعلي. يتم فحص الوجوه الموجودة في السجلات بحيث يمكن مقارنتها ، إذا لزم الأمر ، بالمعلومات الموجودة في قواعد البيانات المختلفة - على سبيل المثال ، في قواعد بيانات الصور لوكالات إنفاذ القانون عندما يتعلق الأمر بالعثور على الجاني. بالإضافة إلى ذلك ، يمكن لمثل هذا النظام التحليلي أن يساعد وكالات إنفاذ القانون ، عند القبض على مجرم ، في بناء طريق لحركته في جميع أنحاء المدينة. سيختار النظام نفسه تسجيلات الفيديو اللازمة من كاميرات مراقبة مختلفة ، وتحديد المشتبه به في الفيديو. تتكون الشبكة الحضرية من 160 ألف كاميرا فيديو وتغطي 95 في المائة من مداخل المباني السكنية. حتى نهاية العام ، سيتمكن المواطنون من تركيب كاميرات في منازلهم بشكل مستقل وربطها بنظام موحد للمراقبة بالفيديو.

"يعد إدخال تحليلات الفيديو محركًا قويًا لزيادة كفاءة أنظمة المراقبة بالفيديو الخاصة والحضرية على حدٍ سواء. قال رئيس الدائرة أن سكان المدينة لديهم مستوى إضافي من الحماية تقنيات المعلوماتموسكو ارتيم ارمولايف. - بالطبع ، يجب تنفيذ كل هذه الفرص بمسؤولية كبيرة. أولويتنا هي التوازن بين الخصوصية والأمن ، ونحن نلتزم بسياسة رقابة داخلية صارمة لضمان احترام حقوق المواطنين ".

الآن حوالي 16 ألف مستخدم متصلون بنظام مراقبة المدينة - إنهم موظفون في وكالات إنفاذ القانون ومؤسسات الدولة والبلديات. لكل منها مستوى وصول خاص به ، مما يسمح بالحفاظ على سرية المعلومات. يمكن لضباط إنفاذ القانون الحصول على البيانات اللازمة عند الطلب في إطار التشريع الحالي ، ولا يحصل موظفو مؤسسات الدولة على إمكانية الوصول إلى كاميرات الفيديو إلا من تلك المناطق والطرق التي يتحملون مسؤوليتها. يتم تسجيل كل مكالمة إلى نظام التتبع.

تعمل وظيفة التعرف على الوجوه عبر الإنترنت ، وتستغرق عملية تحديد الهوية بضع ثوانٍ. إذا اكتشفت الخوارزمية شخصًا تم تحميل وجهه إلى قاعدة البيانات ، فسوف ترسل تنبيهًا إلى وكالات إنفاذ القانون.

كما أشارت الإدارة إلى أن استحداث وظيفة التعرف على الوجوه قد أدى بالفعل إلى زيادة كفاءة التحقيق في الجرائم والبحث عن المجرمين. خلال الاختبارات التجريبية ، حددت واحتجزت أكثر من 50 في المائة من منتهكي القانون ، الذين تم البحث عنهم باستخدام خوارزميات تحليلية. قبل ذلك ، لم يكن من الممكن العثور على بعضها لسنوات عديدة.

سيتمكن سكان موسكو من توصيل كاميرات المراقبة الخاصة بهم بشبكة المدينة العامة. سيتم تنفيذ هذا الخيار قبل نهاية العام. سيتم إرسال مقاطع الفيديو من هذه الكاميرات إلى مركز تخزين ومعالجة البيانات الموحد (ECDC) ، ويمكن استخدام التسجيلات منها كدليل مهم من الناحية القانونية في المحكمة.

هذا العام ، تم أيضًا توصيل أكثر من 3.5 ألف كاميرا بمركز تخزين ومعالجة بيانات واحد. يتم توصيل كاميرات الوصول والكاميرات المثبتة في الأراضي وفي مباني المدارس ورياض الأطفال وفي محطات MCC والملاعب ومحطات النقل العام ومحطات الحافلات ، وكذلك في الحدائق ، بنظام واحد. بالإضافة إلى ذلك ، ستظهر كاميرات المراقبة بالفيديو في 25 معبرًا للمشاة تحت الأرض في العاصمة بحلول يونيو 2018. سيتم تثبيت أجهزة التسجيل في ممرات تحت الأرض غير متصلة بمحطات المترو وتحت اختصاص GBU "Gormost".

ربما لا توجد تقنية أخرى اليوم يمكن أن يكون حولها الكثير من الأساطير والأكاذيب وعدم الكفاءة. الصحفيون الذين يتحدثون عن التكنولوجيا يكذبون ، والسياسيون الذين يتحدثون عن التطبيق الناجح يكذبون ، ومعظم بائعي التكنولوجيا يكذبون. أرى كل شهر عواقب محاولة الأشخاص تطبيق التعرف على الوجه في أنظمة لا يمكنها العمل معها.

أصبح موضوع هذا المقال مؤلمًا منذ فترة طويلة ، لكنني كنت كسولًا إلى حد ما بحيث لا يمكنني كتابته. الكثير من النصوص التي كررتها بالفعل عشرين مرة لأشخاص مختلفين. لكن بعد قراءة حزمة أخرى من القمامة ، ما زلت أقرر أن الوقت قد حان. سأعطي رابط لهذه المقالة.

وبالتالي. في هذا المقال سأجيب على بعض الأسئلة البسيطة:

أين تعتقد أن مبتكري الخوارزميات حصلوا على هذه القواعد؟

نصيحة صغيرة. أول منتج لـ NTech هم الآن هو Find Face ، بحث عن الأشخاص عن طريق الاتصال. لا أعتقد أن هناك حاجة إلى تفسيرات. بالطبع ، تحارب فكونتاكتي الروبوتات التي تضخ كل الملفات الشخصية المفتوحة. لكن بقدر ما سمعت ، لا يزال الناس يضخون. وزملاء الدراسة. و instagram.

إنه مثل Facebook - كل شيء أكثر تعقيدًا هناك. لكنني متأكد من أنهم توصلوا إلى شيء ما أيضًا.
لذا نعم ، إذا كان ملفك الشخصي مفتوحًا ، فيمكنك أن تفخر به ، فقد تم استخدامه لتدريب الخوارزميات ؛)

عن الحلول وعن الشركات

يمكنك أن تكون فخوراً به. من بين الشركات الخمس الرائدة في العالم ، هناك الآن شركتان روسيتان. هذه هي N-Tech و VisionLabs. قبل نصف عام ، كان NTech و Vocord هما القائدان ، الأول يعمل بشكل أفضل على الوجوه المخروطة ، والثاني على الوجوه الأمامية.

الآن باقي القادة هم 1-2 شركتان صينيتان وواحدة أمريكية ، وقد اجتاز Vocord شيئًا ما في التصنيف.

الروسية أيضًا في تصنيف itmo ، و 3 divi ، و intellivision. Synesis هي شركة بيلاروسية ، على الرغم من أن البعض كان في موسكو مرة واحدة ، قبل حوالي 3 سنوات كان لديهم مدونة على Habré. أعرف أيضًا عن العديد من الحلول التي تخصهم شركات أجنبية ، لكن مكاتب التطوير موجودة أيضًا في روسيا. هناك أيضًا العديد من الشركات الروسية التي ليست في المنافسة ، ولكن يبدو أن لديها حلولًا جيدة. على سبيل المثال ، الأهداف الإنمائية للألفية. من الواضح أن Odnoklassniki و Vkontakte لهما أيضًا أشياء جيدة خاصة بهما ، لكنهما مخصصان للاستخدام الداخلي.

باختصار ، نعم ، في الغالب نحن والصينيين ننتقل إلى وجوهنا.

كانت NTech هي الأولى في العالم لعرضها معلمات جيدةمستوى جديد. في وقت ما في نهاية عام 2015. VisionLabs فقط مع NTech. في عام 2015 ، كانوا رواد السوق. لكن قرارهم كان من الجيل الماضي ، وبدأوا في محاولة اللحاق بـ NTech فقط في نهاية عام 2016.

لأكون صادقًا ، لا أحب هاتين الشركتين. تسويق عدواني للغاية. لقد رأيت أشخاصًا تم إعطاؤهم حلًا غير مناسب بشكل واضح ولم يحل مشاكلهم.

من هذا الجانب ، أحببت Vocord أكثر من ذلك بكثير. ذات مرة استشرت الرجال الذين قال لهم Vocord بصراحة شديدة ، "مشروعك لن يعمل مع مثل هذه الكاميرات ونقاط التثبيت". حاولت NTech و VisionLabs البيع بسعادة. لكن شيئًا ما اختفى Vocord مؤخرًا.

الاستنتاجات

في الاستنتاجات ، أود أن أقول ما يلي. التعرف على الوجه هو أداة جيدة وقوية للغاية. إنه حقًا يسمح لك بالعثور على المجرمين اليوم. لكن تنفيذه يتطلب تحليلًا دقيقًا للغاية لجميع المعلمات. هناك ما يكفي من الحلول مفتوحة المصدر حيث. هناك تطبيقات (التعرف في الملاعب وسط حشد من الناس) ، حيث من الضروري تثبيت VisionLabs | Ntech فقط ، وكذلك الاحتفاظ بفريق للصيانة والتحليل واتخاذ القرار. ولن يساعدك OpenSource هنا.

اليوم ، لا يمكن للمرء أن يصدق كل الحكايات التي يمكن للمرء أن يمسك بها جميع المجرمين ، أو يراقب كل شخص في المدينة. لكن من المهم أن تتذكر أن مثل هذه الأشياء يمكن أن تساعد في القبض على المجرمين. على سبيل المثال ، ليس التوقف في مترو الأنفاق كل شخص على التوالي ، ولكن فقط أولئك الذين يعتبرهم النظام متشابهين. ضع الكاميرات بحيث يتم التعرف على الوجوه بشكل أفضل وإنشاء بنية أساسية مناسبة لذلك. على الرغم من أنني ، على سبيل المثال ، ضد هذا. بالنسبة لتكلفة الخطأ إذا تم التعرف عليك كشخص آخر ، فقد يكون ذلك كبيرًا جدًا.

اضف اشارة

كلمات مرور معقدة ، توثيق ذو عاملينالماسحات الضوئية لبصمات الأصابع كلها طرق لحماية بيانات المستخدم. في السنوات القليلة الماضية ، بدأ مصنعو الهواتف الذكية في الترويج بنشاط لاتجاه جديد - الأنظمة التعرف التلقائيوجوه بشرية. دعونا نفهم من أين أتوا وكيف يعملون ولماذا هم مطلوبون.

القليل من التاريخ

بدأت أولى التجارب المغلقة على التعرف على الوجوه البشرية بواسطة الكمبيوتر في الستينيات. المشكلات الرئيسية للعلماء بعد ذلك - عدم قدرة أجهزة الكمبيوتر على التقاط التعبيرات المختلفة والتغيرات المرتبطة بالعمر في وجه الشخص ، فضلاً عن انخفاض أتمتة العملية. انتقل البحث إلى مستوى جديد في نهاية القرن العشرين - ثم بدأت أجهزة الكمبيوتر في التدريس ، عند تحليل الصور ، "للتعرف" على الأشخاص من عدة زوايا ، وليس التفاعل مع اللحى والشارب ومستحضرات التجميل و "التداخل" الأخرى. تستمر هذه العملية حتى يومنا هذا - لا يوجد نظام في العالم يعمل في 100٪ من الحالات ويوفر دقة عالية في التعرف. ومع ذلك ، في بداية القرن الحادي والعشرين ، تقدمت التكنولوجيا إلى الأمام ، وظهرت طريقة جديدة لتحديد الوجه تعتمد على المسح ثلاثي الأبعاد. سوف نركز عليها اليوم.

كيف تعمل أنظمة التعرف على الوجوه على الهواتف الذكية

التعرف على الوجوه قيد التشغيل الأدوات الحديثة، مثل أي عملية أخرى لتحديد هوية المستخدم البيومترية ، يمكن تقسيمها تقريبًا إلى 4 مراحل:

  1. المسح الأولي للوجه. باستخدام مستشعر أو كاميرا خاصة ، يقوم النظام بإجراء مسح ثلاثي الأبعاد للوجه ومعالجة المعلومات الواردة.
  2. استخراج بيانات فريدة وإنشاء قالب بناءً عليها. في هذه المرحلة ، يحدد النظام مجموعة من السمات لوجه معين: خطوط تجويف العين وعرض الأنف وشكل عظام الوجنتين.
  3. مطابقة القالب النهائي بإدخال جديد ، على سبيل المثال ، وجه شخص آخر.
  4. ابحث عن التطابقات. يقرر النظام ما إذا كانت مجموعة ميزات النموذج الجديد تتطابق مع القالب الجاهز وتنفذ إجراءً محددًا. في حالتنا ، سيتم إلغاء قفل الشاشة أو تركها مقفلة.

سلبيات

تشغيل الهواتف الذكية الحديثةالمسح يستغرق أقل من ثانية. ومع ذلك ، لا يمكن للمستشعر ثلاثي الأبعاد أن يحل تمامًا محل الطرق الأخرى لتحديد هوية المستخدم ، مثل ماسح بصمات الأصابع. هناك عدة أسباب:

  • النظام غير مستقر في ظروف الإضاءة المنخفضة ؛
  • لا تتكيف بشكل جيد مع التعبيرات المختلفة للوجه البشري وتسريحات الشعر وشعر الوجه والعقبات الأخرى ؛
  • لا يقوم النظام دائمًا بمقارنة النموذج بدقة ببيانات الإدخال الجديدة ، ولهذا السبب يمكن إلغاء قفل الجهاز باستخدام صورة المالك.

أين تستخدم أنظمة التعرف على الوجوه؟

في السابق ، كانت أنظمة التعرف على الوجوه والتعرف عليها تُستخدم حصريًا من قبل وكالات إنفاذ القانون ، في المطارات وفي الجمارك. في السنوات الأخيرة ، تحول التركيز نحو أجهزة الكمبيوتر الشخصية والهواتف الذكية والأجهزة القابلة للارتداء ، حيث تعد الماسحات الضوئية للوجه أداة إضافية لمصادقة المستخدم. وبالتالي ، فإن Galaxy S8 الذي تم تقديمه في شهر مارس مزود بمستشعر ثلاثي الأبعاد يمكنه فتح الجهاز. من الجدير بالذكر أنه لإجراء مدفوعات أو العمل مع مجلدات سرية ، يتعين على المستخدمين استخدام طريقة أكثر موثوقية للتحقق البيومتري - بصمة الإصبع.

مجال آخر لتطبيق تقنية التعرف على الوجوه هو تحديد الأشخاص في الصور. تعمل هذه الميزة في ألبومات صور Google وتطبيق الصور على iPhone و Mac. في الأخير ، يتعرف النظام على الأشخاص الموجودين في الصور التي يقوم المستخدم بتحميلها إلى المكتبة ، ثم يتيح لك إضافة الأسماء وتفاصيل الاتصال ، مما يسهل العثور على الصور.

عندما تكمل Apple Siri ، سنكون قادرين على فتح الصور التي نحتاجها دون لمس الجهاز ومشاركتها على الشبكات الاجتماعية ، أو الاتصال بالأصدقاء القدامى الذين رأيناهم في ألبوم به صور جامعية ، أو نطلب من أحد المساعدين أن يوضح لنا كيف تغير مظهرنا على مدى السنوات الخمس الماضية. وهذا ما يتبادر إلى الذهن أولاً.

التعرف على الوجه في روسيا

أين ولماذا يريدون تطبيقه

المناسبات العامة

طورت NtechLab نظام كاميرا يمكنه. تتعرف على الدخلاء وترسل صورهم إلى الشرطة. سيكون لدى الشرطة أيضًا كاميرات محمولة لتصوير الأشخاص المشبوهين والتعرف على وجوههم ومعرفة من هم من قواعد البيانات.

يجري اختبار الكاميرات المزودة بميزة التعرف على الوجوه في مترو موسكو. يقومون بمسح وجوه 20 شخصًا في الثانية ومقارنتها بقواعد بيانات الأشخاص المطلوبين. إذا كان هناك تطابق ، ترسل الكاميرات البيانات إلى الشرطة. لمدة 2.5 شهر كان النظام على قائمة المطلوبين. من المعروف أن هناك مثل هذه الكاميرات ، ولكن من الممكن أن تكون قد تم تركيبها في محطات أخرى أيضًا.

أطلق Otkritie Bank نظام التعرف على الوجوه في بداية عام 2017. يقارن وجه الزائر بالصورة الموجودة في قاعدة البيانات. النظام ضروري لخدمة العملاء بشكل أسرع ، كيف لم يتم تحديده بالضبط. تريد Otkritie في المستقبل استخدام النظام لتحديد الهوية عن بعد. في 2018 نظام مشابه، ولكن تطوير "Rostelecom" يجب أن يظهر.

الشيء الرئيسي هو الخوارزمية

ما هي التكنولوجيا التي تسمح للآلات بالتعرف على الوجوه

سيرجي ميلييف

رؤية الكمبيوتر هي خوارزميات تسمح لك بالحصول على معلومات عالية المستوى من الصور ومقاطع الفيديو ، وبالتالي أتمتة بعض جوانب الإدراك البصري البشري. الرؤية الحاسوبية للآلة ، مثل الرؤية العادية للإنسان ، هي وسيلة للقياس والحصول على معلومات دلالية حول المشهد المرصود. بفضل مساعدتها ، تتلقى الآلة معلومات حول حجم الكائن وشكله وما هو عليه.

كاميرا خوارزمية رؤية الكمبيوتريراقب OpenCV الأطفال في الملعب

كل شيء يعمل على أساس الشبكات العصبية

كيف يعمل التعرف على الوجوه بالضبط ، مع مثال

سيرجي ميلييف:تقوم الآلات بهذا بكفاءة أكبر على أساس التعلم الآلي ، أي عندما تتخذ قرارًا بناءً على بعض النماذج البارامترية دون وصف صريح لجميع قواعد اتخاذ القرار الضرورية. كود البرنامج... على سبيل المثال ، بالنسبة للتعرف على الوجوه ، تستخرج الشبكة العصبية ميزات من صورة ما وتحصل على تمثيل فريد لوجه كل شخص ، والذي لا يتأثر بتوجيه رأسه في الفضاء ، أو وجود أو عدم وجود لحية أو مكياج أو إضاءة ، التغييرات المرتبطة بالعمر ، وما إلى ذلك.

الرؤية الحاسوبية لا تعيد إنتاج النظام البصري للإنسان ، ولكنها تحاكي فقط بعض الجوانب لحل المشكلات المختلفة

سيرجي ميلييف

باحث رئيسي ، VisionLabs

تعتمد خوارزميات رؤية الكمبيوتر الأكثر شيوعًا الآن على الشبكات العصبية ، والتي أظهرت ، مع زيادة أداء المعالج وحجم البيانات ، إمكانات عالية لحل مجموعة واسعة من المشكلات. يتم تحليل كل جزء من الصورة باستخدام مرشحات ذات معلمات تستخدمها الشبكة العصبية للبحث عن السمات المميزة للصورة.

مثال

تقوم طبقات الشبكة العصبية بمعالجة الصورة بشكل تسلسلي ، وفي كل طبقة لاحقة ، يتم حساب المزيد والمزيد من الميزات المجردة ، ويمكن لمرشحات الطبقات الأخيرة رؤية الصورة بأكملها. عند التعرف على الوجوه في الطبقات الأولى ، تكتشف الشبكة العصبية ميزات بسيطة مثل الحدود وميزات الوجه ، ثم يمكن أن تكشف المرشحات ذات الطبقات العميقة عن ميزات أكثر تعقيدًا - على سبيل المثال ، ستعني دائرتان متجاورتان على الأرجح أنها عيون ، وما إلى ذلك وهلم جرا.

تحدد خوارزمية رؤية الكمبيوتر الخاصة بـ OpenCV عدد الأصابع المعروضة

يعرف الكمبيوتر متى يتم الغش

يمكن لأي شخص أن يخدع جهاز كمبيوتر ذكي للغاية ، ثلاثة أمثلة

أوليج جرينشوك

باحث رئيسي في VisionLabs

يمكن للمحتالين محاولة انتحال شخصية شخص آخر للوصول إلى حساباته وبياناته ، أو خداع النظام حتى لا يتمكن من التعرف عليها من حيث المبدأ. دعنا نفكر في كلا الخيارين.

صورة شخص آخر أو مقطع فيديو أو قناع مطبوع

تحارب منصة VisionLabs أساليب الخداع هذه عن طريق التحقق من الحياة ، أي أنها تتحقق من أن الكائن الموجود أمام الكاميرا على قيد الحياة. يمكن أن يكون هذا ، على سبيل المثال ، حيويًا تفاعليًا ، عندما يطلب النظام من شخص ما أن يبتسم أو يرمش أو يجعل الكاميرا أو الهاتف الذكي أقرب إلى وجهه.

لا يمكن توقع مجموعة المراجعات ، نظرًا لأن النظام الأساسي ينشئ تسلسلاً عشوائيًا من عشرات الآلاف من المجموعات - من غير الواقعي تسجيل آلاف مقاطع الفيديو بالتركيبات المرغوبة من الابتسامات والعواطف الأخرى. وإذا كانت الكاميرا مزودة بأجهزة استشعار لمدى الأشعة تحت الحمراء القريبة أو مستشعر عمق ، فإنها تنتقل إلى النظام معلومة اضافيةمما يساعد على تحديد إطار واحد في كل مرة إذا كان الشخص الذي أمامها حقيقيًا.

بالإضافة إلى ذلك ، يقوم النظام بتحليل انعكاس الضوء من مواد مختلفة ، وكذلك بيئة الكائن. لذلك يكاد يكون من المستحيل خداع النظام بهذه الطريقة.

في هذه الحالة ، من أجل إعادة إنتاج نسخة كافية للوصول ، يحتاج المحتال إلى الوصول إلى مصدر الرمزواستنادًا إلى ردود فعل النظام على التغيرات في المظهر بالمكياج ، غيريها تدريجيًا لتصبح نسخة طبق الأصل من شخص آخر.

يحتاج المهاجم إلى كسر منطق ومبدأ التحقق بالضبط. ولكن بالنسبة لمستخدم خارجي ، فهذه مجرد كاميرا ، صندوق أسود ، بالنظر إلى أنه من المستحيل فهم أي إصدار من الشيك موجود بالداخل. علاوة على ذلك ، تختلف عوامل التحقق من حالة إلى أخرى ، لذلك لا يمكن استخدام بعض الخوارزمية العامة للقرصنة.

في حالة وجود العديد من أخطاء التعرف ، يرسل النظام إشارة تحذير إلى الخادم ، وبعد ذلك يتم حظر وصول المهاجم. لذلك ، حتى في ظل الحالة غير المحتملة للوصول إلى الكود ، من الصعب اختراق النظام ، نظرًا لأن المهاجم لا يمكنه تغيير مظهره إلى ما لا نهاية حتى يتم التعرف عليه.

نظارة شمسية كبيرة ، قبعة ، وشاح ، غطي وجهك بيدك

لن يكون النظام قادرًا على التعرف على الشخص إذا كان معظم وجهه مخفيًا ، على الرغم من أن الشبكة العصبية تتعرف على الوجوه بشكل أفضل بكثير من الشخص. ولكن من أجل الاختباء تمامًا من نظام التعرف على الوجوه ، يجب على الشخص دائمًا إخفاء وجهه عن الكاميرات ، وهذا أمر صعب التطبيق عمليًا.

الرؤية الحاسوبية تتفوق على الرؤية البشرية

ماذا بالضبط ولماذا ، مع مثال

يوري مينكين

تتشابه أنظمة الرؤية الحاسوبية في المبادئ الأساسية مع الرؤية البشرية. كشخص ، لديهم أجهزة مسؤولة عن جمع المعلومات ، هذه كاميرات فيديو ، نظير للعينين ، ومعالجتها عبارة عن كمبيوتر ، نظير للدماغ. لكن رؤية الكمبيوتر لها ميزة كبيرة على الرؤية البشرية.

الشخص لديه عتبة معينة لما يمكنه رؤيته وما هي المعلومات التي يجب استخلاصها من الصورة. لا يمكن تجاوز هذه العتبة لأسباب فسيولوجية بحتة. وستتحسن خوارزميات الرؤية الحاسوبية. لديهم فرص تعلم لا حصر لها

يوري مينكين

رئيس قسم التقنيات المعرفية

وخير مثال على ذلك هو تقنية الرؤية الحاسوبية في السيارات ذاتية القيادة. إذا كان بإمكان شخص ما تعليم معرفته بحالة المرور عددًا صغيرًا ومحدودًا بشكل كبير من الأشخاص ، فيمكن للسيارات نقل جميع التجارب الحالية للكشف عن أشياء معينة في وقت واحد إلى جميع الأنظمة الجديدة التي سيتم تثبيتها على أسطول من الآلاف أو حتى مليون.

مثال

في نهاية العام الماضي ، أجرى متخصصو Cognitive Technologies تجارب لمقارنة قدرات البشر والذكاء الاصطناعي في اكتشاف كائنات مشهد الطريق. وحتى الآن ، لم يكتف الذكاء الاصطناعي في بعض الحالات فحسب ، بل تجاوز القدرات البشرية أيضًا. على سبيل المثال ، كان أفضل في التعرف على لافتات الطريق عندما حجبتها أوراق الأشجار جزئيًا.

يمكن للكمبيوتر أن يشهد ضد شخص

سيرجي إزرائيليت:الآن في التشريع ، يتم تنظيم استخدام البيانات "التي تم الحصول عليها من أجهزة الكمبيوتر" لاستخدامها كدليل على بعض الظروف الهامة ، بما في ذلك الجرائم ، على وجه التحديد فقط لبعض الحالات. على سبيل المثال ، يتم تنظيم استخدام الكاميرات التي تتعرف على لوحات ترخيص السيارات التي تنتهك حركة المرور عالية السرعة.

بشكل عام ، يمكن استخدام هذه البيانات على قدم المساواة مع أي دليل آخر يمكن أن يأخذه التحقيق أو المحكمة في الاعتبار أو يرفضه. في الوقت نفسه ، يحدد التشريع الإجرائي النظام العامالعمل مع الدليل - فحص ، في إطاره يتم إثبات ما إذا كان السجل المقدم يؤكد حقًا أي حقائق أو تم تشويه المعلومات بطريقة أو بأخرى.