Menü
Bedava
kayıt
ev  /  Eğitim/ Rus şehirlerinin sokaklarında kameralar bizi nasıl izliyor. Ve onları nasıl kandırırım

Rus şehirlerinin sokaklarında kameralar bizi nasıl izliyor. Ve onları nasıl kandırırım

Kıskanılacak bir düzenlilikle, Habré'de belirli yüz tanıma yöntemleri hakkında bilgi veren makaleler ortaya çıkıyor. Sadece bu harika konuyu desteklemekle kalmayıp, yüz tanımaya yönelik tüm yaklaşımları değil, bunların güçlü ve zayıf yönlerini kapsayan birçok yaklaşımı kapsayan dahili belgemizi yayınlamaya karar verdik. Mühendisimiz Andrey Gusak tarafından yapay görme departmanının genç çalışanları için deyim yerindeyse eğitim amaçlı derlenmiştir. Bugün herkese sunuyoruz. Makalenin sonunda - en meraklıları için etkileyici bir referans listesi.

Öyleyse başlayalım.
Sunulan çok çeşitli algoritmalara rağmen, Genel yapı yüz tanıma süreci:

Tanıma sırasında bir yüz görüntüsünü işlemenin genel süreci

İlk aşamada yüz algılanır ve görüntüde lokalize edilir. Tanıma aşamasında, yüz görüntüsü hizalanır (geometrik ve parlaklık), özellikler hesaplanır ve tanımanın kendisi gerçekleştirilir - hesaplanan özellikler, veritabanında saklanan standartlarla karşılaştırılır. Sunulan tüm algoritmalar arasındaki temel fark, özelliklerin hesaplanması ve koleksiyonlarının birbirleriyle karşılaştırılması olacaktır.

1. Elastik grafik eşleştirme yöntemi.

Yöntemin özü, yüz görüntülerini tanımlayan grafiklerin esnek karşılaştırmasına indirgenmiştir. Yüzler, ağırlıklı köşeleri ve kenarları olan grafikler olarak temsil edilir. Tanıma aşamasında, grafiklerden biri - referans olan - değişmeden kalırken, diğeri ilkine en iyi uyacak şekilde deforme olur. Bu tür tanıma sistemlerinde, grafikler hem dikdörtgen bir kafes hem de yüzün karakteristik (antropometrik) noktalarından oluşan bir yapıyı temsil edebilir.

A)

B)

Yüz tanıma için bir grafik yapısı örneği: a) düzenli bir kafes b) yüzün antropometrik noktalarına dayalı bir grafik.

Grafiğin köşelerinde, özellik değerleri hesaplanır, çoğu zaman grafik köşesinin bazı yerel alanlarında hesaplanan Gabor filtrelerinin karmaşık değerlerini veya sıralı kümelerini - Gabor dalgacıklarını (Gabor sistemleri) kullanırlar. Gabor filtreleri ile piksel parlaklık değerlerini yerel olarak sararak.


Gabor filtrelerinin seti (banka, jet)


İki Gabor filtreli bir yüz görüntüsünün evrişimine bir örnek

Grafiğin kenarları, bitişik köşeler arasındaki mesafeye göre ağırlıklandırılır. İki grafik arasındaki fark (mesafe, ayırt edici özellik), hem köşelerde hesaplanan özelliklerin değerleri arasındaki farkı hem de grafiğin kenarlarının deformasyon derecesini dikkate alan belirli bir fiyat deformasyon fonksiyonu kullanılarak hesaplanır. .
Grafiğin deformasyonu, köşelerinin her birinin orijinal konumuna göre belirli yönlerde bir miktar mesafe ile yer değiştirmesi ve özelliklerin değerleri (Gabor filtrelerinin yanıtları) arasındaki farkın tepe noktasında olduğu bir konum seçilmesiyle gerçekleşir. deforme grafik ve referans grafiğin ilgili tepe noktası minimum olacaktır. Bu operasyon deforme olabilen ve referans grafikleri arasındaki en küçük toplam farka ulaşılana kadar grafiğin tüm köşeleri için tek tek gerçekleştirilir. Deforme olabilen grafiğin bu konumundaki fiyat deformasyon fonksiyonunun değeri, girdi yüzü görüntüsü ile referans grafiği arasındaki farkın bir ölçüsü olacaktır. Bu "gevşeme" deformasyon prosedürü, sistem veri tabanında saklanan tüm referans yüzleri için gerçekleştirilmelidir. Sistem tanıma sonucu, fiyat deformasyon fonksiyonunun en iyi değerine sahip bir standarttır.


Normal bir kafes şeklinde bir grafiğin deformasyonu örneği

Bazı yayınlar, çeşitli duygusal ifadelerin varlığında ve yüzün açısının 15 dereceye kadar değiştirilmesi durumunda bile %95-97 tanıma verimine işaret etmektedir. Bununla birlikte, grafiklerdeki elastik karşılaştırma sistemlerinin geliştiricileri, yüksek hesaplama maliyetlerinden bahseder. bu yaklaşım... Örneğin, giriş yüz görüntüsünü 87 referans görüntüyle karşılaştırmak, 23 transputerlı paralel bir bilgisayarda çalışırken yaklaşık 25 saniye sürdü (Not: yayın 1993 tarihlidir). Bu konudaki diğer yayınlarda ya süre belirtilmemiş ya da uzun olduğu söylenmiştir.

Dezavantajları: tanıma prosedürünün yüksek hesaplama karmaşıklığı. Yeni standartları ezberlerken düşük üretilebilirlik. Çalışma süresinin yüz veritabanının boyutuna doğrusal bağımlılığı.

2. Sinir ağları

Şu anda, yaklaşık bir düzine sinir ağı (NN) türü vardır. En yaygın olarak kullanılan seçeneklerden biri, giriş görüntüsünü / sinyalini ağın ön ayarına / eğitimine göre sınıflandırmanıza izin veren çok katmanlı bir algılayıcıya dayalı bir ağdır.
Sinir ağları bir dizi eğitim örneği kullanılarak eğitilir. Eğitimin özü, gradyan iniş yöntemini kullanarak bir optimizasyon problemini çözme sürecinde internöral bağlantıların ağırlıklarını ayarlamaktır. Sinir ağını öğrenme sürecinde anahtar özellikler otomatik olarak çıkarılır, önemleri belirlenir ve aralarındaki ilişkiler kurulur. Eğitimli bir NN'nin, genelleme yetenekleri nedeniyle öğrenme sürecinde edindiği deneyimi bilinmeyen görüntülere uygulayabileceği varsayılmaktadır.
Yüz tanıma alanındaki en iyi sonuçlar (yayınların analizinin sonuçlarına göre), bu tür sinir ağı mimarilerinin fikirlerinin mantıklı bir gelişimi olan Evrişimli Sinir Ağı veya evrişimli sinir ağı (bundan sonra - CNN olarak anılacaktır) tarafından gösterilmiştir. cognitron ve neocognitron olarak. Başarı, çok katmanlı algılayıcının aksine görüntünün iki boyutlu topolojisini hesaba katabilme yeteneğinden kaynaklanmaktadır.
SNS'nin ayırt edici özellikleri, yerel reseptör alanları (nöronların yerel iki boyutlu bağlantısını sağlar), genel ağırlıklar (görüntünün herhangi bir yerinde bazı özelliklerin algılanmasını sağlar) ve uzamsal alt örnekleme ile hiyerarşik organizasyondur. Bu yenilikler sayesinde SNS, ölçek, yer değiştirme, döndürme, perspektif değişikliği ve diğer bozulmalardaki değişikliklere kısmi direnç sağlar.


Bir evrişimsel yapının mimarisinin şematik bir temsili sinir ağı

Aydınlatma, ölçek, uzamsal dönüşler, konum ve çeşitli duygularda küçük değişikliklere sahip yüzlerin görüntülerini içeren ORL veritabanına dayalı SNN'nin test edilmesi, %96 tanıma doğruluğu gösterdi.
SNS, gelişimini satın aldığı DeepFace'in geliştirilmesinde aldı.
Facebook, sosyal ağ kullanıcılarının yüzlerini tanıyacak. Tüm mimari özellikler kapalıdır.


DeepFace nasıl çalışır?

Sinir ağlarının dezavantajları: veritabanına yeni bir referans kişi eklemek, mevcut tüm set üzerinde ağın tamamen yeniden eğitilmesini gerektirir (örnek boyutuna bağlı olarak oldukça uzun bir prosedür, 1 saatten birkaç güne kadar). Eğitimle ilgili matematiksel nitelikteki problemler: yerel optimuma girme, optimal optimizasyon adımını seçme, yeniden eğitim, vb. Bir ağ mimarisi seçme aşamasını resmileştirmek zordur (nöron sayısı, katmanlar, bağlantıların doğası). Yukarıdakilerin tümünü özetleyerek, NS'nin yorumlanması zor çalışma sonuçlarına sahip bir "kara kutu" olduğu sonucuna varabiliriz.

3. Gizli Markov Modelleri (CMM, HMM)

Yüz tanımanın istatistiksel yöntemlerinden biri de ayrık zamanlı gizli Markov modelleridir (HMM). HMM, sinyallerin istatistiksel özelliklerini kullanır ve uzamsal özelliklerini doğrudan hesaba katar. Modelin öğeleri şunlardır: bir dizi gizli durum, bir dizi gözlenen durum, bir geçiş olasılıkları matrisi, bir başlangıç ​​durumu olasılığı. Her birinin kendi Markov modeli vardır. Bir nesneyi tanırken, belirli bir nesne tabanı için üretilen Markov modelleri kontrol edilir ve gözlem dizisinin gözlemlenebilir maksimum olasılığı aranır. bu nesnenin karşılık gelen model tarafından oluşturulur.
Bugüne kadar yüz tanıma için SMM'nin ticari bir uygulamasına dair bir örnek bulmak mümkün olmamıştır.

Dezavantajları:
- her bir veritabanı için modelin parametrelerinin seçilmesi gereklidir;
- HMM'nin ayırt etme yeteneği yoktur, yani öğrenme algoritması yalnızca her görüntünün kendi modeline verdiği yanıtı maksimize eder, diğer modellere olan yanıtı ise minimize etmez.

4. Temel bileşen analizi (PCA)

En iyi bilinen ve en gelişmiş yöntemlerden biri, Karunen-Loev dönüşümüne dayanan temel bileşen analizi (PCA) yöntemidir.
Başlangıçta, önemli bilgi kaybı olmadan özellik alanını azaltmak için istatistikte temel bileşen analizi uygulanmaya başlandı. Yüz tanıma probleminde, esas olarak küçük boyutlu bir vektöre (temel bileşenler) sahip bir yüz görüntüsünü temsil etmek için kullanılır, bu daha sonra veritabanında depolanan referans vektörlerle karşılaştırılır.
Temel bileşen yönteminin ana amacı, birçok yüze ait "tipik" görüntüleri mümkün olan en iyi şekilde tanımlayacak şekilde özellik uzayının boyutunu önemli ölçüde azaltmaktır. Bu yöntemi kullanarak, yüzlerin eğitim setindeki çeşitli değişkenliği tanımlamak ve bu değişkenliği, özyüzler olarak adlandırılan birkaç ortogonal vektör temelinde açıklamak mümkündür.

Yüz görüntülerinin eğitim örneğinde bir kez elde edilen özvektörler seti, bu özvektörlerin ağırlıklı bir kombinasyonu ile temsil edilen diğer tüm yüz görüntülerini kodlamak için kullanılır. Sınırlı sayıda özvektör kullanarak, girdi yüz görüntüsünün sıkıştırılmış bir yaklaşımını elde etmek mümkündür, bu daha sonra veri tabanında bir katsayı vektörü olarak saklanabilir ve bu aynı zamanda yüz veri tabanında bir arama anahtarı görevi görür.

Temel bileşen yönteminin özü aşağıdaki gibidir. İlk olarak, tüm yüz eğitim seti tek bir ortak veri matrisine dönüştürülür; burada her satır, bir satıra ayrıştırılmış yüz görüntüsünün bir örneğidir. Eğitim setinin tüm yüzleri aynı boyuta ve normalleştirilmiş histogramlara küçültülmelidir.


Yüzlerin eğitim setini tek bir ortak matris X'e dönüştürme

Daha sonra veriler normalleştirilir ve satırlar 0. ortalama ve 1. varyansa indirgenir ve kovaryans matrisi hesaplanır. Elde edilen kovaryans matrisi için özdeğerlerin ve karşılık gelen özvektörlerin (özdeğerlerin) belirlenmesi sorunu çözülmüştür. Daha sonra, özvektörler özdeğerlerin azalan düzeninde sıralanır ve kurala göre yalnızca ilk k vektörleri bırakılır:




PCA algoritması


Eğitilmiş yüzler kümesinde elde edilen ilk on özvektörün (özdeğerlerin) bir örneği

= 0.956*-1.842*+0.046

Kendi yüzlerinin ve ana bileşenlerinin bir kombinasyonunu kullanarak bir insan yüzü oluşturma (sentezleme) örneği


İlk en iyi özvektörlerden bir temel seçme ilkesi


Üç kendi yüzünden ve daha fazla tanımadan elde edilen, bir yüzü üç boyutlu metrik uzaya eşleme örneği

Temel bileşen analizi, pratik uygulamalarda kendini kanıtlamıştır. Ancak yüz görüntüsünde aydınlatma veya yüz ifadesinde önemli değişikliklerin olduğu durumlarda yöntemin etkinliği önemli ölçüde düşmektedir. Buradaki nokta, PCA'nın, giriş veri kümesine mümkün olduğunca yaklaşmak ve insan sınıfları arasında ayrım yapmamak gibi bir amacı olan bir alt uzay seçmesidir.

Bu probleme lineer Fisher diskriminant kullanılarak bir çözüm önerilmiştir (“Eigen-Fisher”, “Fisherface”, LDA isimleri literatürde bulunmaktadır). LDA, oranı maksimize eden doğrusal bir alt uzay seçer:

Nereye

Sınıflar arası dağılım matrisi ve

Sınıf içi dağılım matrisi; m, veritabanındaki sınıf sayısıdır.

LDA, sınıfları mümkün olduğunca doğrusal olarak ayrılabilir kılan bir veri projeksiyonu arar (aşağıdaki şekle bakın). Karşılaştırma için, PCA, tüm yüz veritabanına (sınıflar hariç) yayılmayı en üst düzeye çıkaran bir veri projeksiyonu arar. Güçlü tank ve yüz görüntülerinin alttan gölgelenmesiyle yapılan deneyler, Fisherface'in Eigenface için %53'e kıyasla %95 etkili olduğunu gösterdi.


PCA ve LDA projeksiyonlarının oluşumu arasındaki temel fark

PCA ve LDA arasındaki fark

5. Aktif Görünüm Modelleri (AAM) ve Aktif Şekil Modelleri (ASM) ()
Aktif Görünüm Modelleri (AAM)
Aktif Görünüm Modelleri (AAM), çeşitli deformasyonlarla gerçek görüntüye uyacak şekilde ayarlanabilen istatistiksel görüntü modelleridir. Bu tür 2B model, 1998'de Tim Coots ve Chris Taylor tarafından önerildi. Başlangıçta, yüz görüntülerinin parametrelerini tahmin etmek için aktif görünüm modelleri kullanıldı.
Aktif görünüm modeli iki tür parametre içerir: şekille ilgili parametreler (şekil parametreleri) ve bir görüntünün veya dokunun istatistiksel piksel modeliyle ilgili parametreler (görünüm parametreleri). Kullanımdan önce model, önceden etiketlenmiş bir dizi görüntü üzerinde eğitilmelidir. Görüntüler manuel olarak işaretlenir. Her işaretin kendi numarası vardır ve modelin yeni bir görüntüye adaptasyon sırasında bulması gereken karakteristik bir noktayı tanımlar.


Bir AAM şekli oluşturan 68 noktadan işaretlenen bir yüz görüntüsü örneği.

AAM eğitim rutini, ölçek, eğim ve ofset farklarını telafi etmek için eşlenen görüntülerdeki şekilleri normalleştirerek başlar. Bunun için sözde genelleştirilmiş Procrustean analizi kullanılır.


Normalleştirmeden önce ve sonra yüz şeklinin noktalarının koordinatları

Ana bileşenler daha sonra PCA yöntemi kullanılarak normalleştirilmiş noktalar kümesinden çıkarılır.


AAM şekil modeli, bir üçgenleme kafesi s0 ve s0'a göre yer değiştirmelerin doğrusal bir kombinasyonundan oluşur.

Daha sonra, şeklin noktalarının oluşturduğu üçgenlerin içindeki piksellerden bir matris oluşturulur, böylece sütunlarının her biri karşılık gelen dokunun piksel değerlerini içerir. Eğitim için kullanılan dokuların tek kanallı (gri tonlamalı) veya çok kanallı (örneğin, RGB renk alanı veya diğer) olabileceğini belirtmekte fayda var. Çok kanallı dokular durumunda, piksel vektörleri kanalların her biri için ayrı ayrı oluşturulur ve ardından birleştirilir. Doku matrisinin temel bileşenlerini bulduktan sonra, AAM modeli eğitilmiş olarak kabul edilir.

AAM görünüm modeli, bir temel kafes s0 içindeki pikseller tarafından tanımlanan bir temel görünüm A0 ve A0'a göre Ai ofsetlerinin doğrusal bir kombinasyonundan oluşur.

AAM'nin ete kemiğe büründürülmesine bir örnek. Şekil parametresi vektörü
p = (p_1, p_2, 〖…, p〗 _m) ^ T = (- 54,10, -9.1,…) ^ T, s biçiminde bir modeli sentezlemek için kullanılır ve parametre vektörü λ = (λ_1, λ_2, 〖…, λ〗 _m) ^ T = (3559,351, -256,…) ^ T modelin görünümünü sentezlemek için. Nihai yüz modeli 〖M (W (x; p))〗 ^, şekil ve görünüm olmak üzere iki modelin bir kombinasyonu olarak elde edilir.

Modelin belirli bir yüz görüntüsüne uydurulması, özü fonksiyonelliği en aza indirmek olan bir optimizasyon problemini çözme sürecinde gerçekleştirilir.

Gradyan iniş yöntemi. Bu durumda bulunan modelin parametreleri, modelin belirli bir görüntü üzerindeki konumunu yansıtacaktır.




Degrade iniş prosedürünün 20 yinelemesinde belirli bir görüntüye bir model sığdırma örneği.

AAM, hem katı hem de katı olmayan deformasyona maruz kalan nesnelerin görüntülerini simüle etmek için kullanılabilir. AAM, bazıları yüzün şeklini temsil eden, geri kalanı dokusunu belirleyen bir dizi parametreden oluşur. Deformasyonlar genellikle öteleme, döndürme ve ölçekleme bileşimi biçimindeki geometrik bir dönüşüm olarak anlaşılır. Bir görüntüdeki bir yüzün yerini belirleme problemini çözerken, gözlemlenene en yakın sentezlenmiş görüntüyü temsil eden AAM parametreleri (konum, şekil, doku) aranır. AAM'nin ayarlanan görüntüye yakınlığına göre yüz olup olmadığına karar verilir.

Aktif Şekil Modelleri (ASM)

ASM yönteminin özü, antropometrik noktaların konumu arasındaki istatistiksel ilişkileri hesaba katmaktır. Önden görünümde çekilen yüzlerin mevcut görüntü örneğinde. Görüntü üzerinde uzman, antropometrik noktaların yerini işaretler. Her görüntüde noktalar aynı sırada numaralandırılmıştır.




68 nokta kullanarak bir yüz şeklini temsil etme örneği

Tüm görüntülerdeki koordinatları getirmek için birleşik sistem genellikle sözde. genelleştirilmiş Kaydırma analizi, bunun sonucunda tüm noktalar aynı ölçeğe getirilir ve ortalanır. Ayrıca, tüm görüntü seti için ortalama şekil ve kovaryans matrisi hesaplanır. Özvektörler, daha sonra karşılık gelen özdeğerlerine göre azalan düzende sıralanan kovaryans matrisine dayalı olarak hesaplanır. ASM, bir matris Φ ve bir ortalama form vektörü s ̅ ile tanımlanır.
Daha sonra herhangi bir form, bir model ve parametreler kullanılarak tanımlanabilir:

ASM modelinin eğitim örneğine dahil olmayan yeni bir görüntü üzerinde yerelleştirilmesi optimizasyon probleminin çözümü sürecinde gerçekleştirilir.


bir B C D)
ASM modelini belirli bir görüntü üzerinde yerelleştirme sürecinin gösterimi: a) ilk konum b) 5 yinelemeden sonra c) 10 yinelemeden sonra d) model yakınsadı

Bununla birlikte, AAM ve ASM'nin asıl amacı yüz tanıma değil, daha fazla işlem için görüntüdeki yüzün ve antropometrik noktaların tam olarak lokalizasyonudur.

Hemen hemen tüm algoritmalarda, sınıflandırmadan önce gelen zorunlu aşama, yüz görüntüsünü kameraya göre ön konuma hizalamak veya bir dizi yüz getirmek (örneğin, bir sınıflandırıcıyı eğitmek için bir eğitim örneğinde) anlamına gelen hizalamadır. tek bir koordinat sistemi. Bu aşamayı uygulamak için, tüm yüzlerin karakteristik antropometrik noktalarının görüntüsü üzerinde yerelleştirme gereklidir - çoğu zaman bunlar öğrencilerin merkezleri veya gözlerin köşeleridir. Farklı araştırmacılar, bu tür noktaların farklı gruplarını ayırt eder. Gerçek zamanlı sistemler için hesaplama maliyetlerini azaltmak için geliştiriciler, bu tür 10'dan fazla nokta tahsis etmez.

AAM ve ASM modelleri, yüz görüntüsündeki bu antropometrik noktaları tam olarak konumlandırmak için tasarlanmıştır.

6. Yüz tanıma sistemlerinin geliştirilmesiyle ilgili temel sorunlar

aydınlatma sorunu

Baş pozisyonu sorunu (sonuçta yüz bir 3B nesnedir).

Önerilen yüz tanıma algoritmalarının etkinliğini değerlendirmek için DARPA ajansı ve ABD Ordusu Araştırma Laboratuvarı FERET (yüz tanıma teknolojisi) programını geliştirdi.

FERET programının büyük ölçekli testleri, grafikler üzerinde esnek karşılaştırmaya ve temel bileşen analizinin (PCA) çeşitli modifikasyonlarına dayanan algoritmaları içeriyordu. Tüm algoritmaların verimliliği yaklaşık olarak aynıydı. Bu bağlamda, ikisi arasında net bir ayrım yapmak (özellikle test tarihleri ​​üzerinde anlaşmaya varılmışsa) zor hatta imkansızdır. Aynı gün çekilen önden görüntüler için kabul edilebilir tanıma doğruluğu genellikle %95'tir. Farklı cihazlarla ve farklı aydınlatma koşullarında çekilen görüntüler için doğruluk genellikle %80'e düşer. Bir yıl farkla çekilen görüntüler için tanıma doğruluğu yaklaşık %50 idi. Bu tür bir sistemin yüzde 50'sinin bile kabul edilebilir doğruluktan daha fazla olduğu belirtilmelidir.

FERET, her yıl karşılaştırmalı bir test raporu yayınlıyor modern sistemler bir milyondan fazla yüze dayalı yüz tanıma. Ne yazık ki, son raporlar bina tanıma sistemlerinin ilkelerini açıklamamakta, sadece ticari sistemlerin işleyişinin sonuçları yayınlanmaktadır. Bugün önde gelen sistem NEC tarafından geliştirilen NeoFace sistemidir.

Referanslar (ilk bağlantıda googled)
1. Görüntü Tabanlı Yüz Tanıma - Sorunlar ve Yöntemler
2. Yüz Algılama Anketi.pdf
3. Yüz Tanıma Bir Literatür Araştırması
4. Yüz tanıma teknikleriyle ilgili bir anket
5. Yüz algılama, çıkarma ve tanıma araştırması
6. Yüz görüntülerine dayalı insanları tanımlama yöntemlerine genel bakış
7. Bir kişiyi yüz görüntüsünden tanıma yöntemleri
8. Yüz tanıma algoritmalarının karşılaştırmalı analizi
9. Yüz Tanıma Teknikleri
10. Antropometrik noktaların lokalizasyonuna yaklaşık bir yaklaşım.
11. Grup fotoğraflarında segmentasyon algoritmaları kullanarak yüz tanıma
12. Yüz tanıma ile ilgili araştırma raporu 2. aşama
13. Elastik Grup Grafiği Eşleştirme ile Yüz Tanıma
14. Geometrik dönüşümlere dayalı bir fotoğraftan bir kişiyi tanımlamak için algoritmalar. Tez.
15. Dinamik Bağlantı Mimarisinde Bozulma Değişmeyen Nesne Tanıma
16. Aktif Şekil Modelleri, Yerel Yamalar ve Destek Vektör Makinelerini Kullanarak Yüz Tanıma
17. Aktif Görünüm Modellerini Kullanarak Yüz Tanıma
18. Yüz Tanıma için Aktif Görünüm Modelleri
19. Aktif Şekil Modeli ve Destek Vektör Makinesi Kullanarak Yüz Hizalama
20. Aktif Şekil Modelleri - Eğitimi ve Uygulaması
21. Vahşi Balıkçı Vektör Yüzleri
22. Özyüzler vs. Sınıfa Özgü Doğrusal Projeksiyon Kullanarak Fisherfaces Tanıma
23. Özyüzler ve balıkçı yüzleri
24. Boyut Azaltma
25. ICCV 2011 Parça Tabanlı Deforme Edilebilir Tescil Üzerine Eğitimi
26. Yüz Hizalama için Kısıtlı Yerel Model, Bir Eğitim
27. Siz kimsiniz - Videodan kişiye özel sınıflandırıcıları öğrenme
28. Sinir ağı yöntemlerini kullanarak bir kişinin yüz görüntüsü ile tanınması
29. Yüz Tanıma Bir Evrişimsel Sinir Ağı Yaklaşımı
30. Evrişimli Sinir Ağı ve Basit Lojistik Sınıflandırıcı kullanarak Yüz Tanıma
31. Evrişimsel Sinir Ağları ile Yüz Görüntü Analizi
32. Gizli Markov süreçlerine dayalı yüz tanıma yöntemleri. Yazar-ferat
33. Yüz tanıma için gizli Markov modellerinin uygulanması
34. Gizli Markovs Modellerini Kullanarak Yüz Algılama ve Tanıma
35. GNU Octave-MATLAB ile Yüz Tanıma
36. Python ile Yüz Tanıma
37. Antropometrik 3D Yüz Tanıma
38.3D Yüz Tanıma
39. 3B Dönüştürülebilir Bir Modelin Yerleştirilmesine Dayalı Yüz Tanıma
40. Yüz Tanıma
41. Seyrek Temsil Yoluyla Güçlü Yüz Tanıma
42. Yüz Tanıma Algoritmaları İçin FERET Değerlendirme Metodolojisi
43. Elektronik tarihi fotoğraf koleksiyonlarında yüzleri arayın
44. Gerçek Zamanlı Yüz Tanımaya Adanmış Donanım Görüntü Sistemlerinin Tasarımı, Uygulanması ve Değerlendirilmesi
45. İyi, Kötü ve Çirkin Yüz Tanıma Zorluk Problemine Giriş
46. ​​​​Dijital görüntülerde insan yüzünü algılama yöntemlerinin araştırılması ve geliştirilmesi. Diploma
47. DeepFace Yüz Doğrulamada İnsan Düzeyinde Performans Arasındaki Farkı Kapatıyor
48. TV videosundaki karakterlerin otomatik olarak adlandırılmasının etkisinden kurtulmak
49. Pratik Bir Yüz Tanıma Sistemine Doğru Seyrek Temsil ile Güçlü Hizalama ve Aydınlatma
50. Uygulamalı görüntü analizi ve işleme problemlerini çözmek için bir kişinin yüzünü algılama algoritmaları
51. Görüntüde yüz algılama ve yerelleştirme
52. Modifiye Viola-Jones motoru
53. Makine öğrenimi yöntemlerine dayalı nesnelerin tespiti ve sınıflandırılması için algoritmaların geliştirilmesi ve analizi
54. Yüz Tanıma Büyük Mücadelesine Genel Bakış
55. Yüz Tanıma Satıcı Testi (FRVT)
56. Yüzleri tanımlama probleminde SURF algoritmasını kullanmanın etkinliği üzerine

Şehir video gözetim ağının üç binden fazla video kamerası yüz tanıma sistemine bağlandı. Video görüntüsü otomatik olarak gerçek zamanlı olarak analiz edilir: sistem videodaki kişiyi, cinsiyetini ve yaşını tanımlayabilir.

Moskova video gözetim sistemine yüzleri tanıması öğretildi. Yapay sinir ağlarının kullanımına dayalı bir algoritma sayesinde şehir kameralarından alınan video kayıtları gerçek zamanlı olarak analiz ediliyor. Kayıtlardaki yüzler, gerektiğinde çeşitli veritabanlarındaki bilgilerle - örneğin, suçluyu bulmaya gelince kolluk kuvvetlerinin fotoğraf veritabanlarında - karşılaştırılabilmesi için taranır. Ek olarak, böyle bir analitik sistem, bir suçluyu yakalarken kolluk kuvvetlerinin şehirdeki hareketi için bir rota oluşturmasına yardımcı olabilir. Sistemin kendisi, videodaki şüpheliyi tanımlayarak farklı güvenlik kameralarından gerekli video kayıtlarını seçecektir. Metropol ağı 160 bin video kameradan oluşuyor ve konut binalarının girişlerinin yüzde 95'ini kapsıyor. Yıl sonuna kadar vatandaşlar evlerine bağımsız olarak kameralar kurabilecek ve bunları tek bir video gözetim sistemine bağlayabilecekler.

“Video analitiğinin tanıtımı, hem özel hem de kentsel video gözetim sistemlerinin verimliliğini artırmak için güçlü bir itici güç. Şehir sakinlerinin ek bir koruma düzeyi var, - dedi Daire başkanı Bilişim Teknolojileri Moskova Artem Ermolaev. - Tabii ki, tüm bu fırsatlar çok sorumlu bir şekilde uygulanmalıdır. Önceliğimiz gizlilik ve güvenlik arasındaki dengedir ve vatandaşların haklarına saygı gösterilmesini sağlamak için katı bir iç kontrol politikasına bağlıyız."

Şimdi yaklaşık 16 bin kullanıcı şehir gözetim sistemine bağlı - bunlar kolluk kuvvetleri, devlet ve belediye kuruluşlarının çalışanları. Her birinin, bilgilerin gizliliğini korumanıza izin veren kendi erişim düzeyi vardır. Mevcut mevzuat çerçevesinde kolluk kuvvetleri talep üzerine gerekli verileri temin edebilmekte ve kamu kurumları çalışanları video kameralara sadece sorumlu oldukları bölge ve güzergahlardan erişebilmektedir. Takip sistemine yapılan her çağrı kayıt altına alınmaktadır.

Yüz tanıma işlevi çevrimiçi çalışır, tanımlama işlemi birkaç saniye sürer. Algoritma, yüzü veritabanına yüklenen bir kişiyi tespit ederse, kolluk kuvvetlerine bir uyarı gönderir.

Bakanlık ayrıca, yüz tanıma işlevinin getirilmesinin, suçların soruşturulmasının ve suçluların aranmasının etkinliğini artırdığını da kaydetti. Pilot testler sırasında, analitik algoritmaları kullandıkları için aranan yasaları çiğneyenlerin yüzde 50'den fazlası bulundu ve onun yardımıyla gözaltına alındı. Ondan önce, bazıları uzun yıllar bulunamadı.

Moskovalılar güvenlik kameralarını genel şehir ağına bağlayabilecekler. Bu seçenek yıl sonuna kadar uygulanacaktır. Bu tür kameralardan gelen videolar, birleşik veri depolama ve işleme merkezine (ECDC) iletilecek ve bunlardan alınan kayıtlar mahkemede yasal olarak önemli delil olarak kullanılabilecek.

Bu yıl 3,5 binden fazla kamera ek olarak tek bir veri depolama ve işleme merkezine bağlandı. Bölgede ve okul ve kreş binalarında, MCC istasyonlarında, stadyumlarda, toplu taşıma duraklarında ve otobüs duraklarında ve ayrıca parklarda bulunan erişim kameraları, kameralar tek bir sisteme bağlanır. Ayrıca, Haziran 2018'e kadar başkentteki 25 yeraltı yaya geçidinde güvenlik kameraları görünecek. Kayıt cihazları, metro istasyonlarına bağlı olmayan ve GBU "Gormost" un yetkisi altındaki yeraltı geçitlerine kurulacaktır.

Belki de bugün çevresinde bu kadar çok efsanenin, yalanın ve beceriksizliğin olacağı başka bir teknoloji yoktur. Teknolojiden bahseden gazeteciler yalan söyler, başarılı uygulamadan bahseden politikacılar yalan söyler, çoğu teknoloji satıcısı yalan söyler. Her ay, yüz tanımayı onunla çalışamayan sistemlere uygulamaya çalışan insanların sonuçlarını görüyorum.

Bu makalenin konusu uzun zamandır acı vericiydi, ancak bir şekilde yazmak için çok tembeldim. Farklı insanlara yirmi kez tekrarladığım bir sürü metin. Ama başka bir çöp paketi daha okuduktan sonra zamanın geldiğine karar verdim. Bu yazının linkini vereceğim.

Yani. Bu yazıda birkaç basit soruya cevap vereceğim:

Algoritmaların yaratıcılarının bu temelleri nereden aldığını düşünüyorsunuz?

Küçük bir ipucu. Şu anda oldukları ilk NTech ürünü, kişileri temasa göre arayan Find Face'dir. Bence açıklamaya gerek yok. Elbette VKontakte, tüm açık profilleri dışarı pompalayan botlara karşı savaşır. Ama duyduğum kadarıyla, insanlar hala pompalıyor. Ve sınıf arkadaşları. Ve instagram.

Facebook'ta gibi görünüyor - orada her şey daha karmaşık. Ama eminim onlar da bir şeyler bulmuşlardır.
Yani evet, profiliniz açıksa gurur duyabilirsiniz, algoritmaları eğitmek için kullanıldı ;)

Çözümler ve şirketler hakkında

Burada gurur duyabilirsiniz. Dünyanın önde gelen 5 şirketinden ikisi artık Rus. Bunlar N-Tech ve VisionLabs'tır. Yarım yıl önce liderler NTech ve Vocord idi, ilki açık yüzlerde, ikincisi ön cephede çok daha iyi çalıştı.

Şimdi liderlerin geri kalanı 1-2 Çinli şirket ve 1 Amerikalı, Vocord reytinglerde bir şeyi geçti.

Ayrıca itmo, 3divi, intellivision derecelendirmesinde Rusça. Synesis bir Belarus şirketidir, bazıları bir zamanlar Moskova'da olmasına rağmen, yaklaşık 3 yıl önce Habré'de bir blogları vardı. Ayrıca yabancı şirketlere ait birkaç çözümü de biliyorum, ancak geliştirme ofisleri de Rusya'da. Ayrıca rekabette olmayan, ancak iyi çözümlere sahip gibi görünen birkaç Rus şirketi de var. Örneğin, Binyıl Kalkınma Hedefleri buna sahiptir. Açıkçası, Odnoklassniki ve Vkontakte'nin de kendi iyileri var, ancak bunlar dahili kullanım içindir.

Kısacası, evet, çoğunlukla biz ve Çinliler yüzümüzden kaymış durumdayız.

NTech, dünyada bunu gösteren ilk kişiydi. iyi parametreler yeni seviye. 2015'in sonunda bir zaman. VisionLabs sadece NTech'i yakaladı. 2015 yılında pazar lideriydiler. Ancak kararları geçmiş nesildi ve NTech'i ancak 2016'nın sonunda yakalamaya çalışmaya başladılar.

Dürüst olmak gerekirse, bu iki şirketi de sevmiyorum. Çok agresif pazarlama. Sorunlarını çözmeyen, açıkça uygunsuz bir çözüm verilen insanlar gördüm.

Bu açıdan Vocord'u daha çok sevdim. Bir keresinde Vocord'un çok dürüst bir şekilde “projeniz bu tür kameralar ve kurulum noktaları ile çalışmaz” dediği adamlara danıştım. NTech ve VisionLabs mutlu bir şekilde satmaya çalıştı. Ancak Vocord'un son zamanlarda ortadan kaybolduğu bir şey var.

sonuçlar

Sonuç kısmında şunu söylemek isterim. Yüz tanıma çok iyi ve güçlü bir araçtır. Gerçekten bugün suçluları bulmanızı sağlar. Ancak uygulanması, tüm parametrelerin çok doğru bir analizini gerektirir. Yeterince OpenSource çözümü var. Yalnızca VisionLabs | Ntech'i kurmanın ve ayrıca bir bakım, analiz ve karar verme ekibi tutmanın gerekli olduğu uygulamalar (kalabalıktaki stadyumlarda tanıma) vardır. Ve OpenSource burada size yardımcı olmaz.

Bugün, tüm suçluları yakalayabileceğiniz veya şehirdeki herkesi gözlemleyebileceğiniz tüm hikayelere inanamazsınız. Ancak bu tür şeylerin suçluları yakalamaya yardımcı olabileceğini hatırlamak önemlidir. Örneğin, metroda durmak herkes arka arkaya değil, sadece sistemin benzer olduğunu düşündüğü kişileri durdurmak. Kameraları yüzleri daha iyi tanıyacak şekilde yerleştirin ve buna uygun bir altyapı oluşturun. Örneğin, buna karşıyım. Çünkü bir hatanın bedeli, başka biri olarak tanınırsanız çok büyük olabilir.

Etiket ekle

Karmaşık şifreler, iki faktörlü kimlik doğrulama Parmak izi tarayıcıları, kullanıcı verilerini korumanın tüm yollarıdır. Son birkaç yılda, akıllı telefon üreticileri yeni bir trend olan sistemleri aktif olarak tanıtmaya başladılar. otomatik tanıma insan yüzleri. Nereden geldiklerini, nasıl çalıştıklarını ve neden gerekli olduklarını anlayalım.

biraz tarih

İnsan yüzlerinin bilgisayar tarafından tanınmasıyla ilgili ilk kapalı deneyler 1960'larda başladı. O zaman bilim adamlarının temel sorunları - bilgisayarların bir kişinin yüzündeki farklı ifadeleri ve yaşa bağlı değişiklikleri yakalayamamasının yanı sıra sürecin düşük otomasyonu. 20. yüzyılın sonunda araştırmalar yeni bir düzeye taşındı - daha sonra bilgisayarlar fotoğrafları analiz ederken insanları sakal, bıyık, kozmetik ve diğer "müdahalelere" tepki vermemek için çeşitli açılardan "tanımayı" öğretmeye başladı. Bu süreç bugüne kadar devam ediyor - dünyada vakaların %100'ünde çalışan ve yüksek tanıma doğruluğu sağlayan bir sistem yok. Ancak 21. yüzyılın başında teknoloji bir adım öne çıkmış ve üç boyutlu taramaya dayalı yeni bir yüz tanıma yöntemi ortaya çıkmıştır. Bugün buna odaklanacağız.

Akıllı telefonlarda yüz tanıma sistemleri nasıl çalışır?

Yüz tanıma açık modern araçlar, diğer herhangi bir biyometrik kullanıcı tanımlama süreci gibi, şartlı olarak 4 aşamaya ayrılabilir:

  1. İlk yüz taraması. Sistem, özel bir sensör veya kamera kullanarak üç boyutlu yüz taraması yapar ve alınan bilgileri işler.
  2. Benzersiz verileri ayıklamak ve buna dayalı bir şablon oluşturmak. Bu aşamada sistem, belirli bir yüzün bir dizi özelliğini belirler: göz çukurunun dış hatları, burnun genişliği ve elmacık kemiklerinin şekli.
  3. Bitmiş şablonu yeni giriş verileriyle, örneğin başka bir kişinin yüzüyle eşleştirme.
  4. Maçları arayın. Sistem, yeni örneğin özellik setinin hazır şablonla eşleşip eşleşmediğine karar verir ve belirli bir eylemi gerçekleştirir. Bizim durumumuzda, ekranın kilidini açacak veya kilitli bırakacaktır.

Dezavantajları

Açık modern akıllı telefonlar tarama bir saniyeden az sürer. Bununla birlikte, 3D sensör, parmak izi tarayıcı gibi diğer kullanıcı tanımlama yöntemlerinin yerini henüz tam olarak alamaz. Birkaç sebep var:

  • sistem düşük ışık koşullarında kararsızdır;
  • insan yüzünün farklı ifadeleriyle, saç stilleriyle, sakallarla ve diğer engellerle pek başa çıkamaz;
  • sistem, şablonu her zaman yeni giriş verileriyle doğru bir şekilde karşılaştırmaz, bu nedenle cihazın kilidi, sahibinin fotoğrafı kullanılarak açılabilir.

Yüz tanıma sistemleri nerelerde kullanılır?

Daha önce yüz tanıma ve tanımlama sistemleri yalnızca kolluk kuvvetleri tarafından, havaalanlarında ve gümrüklerde kullanılıyordu. Son yıllarda, yüz tarayıcıların kullanıcı kimlik doğrulaması için ek bir araç olduğu kişisel bilgisayarlara, akıllı telefonlara ve giyilebilir cihazlara odaklanıldı. Böylece Mart ayında tanıtılan Galaxy S8, cihazın kilidini açabilen bir 3D sensörle donatıldı. Kullanıcıların ödeme yapmak veya gizli klasörlerle çalışmak için daha güvenilir bir biyometrik doğrulama yöntemi - parmak izi kullanmaları dikkat çekicidir.

Yüz tanıma teknolojisinin bir başka uygulama alanı da fotoğraflardaki kişileri tanımlamaktır. Bu özellik, Google Fotoğraflar albümlerinde ve iPhone ve Mac'teki Fotoğraflar uygulamasında çalışır. İkincisinde sistem, kullanıcının kitaplığa yüklediği resimlerdeki kişileri tanır ve ardından isimleri ve iletişim bilgilerini eklemenize izin vererek resimleri bulmayı kolaylaştırır.

Apple Siri'yi tamamladığında cihaza dokunmadan ihtiyacımız olan fotoğrafları açıp sosyal ağlarda paylaşabilecek, bir albümde gördüğümüz eski arkadaşlarımızı üniversite fotoğraflarıyla arayacak veya bir asistandan görünüşümüzün nasıl değiştiğini bize göstermesini isteyebileceğiz. son 5 yılda. Ve bu sadece ilk akla gelen şey.

Rusya'da yüz tanıma

Nerede ve neden uygulamak istiyorlar?

Halka açık olaylar

NtechLab bir kamera sistemi geliştirmiştir. Davetsiz misafirleri tanır ve fotoğraflarını polise gönderir. Polis ayrıca şüpheli kişileri fotoğraflamak, yüzlerini tanımak ve veri tabanlarından kim olduklarını öğrenmek için el kameralarına sahip olacak.

Moskova metrosunda yüz tanımalı kameralar test ediliyor. Saniyede 20 kişinin yüzünü tararlar ve aranan kişilerin veri tabanlarına karşı kontrol ederler. Bir eşleşme varsa, kameralar verileri polise gönderir. 2.5 aydır sistem arananlar listesinde. Bu tür kameraların olduğu biliniyor, ancak başka istasyonlara da kurulmuş olabilirler.

Otkritie Bank, 2017 yılının başında bir yüz tanıma sistemi başlattı. Ziyaretçinin yüzünü veritabanındaki bir fotoğrafla karşılaştırır. Müşterilere daha hızlı hizmet verebilmek için ihtiyaç duyulan sistemin tam olarak nasıl olduğu belirtilmemiştir. Gelecekte, Otkritie sistemi uzaktan tanımlama için kullanmak istiyor. 2018 yılında benzer sistem, ancak "Rostelecom" un gelişimi görünmelidir.

Önemli olan algoritmadır.

Hangi teknoloji makinelerin yüzleri tanımasını sağlar?

Sergey Milyaev

Bilgisayarla görme, görüntülerden ve videolardan yüksek düzeyde bilgi elde etmenizi sağlayan ve böylece insan görsel algısının bazı yönlerini otomatikleştiren algoritmalardır. Bir makine için bilgisayar görüşü, bir kişinin normal görüşü gibi, gözlemlenen sahne hakkında anlamsal bilgi ölçmenin ve elde etmenin bir yoludur. Yardımı ile makine, bir nesnenin ne kadar büyük olduğu, şeklinin ne olduğu ve ne olduğu hakkında bilgi alır.

algoritma kamerası Bilgisayar görüşü OpenCV, oyun alanındaki çocukları izler

Her şey sinir ağları temelinde çalışır

Bir örnekle tam olarak yüz tanıma nasıl çalışır?

Sergey Milyaev: Makineler bunu en verimli şekilde makine öğrenimi temelinde, yani gerekli tüm karar verme kurallarını açıkça tanımlamadan bazı parametrik modellere dayalı bir karar verdiklerinde yaparlar. program kodu... Örneğin, yüz tanıma için, bir sinir ağı bir görüntüden özellikler çıkarır ve her kişinin yüzünün benzersiz bir temsilini alır; bu, başının uzaydaki yöneliminden, sakalın veya makyajın varlığından veya yokluğundan, aydınlatmadan etkilenmez. yaşa bağlı değişiklikler vb.

Bilgisayarla görme, insan görsel sistemini yeniden üretmez, sadece çeşitli sorunları çözmek için bazı yönleri simüle eder.

Sergey Milyaev

VisionLabs'ta baş araştırmacı

En yaygın bilgisayarlı görme algoritmaları artık, işlemci performansındaki ve veri hacmindeki artışla birlikte çok çeşitli sorunları çözmek için yüksek bir potansiyel sergileyen sinir ağlarına dayanmaktadır. Görüntünün her bir parçası, sinir ağının görüntünün karakteristik özelliklerini aramak için kullandığı parametrelere sahip filtreler kullanılarak analiz edilir.

Örnek

Sinir ağının katmanları görüntüyü sırayla işler ve sonraki her katmanda giderek daha fazla soyut özellik hesaplanır ve son katmanlardaki filtreler görüntünün tamamını görebilir. İlk katmanlarda yüzleri tanırken, sinir ağı sınırlar ve yüz özellikleri gibi basit özellikleri algılar, ardından daha derin katmanlarda filtreler daha karmaşık özellikleri ortaya çıkarabilir - örneğin yan yana iki daire büyük olasılıkla bunların göz olduğu anlamına gelir, ve bunun gibi.

OpenCV'nin bilgisayarlı görme algoritması, kaç parmağın gösterileceğini belirler

Bilgisayar ne zaman aldatıldığını bilir

Bir kişi çok akıllı bir bilgisayarı kandırabilir mi, üç örnek

Oleg Grinchuk

VisionLabs Baş Araştırmacısı

Dolandırıcılar, hesaplarına ve verilerine erişmek için başka bir kişinin kimliğine bürünmeye çalışabilir veya sistemi prensipte tanımayacak şekilde aldatabilir. Her iki seçeneği de ele alalım.

Başka bir kişinin fotoğrafı, videosu veya basılı maske

VisionLabs platformu, canlılığı kontrol ederek bu aldatma yöntemleriyle mücadele eder, yani kameranın önündeki nesnenin canlı olup olmadığını kontrol eder. Bu, örneğin, sistem bir kişiden gülümsemesini, göz kırpmasını veya kamerayı veya akıllı telefonu yüzüne yaklaştırmasını istediğinde etkileşimli canlılık olabilir.

Platform on binlerce kombinasyonla rastgele bir dizi oluşturduğundan, kontrol setini tahmin etmek imkansızdır - istenen gülümseme ve diğer duygu kombinasyonlarıyla binlerce video kaydetmek gerçekçi değildir. Ve kamera yakın kızılötesi menzilli sensörler veya bir derinlik sensörü ile donatılmışsa, sisteme iletirler. Ek bilgi Bu, önündeki kişinin gerçek olup olmadığını her seferinde bir atış belirlemeye yardımcı olur.

Ayrıca sistem, farklı dokulardan gelen ışığın yansımasının yanı sıra nesnenin ortamından da analiz eder. Yani sistemi bu şekilde aldatmak neredeyse imkansız.

Bu durumda, erişim elde etmek için yeterli bir kopyayı çoğaltmak için, dolandırıcının şu bilgilere erişmesi gerekir: kaynak kodu ve sistemin makyajla görünümdeki değişikliklere verdiği tepkilere dayanarak, yavaş yavaş başka bir kişinin tam bir kopyası olacak şekilde değiştirin.

Bir saldırganın tam olarak mantığı ve doğrulama ilkesini kırması gerekir. Ancak üçüncü taraf bir kullanıcı için bu sadece bir kamera, bir kara kutu, hangi kontrol sürümünün içinde olduğunu anlamak imkansız. Ayrıca, doğrulama faktörleri durumdan duruma farklılık gösterir, bu nedenle bazı evrensel algoritmalar bilgisayar korsanlığı için kullanılamaz.

Birkaç tanıma hatası varsa, sistem sunucuya bir uyarı sinyali gönderir ve ardından saldırganın erişimi engellenir. Bu nedenle, koda erişim gibi olası olmayan koşullarda bile, bir saldırgan, tanıma gerçekleşene kadar görünüşünü sonsuza kadar değiştiremeyeceğinden, sistemi hacklemek zordur.

Büyük güneş gözlüğü, şapka, atkı, elinizle yüzünü örtün

Sinir ağı yüzleri bir kişiden çok daha iyi tanısa bile, yüzünün çoğu gizliyse sistem bir kişiyi tanıyamayacaktır. Ancak yüz tanıma sisteminden tamamen gizlenmek için kişinin yüzünü her zaman kameralardan gizlemesi gerekir ve bunu pratikte uygulamak oldukça zordur.

Bilgisayar görüşü, insan görüşünden üstündür

Tam olarak ne ve neden, bir örnekle

Yuri Minkin

Bilgisayarlı görme sistemleri, temel prensiplerde insan görüşüne benzer. Bir kişi olarak, bilgi toplamaktan sorumlu cihazları var, bunlar video kameralar, bir göz analogu ve işlenmesi bir bilgisayar, beynin bir analogu. Ancak bilgisayar görüşünün insan görüşüne göre önemli bir avantajı vardır.

Bir kişinin görebileceği ve görüntüden hangi bilgilerin çıkarılacağı konusunda belirli bir eşiği vardır. Bu eşik tamamen fizyolojik nedenlerle aşılamaz. Ve bilgisayarla görme algoritmaları sadece daha iyi hale gelecek. Sonsuz öğrenme fırsatlarına sahipler

Yuri Minkin

Bilişsel Teknolojiler Bölüm Başkanı

İyi bir örnek, kendi kendini süren arabalardaki bilgisayarla görme teknolojisidir. Bir kişi trafik durumu hakkındaki bilgisini yalnızca küçük, önemli ölçüde sınırlı sayıda kişiye öğretebilirse, arabalar belirli nesneleri bir kerede tespit etme konusundaki mevcut tüm deneyimlerini binlerce hatta binlerce filoya kurulacak tüm yeni sistemlere aktarabilir. bir milyon.

Örnek

Geçen yılın sonunda, Bilişsel Teknolojiler uzmanları, yol sahnesi nesnelerini tespit etmede insanların ve yapay zekanın yeteneklerini karşılaştırmak için deneyler yaptı. Ve şimdi bile, bazı durumlarda AI sadece pes etmedi, aynı zamanda insan yeteneklerini de aştı. Örneğin, ağaçların yaprakları tarafından kısmen gizlendiklerinde yol işaretlerini tanımakta daha iyiydi.

Bir bilgisayar bir kişiye karşı tanıklık edebilir mi?

Sergey Izrailit: Artık mevzuatta "bilgisayarlardan elde edilen" verilerin suçlar da dahil olmak üzere bazı önemli durumların kanıtı olarak kullanılması sadece bazı durumlar için özel olarak düzenlenmiştir. Örneğin, yüksek hızlı trafiği ihlal eden araçların plakalarını tanıyan kameraların kullanımı düzenlenmiştir.

Genel olarak, bu tür veriler, soruşturmanın veya mahkemenin dikkate alabileceği veya reddedebileceği diğer kanıtlarla eşit olarak kullanılabilir. Aynı zamanda, usul mevzuatı, genel düzen kanıtlarla çalışma - sunulan kaydın herhangi bir gerçeği gerçekten doğrulayıp doğrulamadığını veya bilgilerin bir şekilde çarpıtılıp çarpıtılmadığını belirleyen bir inceleme.