Menü
ücretsiz
Kayıt
Ev  /  Navigatörler/ Görüntü işleme için yöntemler ve algoritmalar. Sistem uygulaması

Görüntü işleme için yöntemler ve algoritmalar. Sistem uygulaması

Görüntü gösterimi

İki ana görüntü gösterimi türü vardır - vektör ve raster.

Vektör temsilinde görüntü, başlangıç ​​ve bitiş noktalarının koordinatlarını, çizgilerin eğriliğini ve diğer geometrik özellikleri içeren bir dizi çizgi (vektörler) ile tanımlanır, çeşitli alanların oluşturulması için kurallar ve renk özellikleri de tarif edildi. Başka bir deyişle, bir raster temsil, bazı matematiksel modellerin oluşturulmasını gerektirir. Bu nedenle, vektör gösterimi esas olarak görüntü sentezi problemlerinin çözümünde kullanılır. Bazı görüntü tanıma algoritmaları, çalışmaları için orijinal görüntüden elde edilmesi gereken bir vektör gösterimi gerektirmesine rağmen.

Raster görüntü, belirli bir Kartezyen koordinat ızgarasında görüntü özelliklerinin uzamsal dağılımını tanımlayan bir veya daha fazla matristir. Bu durumda, görüntü bir dizi noktadan oluşturulur ve raster bir yapıya sahiptir. Bir görüntünün raster temsilinin ana öğesi, bir raster koordinat sisteminde koordinatlara ve bazı niteliklere (renk, parlaklık, şeffaflık, vb.) Sahip olan bir pikseldir ("resim öğeleri" ifadesinin kısaltması - görüntü öğeleri). X ve Y koordinatları boyunca (yatay ve dikey olarak) piksel sayısı, görüntü gösteriminin çözünürlüğünü (boyutunu) ayarlar. Bir pikselin rengi, herhangi bir rengi belirtmek için gereken bit sayısı olan derinliği ile verilir.

Raster görüntüler, bir pikselin rengini ayarlama yöntemlerine ve orijinal görüntünün özelliklerine bağlı olarak aşağıdakilere ayrılır:

İkili

Yarım ton

Palet

tüm renkler

İkili gösterimde, bir pikselin rengi beyaz veya siyah olabilir ve bir bit olarak kodlanır. Görüntü bir matristir. Bu matrisin her elemanı (i , j ), 0 veya 1 değerine sahiptir, burada i satır numarasıdır ve verilen piksele karşılık gelen elemanın j sütun numarasıdır (Şekil 1).

Gri tonlamalı görüntülerde pikseller, gri tonlarına karşılık gelen parlaklık değerlerini temsil eder. Yarı tonlu görüntüyü tanımlayan matris indeksleri, pikselin raster üzerindeki konumunu ve matris öğesinin değerini tanımlar.

- parlaklığını ayarlar I (i, j) (Şek. 2).

Palet görüntüleri iki matrisle tanımlanır (Şekil 3). Biri, palet matrisinin satırına erişimi belirten dizinlerin değerlerini saklar. Palet matrisi bir renk haritasıdır. Kırmızı "R", yeşil "G" ve mavi "B" renklerine karşılık gelen 3 sütun grubu içerir. Karşılık gelen pikselin rengini ayarlarlar.

Palet, Nc'nin renk sayısı olduğu bir Nc 3 matrisidir.

Görüntü ön işleme algoritmaları

Tam renkli görüntüler RGB biçiminde oluşturulur ve üç matrisi R (i , j ), G (i , j ), B (i , j ) temsil eder. Her matrisin karşılık gelen elemanları, matris indeksleri tarafından belirtilen piksel için kırmızı, yeşil ve mavi renklerin yoğunluk değerlerini içerir. Bu nedenle, tam renkli bir görüntünün bir renk haritası yoktur ve her pikselin rengi, karşılık gelen matrislerden alınan üç sayı ile temsil edilir (Şekil 4).

Matrislerdeki sayıların biçimi tamsayı veya kayan nokta olabilir. İlk durum, çeşitli cihazlar - tarayıcılar, dijital kameralar, televizyon kameraları vb. - kullanılarak elde edilen sözde sayısallaştırılmış görüntülere atıfta bulunur. Görüntülerle ilgili bilgilerin standart grafik dosyalarında saklandığı format budur.

İkinci seçenek, görüntülerin işlenmesi sırasında dahili temsili için kullanılır. Bu durumda, yoğunluk verilerini bir aralığa, örneğin aralığa normalleştirmek ve kayan sayılarla çeşitli hesaplamalar yapmak ve ardından sonucu orijinal tamsayı biçimine dönüştürmek uygundur. Bu yöntem, hesaplama hatalarını azaltmaya ve işleme sonucunun doğruluğunu artırmaya izin verir.

Tam renkli görüntüler için seçeneklerden biri, o formatta temsil edilebilecek maksimum renk sayısıdır. En sık kullanılan görseller 16, 256, 65536 (Yüksek Renk) ve 10,7 milyon (Gerçek Renk) renge sahiptir.

Görüntü ön işleme algoritmaları

0 0 0 0 1 1 1 0 0

120 122 125 128 115 117 118

1 0 0 0 1 1 1 1 0

119 121 124 125 128 130 133

1 1 0 0 1 1 0 0 1

122 122 124 123 127 126 128

120 121 123 125 127 125 126

1 1 1 0 1 1 0 0 0

118 110 109 108 108 109 110

0 0 1 0 0 1 0 0 1

Görüntü ön işleme algoritmaları

İndeks Matrisi

31 15 03 09

palet matrisi

Görüntü ön işleme algoritmaları

Tam renkli bir görüntü yalnızca RGB formatında değil, diğer renk sistemleri kullanılarak da temsil edilebilir.

HSB sisteminde renk, aşağıdaki renk özellikleriyle temsil edilir: Ton - renk tonu;

Doygunluk - doygunluk; Parlaklık - parlaklık.

Bu renk sisteminin, insanın renk algısının özelliklerine karşılık geldiğine inanılmaktadır.

LAB sisteminde renk, bir pikselin gerçek rengini belirleyen parlaklık (açıklık) ve iki bağımsız krominans değerinin birleşimi olarak kabul edilir. Renklilik A - renk bileşeni macentadan yeşile kadar seçilir. Renklilik B - ikinci renk bileşeni sarıdan maviye kadar olan aralıktan seçilir.

Başka renk temsil sistemleri de vardır. Doğal olarak hepsi birbiriyle bağlantılıdır ve bir gösterimden bir diğeri elde edilebilir. Renk sistemlerinin çeşitliliği, onların yardımıyla çözülen görevlerden kaynaklanmaktadır. Örneğin, LAB sisteminde renk düzeltmesi yapmak, RGB sisteminde monitör ekranındaki görüntüyü çoğaltmak daha uygundur, yazdırmak daha iyidir,

Görüntü ön işleme algoritmaları

CMYK temsilini kullanarak. Bununla birlikte, her durumda, görüntüleri işlerken ve tanırken, bir veya daha fazla matris içeren görüntülerin raster bir temsiliyle çalışırlar.

Ön işleme algoritmalarının sınıflandırılması

Görüntü ön işleme algoritmaları, sınıflandırma özelliğine göre farklı gruplara ayrılmaktadır. Tüm ön işleme algoritmaları, ya görüntülerin kalitesini bir anlamda iyileştirmeli ya da sonraki işlemler için en uygun forma dönüştürmelidir.

Bir görüntünün renk üretimini iyileştirmeyi amaçlayan algoritmalara renk düzeltme algoritmaları denir. Bu grup, parlaklık ve kontrast özelliklerini değiştiren gri tonlamalı görüntülerle çalışan algoritmaları da içerir.

Görüntülerin uzamsal özelliklerini işlemeyi amaçlayan algoritmalara algoritmalar denir. uzaysal filtreleme Bu grup, gürültü bastırma algoritmalarını, uzamsal yumuşatma algoritmalarını ve uzamsal yükseltme algoritmalarını, uzamsal frekansları bastırmak ve yükseltmek için algoritmaları içerir.

Bir görüntü üzerinde geometrik işlemler gerçekleştiren algoritmalara ne ad verilir? geometrik işleme algoritmaları. Bunlar şunları içerir:

Görüntü ön işleme algoritmaları

Bir görüntüyü kırpma - orijinal görüntüden dikdörtgen şeklin belirli bir bölümünün seçilmesi;

Görüntü yeniden boyutlandırma. Bu algoritmalar, büyütülmüş görüntüdeki eksik pikselleri doğru bir şekilde doldurmak veya görüntü küçültüldüğünde piksel değerlerini yeniden hesaplamak için çeşitli enterpolasyon yöntemleri kullanır.

Görüntü döndürme. Bu algoritmalar, çeşitli enterpolasyon yöntemlerini kullanarak piksel değerlerini doğru bir şekilde yeniden hesaplayarak orijinal görüntüyü belirli bir açıyla döndürür.

Bir renk sisteminden diğerine dönüşüm gerçekleştiren algoritmalara ne ad verilir? renk dönüştürme algoritmaları. Ayrıca, renkli görüntüleri gri tonlamaya dönüştürmek için algoritmalar ve orijinal görüntüyü ikili görüntüye dönüştüren ikilileştirme algoritmaları içerir.

Orijinal görüntüdeki bazı alanları çeşitli, genellikle resmi olmayan koşullara göre seçen algoritmalara bölümleme algoritmaları denir. Böyle bir algoritmanın bir örneği, örneğin, bir belge görüntüsündeki metin ve grafik bilgilerinin alanlarını vurgulaması gereken bir algoritma veya bir metin görüntüsünde tek tek sözcüklere ait olan alanları seçen bir algoritma olabilir.

Görüntü ön işleme algoritmaları

Mekansal filtreleme algoritmaları

Bir görüntünün matematiksel biçimde uzamsal filtrelenmesi, ayrık bir görüntünün, uzamsal bir filtrenin bazı dürtü tepkileri ile ayrık evrişimidir.

Eğer (i, j)

Im(im , j n )h (m , n ), burada:

m N11 n N21

Im, Orijinal ve filtrelenmiş görüntülerin matrisleri ise, h, filtrenin impuls yanıtının matrisidir,

N 11 , N 21 darbe yanıtı sütunlarının alt ve üst sınırları, N 12 , N 22 darbe yanıtı satırlarının sol ve sağ sınırları.

Darbe yanıt matrisi, uzamsal filtrenin hesaplanmasıyla elde edilebilir. parametreleri ayarla. Örneğin, dijital filtrelemeye ilişkin büyük miktarda literatür, uzamsal filtrelerin hesaplanmasına yönelik yöntemlere ayrılmıştır. Pratik hesaplamalar için standart matematiksel paketleri kullanabilirsiniz, örneğin “MATLAB” sistemi “Image Filter Design” filtre hesaplama sistemini içerir.

Filtrelemenin frekans alanında da yapılabileceğini unutmayın. Şöyle

Görüntü ön işleme algoritmaları

Bu durumda, filtreleme sırası aşağıdaki gibidir:

2D ayrık Fourier dönüşümü kullanarak görüntüyü uzamsal alandan frekans alanına dönüştürün

Görüntünün frekans matrisinin filtrenin frekans matrisiyle eleman bazında çarpımını gerçekleştirin

Elde edilen sonuç, ters iki boyutlu ayrık Fourier dönüşümü kullanılarak uzamsal bir alana dönüştürülür.

ben(x , y )

ben(f x , f y )

Eğer (f x , f y ) Im(f x , f y ) H (f x , f y ) ise

Eğer (fx , f y )

(x, y) ise

Frekans alanındaki görüntüleri filtrelemek, büyük miktarda hesaplama nedeniyle nadiren kullanılır. Ancak bu filtreleme yöntemi, görüntü işleme seçeneklerinin analizinde teorik hesaplamalarda yaygın olarak kullanılmaktadır. Ne tür bir filtrelemeye ihtiyaç duyulduğunu oldukça net bir şekilde görselleştirmenizi sağlar. Örneğin, görüntüdeki keskin parlaklık değişikliklerini vurgulamanız gerekiyorsa, yüksek geçişli filtreler kullanmanız gerektiği açıktır. Aksine, düşük frekanslı gürültüden - titreyen devrelerden, bireysel tepe noktalarından vb. - kurtulmanız gerekiyorsa, düşük geçişli filtreler kullanmanız gerekir. Spesifik filtre parametreleri, girişimin frekans analizine ve orijinal görüntünün özelliklerine göre seçilir.

DİJİTAL TEDAVİ SİNYALLER

Konu 17. GÖRÜNTÜ İŞLEME

İnsanın hayal gücünün ötesinde hiçbir şey yoktur.

Titus Lucretius. Romalı filozof ve şair. 1. yüzyıl M.Ö e.

Hayal gücü iyi bir şeydir. Ama serseriyi bodrumdan çıkarmak, yıkamak, Apollon'a dönüştürmek, kibrit kutusuna koyup bir arkadaşına göndermek e-posta iyi grafik programı daha iyisini yapacak

Anatoly Pyshmintsev, Ural Okulu'nun Novosibirsk jeofizikçisi. 20. yüzyıl

Giriiş.

1. Temel kavramlar. grafiksel gösterim Görüntüler. Bilgisayar grafiklerinde rengin temsili. RGB renk modeli. CIE XYZ renk sistemi.

2. Raster görüntülerin geometrik dönüşümleri. Dönüşüm alanları ve aşamaları. Örnekleme. İki boyutlu sinyal kurtarma enterpolasyon serisi. Görüntülerin frekans bozulmaları ve giderilmesi. Görüntü yeniden örnekleme.

3. Görüntü filtreleme. Hat filtreleri. Yumuşatma filtreleri. Kontrast filtreleri. fark filtreleri. İki boyutlu döngüsel evrişim. doğrusal olmayan filtreler Eşik filtreleme. medyan filtreleme Aşırı filtreler.

4. Görüntü sıkıştırma. Tekrar Uzunluğu Kodlama Algoritmaları (RLE). Sözlük algoritmaları. İstatistiksel kodlama algoritmaları. Kayıplı görüntü sıkıştırma. Görüntü kaybı tahmini. Fourier dönüşümü. Dalgacık dönüşümü.

GİRİİŞ

Dijital görüntüleme alanındaki araştırmaların kapsamı hızla büyüyor. Bunun nedeni, görüntü işlemenin çok boyutlu sinyal işleme olması ve gerçek dünyadaki çoğu sinyalin çok boyutlu olmasıdır.


Matematiksel gösterimde bir görüntü, büyük miktarda bilgi taşıyan iki boyutlu bir sinyaldir. renkli görüntü 500 × 500 öğe, birkaç yüz bin baytlık bir dizidir. Bu tür bilgileri yalnızca rasyonel bir hesaplama organizasyonu ile işlemek mümkündür. Belirli görüntü işleme görevleri için şunları kullanabilirsiniz: etkili yollar bu özel görevin özelliklerini ve sınırlamalarını dikkate alarak işleme. Ancak, çok çeşitli sorunları çözmek için görüntü işlemeden bahsedersek, keyfi sorunları çözmek için algoritmaların oluşturulabileceği bir dizi standart işlemi ayırmak gerekir. Bunlar, doğrusal dönüşümleri, 2B evrişimi ve 2B ayrık Fourier dönüşümlerini içerir.

Ancak görüntü işlemede doğrusal olmayan dönüşümler de yaygın olarak kullanılmaktadır. Görüntülerin özelliği, görüntünün bireysel öğelerinin komşu öğelerle belirli bir bağlantı içinde olmasıdır. Bu nedenle, çoğu görüntü dönüştürme algoritması doğası gereği yereldir, yani görüntüleri verilenin etrafındaki komşuluklarda bulunan öğe gruplarına göre işlerler. Doğrusal dönüşümler, yerellik özelliğini karşılar ve hesaplama karmaşıklığı kapsanan komşuluğun boyutuna fazla bağlı olmayan algoritmaların oluşturulmasına izin verir. Doğrusal olmayan görüntü dönüşümleri için aynı özellikler gereklidir. Bu tür dönüşümlerin sınıfı, yerel sıralama görüntü istatistiklerinin hesaplanmasına dayanan, sıralama filtreleme algoritmaları olarak adlandırılan algoritmaları içerir. Sıralama istatistikleri ve türevleri hesaplanırken, görüntülerin bilgi fazlalığına ilişkin basitleştirmeler mümkündür. Bu sınıfın en bilinen algoritması medyan filtreleme algoritmasıdır. Sıralama algoritmalarının diğer örnekleri, analiz edilen görüntü öğesini komşuluktaki bir maksimum veya minimum değerle değiştiren aşırı filtreleme algoritmalarıdır. Sıralama algoritmalarının diğer bir özelliği, işlenmiş görüntünün özelliklerine yerel olarak uyarlanması ve bunların yalnızca yumuşatma ve gürültü giderme için değil, aynı zamanda özellik çıkarımı için de kullanılma potansiyelidir. otomatik tanıma Görüntüler.

Görüntü işlemede, eğer çok boyutlu sinyallere genelleştirmek mümkünse, tek boyutlu sinyal işleme yöntemleri yaygın olarak kullanılmaktadır. Aynı zamanda, çok-boyutlu sistemleri tanımlamaya yönelik matematiksel yöntemlerin tam olmadığı dikkate alınmalıdır. Çok boyutlu sistemler, çok sayıda serbestlik derecesine sahiptir ve tasarımları, tek boyutlu sistemlerin özelliği olmayan bir esneklik kazanır. Aynı zamanda, çok boyutlu polinomlar, çok boyutlu sistemlerin analizini ve sentezini karmaşıklaştıran basit faktörlere ayrıştırılamaz.

17.1. Temel konseptler

Resimlerin grafik gösterimi. Grafik bilgileri iki boyutlu bir düzlemde (monitör ekranı) temsil etmek için iki yaklaşım kullanılır: raster ve vektör.

Vektör yaklaşımı ile grafik bilgi, bir dizi soyut geometrik nesne olarak tanımlanır - düz çizgiler, parçalar, eğriler, dikdörtgenler, vb. Vektör tanımı, görüntünün yapısı hakkında a priori bilgi varsayar.

Raster grafikler, bitmap biçiminde rastgele görüntüler üzerinde çalışır. Raster, bir düzlemdeki bir görüntünün, onu düzenli bir ızgara boyunca aynı öğelere bölerek (örnekleyerek) ve her öğeye kendi rengini ve diğer niteliklerini atayarak açıklamasıdır. En basit raster dikdörtgendir, görüntüleri iletmek için örnek sayısı açısından en ekonomik olanı altıgendir. Matematiksel olarak raster, sürekli bir görüntü fonksiyonu düzleminde parçalı sabit bir yaklaşımdır.

Rasterin bir elemanına piksel denir. Standart piksel tanımlama:


f(i, j) = (A(i, j),C(i, j)), (17.1.1)

burada A(i, j) Ì R2 - piksel alanı, C(i, j) Î C - piksel özelliği (genellikle renkli). En sık kullanılan iki öznitelik şunlardır:

C(i, j) = I(i, j) - bir pikselin yoğunluğu (parlaklığı);

C(i, j) = (R(i, j), G(i, j), B(i, j)) - RGB renk modelindeki renk nitelikleri.

matris biçiminde:

Mij ​​= (Aij, Cij).

Sürekli görüntüler örneklenirken, Aij değerleri Cij niteliklerinin tanımlandığı Aij = (i, j) noktalarının değerleri veya karelerin değerleri olarak iki şekilde tanımlanabilir. Aij = (i, i+1) × (j, j+1) veya başka herhangi bir form, Cij tanımı ile bu form içindeki ortalama değerler (Şekil 17.1.1).

Uygulamada, bir kural olarak, X ve Y, örneğin şöyle yazılan raster genişliğinin yüksekliğine bir en boy oranına (en boy oranı) sahip bir kare veya dikdörtgen rasterin negatif olmayan tamsayılarının sınırlı kümeleridir. "4:3".

Bilgisayar grafiklerinde rengin temsili. Renk kavramı, belirli bir frekans aralığındaki elektromanyetik dalgaların insan gözü tarafından algılanmasına dayanmaktadır. bizim tarafımızdan algılanan gün ışığı 400 nm'den (mor) ila 700 nm'ye (kırmızı) kadar λ dalga boylarına sahiptir. Işık akısının tanımı, onun spektral fonksiyonu I(λ) olabilir. Spektrumu yalnızca belirli bir dalga boyuna sahipse ışık monokromatik olarak adlandırılır.

Retinada iki tip reseptör vardır: çubuklar ve koniler. Çubukların spektral hassasiyeti (Şekil 17.1.2), gelen ışığın parlaklığı ile doğru orantılıdır. Koniler, her biri kırmızı, yeşil ve mavi renkler için maksimum olan sınırlı aralıklarda belirli bir hassasiyete sahip olan ve karanlıkta hassasiyetlerini keskin bir şekilde kaybeden üç türe ayrılır. Gözün maviye duyarlılığı diğer ikisine göre çok daha düşüktür. İnsan ışığı algılamasının önemli bir özelliği, farklı dalga boylarına sahip renkleri eklerken doğrusallıktır.

RGB renk modeli (Kırmızı, Yeşil, Mavi - kırmızı, yeşil, mavi) bilgisayar grafiklerinde şu anda en yaygın olanıdır. Bu modelde, spektral fonksiyon, R, G ve B olarak gösterilen, negatif olmayan ağırlık katsayılarına (0'dan 1'e normalize edilmiş) sahip her bir koni türü için duyarlılık eğrilerinin toplamı olarak temsil edilir. Model şu şekilde karakterize edilir: yeni renkler elde etmek için toplama özelliği. Örneğin, spektral fonksiyonların kodlanması:

Siyah: fsiyah = 0, (R, G, B) = (0,0,0);

Menekşe fmor = fred + fblue, (R, G, B) = (1,0,1);

Beyaz fbeyaz = fred + fgreen + fblue, (R, G, B) = (1,1,1).

RGB modelinin üç boyutlu renk alanı, Şek. 17.1.3. Işığın alıcılar tarafından algılanmasının özellikleri nedeniyle, insanlar tarafından görülebilen tüm renkler bu modelde temsil edilemez. Ancak, yeniden üretilebilir renklerin oranı, bu modelde temsil edilemeyen renklerin oranından çok daha fazladır.

CIE XYZ renk sistemi. Uluslararası renk gösterimi standardı CIE (CIE - Commission Internationale de l "Eclairage), 1931'de Uluslararası Aydınlatma Komisyonu tarafından kabul edilmiştir. Üç temel işlevi tanımlar: ρX (λ), ρY (λ), ρZ (λ), dalga boyu , doğrusal kombinasyonları negatif olmayan katsayılarla (X, Y ve Z) insan tarafından görülebilen tüm renkleri üretir. Bu işlevler, ışık yoğunluğunun göz alıcıları tarafından göreceli olarak algılanmasını hesaba katar. Üç boyutlu uzayda, CIE renk sistemi birinci kadranda bir koni oluşturur ve yüksek kaliteli renkli görüntüleri göstermek için kullanılır.

17.2. Bit eşlemlerin geometrik dönüşümleri

Dönüşüm alanları ve aşamaları. Görüntüler dokusal ve ayrıntılı olarak ayrılabilir. Doku görüntülerinde, tüm örnekler (öğeler) bilgi taşır (TV ekranındaki bir görüntü). Ayrıntılı bir görüntü, karışan nesnelerin, arka planın ve kullanışlı nesnelerin ayırt edilebildiği bir görüntüdür.

Bilgisayarlarda üç ana görüntü işleme algoritması grubu vardır:

1. Restorasyon, rastgele gürültüden arındırma, kaliteyi iyileştirme, optik sistemlerin geometrik bozulmalarını düzeltme (odaklanmama, sapmalar, vb.) amacıyla birincil (ön) görüntü işleme.

2. Resimlerin tanımı, örüntü tanıma. Görüntü detaylarının parametrelerini belirlemek için gerçekleştirilir ve şunları içerir: görüntünün aydınlatma ve renk açısından tekdüze olan alanlarını bulma, görüntülerin şeklinin işaretlerini vurgulama, nesnelerin özel noktalarının koordinatlarını belirleme vb.

3. İletim ve depolama miktarını azaltmak için verimli kodlama.

Çoğu ön işleme yöntemi, doğrusal uzamsal olarak değişmez (LPI) filtrelerin kullanımına dayanır. Doğrusal algoritmalar, 1D FIR ve IIR filtrelerinin 2D analogları kullanılarak gerçekleştirilir. Örneğin, görüntülerdeki gürültü seviyesini azaltmak için filtreler uygularken kullanılabilirler.

FIR filtreleri evrişim yöntemi kullanılarak uygulanır. 2D FIR filtrelerinin avantajı görünürlük, basitlik ve mutlak kararlılıktır. IIR filtreleri, fark denklemleri ve z-dönüşümleri kullanılarak uygulanır. FIR filtrelerinden daha hızlıdırlar, ancak kararsız olabilirler. İki boyutlu IIR filtrelerinin sentezi, tek boyutlu olanların sentezinden farklıdır, çünkü iki boyutlu bir fonksiyon için kutupları açıkça seçmek mümkün değildir.

Görüntüleri geri yüklemek ve kalitelerini iyileştirmek için doğrusal olmayan yöntemler de gerekebilir. Bu nedenle, örneğin, gürültüyü bastırmak ve aynı zamanda görüntülerin kontur kısmını korumak için, sıralama algoritmaları tarafından uygulanan doğrusal olmayan veya doğrusal uzamsal olarak değişmez (SPNI) filtreler uygulamak gerekir. Tüm dereceli doğrusal olmayan filtreler, yerel histogramları hesaplamak için hızlı algoritmalara dayalıdır.

Böyle bir yöntem medyan filtrelemedir. Medyan filtrelerin kullanımı, örneğin hat kesintileri de dahil olmak üzere gürültü emisyonlarının patlamalarını bastırmak için, sinyali aynı anda bozmadan belirli tipteki gürültüyü ve periyodik gürültüyü bastırmak için etkilidir. Yöntem, örneğin ince çizgileri ve küçük yalıtılmış nesneleri vurgulamak gibi tanıma ile ilgili sorunları çözmek için de kullanılabilir.

Görüntüleri tanımlamaya ve görüntüleri tanımaya yönelik algoritmalar, kural olarak doğrusal değildir ve buluşsal niteliktedir. Nesnelerin işaretleri genellikle nesnenin görüntüsünün alanı, görüntü konturunun çevresi, alanın görüntü çevresinin karesine oranıdır. Bir nesnenin şekli, görüntüde çizilen veya nesnenin görüntüsünün etrafına çizilen dairenin yarıçapı, görüntünün "kütle merkezi"nden minimum ve maksimum yarıçap vektörünün uzunluğu ile karakterize edilebilir.

Örnekleme. Bir bilgisayarda görüntü dönüşümleri ve işlenen verilerin saklanması ayrı bir biçimde gerçekleştirilir. Örnekleme, gerçek dünyanın sürekli analog görüntülerinden ayrı bir temsil elde etmek için kullanılır. Uygulamada, giriş cihazları (dijital kamera, tarayıcı veya diğerleri) tarafından gerçekleştirilir. Çıkış cihazlarında (ekran, çizici vb.) işlenmiş görüntülerin görsel olarak algılanması için, bir analog görüntü, ayrıklaştırılmış temsiline göre yeniden oluşturulur.

Siyah beyaz görüntülerin en basit durumunda, iki boyutlu bir sa(x, y) dizisine sahibiz. RGB modelindeki renkli görüntüler için, renkleri eklerken toplama özelliğini dikkate alarak, her bir R, G ve B katmanı da iki boyutlu bir dizi olarak kabul edilebilir ve işlenebilir ve ardından sonuçların toplamı alınabilir.

Tek boyutlu periyodik ayrıklaştırmayı iki boyutlu duruma genelleştirmenin yollarından en basiti, dikdörtgen koordinatlarda periyodik ayrıklaştırmadır:

s(n, m) = sa(nDx, mDy),

burada Dx ve Dy, sürekli x ve y koordinatlarına sahip iki boyutlu sürekli sinyal sa(x, y)'nin yatay ve dikey örnekleme aralıklarıdır. Aşağıda tek boyutlu durumda olduğu gibi Dx ve Dy değerleri 1'e eşit alınmıştır.

İki boyutlu bir sinyalin ayrıklaştırılması, spektrumunun periyodikleştirilmesine de yol açar ve bunun tersi de geçerlidir. Ayrık bir sinyalin koordinat ve frekans temsillerinin bilgi denkliği koşulu, ana sinyal aralıklarında eşit sayıda örnekleme noktası ile de korunur. Dikdörtgen ayrıklaştırma için doğrudan ve ters Fourier dönüşümleri şu ifadelerle tanımlanır:

S(k, l) =s(n, m) exp(-jn2pk/N-jm2pl/M), (17.2.1)

S(k, l) = exp(-jn2pk/N) s(n, m) exp(-jm2pl/M), (17.2.1")

s(n, m) =S(k, l) exp(-jn2pk/N-jm2pl/M). (17.2.2)

s(n, m) = exp(-jn2pk/N) S(k, l) exp(-jm2pl/M). (17.2.2")

Pirinç. 17.2.1. Spektrum periyodizasyonu.

Bu ifadeler, dikdörtgen bir veri örnekleme raster üzerinde bir 2D DFT'nin 1D seri DFT'ler kullanılarak hesaplanabileceğini göstermektedir. (17.2.1") ve (17.2.2") ifadelerinin ikinci toplamları, n ve k hatları boyunca s(n, m) ve S(k, l) fonksiyonlarının bölümlerinin tek boyutlu DFT'leridir, sırasıyla ve ilk toplamlar, m ve l ile bölümlerde hesaplanan fonksiyonların tek boyutlu DFT'leridir. Başka bir deyişle, s(n, m) ve S(k, l) değerlerinin başlangıç ​​matrisleri önce DFT ile ara matrislere satırlara (veya sütunlara) göre yeniden hesaplanır ve ara matrisler DFT ile nihai matrislere yeniden hesaplanır. sütunlara göre (veya sırasıyla satırlara göre).

Frekansı Fx=1/Dx ve Fy=1/Dy olan bir analog sinyalin örneklenmesinden kaynaklanan spektrumun (Şekil 17.2.1) periyodik tekrarının ana frekansta spektrumu değiştirmemesi için aralığı (orijinal analog sinyalin spektrumuna göre), hem satırlarda hem de sütunlarda analog sinyalin spektrumundaki maksimum frekans bileşenleri fmax'ın Nyquist frekansını (fmax. x £ fN = Fx/2, fmaks.y £ fM = Fy/2). Bu, sinyalin örnekleme frekansının, sinyal spektrumundaki maksimum frekans bileşeninin en az iki katı kadar yüksek olması gerektiği anlamına gelir:

Fx ³ 2fmaks. x, Fy ³ 2fmaks. y, (17.2.3)

bu da spektral fonksiyonların spektrumun ana aralığının uçlarında sıfır değerlere ulaşmasını sağlar.

İki boyutlu sinyal kurtarma enterpolasyon serisi. Eğer sürekli sinyal sa(x, y) spektrum sınırlı bir sinyaldir ve örnekleme periyotları yeterince küçük seçilir ve komşu periyotların spektrumları çakışmaz:

|Gx|p/Dx, |Wy|p/Dx için Sa(Gx, Wy) = 0,

daha sonra, tek boyutlu durumda olduğu gibi, sa(x, y) sinyali, Kotelnikov-Shannon serisinin iki boyutlu bir analoğu kullanılarak ayrı bir sinyalden yeniden oluşturulabilir:

sa(x, y) = Sn Sm s(n, m) . (17.2.4)

Görüntülerin frekans bozulmaları ve giderilmesi. Sınırsız spektruma sahip bir sinyal de örneklenebilir, ancak bu durumda, bitişik periyotlarda bir spektrum örtüşmesi vardır, Nyquist frekanslarından daha yüksek olan yüksek frekanslar, tek boyutlu durumda olduğu gibi "maskelenir". düşük frekanslar ana dönem. Dönemin sınırlarından "yansıma" etkisi, farklı koordinatlarda yansıyan frekansların girişimi nedeniyle daha da karmaşık bir tablo verir. Örtüşme olarak bilinen benzer bir efekt, görüntüler düşük örneklendiğinde de ortaya çıkar. Bu etki, özellikle parlaklıktaki keskin kontrast değişimlerinde net bir şekilde gözlemlenebilir.

Bu tür olaylarla mücadele etmek için ön filtreleme (kenar yumuşatma) kullanılır - örtüşmeye yol açabilecek yüksek frekanslı bileşenleri kesen bir ağırlık filtresi işlevine sahip bir analog görüntünün ön konvolüsyonu. İki boyutlu durumda, filtreleme şu şekilde açıklanır:

z(x, y) = h(x", y") ③③ s(x-x", y-y"). (17.2.5)

Analog görüntülerin yalnızca optik aralıkta, örneğin ekranda ışık görüntüsü, fotoğraf kağıdı veya fotoğraf filmi şeklinde var olduğuna, ancak bilgisayar belleğinde bulunamayacağına dikkat edilmelidir. Bu nedenle, ön filtrelemenin fiziksel uygulaması yalnızca bir görüntüyü kural olarak kullanılmayan odak dışı bırakarak kaydederken mümkündür. Birincil bilgiler her zaman maksimum eksiksizlik ve doğrulukla kaydedilmelidir ve birincil bilgileri gereksiz ayrıntılardan ve fazlalıktan temizlemek sonraki veri işleme meselesidir. Bu nedenle, denklem 17.2.5 ile ilgili olarak, pratik uygulamasında iki boyutlu ön filtreleme yalnızca ana frekans aralığında (aşırı çözünürlükte) büyük bir marjla örneklenmiş görüntülerin filtrelenmesi olabilir ve kural olarak kullanılır , örneğin görüntüleri sıkıştırırken daha büyük bir adıma yeniden örnekleme yaparken. Ön filtreleme, görüntüleme algoritmalarına da yerleştirilebilir.

Şek. 17.2.3 ve altındaki Tablo 17.2.1, en yaygın tek boyutlu kenar yumuşatma filtrelerinin örneklerini gösterir. Analog filtreler biçiminde de uygulanabilirler ve örneğin, radyo kanalları üzerinden (yatay kenar yumuşatma) analog biçimde görüntülerin televizyon satırlarını iletirken kullanılırlar. Prensip olarak, benzer bir işlem sütunlarda (kopya - görüntü) gerçekleştirilebilir ve görüntüyü topladıktan sonra tam bir kenar yumuşatma işlemi gerçekleştirilecektir, ancak bu yöntem daha çok özel bilimsel araştırma alanına aittir.

Tablo 17.2.1.

Temel ağırlık fonksiyonları

zaman penceresi

ağırlık fonksiyonu

Fourier dönüşümü

Doğal (P)

П(t) = 1, |t|£t; П(t) = 0, |t|>t

П(w) = 2t beri

Bartlet (D)

B(w) = t sinc2(ağırlık/2).

Henning, Hanna

p(t) = 0,5

0,5p(w)+0,25p(w+p/t)+0,25p(w-p/t)

hamming

p(t) = 0,54+0,46 cos(pt/t)

0,54P(w)+0,23P(w+p/t)+0,23P(w-p/t)

Carré (2. pencere)

p(t) = b(t) beri(pt/t)

|w| için t B(w)*P(w), P(w) = 1

Laplace-Gauss

p(t) = deneyim[-b2(t/t)2/2]

[(t/b) exp(-t2w2/(2b2))] ③ P(w)

Tek boyutlu f1(x) filtrelerinin iki boyutlu analogları, iki simetri varyantında veya yarıçapın bir fonksiyonu olarak oluşturulur:

f2(x, y) = f1(),

veya bir iş olarak:

f2(x, y) = f1(x) × f1(y).

İlk seçenek daha doğrudur, ancak ikincisi ayrılabilirlik özelliğine sahiptir, yani iki boyutlu konvolüsyon, f1(x) ile sıralar halinde ve f1(y) ile sütunlarda sırayla iki tek boyutlu konvolüsyon ile gerçekleştirilebilir.

Görüntü yeniden örnekleme veya yeniden örnekleme, bir dijital sinyalin örnekleme oranındaki bir değişikliktir. Dijital görüntüler için bu, görüntünün yeniden boyutlandırılması anlamına gelir.

Çeşitli görüntü yeniden örnekleme algoritmaları vardır. Örneğin, çift doğrusal enterpolasyon yöntemi kullanılarak görüntüyü 2 kat artırmak için, komşu sütun ve satırların değerlerinin doğrusal enterpolasyonu ile ara sütunlar ve satırlar elde edilir. Yeni görüntünün her noktasını, orijinal görüntünün daha fazla sayıda noktasının ağırlıklı toplamı olarak elde etmek mümkündür (bikübik ve diğer enterpolasyon türleri). En yüksek kalitede yeniden örnekleme, yalnızca zamanı değil aynı zamanda sinyalin frekans alanını da hesaba katan algoritmalar kullanıldığında elde edilir.

Görüntünün frekans bilgisinin maksimum düzeyde korunduğu bir yeniden örnekleme algoritması düşünün. Algoritmanın tek boyutlu sinyaller üzerindeki çalışmasını ele alacağız, çünkü iki boyutlu bir görüntü önce yatay olarak (satırlar halinde) ve sonra dikey olarak (sütunlar halinde) gerilebilir veya sıkıştırılabilir ve iki boyutlu bir görüntünün yeniden örneklenmesi mümkün olabilir. tek boyutlu sinyallerin yeniden örneklenmesine indirgenmiştir.

0-T aralığında verilen ve Dt=1 (N aralık) adımıyla ayrıklaştırılan tek boyutlu bir sinyale sahip olduğumuzu varsayalım (Şekil 17.2.4). Sinyali m kez "uzatmak" gerekir. Şekilde gösterilen sinyalin spektrumu hızlı Fourier dönüşümü ile hesaplanır (FFT, spektrum numune sayısı sinyal numune sayısına eşittir) ve ana FFT aralığında verilir (0-2p, Nyquist frekansı wN = p/Dt = p veya 0.5N, spektrum boyunca bir adımla spektrum örneklerinin numaralandırılmasına göre Df = 1/T veya Dw = 2p/T). Esneme 2 adım gerektirir.

İlk adım, sinyalin uzunluğunu m kat artıran sıfır enterpolasyondur. (Şekil 17.2.5). Orijinal sinyalin tüm örneklerini m ile çarpmak ve ardından her sinyal örneğinden sonra m-1 sıfır değeri eklemek gerekir. Değeri değişmeyen 0-T aralığında artık m kat daha fazla örnekleme aralığı (mN) vardır ve yeni örnekleme adımı Dx=Dt/m'ye eşit olacaktır. Buna göre, bu sinyal için yeni Nyquist frekansı mp/Dt = mp'dir. Ancak frekans birimleri cinsinden spektrum adımının fiziksel değeri, sinyal ayar aralığının (Df=1/T) fiziksel değerinin tersidir ve bu nedenle, mN sinyal noktaları üzerindeki FFT, spektrumun mN noktalarını şu şekilde hesaplayacaktır: orijinal sinyalin spektrum adımı ile 0-2pm'lik ana FFT aralığı;

İkinci adım, zaman veya spektral alanda bir alçak geçiren filtre kullanarak spektrumun yan bantlarını filtrelemektir. Şek. 17.2.6, spektrum temizlendi ve ters Fourier dönüşümü gerçekleştirildi, bunun sonucunda tüm frekans bilgilerinin tam olarak korunmasıyla orijinal sinyalden m kat daha uzun bir sinyal elde edildi.

Benzer bir ilkeye göre, adımların sırası tersine çevrilirken, bir sinyali n kez sıkıştırmak (çözümlemek) için bir algoritma oluşturulabilir. Sinyali sıkıştırırken, sinyal örnekleme adımı artırılır ve buna bağlı olarak Nyquist frekansı azaltılırken, kesilen yüksek frekanslar (gürültü ve sinyal spektrumunun önemsiz yüksek frekanslı kısımları) ana aralığın sınırından yansıtılacaktır. ve ana bilgilere eklenerek çarpıtmalar yaratılır. Bu fenomeni ortadan kaldırmak için, sinyal önce yeni Nyquist frekansına eşit bir kesme frekansıyla (anti-aliasing) düşük geçişli filtreden geçirilir ve ancak bundan sonra sinyal inceltilerek yok edilir.

Yeniden örnekleme yalnızca zaman alanında gerçekleştirildiğinde, germe ve sıkıştırma algoritmaları genellikle m'nin tamsayı değerlerini ayarlamanıza izin veren m/n oranı biçiminde örnekleme adımı değişikliğini ayarlayarak tek bir sıralı işlemde birleştirilir. ve örnekleme adım değişiminin kesirli değerleri için n. Bu, algoritmaları büyük ölçüde basitleştirir ve çalışmalarının verimliliğini ve kalitesini artırır. Örneğin, m/n = 3/2'de sinyal 1,5 kat uzatıldığında, sinyal önce 3 kez uzatılır (tüm örneklere basit ve tek tip sıfırlar eklenir, ardından düşük geçişli filtreleme gerçekleştirilir, ardından sinyal iki kat azaltılır. Kenar yumuşatma filtresi gerekli değildir, çünkü kesme frekansı ilk alçak geçiren filtrenin frekansı ile örtüşür. Ters sıkıştırma işleminde (örneğin, m/n = 2/3) ), benzer şekilde, yalnızca kenar yumuşatma filtresi kullanılır.

17.3. görüntü filtreleme

Görüntü filtreleme, orijinal görüntüden bazı kurallara göre elde edilen aynı boyutta görüntü elde edilmesi işlemidir. Tipik olarak, ortaya çıkan görüntüdeki her bir pikselin yoğunluğu (rengi), orijinal görüntüdeki bazı komşuluklarında bulunan piksellerin yoğunlukları (renkleri) tarafından belirlenir.

Filtreleme kuralları çok çeşitli olabilir. Görüntü filtreleme, bilgisayarla görme, örüntü tanıma ve görüntü işlemenin en temel işlemlerinden biridir. Görüntü işleme yöntemlerinin büyük çoğunluğu, orijinal görüntülerin şu veya bu şekilde filtrelenmesiyle başlar.

Hat filtreleri çok basit bir matematiksel açıklaması var. Orijinal yarı tonlu görüntü A'nın verildiğini varsayacağız ve piksellerinin yoğunluklarını A(x, y) ile göstereceğiz. Doğrusal bir filtre, raster üzerinde tanımlanan gerçek değerli bir h işlevi (filtre çekirdeği) tarafından tanımlanır. Filtrelemenin kendisi, ayrı evrişim (ağırlıklı toplama) işlemi kullanılarak gerçekleştirilir:

B(x, y) = h(i, j) ③③A(x, y) = h(i, j) A(x-i, y-j). (17.3.1)

Sonuç, görüntü B'dir. Genellikle, filtre çekirdeği yalnızca (0, 0) noktasının N komşuluğunda sıfır değildir. Bu komşuluğun dışında, h(i, j) sıfıra eşittir veya sıfıra çok yakındır ve ihmal edilebilir. Toplama (i, j) н N üzerinde gerçekleştirilir ve her bir B(x, y) pikselinin değeri, (x, y) noktasında ortalanmış olan N penceresinde bulunan A görüntüsünün pikselleri tarafından belirlenir ( gösterilen, N(x, y) ) kümesidir. Dikdörtgen bir N mahallesinde tanımlanan bir filtre çekirdeği, kenar uzunluklarının tek sayılar olduğu bir m'ye n matrisi olarak düşünülebilir. Çekirdeği matris olarak belirtirken ortalanmalıdır. Görüntünün kenarlarına bir piksel (x, y) yerleştirilmişse, A(x-i, y-j) koordinatları belirli bir (i, j) için görüntünün dışında var olmayan A piksellerine karşılık gelebilir. Bu sorun birkaç şekilde çözülebilir.

B görüntüsünü kenarlarından kırparak veya A görüntüsünün orijinal değerlerini değerlerine uygulayarak bu tür pikselleri filtrelemeyin.

Kayıp pikseli h(i, j) ağırlığını N(x, y) komşuluğundaki diğer piksellere eşit olarak dağıtarak toplama dahil etmeyin.

Ekstrapolasyon kullanarak görüntü sınırlarının dışındaki piksel değerlerini yeniden tanımlayın.

Görüntünün ayna devamını kullanarak, görüntü sınırları dışındaki piksellerin değerlerini yeniden tanımlayın.

Yöntem seçimi, belirli filtre ve görüntü özellikleri dikkate alınarak yapılır.

Yumuşatma filtreleri. r yarıçaplı en basit dikdörtgen yumuşatma filtresi, tüm değerleri 1/(2r+1)2 olan ve değerlerin toplamı olan bir (2r+1) × (2r+1) matrisiyle verilir. bir. Bu, düşük geçişli 1B U şeklindeki hareketli ortalama filtresinin 2B analoğudur. Böyle bir çekirdek ile filtreleme yaparken, piksel değeri, etrafındaki 2r+1 karedeki ortalama piksel değeri ile değiştirilir. 3×3 filtre maskesi örneği:

.

Filtre uygulamalarından biri gürültü azaltmadır. Gürültü, pikselden piksele bağımsız olarak değişir ve gürültü değerinin matematiksel beklentisinin sıfır olması koşuluyla, komşu piksellerin gürültüsü toplandığında birbirini yok edecektir. Filtreleme penceresi ne kadar büyük olursa, ortalama gürültü yoğunluğu o kadar düşük olur, ancak buna karşılık gelen önemli görüntü ayrıntılarında bulanıklık da meydana gelir. Filtreleme sırasında (tek bir darbeye tepki) siyah bir arka plan üzerinde beyaz bir noktanın görüntüsü, tek tip gri bir kare olacaktır.

Dikdörtgen bir filtre kullanarak gürültü azaltmanın önemli bir dezavantajı vardır: filtre maskesindeki, işlenenden herhangi bir mesafedeki tüm pikseller, sonuç üzerinde aynı etkiye sahiptir. Filtreyi merkez noktanın ağırlığındaki artışla değiştirerek biraz daha iyi bir sonuç elde edilir:

.

Piksellerin sonuç üzerindeki etkisi, işlenenden uzaklaştıkça azalırsa, daha etkili gürültü azaltma elde edilebilir. Bu özellik, çekirdeği olan bir Gauss filtresine sahiptir: h(i, j) = (1/2ps2) exp(-(i2+j2)/2s2). Gauss filtresi, sonsuz boyutta sıfır olmayan bir çekirdeğe sahiptir. Bununla birlikte, filtre çekirdeğinin değeri çok hızlı bir şekilde n)'ye düşer ve bu nedenle, pratikte, (0, 0) civarında küçük bir pencereyle, örneğin pencere yarıçapını 3σ'ya eşit alarak, kişi kendini evrişimle sınırlayabilir.

Gauss filtrelemesi de yumuşatıyor. Bununla birlikte, dikdörtgen filtrenin aksine, Gauss filtreli bir noktanın görüntüsü, ortadan kenarlara doğru parlaklığı azalan simetrik bir bulanık nokta olacaktır. Görüntü bulanıklığının derecesi σ parametresi tarafından belirlenir.

Kontrast filtreleri . Yumuşatma filtreleri görüntünün yerel kontrastını azaltıp bulanıklaştırıyorsa, kontrast arttırıcı filtreler ters etki yaratır ve özünde yüksek uzamsal frekanslara sahip filtrelerdir. (0, 0)'daki destek filtresi çekirdeği, toplam değerlerin toplamı 1'e eşit olan 1'den büyük bir değere sahiptir. Örneğin, destek filtreleri, matrisler tarafından verilen bir çekirdeğe sahip filtrelerdir:

. .

Filtrenin uygulanmasına bir örnek, Şek. 17.3.1. Artan kontrast etkisi, filtrenin komşu piksellerin yoğunlukları arasındaki farkı vurgulaması ve bu yoğunlukları birbirinden kaldırması nedeniyle elde edilir. Bu etki, çekirdeğin merkezi teriminin değeri ne kadar büyük olursa o kadar güçlü olacaktır. Doğrusal kontrast iyileştirme filtrelemesinin karakteristik bir özelliği, fark edilir ışık ve kenarlarda daha az fark edilen koyu halelerdir.

Fark filtreleri diferansiyel operatörlerin ayrık yaklaşımlarıyla (sonlu farklar yöntemiyle) tanımlanan doğrusal filtrelerdir. Bu filtreler, örneğin bir görüntüdeki kenarları aramak gibi birçok uygulamada önemli bir rol oynar.

En basit diferansiyel operatör, sürekli fonksiyonlar için tanımlanan x türevi d/dx'tir. Ayrık görüntüler için benzer işleçlerin ortak değişkenleri, Prewitt ve Sobel filtreleridir:

. .

y-koordinatı d/dy'ye göre türev operatörüne yaklaşan filtreler, matrislerin transpoze edilmesiyle elde edilir.

Üç bitişik nokta üzerinden gradyan normunu hesaplamak için en basit algoritma:

G(x, y) = .

Basitleştirilmiş bir hesaplama formülü de kullanılır:

Dört bitişik nokta üzerinden bir gradyan normunun hesaplanması (Roberts operatörü):

Sobel algoritması, merkezi noktanın yakınında sekiz parlaklık örneği kullanır:

G(x, y) = , G(x, y) @ ,

Gxx, y = - ,

Gyx, y = - .

Sobel algoritması, gradyan normunun daha doğru bir tanımının yanı sıra, gradyan vektörünün yönünü, gradyan vektörü ile matris satırlarının yönü arasındaki j açısı şeklinde görüntü analiz düzleminde belirlemenize de olanak tanır:

j(x, y) = argtg(Gyx, y /Gxx, y).

Ortalama görüntü yoğunluğunu değiştirmeyen yumuşatma ve kontrast arttırıcı filtrelerin aksine fark operatörlerinin uygulanması sonucunda kural olarak ortalama piksel değeri sıfıra yakın bir görüntü elde edilir. Orijinal görüntünün dikey damlaları (kenarlıkları), ortaya çıkan görüntüde büyük modulo değerlerine sahip piksellere karşılık gelir. Bu nedenle, fark filtrelerine nesne sınırı algılama filtreleri de denir.

Yukarıdaki filtrelere benzer şekilde, diğer diferansiyel operatörler için filtreler oluşturmak için sonlu farklar yöntemi kullanılabilir. Özellikle, birçok uygulama için önemli olan diferansiyel Laplace operatörü (Laplacian) D= 𝝏2/𝝏x2 + 𝝏2/𝝏y2, ayrık görüntüler için matrisli bir filtreyle (seçeneklerden biri) yaklaşık olarak hesaplanabilir:

.

Şek. 17.3.2, ayrık Laplacian'ın uygulanması sonucunda, mutlak değerdeki büyük değerler hem dikey hem de yatay parlaklık farklılıklarına karşılık gelir. Dolayısıyla bir filtre, herhangi bir yönelimin sınırlarını bulan bir filtredir. Bir görüntüdeki kenarları bulmak, bu filtre uygulanarak ve mutlak değeri belirli bir eşiği aşan tüm pikseller alınarak yapılabilir.

Bununla birlikte, bu algoritmanın önemli dezavantajları vardır. Bunlardan en önemlisi, eşik değerinin seçilmesindeki belirsizliktir. Görüntünün farklı bölümleri için, genellikle önemli ölçüde farklı eşiklerde kabul edilebilir bir sonuç elde edilir. Ek olarak, diferansiyel filtreler görüntü gürültüsüne karşı çok hassastır.

İki boyutlu döngüsel evrişim. 1D sinyallerde olduğu gibi, 2D konvolüsyon, FFT algoritmaları kullanılarak ve 2D görüntü spektrumları ve filtre çekirdeği çarpılarak uzamsal frekans alanında gerçekleştirilebilir. Aynı zamanda döngüseldir ve genellikle kayan bir versiyonda gerçekleştirilir. Çekirdek spektrumunun sabit modelini hesaplamak için döngüselliği hesaba katarak, çekirdek filtre maskesinin boyutları eksenler boyunca ikiye katlanır ve sıfırlarla doldurulur ve aynı maske boyutları, görüntü üzerinde kayan pencereyi vurgulamak için kullanılır. hangi FFT gerçekleştirilir. Bir FFT ile bir FIR filtresi uygulamak, filtrenin geniş bir referans alanına sahip olması durumunda özellikle verimlidir.

Doğrusal Olmayan Filtreler . Sayısal görüntü işlemede, sıralama istatistiklerine dayalı doğrusal olmayan algoritmalar, çeşitli gürültü modellerinden zarar görmüş görüntüleri geri yüklemek için yaygın olarak kullanılır. Paraziti giderirken ek görüntü bozulmasını önlemenize ve ayrıca yüksek derecede parazitli görüntülerde filtrelerin sonuçlarını önemli ölçüde iyileştirmenize olanak tanırlar.

Bu komşuluk için merkezi olan bir A(x, y) görüntü öğesinin M-komşusu kavramını tanıtalım. En basit durumda, M-komşusu N-piksel içerir - merkezi olan dahil (veya dahil olmayan) filtre maskesine düşen noktalar. Bu N-elemanlarının değerleri, artan (veya azalan) düzende sıralanan bir V(r) varyasyon serisinde düzenlenebilir ve bu serinin belirli anları, örneğin, mN parlaklığının ortalama değeri hesaplanabilir. ve varyans dN. Merkezi numunenin yerini alan filtrenin çıkış değerinin hesaplanması aşağıdaki formüle göre yapılır:

B(x, y) = aА(x, y) + (1-a)mN. (17.3.2)

a = katsayısının değeri, filtre penceresindeki örneklerin istatistiklerine belirli bir bağımlılıkla ilişkilidir, örneğin:

a = dN /(dN + k dS), (17.3.3)

burada dS, bir bütün olarak görüntü üzerindeki veya S > M ve MнS için S-komşusu üzerindeki gürültü varyansıdır, k, S-komşu varyansının güven sabitidir. Bu formülden şu şekilde k=1 ve dN » dS için a » 0,5 olur ve B(x, y) = (A(x, y) + mN)/2 değeri eşit olarak toplanır. merkezi örneğin değerleri ve M komşuluğunun piksellerinin ortalama değeri. dN değerlerinin artmasıyla merkezi referans değerinin sonuca katkısı artar, azalmasıyla mN değeri artar. Ortalama değerlerin M-komşusu üzerindeki katkısının ağırlığı, k katsayısının değeri ile değiştirilebilir.

İstatistiksel işlevin seçimi ve a katsayısının buna bağımlılığının doğası oldukça çeşitli olabilir (örneğin, merkezi bir okuma ile M-komşuluğundaki okumalardaki farklılıkların varyanslarına göre) ve her ikisine de bağlıdır. filtre açıklığının boyutuna ve görüntülerin ve gürültünün doğasına bağlıdır. Özünde, a katsayısının değeri, merkezi numuneye verilen hasarın derecesini ve buna bağlı olarak M komşuluğundan numunelerin düzeltilmesi için ödünç alma fonksiyonunu belirtmelidir.

Görüntü işleme için en basit ve en yaygın doğrusal olmayan filtre türleri, eşik ve medyan filtrelerdir.

eşik filtreleme örneğin aşağıdaki gibi verilir:

B(x, y) =

Değer P filtre eşiğidir. Filtrenin merkez noktasının değeri, M-yakınındaki mN numunelerinin ortalama değerini eşik değeri kadar aşarsa, o zaman ortalama değerle değiştirilir. Eşik değeri, sabit veya işlevsel olarak merkezi noktanın değerine bağlı olabilir.

medyan filtreleme aşağıdaki gibi tanımlanır:

B(x, y) = orta (M(x, y)),

yani filtreleme sonucu, şekli filtre maskesi tarafından belirlenen komşu piksellerin medyan değeridir. Medyan filtreleme, tek tek pikselleri bağımsız olarak etkileyen bir görüntüdeki gürültüyü etkili bir şekilde kaldırabilir. Örneğin, bu tür parazitler, dijital çekim sırasında "kırık" pikseller, bazı piksellerin maksimum yoğunluğa sahip piksellerle değiştirildiği "kar" gürültüsü vb.'dir. Medyan filtrelemenin avantajı, koyu bir arka plan üzerindeki "sıcak" bir pikselin değiştirileceğidir. karanlık ve mahallenin etrafına "bulaşmamış".

Medyan filtreleme, filtre açıklığı içindeki bir sayı dizisinin monoton olmayan bir bileşeni olan dizi elemanlarına göre belirgin bir seçiciliğe sahiptir. Aynı zamanda medyan filtre, dizinin monoton bileşenini değiştirmeden bırakır. Bu özellik sayesinde, optimum şekilde seçilmiş bir açıklığa sahip medyan filtreler nesnelerin keskin kenarlarını bozulma olmadan korur, ilişkisiz veya zayıf ilişkili gürültüyü ve küçük boyutlu ayrıntıları bastırır.

Aşırı Filtreler kurallarla belirlenir:

Bmin(x, y) = min(M(x, y)),

Bmax(x, y) = maks (M(x, y)),

yani filtreleme sonucu, filtre maskesindeki minimum ve maksimum piksel değerleridir. Bu tür filtreler, kural olarak ikili görüntüler için uygulanır.

17.4. GÖRÜNTÜ SIKIŞTIRMA

Renk iletimi için piksel başına 24 bitte yaklaşık 3000×2000 çözünürlüğe sahip tipik bir görüntünün boyutu 17 megabayttır. Profesyonel cihazlar için, ortaya çıkan görüntü tarama boyutunun boyutu çok daha büyük olabilir, renk derinliği piksel başına 48 bit'e kadar çıkabilir ve bir görüntünün boyutu 200 megabayttan fazla olabilir. Bu nedenle, görüntü sıkıştırma algoritmaları, bir görüntüyü temsil eden veri miktarını azaltmak için çok önemlidir.

İki ana algoritma sınıfı vardır:

1. Kayıpsız sıkıştırma A (kayıpsız sıkıştırma), herhangi bir h - görüntü A[h] = h1 için A-1 = h'ye sahip olacak şekilde bir A-1 ters algoritması varsa. Kayıpsız sıkıştırma, GIF, PCX, PNG, TGA, TIFF gibi grafik görüntü formatlarında kullanılır ve özellikle değerli birincil bilgilerin (tıbbi görüntüler, havadan ve uzay görüntüleri vb.) işlenmesinde, en ufak bir bozulmanın bile istenmeyen olduğu durumlarda kullanılır.

2. Orijinal görüntüyü doğru bir şekilde geri yükleme yeteneği sağlamıyorsa, kayıplı sıkıştırma. A ile eşleştirilen yaklaşık görüntü kurtarma algoritması A* olarak gösterilecektir. (A, A*) çifti, görsel kaliteyi korurken yüksek sıkıştırma oranları sağlamak için seçilmiştir. Kayıplı sıkıştırma grafik formatlarında uygulanır: JPEG, JPEG2000, vb.

Tüm algoritmalar ve ifadeler, hem görüntülere hem de elemanları sonlu sayıda değer alabilen keyfi dizilere uygulanır. Aynı zamanda, herhangi bir veri setini kayıpsız sıkıştırabilen ideal algoritmaların olmadığı da göz önünde bulundurulmalıdır.

Uzunluk Kodlama (RLE) Algoritmalarını Tekrarla basit bir ilkeye dayanmaktadır: orijinal dizinin yinelenen öğe gruplarını bir çiftle (nicelik, öğe) veya yalnızca bir nicelikle değiştirmek.

bit seviyesi. Orijinal verileri, örneğin siyah beyaz bir görüntüyü temsil eden bir bit dizisi düzeyinde ele alacağız. Genellikle arka arkaya birkaç 0 veya 1 vardır ve ardışık özdeş basamakların sayısı kodlanabilir. Ancak tekrar sayısı da bit olarak kodlanmalıdır. Her tekrar sayısının 0'dan 7'ye (3 bitlik kod) değiştiği, birler ve sıfırların kod sırasını değiştirdiği düşünülebilir. Örneğin diziler 7 0 4 sayılarıyla karşılaştırılabilir, yani 7 birler, 0 sıfırlar, 4 birler yeni bir yıla girerken - Özdeş bitlerin dizileri ne kadar uzunsa, etki o kadar büyük olur. Böylece, 21 bir, 21 sıfır, 3 bir ve 7 sıfırdan oluşan bir dizi şu şekilde kodlanır: , yani 51 bitlik orijinal diziden, 36 bitlik bir diziye sahibiz.

Bayt düzeyi. Girdinin, piksel yoğunluk değeri için 1 bayt tahsis edilen gri tonlamalı bir görüntü olduğunu varsayalım, aynı bitlerden oluşan uzun bir zincir beklentisi önemli ölçüde azalır.

Girdi akışını baytlara ayıracağız (0 ila 255 arası kod) ve tekrarlanan baytları bir çift (sayı, harf) olarak kodlayacağız. Tek bir bayt değiştirilemez. Böylece, AABBBCDAA baytları (2A) (3B) (C) (D) (2A) kodlar.

Bununla birlikte, algoritmanın etkili olduğu dizilerin alt sınıfı nispeten dar olduğundan, bu algoritmanın modifikasyonları nadiren kendi başlarına kullanılır (örneğin, PCX formatında). Daha sıklıkla sıkıştırma boru hattının aşamalarından biri olarak kullanılırlar.

Sözlük Algoritmaları gelen dizinin sadece bir elemanını kodlamak yerine, bir elemanlar zincirinin kodlaması gerçekleştirilir. Bu, yenilerini kodlamak için (giriş sırasından oluşturulan) bir dizi sözlüğü kullanır.

LZ77 algoritması, sözlük kullanan ilk algoritmalardan biriydi. Dizinin önceden kodlanmış son N elemanı sözlük olarak kullanılır. Sıkıştırma sırasında, sözlük altdizisi, gelen dizinin üzerinde "kayar". Çıktıdaki elemanlar zinciri şu şekilde kodlanır: işlenmiş elemanlar zincirinin eşleşen kısmının sözlükteki konumu - ofset (mevcut konuma göre), uzunluk, zincirin eşleşen kısmını takip eden ilk eleman. Eşleşen zincirin uzunluğu yukarıdan n sayısıyla sınırlıdır. Buna göre görev, sözlükten işlenen diziyle eşleşen en büyük dizeyi bulmaktır. Eşleşme yoksa, ofset sıfır, uzunluk bir ve kodlanmamış dizinin ilk öğesi yazılır.

Yukarıda açıklanan kodlama şeması, iki bölümden oluşan bir kayan pencere kavramına yol açar:

N-sözlük uzunluğunda zaten kodlanmış öğelerin bir alt dizisi - arama arabelleği;

Bir eşleşme bulmaya çalışılacak olan elemanlar zincirinden n uzunluğundaki alt dizi, ileriye dönük arabellektir.

Sıkıştırılmış bir dizinin kodunun çözülmesi, kaydedilen kodların kodunun çözülmesidir: her giriş, bir sözlükten bir dize ve açıkça yazılmış bir öğe ile eşleştirilir, ardından sözlük kaydırılır. Kod çözme algoritması çalışırken sözlük yeniden oluşturulur.

Bu algoritma, bütün bir algoritma ailesinin atasıdır. Avantajları, yeterince büyük dizilerde makul derecede sıkıştırma ve hızlı açma içerir. Dezavantajları, alternatif algoritmalara göre yavaş sıkıştırma hızı ve daha düşük sıkıştırma oranıdır.

LZW algoritması. Bu algoritmadaki sözlük, algoritma çalışırken eleman zincirleriyle dolu bir tablodur. Sıkıştırma işlemi, sözlüğe önceden yazılmış en uzun dizeyi arar. Sözlükte yeni bir öğe dizisi bulunamadığında sözlüğe eklenir ve dizenin kodu kaydedilir. Teorik olarak, tablonun boyutunun bir sınırı yoktur, ancak boyut sınırı, gereksiz (olmayan) zincirler biriktiği için sıkıştırma oranını artırır. Bir tabloda ne kadar fazla giriş varsa, mağaza kodlarına o kadar fazla bilgi tahsis edilmesi gerekir.

Kod çözme, kodların doğrudan çözülmesinden, yani bir sözlüğün oluşturulmasından ve karşılık gelen zincirlerin çıktısından oluşur. Sözlük, kodlayıcıdakiyle aynı şekilde başlatılır. Algoritmanın avantajları, hem sıkıştırma hem de kod çözme olmak üzere yüksek derecede sıkıştırma ve oldukça yüksek bir hız içerir.

Entropi kodlama algoritmaları dizinin her elemanına, uzunluğu elemanın meydana gelme olasılığına karşılık gelecek şekilde bir kod atayın. Sıkıştırma, orijinal dizinin aynı uzunluğa sahip öğelerini (her öğe aynı sayıda biti kaplar) farklı uzunluklardaki öğelerle, olasılığın negatif logaritmasıyla orantılı olarak, yani diğerlerinden daha sık meydana gelen öğelerle değiştirerek gerçekleşir. daha küçük uzunlukta kod.

Huffman algoritması, özel bir özelliği olan değişken uzunluklu bir önek kodu kullanır: daha kısa kodlar, daha uzun olanların önekiyle (ilk kısım) eşleşmez. Böyle bir kod, bire bir kodlamaya izin verir. Sıkıştırma işlemi, girdi dizisinin her öğesini kendi koduyla değiştirmekten oluşur. Bir dizi kodun oluşturulması genellikle sözde kullanılarak gerçekleştirilir. kod ağaçları.

Huffman'ın algoritması iki geçişlidir. Görüntüden ilk geçiş, bir eleman ağırlıkları tablosu oluşturur ve ikinci geçiş sırasında kodlama gerçekleşir. Sabit tablo algoritmasının uygulamaları vardır. Huffman algoritmasının uyarlanabilir modifikasyonları kullanılırken, alfabenin öğelerinin apriori olasılık dağılımının bilinmediği, çünkü tüm dizi bir kerede mevcut olmadığı için sık sık olur.

Kayıplı görüntü sıkıştırma. Görüntüleri depolamak için gereken bilgi miktarı genellikle fazladır. Genel amaçlı algoritmalar olan klasik algoritmalar, sıkıştırılan bilginin bir görüntü - iki boyutlu bir nesne olduğunu hesaba katmaz ve yeterli derecede sıkıştırma sağlamaz.

Kayıplı sıkıştırma, insanın görüntü algısının özelliklerine dayanır: belirli bir renk dalgaları aralığında en yüksek hassasiyet, küçük bozulmaları fark etmeden görüntüyü bir bütün olarak algılama yeteneği. Kayıplı sıkıştırma algoritmalarının odaklandığı ana görüntü sınıfı, fotoğraflar, yumuşak renk geçişlerine sahip görüntülerdir.

Görüntü kaybı tahmini. Görüntülerdeki kayıpları, sıkıştırılmış olanlardan geri yükledikten (kod çözme) sonra tahmin etmek için birçok önlem vardır, ancak hepsi için, fark ölçüleri yeterince büyük olacak şekilde iki görüntü seçilebilir, ancak farklar neredeyse algılanamaz olacaktır. göz. Ve tam tersi - gözle büyük ölçüde farklılık gösteren, ancak küçük bir fark ölçüsüne sahip olan görüntüleri alabilirsiniz.

Standart sayısal kayıp ölçüsü, genellikle yeniden oluşturulmuş görüntünün piksel değerlerinin orijinalinden standart sapmasıdır (RMS). Ancak, kayıp değerlendirmesinin en önemli "ölçüsü" gözlemcinin görüşüdür. Bir gözlemci ne kadar az fark (veya daha iyisi, bunların yokluğu) tespit ederse, sıkıştırma algoritmasının kalitesi o kadar yüksek olur. Kayıplı sıkıştırma algoritmaları genellikle kullanıcının "kayıp" veri miktarını seçmesine izin verir, yani sıkıştırılmış görüntünün kalitesi ve boyutu arasında seçim yapma hakkı. Doğal olarak, daha yüksek bir sıkıştırma oranında görsel kalite ne kadar iyiyse, algoritma da o kadar iyi olur.

Fourier dönüşümü. Genel durumda, görüntü, son raster noktalarında tanımlanan iki değişkenin bir fonksiyonu olarak düşünülebilir. Sabit bir sonlu tarama noktası üzerindeki bu tür fonksiyonların kümesi, sonlu boyutlu bir Öklid uzayı oluşturur ve bunlara ayrık Fourier dönüşümü, yani görüntünün spektral gösterimi uygulanabilir. Sağlar:

Spektrum katsayılarının korelasyonsuzluğu ve bağımsızlığı, yani bir katsayının temsilinin doğruluğu diğerine bağlı değildir.

- Enerji sıkıştırması. Dönüşüm, temel bilgileri az sayıda katsayıda saklar. Bu özellik en çok fotogerçekçi görüntülerde belirgindir.

Spektral temsil katsayıları, görüntünün uzamsal frekanslarının genlikleridir. Düzgün geçişlere sahip görüntüler söz konusu olduğunda, bilgilerin çoğu düşük frekanslı spektrumda bulunur.

Kullanılan sıkıştırma algoritması JPEG biçimi, ayrık kosinüs Fourier dönüşümü kullanılarak oluşturulmuştur. Algoritmadaki sıkıştırma şeması, bu dönüşümün aşamalardan yalnızca biri olduğu, ancak ana aşamalardan biri olduğu bir boru hattıdır. Algoritma aşağıdaki ana işlemleri içerir:

1. YCbCr renk uzayına aktarın. Burada Y, luma bileşenidir, Cb ve Cr, krominans bileşenleridir. İnsan gözü parlaklığa renkten daha duyarlıdır. Bu nedenle, Y'yi iletirken Cb ve Cr'yi iletirken olduğundan daha fazla doğruluk sağlamak daha önemlidir.

2. Ayrık kosinüs dönüşümü (DCT). Görüntü 8×8 bloğa bölünmüştür, her bloğa (Y, Cb ve Cr bileşenleri için ayrı ayrı) ayrı bir kosinüs dönüşümü uygulanır.

3. DCT matrislerinde yüksek frekanslı bileşenlerin azaltılması. İnsan gözü, yüksek frekans bileşenlerindeki değişiklikleri neredeyse hiç fark etmez, bu nedenle, yüksek frekanslardan sorumlu katsayılar daha az doğrulukla saklanabilir.

4. Matrislerin zikzak sıralaması. Bu, tek boyutlu bir dizi elde etmek için özel bir matris geçişidir. Önce T00 öğesi, ardından T01, T10, T1 gelir.Ayrıca, tipik fotogerçekçi görüntüler için, önce düşük frekans bileşenlerine karşılık gelen sıfır olmayan katsayılar ve ardından çok sayıda sıfır (yüksek frekans bileşenleri) olacaktır.

5. Önce RLE yöntemiyle, ardından Huffman yöntemiyle sıkıştırma.

Görüntü kurtarma algoritması ters sırada çalışır. Sıkıştırma oranı 5 ila 100 veya daha fazladır. Aynı zamanda, fotogerçekçi görüntülerin çoğu için görsel kalite, 15 kata kadar sıkıştırıldığında iyi seviyede kalır. Algoritma ve format, tam renkli görüntülerin aktarılması ve saklanması için en yaygın olanlardır.

Dalgacık dönüşümü sinyalleri, klasik Fourier dönüşümünün bir genellemesidir. İngilizce'den tercüme edilen "dalgacık" (dalgacık) terimi "küçük (kısa) dalga" anlamına gelir. Dalgacıklar, matematiksel fonksiyon aileleri için genelleştirilmiş bir isimdir. belli bir biçim zaman ve frekansta yerel olan ve tüm fonksiyonların zaman ekseni boyunca kaymaları ve açılımları yoluyla tek bir temel fonksiyondan elde edildiği.

Kayıplı sıkıştırma algoritmalarında, kural olarak, değiştirme ile sıkıştırma boru hattının tüm işlemleri ayrık dönüşüm Ayrık dalgacık dönüşümünde Fourier. Dalgacık dönüşümleri çok iyi bir frekans-uzamsal lokalizasyona sahiptir ve bu göstergede geleneksel Fourier dönüşümlerini geride bırakır. Bu durumda, sonraki sıkıştırma için dizinin özelliklerini iyileştirerek daha güçlü niceleme uygulamak mümkün hale gelir. Aynı sıkıştırma oranıyla bu dönüşüme dayalı görüntü sıkıştırma algoritmaları, görüntü kalitesinin korunmasında daha iyi sonuçlar verir.

edebiyat

46. ​​​​ve diğerleri Dijital görüntü işlemede hızlı algoritmalar. - M.: Radyo ve iletişim, 1984. - 224 s.

47. Soyfer görüntü işleme. Bölüm 2. Yöntemler ve algoritmalar. - Soros Eğitim Dergisi No. 3, 1996.

48. Derece istatistiklerini kullanan doğrusal olmayan algoritmalara dayalı görüntülerden kıkırdak gürültüsü. - Yaroslavski Devlet Üniversitesi, 2007.

49. Andreev televizyon izleme sistemleri. Bölüm II. Aritmetik - mantıksal temeller ve algoritmalar. Öğretici. - St.Petersburg: St.Petersburg, GUITMO, 2005. - 88s.

51. Sayısal Sinyal İşleme (Matematiksel Temeller) - M.: Moskova Devlet Üniversitesi, Bilgisayar Grafikleri ve Multimedya Laboratuvarı, 2002. - http://pv. *****/dsp/dspkurs. pdf, http://dsp-kitap. *****/dspkurs. djvu, http://geogin. *****/archiv/dsp/dsp4.pdf.

1i. ve raster grafiklerin diğer Algoritmik temelleri. – İnternet Bilgi Teknolojileri Üniversitesi. – http://www. *****/goto/kurs/rastergraf/

2i. Lukin-Elektronik Sistemler: Ders Notları. ITMO, 2004. - St. Petersburg, ITMO IFF, 2004. - http://iff. *****/kons/oes/KL. htm

Fark edilen hatalar ve ekleme önerileri hakkında: *****@***ru.

telif hakkı©2008DavydovA.V.

Dijital gürültü, bir piksel boyutuna yakın ve orijinal görüntüden parlaklık veya renk bakımından farklı olan rastgele yerleştirilmiş alanların olduğu bir görüntü kusurudur. Gürültü azaltma, video dizilerinin ve görüntülerin iletilmesinde, işlenmesinde ve sıkıştırılmasında önemli bir rol oynar.

Video paraziti birkaç nedenden dolayı oluşabilir:

1. Kusurlu video yakalama ekipmanı.

2. Kötü çekim koşulları - gece fotoğraf/video çekimi, sert hava koşullarında çekim gibi.

3. Analog kanallar üzerinden iletim sırasında parazit - elektromanyetik alan kaynaklarından kaynaklanan girişim, iletim hattının aktif bileşenlerinin (amplifikatörlerin) içsel gürültüsü. Bir örnek, bir televizyon sinyalidir.

4. Bir analog bileşik sinyalden vb. parlaklık ve renk farkı sinyallerini çıkarırken filtreleme hataları.

Bir görüntüdeki parazit miktarı, iyi ışıkta çekilmiş bir dijital fotoğraftaki neredeyse algılanamayan bir lekeden, gürültünün görüntünün çoğunu gizlediği astronomik fotoğraflara kadar değişebilir. kullanışlı bilgi, yalnızca zahmetli görüntü işleme ile elde edilebilir.

Görüntüdeki gürültünün rastgele dağılımının doğasına bağlı olarak gürültü farklı tiplerde olabilir. Uygulamada, en yaygın türler şunlardır:

Beyaz Gauss gürültüsü

En yaygın gürültülerden biri, bir görüntünün her pikseline normal dağılıma ve sıfır ortalamaya sahip değerlerin eklenmesiyle karakterize edilen ek Gauss gürültüsüdür. "Ek" terimi, bu tip gürültünün faydalı sinyale eklendiği anlamına gelir. Sinyal alım koşulları zayıf olduğunda oluşur.

dijital gürültü

Dijital gürültünün nedeni çoğunlukla çekim için kullanılan ekipmanın özellikleriyle ilişkilidir - genellikle matrisin yetersiz ışık duyarlılığı ile. Bu gürültü türü, görüntüdeki bazı piksellerin sabit veya rastgele bir değişkenin değerleri ile değiştirilmesi ile karakterize edilir. Noktaların parlaklığı yaklaşık olarak eşitse, dijital gürültüye "dürtüsel" de denir. Noktaların yoğunluğu siyahtan beyaza değişebiliyorsa bu gürültüye tuz ve biber gürültüsü denir.

Tipik olarak, bu tür gürültü bir görüntüdeki yalnızca az sayıda pikseli etkiler.

Kombine gürültü

Eşit hacimdeki bir görüntünün Gauss gürültüsü ve rastgele darbelerle gürültülü olduğu durumlar çok daha az yaygındır. Bu kümeye birleşik gürültü denir.

Görüntü Tarama Hataları

Görüntüde çatlak, çizik, morluk gibi dış etkiler de görünebilir. Bu eserler homojen bir yapıya sahip değildir, şekillerinin ve konumlarının tanımı temel olarak matematiksel analizlerin ötesindedir. Bu tür kusurlarla yalnızca manuel görüntü işleme yardımıyla mücadele edilebilir; bu nedenle bu yazıda ele alınmamıştır.

Gürültü Giderme Algoritmaları

Görüntülerdeki gürültüyü gidermek için çok sayıda algoritma vardır ve bunlar yalnızca özel işleme programları tarafından değil, bazı fotoğraf ve video kameralar tarafından da kullanılabilir. Buna rağmen, hala evrensel bir filtreleme algoritması yoktur, çünkü bir görüntüyü işlerken, her zaman istenmeyen etkilerin ortadan kaldırılması derecesi ile gürültüye benzer özelliklere sahip küçük detayların korunması arasında seçim yapma ihtiyacı vardır. Ek olarak, bir gürültü türüyle kolayca başa çıkan bir algoritma, görüntüyü yalnızca başka bir gürültü türüyle bozabilir.

En iyi bilinen görüntü paraziti azaltma algoritmalarından bazılarını ele alalım.

Doğrusal piksel ortalaması

Gürültü giderme için en basit fikir, uzamsal komşuluktaki piksel değerlerinin ortalamasını almaktır. Gürültü pikselden piksele bağımsız olarak değiştiği için, bitişik piksellerin gürültüsü toplandığında birbirini yok edecektir. Görüntünün her pikseline sırayla bindirilen dikdörtgen bir pencere ayarlanır. Merkezi pikselin değeri, pencere alanına düşen tüm komşu piksellerin analizine dayalı olarak hesaplanır. Buna göre, alınan pencere ne kadar büyük olursa, sonunda o kadar fazla ortalama değer elde edilecek ve bu da güçlü bir bulanıklaştırma etkisine yol açacaktır.

En basit versiyonda, komşu piksellerin analizi onların aritmetik ortalamasını bulmaktır. Dikkate alınan alanla aynı alana ait olmayan piksellerin etkisini azaltmak için (örneğin, açık renkli bir arka plan üzerinde koyu bir kontur), belirli bir sayısal eşik getirebilir ve yalnızca farkı olan komşuları hesaplarken dikkate alabilirsiniz. merkezi piksel bu eşiği aşmaz. Eşik değeri ne kadar büyük olursa, ortalama alma o kadar güçlü olur. Ele alınan varyant, incelenen alanın merkezinden uzaklığına bağlı olarak her bir komşu piksel için ağırlık katsayıları getirilerek karmaşık hale getirilebilir.

Bu yöntem, video akışının bitişik kareleri üzerindeki her bir pikselin ortalaması alınarak zaman alanında da uygulanabilir (her pikselin ortalaması, bitişik karelerde aynı konumda bulunan pikseller üzerinden alınacaktır).

Bu algoritma çok basittir, ancak iyi bir sonuç vermez, aynı zamanda görüntü ayrıntılarının güçlü bir şekilde bulanıklaşmasına neden olur.

Gauss filtresi

Önceki yönteme benzer bir çalışma prensibine sahiptir ve aynı zamanda kenar yumuşatma filtrelerinin sayısına aittir. Bununla birlikte, doğrusal bir ortalama alma filtresi kullanan gürültü azaltmanın önemli bir dezavantajı vardır: işlenen pikselin tüm komşuları, uzaklıklarına bakılmaksızın sonuç üzerinde aynı etkiye sahiptir. Gauss filtresi ayrıca merkezi pikselin ve belirli bir alandaki komşularının ortalamasını alır, ancak bu, Gauss işlevi tarafından belirlenen belirli bir yasaya göre gerçekleşir.

Burada y parametresi bulanıklığın derecesini belirtir ve A parametresi normalleştirmeyi sağlar. Sonuç olarak, incelenen alanın merkezi pikseli, Gauss dağılımının zirvesine karşılık gelen en yüksek değere sahip olacaktır. Kalan elemanların değerleri, merkezden uzaklaştıkça daha az etkiye sahip olacaktır.

Belirtilen formülle hesaplanan matris filtresine Gauss denir; boyutu ne kadar büyük olursa, bulanıklık o kadar güçlü olur (sabit bir y için). Bu filtre ayrılabilir olduğundan, şu şekilde temsil edilebilir:

Evrişimin, büyük filtre boyutları için yöntemin önemli ölçüde hızlanmasına yol açan sıralı olarak satırlar ve sütunlar halinde gerçekleştirilebileceği sonucu çıkar.

2Dcleaner algoritması

Görüntüdeki her pikseli, bir yarıçapla sınırlanmış bir alanda alınan komşu piksellerin ortalama değeriyle değiştirir. Bu durumda, yarıçap içinde kalan tüm noktalar dikkate alınmaz, yalnızca değeri merkezi pikselden önceden belirlenmiş bir değerden (eşik) daha fazla farklı olmayan noktalar dikkate alınır. Bu nedenle, tekdüze renkli alanlar, nesnelerin keskin kenarlarından daha fazla bulanıklaşır. Bu, ince ayrıntıları olduğu gibi tutarken görüntüdeki düşük seviyeli gürültüyü azaltır.

medyan filtreleme

Doğrusal algoritmalar, komşu pikseller, bazı rastgele değer dağılımlarına sahip olmalarına rağmen, ait oldukları alanın bazı ortalama değer özellikleri içinde kaldıklarında, Gauss gürültüsünü bastırmada çok etkili olmaktadır. Ancak, bazen diğer parazit türleri tarafından bozulan görüntülerle uğraşmanız gerekir. Bu tür girişimin bir örneği, görüntüde rastgele dağılmış rastgele parlaklık noktalarının varlığında kendini gösteren dürtü gürültüsüdür. Bu durumda ortalama alma, bu tür her bir noktayı komşu piksellere "lekeler" ve görüntü kalitesinde bozulmaya yol açar.

Medyan filtreleme, dürtü gürültüsünü bastırmanın standart yoludur. Bu doğrusal olmayan görüntü işleme yöntemi ani artışları ortadan kaldırır ancak doğrusal ortalama alma algoritmalarının aksine monoton piksel dizilerini olduğu gibi bırakır. Bu nedenle, medyan filtreler, nesnelerin dış hatlarını ve farklı parlaklıktaki alanlar arasındaki farklılıkları bozulmadan koruyabilirken, ilişkisiz gürültüyü ve küçük boyutlu ayrıntıları etkili bir şekilde bastırır.

Filtreleme ilkesi: Görüntünün her pikselinin üzerine sıralı olarak bindirilmiş, tek boyutlu belirli bir pencere ayarlanır. Merkezi olan da dahil olmak üzere, söz konusu alana düşen tüm pikseller arasında, sonunda alanın merkezi pikseline atanan medyan değer aranır. Bu durumda medyan, bölgeye ait sıralanmış piksel değerleri dizisinin orta elemanıdır. Tek pencere boyutu tam olarak ortadaki pikselin varlığını sağlamak için seçilir.

Görüntüdeki beyaz Gauss gürültüsünü bastırmak için medyan filtre kullanmak da mümkündür. Bununla birlikte, medyan filtreleme kullanılarak gürültü bastırma üzerine yapılan bir çalışma, bu sorunu çözmedeki etkinliğinin doğrusal filtrelemeden daha düşük olduğunu göstermektedir.

Medyan filtreleme, çoğu gürültü azaltma filtresinin doğasında olan bir dezavantaj değildir - gürültü azaltma derecesini iyileştirmek için maske boyutu artırıldığında, görüntü keskinliği azalır ve konturları bulanıklaşır. Bununla birlikte, dinamik bir maske boyutuyla medyan filtreleme uygulayarak olumsuz etkileri en aza indirmek mümkündür (toplu medyan filtreleme) Prensibi aynı kalır, komşu piksellerin parlaklığına bağlı olarak yalnızca filtreleme kayan penceresinin boyutu değişebilir.

görüntü keskinleştirme

Görüntüdeki gürültüyü azaltmaya yönelik hemen hemen tüm algoritmalar, görüntünün bulanıklaşmasına neden olur, sonuç olarak küçük ayrıntılar kaybolur ve görüntünün algılanması zordur. Görüntü keskinleştirme filtresi, bu olumsuz etkiyi kısmen telafi etme ve kaybolan kontur kontrastını ve renk geçişlerini geri yükleme yeteneğine sahiptir. Keskinlik, diğer birçok faktöre de bağlı olabilir - merceğin kalitesine, kullanılan diyaframa, çoğu dijital kameranın matrisinde bulunan ve görüntüyü değişen derecelerde bulanıklaştıran hare önleyici filtrenin kalınlığına. Ayrıca, boyutları küçültüldükten sonra görüntülerin keskinliğinin genellikle artırılması gerekir, çünkü bu durumda bilgilerin bir kısmı ve bununla birlikte konturların keskinliği de kaçınılmaz olarak kaybolur.

Keskin olmayan maskeleme, bir görüntüdeki tonlar arasındaki geçişlerin kontrastını artırarak, keskinleştirme yanılsaması nedeniyle görsel algıyı iyileştiren bir tekniktir. Aslında keskinlik aynı seviyede kalıyor çünkü prensipte görüntünün kaybolan ayrıntılarını geri yüklemek imkansız, ancak farklı parlaklıktaki alanlar arasındaki kontrastı iyileştirmek görüntünün daha net algılanmasına yol açıyor.

Şekil 5.1 - "Konturun keskinliği" kavramının gösterimi

Görüntünün keskinliği, konturlarını oluşturan alanlar arasındaki parlaklık farkının büyüklüğüne (W) ve bu farktaki değişimin keskinliğine (H) bağlıdır.

Keskin olmayan maskeleme tekniği ilk olarak film fotoğraflarının işlenmesinde uygulandı. Dijital görüntü işleme için uyarlanan yöntem, orijinalinden çok az farklıdır: "keskin olmayan maske" adı verilen görüntüden çıkarılır - bulanık ve ters çevrilmiş kopyası. Sonuç, yalnızca orijinalin hafif ana hatlarını içeren yeni bir görüntüdür. Sonuç tersine çevrilerek koyu konturlar elde edilebilir.

Orijinal görüntüden koyu kenarları daha da çıkarır ve açık kenarlar eklerseniz, her parlaklık farklılığında kontrastta önemli bir artış elde edersiniz.

Gauss filtresi gibi gürültü azaltma filtrelerinden herhangi biri, "keskin olmayan bir maske" elde etmek için orijinali bulanıklaştırmak için kullanılabilir.

Şekil 5.2 - Keskin olmayan maskeleme uygulamasının sonucu

Evrişim işlemi, görüntü işlemede oldukça sık kullanılır. Keskinleştirmeye ek olarak, bulanıklaştırma, parlaklığı artırma, aydınlatma vb. için kullanılır.

Görüntü evrişimi, çevreleyen komşu piksellerin değerlerini dikkate alan belirli bir pikselin yeni bir değerini hesaplama işlemidir. Genel anlamda bu terim, görüntünün her bir parçası üzerinde gerçekleştirilen bazı eylemler anlamına gelir.

Evrişimin ana unsuru evrişim maskesidir - bu bir matristir (isteğe bağlı boyut ve en boy oranına sahip). Genellikle böyle bir maskeye filtre, çekirdek, şablon veya pencere denir. Matris elemanlarının değerlerine genellikle katsayılar denir.

Çoğu zaman, evrişim çekirdeği olarak bir kare matris kullanılır.

Evrişim işlemiyle görüntü işleme şu şekilde gerçekleşir: "Çapa" olarak adlandırılan matrisin merkezi öğesi, görüntünün her pikseli üzerine art arda bindirilir. Ele alınan pikselin yeni değeri, komşu piksellerin değerlerinin toplamının karşılık gelen evrişim maskesi katsayılarıyla çarpımı olarak hesaplanır.

Ortaya çıkan etki, seçilen evrişim çekirdeğine bağlıdır.

Yükseltme filtresi çekirdeği, (0, 0) noktasında 1'den büyük bir değere sahiptir ve tüm değerlerin toplamı 1'e eşittir. Örneğin, bir destek filtresi, matrisler tarafından verilen çekirdeklere sahip filtrelerdir :

Artan kontrast etkisi, filtrenin komşu piksellerin yoğunlukları arasındaki farkı vurgulaması ve bu yoğunlukları birbirinden kaldırması nedeniyle elde edilir. Bu etki, çekirdeğin merkezi teriminin değeri ne kadar büyük olursa o kadar güçlü olacaktır.

Evrişim tabanlı doğrusal kontrastla geliştirilmiş filtreleme, görüntü kenarlarında görünür renk halelerine neden olabilir.

Işık farkı telafisi

Görüntü aydınlatma sorunları çoğunlukla pencereler, güneş veya diğer düzensiz ışık kaynakları çerçeveye girdiğinde ortaya çıkar.

Bu duruma "fazla ışık" denir ve çok parlak payanda aydınlatması nedeniyle, çok parlak nesnelerin arka planında bulunan nesnelerin detaylarının ve renklerinin kaybolmasına, ayırt edilmesinin zorlaşmasına yol açar.

Işık eksikliği durumu da sıklıkla karşımıza çıkmaktadır. Yetersiz aydınlatmaya sahip karanlık odalarda çekim yapılmasının yanı sıra video ekipmanının sınırlı bir hassasiyet aralığına sahip olması buna neden olabilir.

Tek Ölçekli Retinex Algoritması

Her pikselin parlaklığını sabit bir değer kadar artırarak görüntüyü aydınlatmaya çalıştığınızda, başlangıçta aydınlık alanlar tamamen fazla pozlanmış olabilir.

Bu gibi durumlarda, aydınlık alanları karanlık olanlardan daha az işleyerek görüntüdeki aydınlatmayı eşitleyebilecek “akıllı” renk düzeltmesinin uygulanması gerekir.

Bu gereksinimler, retina reseptörlerinin ilkelerine dayanan Tek Ölçekli Retinex algoritması tarafından karşılanır. Algoritmanın temel amacı, görüntüyü aydınlatma ve ayrıntılardan ayrı ayrı sorumlu olan bileşenlere ayırmaktır. Görüntüdeki sorunlar sahnenin aydınlatmasıyla ilgili olduğundan, aydınlatmadan sorumlu bileşeni aldıktan sonra, onu görüntüden ayrı dönüştürmek mümkün hale gelir ve böylece kalitesini önemli ölçüde artırır.

Herhangi bir görüntü, yüksek frekanslı bir sinyalin (yansıma - R) ve düşük frekanslı bir sinyalin (aydınlık - I) bir ürünü olarak temsil edilebilir.

S(x,y) = I(x,y) * R(x,y)(5.6)


Şekil 5.3 - Retinex algoritmasında görüntü gösterimi.

Aydınlatmanın yaklaşık bir görüntüsü, düşük geçişli filtreleme kullanılarak elde edilebilir - başka bir deyişle, orijinal görüntüyü, örneğin bir Gauss filtresiyle basitçe bulanıklaştırın.

burada G -- Gauss filtresi

Sinyalin logaritması frekansı değiştirmediğinden ve logaritmik fonksiyonun özelliklerinden dolayı (çarpımın logaritması, faktörlerin logaritmalarının toplamına eşittir), sinyallerin çarpımını ayırma görevi olabilir. sinyallerin toplamını ayırma problemine basitleştirilmiştir.

Bundan sonra, orijinal genlik ölçeğine geri döndürmek için yalnızca alınan sinyalden üs almak kalır. Ortaya çıkan yüksek frekans bileşeni, yeni bir aydınlatma modeli görevi gören bulanık ve parlak orijinal görüntüye eklenebilir.

Işık eşitlemesinden elde edilen etki çok güçlü olabilir (karanlık alanlar, aydınlık olanlarla aynı parlaklığa sahip olacaktır). Efekti azaltmak için, işlenmiş görüntüyü orijinalle belirli bir oranda karıştırmanız yeterlidir.

Gamma düzeltmesi

Gama düzeltmenin orijinal amacı, farklı çıkış aygıtlarında görüntülenen renklerdeki farklılıkları telafi etmektir, böylece görüntü farklı monitörlerde görüntülendiğinde aynı görünür. Uygulanan güç işlevinin doğrusal olmayan biçimi nedeniyle, gama düzeltmesi, parlak ayrıntıları vurgulamadan ve görüntü nesnelerinin sınırlarının görünürlüğünü kaybetmeden görüntünün karanlık alanlarının kontrastını artırmayı da mümkün kılar.

Televizyonda olduğu kadar televizyonda da analog biçimde parlaklık bilgisi dijital form en yaygın grafik formatlarında, doğrusal olmayan bir ölçekte saklanır. Bir monitör ekranındaki bir pikselin parlaklığı orantılı olarak kabul edilebilir.

burada I, görüntü ekranındaki pikselin parlaklığıdır (veya ayrı ayrı kırmızı, yeşil ve mavi renk bileşenlerinin parlaklığıdır),

V, 0'dan 1'e kadar sayısal bir renk değeridir ve

r -- gama düzeltme indeksi .

r 1'den küçükse, seviye aktarım özelliği dışbükey olacak ve ortaya çıkan görüntü orijinalinden daha açık olacaktır. r 1'den büyükse, seviye aktarım özelliği içbükey olacak ve ortaya çıkan görüntü orijinalinden daha koyu olacaktır.

Varsayılan olarak, r parametresi 1'dir ve seviyelerin doğrusal iletimine karşılık gelir ve gama düzeltmesi yoktur.

Görüntü konturu seçimi

Kontur analizi, harici ana hatlar olarak temsil edilen grafik nesneleri tanımlamak, tanımak, karşılaştırmak ve aramak için kullanılabilir. Konturların kullanılması, nesnenin iç noktalarını dikkate almadığından, bu, bu işlemlerin hesaplama ve algoritmik karmaşıklığını önemli ölçüde azaltabilir.

Şekil 5.4 - r parametresine bağlı olarak güç fonksiyonunun türünün değiştirilmesi

Bir nesnenin ana hatları, görüntüde nesneyi arka plandan ayıran bir eğriyi temsil eden noktaların listesidir. Çoğu zaman, kontur boyunca parlaklıkta veya renkte bir sıçrama olur.

Görüntüdeki kontur aramayı basitleştirmek için görüntüyü önceden ikili hale getirebilirsiniz.

Sobel filtresi, nesnelerin kenarlarını parlaklıklarına göre vurgular. Renk bileşeni dikkate alınmadığı için görüntülerin öncelikle gri tonlamaya dönüştürülmesi gerekir.

Sobel filtresi, parlaklık gradyanının yaklaşık değerini hesaplayarak her piksele sırayla uygulanır. Her görüntü noktası için gradyan (parlaklık fonksiyonu), bileşenleri görüntü parlaklığının yatay ve dikey türevleri olan iki boyutlu bir vektördür.

Görüntünün her noktasında, gradyan vektörü, parlaklıktaki en büyük artış yönünde yönlendirilir ve uzunluğu, parlaklıktaki değişim miktarına karşılık gelir. Bu veriler, belirli bir nesnenin sınırında dikkate alınan noktayı bulma olasılığı ve bu sınırın yönü hakkında bir varsayım yapmamızı sağlar.

O. Sobel operatörünün sabit parlaklık bölgesindeki bir noktada çalışmasının sonucu bir sıfır vektörü ve farklı parlaklıktaki bölgelerin sınırında uzanan bir noktada - sınırı artan parlaklık yönünde geçen bir vektör olacaktır.

Görüntüdeki her noktadaki türevlerin yaklaşık değerlerini hesaplamak için Sobel filtresi 3×3 matrisli bir evrişim kullanır.

Sobel matris katsayıları:

Gradyanın nihai değeri, aşağıdaki formüle göre yaklaşık olarak hesaplanır:

|G| = |Gx| + |Gy|

Kenny Sınır Dedektörü

Kenny'nin çalışması, bilgisayar görüşünün ilk günlerinde (1986) yapılmış olmasına rağmen, Kenny'nin kenar dedektörü bugün hala en iyi dedektörlerden biridir. Kenny'nin yöntemi çok aşamalı bir algoritmadır ve aşağıdaki adımları içerir:

1. Görüntüyü gürültüden ve gereksiz ayrıntılardan arındırma.

2. Görüntüyü gürültüden ve gereksiz ayrıntılardan arındırmak.

3. Örneğin, Sobel operatörünü kullanarak görüntü gradyanlarını arayın.

4. Maksimum olmayanların bastırılması. Yalnızca yerel maksimumlar sınır olarak işaretlenir.

5. Çift eşik filtreleme. Potansiyel sınırlar eşiklerle tanımlanır.

6. İzleme yolları (Kenarları yollara bağlayın)

Görüntüdeki en ufak bir gürültü, konturlarının bütünlüğünü bozabileceğinden, aramaya başlamadan önce herhangi bir gürültü azaltma yöntemi kullanılarak görüntünün filtrelenmesi önerilir. Yüksek çalışma hızı ve uygulama kolaylığı nedeniyle, en çok Gauss filtresi kullanılır. Bir görüntüdeki kenarlar farklı yönlerde olabilir, bu nedenle Kenny'nin algoritması yatay, dikey ve çapraz kenarları algılamak için dört filtre kullanır. Bir kenar algılama operatörü (Sobel operatörü gibi) kullanılarak yatay yönde (Gy) ve dikey yönde (Gx) birinci türev için değer elde edilir. Bu degradeden, sınırın yönünün açısını elde edebilirsiniz:

Kenar yönü açısı dikey, yatay ve iki köşegeni (örneğin, 0, 45, 90 ve 135 derece) temsil eden dört açıdan birine yuvarlanır. Yalnızca bu pikseller, içinde gradyan vektörünün yönündeki gradyanın yerel maksimumuna ulaşılan sınırlar olarak bildirilir. Yön değeri 45°'nin katı olmalıdır. Maksimum olmayanları bastırdıktan sonra, kenarlar daha kesin ve ince hale gelir.

Bir sonraki adımda, eşik filtreleme, dikkate alınan her piksel için görüntü sınırlarına ait olup olmadığını belirler. Eşik ne kadar yüksek olursa, bulunan konturlar o kadar düzgün olacaktır, ancak zayıf kenarlar göz ardı edilebilir. Öte yandan, eşiğin düşürülmesi, algoritmanın gürültüye duyarlılığını artırır. Kenny kenar algılama, iki filtreleme eşiği kullanır: piksel değeri üst sınırın üzerindeyse, maksimum değer(sınır geçerli kabul edilir), eğer altındaysa - piksel bastırılır, değeri eşikler arasındaki aralığa düşen noktalar sabit bir ortalama değer alır (bir sonraki adımda iyileştirileceklerdir).

Görüntü işlemenin son aşaması, tek tek kenarları tek tip konturlara bağlamaktır. Bir önceki adımda ortalama değeri alan pikseller ya bastırılır (önceden algılanan kenarların hiçbirine dokunmazlarsa) ya da karşılık gelen konturlara iliştirilir.

segmentasyon

Fotoğraf ve video ekipmanından elde edilen görüntülerin çoğu rasterdir, yani dikdörtgen bir ızgarada düzenlenmiş renkli noktalardan oluşur. Bununla birlikte, insanlar çevrelerindeki dünyayı bir nokta matrisi değil, katı nesnelerden oluşan bir koleksiyon olarak algılarlar. İnsan beyni, görüntünün farklı ayrıntılarını homojen alanlarda birleştirerek, bilinçaltı düzeyde net bir şekilde nesnelere ayırabilir. Bu işleme segmentasyon denir ve bilgisayar görüntü analizi ve örüntü tanıma problemini çözerken yazılımda uygulanabilir. Segmentasyon, analizin ilk aşamalarında gerçekleştirilir ve uygulamanın kalitesi, hızı ve doğruluğu üzerinde güçlü bir etkiye sahip olabilir.

Segmentasyon yöntemleri iki sınıfa ayrılabilir: otomatik - kullanıcı etkileşimi gerektirmeyen ve etkileşimli - süreçte doğrudan kullanıcı girişi kullanan.

İlk durumda, bölgelerin özellikleri hakkında önceden bilgi kullanılmaz, ancak görüntü bölümünün kendisine bazı koşullar uygulanır (örneğin, tüm bölgelerin renk ve doku bakımından tek tip olması gerekir). Bölütleme probleminin bu formülasyonu, tasvir edilen nesneler hakkında apriori bilgi kullanmadığından, bu grubun yöntemleri evrenseldir ve herhangi bir görüntüye uygulanabilir.

Belirli bir görevdeki bir yöntemin kalitesinin kaba bir tahmini için, iyi bir bölümlemenin sahip olması gereken birkaç özellik genellikle sabitlenir:

§ Bölgelerin homojenliği (renk veya dokunun tekdüzeliği);

§ komşu bölgelerin farklılığı;

§ bölge sınırının düzgünlüğü;

§ bölgeler içinde az sayıda küçük "delikler";

Eşik segmentasyonu

Eşik işleme, tek tek homojen alanları ortalama parlaklıkta farklılık gösteren görüntü işlemeye yönelik en basit yöntemdir. Bununla birlikte, görüntü eşit olmayan bir şekilde aydınlatılmışsa, bazı nesneler arka planın yoğunluğuyla eşleşebilir ve bu da eşik bölütlemeyi etkisiz hale getirir.

En basit ve aynı zamanda sıklıkla kullanılan eşik bölütleme türü, görüntüde yalnızca iki tür homojen alanın ayırt edildiği ikili bölütlemedir.

Bu durumda, kaynak görüntünün her noktasının çıkış görüntüsüne dönüştürülmesi şu kurala göre gerçekleştirilir:

burada x0, eşik adı verilen tek işleme parametresidir. Çıktı parlaklık seviyeleri y0 ve y1 isteğe bağlı olabilir, bunlar yalnızca elde edilen haritanın işaretlendiği işaretçiler olarak işlev görür - sırasıyla puanlarını K1 veya K2 sınıflarına atayarak. Ortaya çıkan hazırlık görsel algı için hazırlanırsa, değerleri genellikle siyah beyaz seviyelerine karşılık gelir. İkiden fazla sınıf varsa, eşikleme sırasında farklı sınıfların parlaklıklarını birbirinden ayırarak bir eşik ailesi belirtilmelidir.

Eşik bölütleme, bir görüntüde düzgün bir yapıya sahip olan ve arka plandan keskin bir şekilde öne çıkan az sayıda kesişmeyen nesneyi seçmek için çok uygundur. Görüntü heterojenlik derecesindeki ve dolayısıyla segmentlerin sayısındaki ve karmaşıklıklarındaki artışla birlikte, bu tip segmentasyon verimsiz hale gelir.

Bir grafiğin bölümlenmesine dayalı bölümleme

Grafik teorisi yöntemleri, görüntü bölütlemede en aktif olarak gelişen alanlardan biridir.

Bu grubun yöntemlerinin genel fikri şu şekildedir. Görüntü, köşeleri görüntü noktalarında olan ağırlıklı bir grafik olarak temsil edilir. Grafik kenar ağırlığı, bir anlamda noktaların benzerliğini yansıtır (bazı metrikler boyunca noktalar arasındaki mesafe). Görüntünün bölümlenmesi grafik kesimlerle modellenmiştir.

Genellikle, grafik teorisi yöntemlerinde, elde edilen segmentasyonun kalitesini yansıtan bir kesim "maliyet" işlevi tanıtılır. Böylece, bir görüntüyü homojen bölgelere ayırma problemi, bir grafik üzerinde minimum maliyet kesintisi bulma optimizasyon problemine indirgenmiştir. Bu yaklaşım, segmentlerin renk ve dokusunun tekdüzeliğine ek olarak, segmentlerin şeklini, boyutlarını, kenarların karmaşıklığını vb. kontrol etmeyi sağlar.

Minimum maliyet kesintisini bulmak için çeşitli yöntemler kullanılır: açgözlü algoritmalar (kesimin toplam maliyeti minimum olacak şekilde her adımda bir kenar seçilir), dinamik programlama yöntemleri (her adımda en uygun kenarı seçerek, en uygun yolu bulacağız), Dijkstra algoritması vb.

İnterpolasyon

İÇİNDE bilgisayar grafikleri enterpolasyon yöntemi, görüntüleri yeniden ölçeklendirme sürecinde sıklıkla kullanılır. Enterpolasyon, görüntü piksellerinin sayısını değiştirerek, görüntü büyütüldüğünde aşırı pikselleşmeyi veya küçültüldüğünde önemli ayrıntıların kaybolmasını önlemeye yardımcı olur.

Enterpolasyon işlemi sırasında, komşu alanlardaki mevcut verilerin analizine dayanan özel bir algoritma kullanılarak tahmini tonu ve rengi hesaplanan görüntünün pikselleri arasına ek noktalar eklenir. Ne yazık ki, herhangi bir enterpolasyon sadece bir tahmin olduğundan, enterpolasyon yapıldığında görüntü her zaman kalite kaybeder.

En yakın komşu enterpolasyonu

Bu algoritma, enterpolasyonun en basit türüdür, basitçe görüntünün her pikselini gereken ölçeğe yükseltir. En az işlem süresi gerektirir, ancak en kötü sonuçlara yol açar.

Çift Doğrusal Enterpolasyon

Bu tür enterpolasyon, iki boyutlu ızgaranın her bir koordinatı için gerçekleştirilir. Görüntü bir yüzey, renk - üçüncü boyut olarak kabul edilir. Görüntü renkliyse enterpolasyon üç renk için ayrı ayrı yapılır. Yeni görüntüdeki her bilinmeyen nokta için, çift doğrusal enterpolasyon, onu çevreleyen bilinen dört pikselden oluşan bir kareyi dikkate alır. Bu dört pikselin ağırlıklı ortalaması enterpolasyonlu değer olarak kullanılır. Sonuç olarak, görüntüler en yakın komşu yönteminin sonucundan çok daha pürüzsüz görünüyor.

Çift doğrusal enterpolasyon, ölçekleme faktörlerinin tamsayı büyük değerlerinde iyi çalışır, ancak görüntünün keskin kenarlarını oldukça fazla bulanıklaştırır.

Bikübik enterpolasyon, 4x4 çevreleyen piksel dizisini (toplamda 16) göz önünde bulundurarak çift doğrusaldan bir adım daha ileri gider. farklı mesafeler bilinmeyen bir pikselden, en yakın pikseller hesaplamada daha fazla ağırlık alır. Bikübik enterpolasyon, önceki iki yöntemden önemli ölçüde daha keskin görüntüler üretir ve işlem süresi ve çıktı kalitesi açısından tartışmasız en iyisidir. Bu nedenle, birçok görüntü düzenleme programında (Adobe Photoshop dahil), yazıcı sürücülerinde ve yerleşik kamera enterpolasyonunda standart hale geldi.

Ölçeklenen görüntü önemli ölçüde daha az keskin hale gelebilir. Keskinliği daha iyi koruyan enterpolasyon algoritmaları harelenmeye daha yatkınken, hareyi ortadan kaldıranlar daha yumuşak sonuçlar üretme eğilimindedir. Ne yazık ki, bu ölçeklendirme takasından kaçınılamaz.

Biri en iyi yollar Bununla mücadele etmek için, ölçeklendirmeden hemen sonra, orijinal zaten keskinleştirilmiş olsa bile, bir keskinliği azaltma maskesi uygulayın.

5.2 Alt sistemde kullanılan algoritmaların seçim gerekçesi

Geliştirilen yazılım paketinin temel gereksinimi, bir bilgi işlem kümesindeki ön işleme sırasında video akışı oynatma gecikmesini en aza indirmekti. Ek olarak, çekim her koşulda yapılabilir, bu da kısa sürede çeşitli olumsuz etkileri etkisiz hale getirmek için çok sayıda basit filtre uygulamak gerektiği anlamına gelir. Ayrıca videoda görünen çok sayıda olumsuz faktörü kısa sürede incelemek ve bunları etkisiz hale getirmek için basit filtreler uygulamak gerekiyordu. Sunulan gereksinimleri karşılayan algoritmalar kolayca erişilebilir, iyi optimize edilmiş, yüksek güvenilirliğe sahip ve aynı zamanda uygulanması kolay olmalıdır. OpenCV kitaplığının işlevleri bu tür özelliklere sahiptir, bu nedenle, video akışı işleme filtrelerini uygulamak için belirli yöntemler seçerken, bu kitaplıkta şu veya bu şekilde bulunan algoritmalara öncelik verildi.

Nihai yeterlilik çalışmasının teorik bölümünde ele alınan tüm algoritmalar, özelliklerini pratikte karşılaştırmak için bir test formunda uygulanmıştır. Özellikle, bir video akış çerçevesinin işlem hızı ile sonucun kalitesi arasında bir uzlaşma tercih edildi.

Sonuç olarak, bilgi işlem kümesinde video akışı işleme filtrelerini uygulamak için aşağıdaki algoritmalar seçildi:

1. "Toplanan beyaz" gürültüyü kaldırmak için Gauss algoritması seçildi. En yaygın gürültü azaltma yöntemi olarak çok iyi optimize edilmiştir ve bu nedenle yüksek bir hıza sahiptir.

2. “Toplanan beyaz” gürültüyü ortadan kaldırmak için Gauss algoritması seçildi. En yaygın gürültü azaltma yöntemi olarak çok iyi optimize edilmiştir ve bu nedenle yüksek çalışma hızına sahiptir.

3. “İmpuls” gürültüsünü ortadan kaldırmak için medyan filtreleme seçildi. Bu yöntem aynı zamanda iyi optimize edilmiştir ve dürtüsel ve tuz-biber gürültüsünü ortadan kaldırmak için özel olarak tasarlanmıştır.

4. Keskin olmayan maskelemeden çok daha hızlı çalıştığı ve aynı zamanda kabul edilebilir sonuçlar verdiği için görüntüyü keskinleştirmek için evrişim seçildi.

5. OpenCV kitaplığı renk düzeltme algoritmaları içermez - bu nedenle, en yaygın ve iyi belgelenmiş Tek Ölçekli Retinex algoritmasının uygulanmasına karar verildi. Bu yöntem çok yüksek bir verimliliğe sahiptir, ancak işi hızlandırmak için optimizasyon gerektirir.

6. Kenny algoritması, Sobel filtresinden daha iyi sonuçlar verdiği için kenar algılama yöntemi olarak seçilmiştir.

7. OpenCV kütüphanesinde sunulan piramidal segmentasyon algoritması son derece yavaştır, bu nedenle grafiklerde daha önce düşünülen segmentasyon algoritmasının kullanılmasına karar verildi.

8. enterpolasyon - bikübik enterpolasyon yöntemi, iş hızı ile sonucun kalitesi arasındaki en makul uzlaşma olarak seçildi.

Kullanılan yazılımın kurulumu ve konfigürasyonu.

Kullanılan bilgi işlem kümesi GNU Linux (Ubuntu) çalıştırıyordu.

İşletim sistemini kurduktan sonra, görüntü dosyalarını okumayı ve yazmayı, ekranda çizim yapmayı, video ile çalışmayı vb. destekleyen birkaç kitaplık kurmanız gerekir.

CMake'i Yükleme

Proje CMake kullanılarak oluşturulmuştur (sürüm 2.6 veya üstü gerekir). Şu komutla yükleyebilirsiniz:

apt-get kurulum cmake

Aşağıdaki kitaplıklara da ihtiyacınız olabilir:

build-essential libjpeg62-dev libtiff4-dev libjasper-dev libopenexr-dev libtbb-dev libeigen2-dev libfaac-dev libopencore-amrnb-dev libopencore-amrwb-dev libtheora-dev libvorbis-dev libxvidcore-dev

ffmpeg'i yükleme

Opencv'nin video dosyalarını doğru bir şekilde işleyebilmesi için ffmpeg kütüphanesini kurmanız gerekir. Bu, aşağıdaki komutlarla yapılır:

1) Kütüphanenin kaynak kodlarının indirilmesi

wget http://ffmpeg.org/releases/ffmpeg-0.7-rc1.tar.gz

2) Arşivi kaynak kodlarıyla birlikte açmak

tar -xvzf ffmpeg-0.7-rc1.tar.gz

3) Kitaplık yapılandırması

yapılandır --enable-gpl --enable-version3 --enable-nonfree --enable-postproc

enable-libfaac --enable-libopencore-amrnb --enable-libopencore-amrwb

Enable-libtheora --enable-libvorbis --enable-libxvid --enable-x11grab

Enable-swscale --enable-shared

4) Kütüphaneyi oluşturmak ve kurmak

GTK kurulumu

OpenCV pencerelerinin görüntülenmesi, GTK+ 2.x veya daha üstünün kurulu olmasını gerektirir; başlık dosyaları(libgtk2.0-dev)

apt-get kurulum libgtk2.0-dev

Opencv'i Kurmak

İlgili tüm kütüphaneler kurulduktan sonra aşağıdaki komutlar ile opencv2.2 kurulumu yapılır:

1) OpenCV kütüphanesinin kaynak kodlarını indirmek

http://downloads.sourceforge.net/project/opencvlibrary/opencv-unix/2.2/OpenCV-2.2.0.tar.bz2

2) Arşivi kaynak kodlarıyla birlikte açmak

tar -xvf OpenCV-2.2.0.tar.bz2

3) CMake kullanarak bir Makefile oluşturmak.

4) OpenCV kütüphanesini oluşturmak ve kurmak

5) Kütüphanelere giden yolu da ayarlamanız gerekebilir.

dışa aktar LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH

Geliştirilen yazılım paketinin kurulumu ve derlenmesi

kopyalamak gerekiyor kaynak kodları bu açıklayıcı nota ekli diskteki programlar. build_all.sh toplu iş dosyasını aynı klasöre kopyalayın ve ardından çalıştırın. Sistemde gcc derleyicisi kuruluysa derleme otomatik olarak gerçekleşir.

Görüntü işlemenin özü, sahnenin orijinal görüntüsünü, nesnelerini tanıma sorununu çözmeye izin verecek bir forma getirmektir.

VS'de görüntü işlemenin nihai amacı, sahne nesnelerini tanıma için hazırlamaktır, yani, görüntülerini önceden belirlenmiş bazı sınıflara atamak. Sunulan bilgi dönüştürme prosedürlerinin çeşitliliğine rağmen, VS'de genellikle üç ana işleme aşaması ayırt edilir:

1) görüntü ön işleme;

2) segmentasyon;

3) açıklama.

Ön işleme ise iki temel aşamaya sahiptir: görüntü oluşturma ve kodlama (sıkıştırma). Adımların sırası katı değildir ve belirli göreve bağlıdır.

Görüntü Ön İşleme

VS'deki tüm görüntü ön işleme yöntemleri, uzamsal ve frekansa bölünmüştür. Mekansal yöntemler, doğrudan bir görüntüdeki pikseller üzerinde çalışan prosedürlerdir. Parlaklık, bir görüntünün özelliği olarak kullanılır. Y(x, y). Frekans yöntemleri, Fourier dönüşümü kullanılarak görüntünün karmaşık düzleme çevrilmesiyle ilişkilendirilir.

Ön işleme prosedürlerini göz önünde bulundururken, kendimizi yalnızca mekansal yöntemler ve orijinal görüntü gri tonlamalı olarak değerlendirilecektir.

Ön işlemenin ilk aşamasında, görüntü oluşumu. Görüntü oluşturma, video işlemcisinin belleğinde bulunan bir dizi ayrı öğe biçiminde doğrudan bir görüntü elde etme prosedürüdür - bir matris veya kontur oluşturan pikseller.

STZ'de görüntü oluşturma aşamasında aydınlatma ayarlanarak bir parlaklık eşiği seçilir ve görüntü filtrelenir.

filtreleme görüntü, ön işlemenin en uzun ve en karmaşık aşamasıdır. Genel olarak, filtreleme aşağıdaki ana görevleri çözer:

yumuşatma ("kar" gibi yüksek frekanslı gürültünün bastırılması);

kontrast artışı;

kontur seçimi.

Yumuşatma prosedürü, parlaklık eşiği seçildikten hemen sonra uygulanır. Anlamı, parlaklık fonksiyonunun değerlerinin belirli bir kurala göre ortalamasının alınmasında yatmaktadır. Y(X, y) analiz edilen görüntü parçasının içinde.

"Kar" tipi yüksek frekanslı paraziti ortadan kaldırmak için bir alçak geçiren filtre kullanılır. dezavantaj alçak geçiren filtreleme görüntü kontrastında bir bozulmadır.

segmentasyon



Ön işlemenin bir sonucu olarak görüntü, nesnelerin bir veya daha fazla kontur gösterimini içerir. Bu konturları ayırma ve onları belirli nesnelerle ilişkilendirme prosedürüne denir. segmentasyon.

Görüntünün birkaç nesne içerdiği önceden biliniyorsa, görüntü kodlama aşamasından önce kontur çıkarıldıktan sonra bölütleme işlemi gerçekleştirilir.

Bölütleme algoritmaları, kural olarak, konturdaki süreksizliklerin aranmasına ve alanların benzerliğine dayanır. İlk durumda, kontur bulunur ve belirlenen kurala göre yazılımı atlanır. Kontur kapalı ise nesneye ait kabul edilir. İkinci durumda, görüntünün ortak özelliklere sahip alanları (örneğin, piksellerin aynı parlaklığı) belirlenir. Bu tür alanlar bulunduğunda, arka plana veya nesneye atanırlar.

görüntü kodlama

Gri tonlamalı görüntüleri uzamsal yöntemlerle işleyen sistemler için iki ana kodlama yöntemi vardır:

· uzunluk kodları yöntemiyle görüntünün kendisinin kodlanması;

· görüntü konturunun Freeman zincir koduyla kodlanması.

Her iki durumda da, kodlama sırasında görüntüyü karakterize eden veri miktarında önemli bir azalma olur. Kodlama verimliliği, görüntü sıkıştırma derecesine göre belirlenir.

Kodlama yöntemiyle kodlamanın özü dizi uzunluğu, RLE algoritması kullanılarak uygulanan, görüntüyü, piksellerin parlaklığının ve renginin aynı olduğu, tarama çizgisinin homojen bölümleri olarak temsil etmektir. Ek olarak, her seri, karşılık gelen değer ve serinin uzunluğu (piksel sayısı) ile karakterize edilir.

Görüntünün konturunu doğrudan kodlamak için en çok zincir kullanılır. serbest adam kodu(Şekil 6.22, B). Bu durumda, nesnenin konturu, belirli bir noktadan başlayarak, 45'e bölünebilen modül eğim açısı ile ayrık değerler alan bir vektör dizisi tarafından verilir. Vektör eğim açısı 45 ise, modül değeri 2'dir, ve dikey veya yatay konumda ise 1. Eğrinin bir noktasından diğerine geçiş sırasında vektörün yönündeki değişiklik, modellenen eğrideki değişikliğin doğasını yansıtır.



Görüntü açıklaması

Altında Tanım bir nesnenin karakteristik parametrelerinin tanımı anlaşılmaktadır - işaretler(ayırıcılar) sahneyi oluşturan her şey arasından seçilmesi için gereklidir.

Fiziksel yapılarına göre, işaretler küresel ve yerel olarak ayrılır. Küresel özellik görüntüler, bir nesnenin herhangi bir görüntüsü için hesaplanabilen bir özelliktir.

yerel işaretler daha az kullanılır; görüntünün tamamını değil, yalnızca bir kısmını karakterize ederler. Bunlar, iki kontur çizgisi arasındaki açıyı, nesne görüntüsündeki deliklerin sayısını ve parametrelerini vb. içerir.

görüntü tanıma

Tanıma bir nesnenin belirli bir görüntüsünün bir dizi özelliğine dayanarak, belirli bir sınıfa ait olduğunun belirlendiği bir süreçtir.

Tanıma, görsel görüntü analizi işlevini uygular.

Geleneksel olarak, tüm tanıma yöntemleri iki gruba ayrılabilir: teorik ve yapısal. En yaygın teorik tanıma yöntemleri, karar teorisinin ilkelerini kullanır.

Değerler her ölçümde farklılık gösterdiğinden, bir nesnenin özelliklerinin gerçek değerini belirlemek imkansızdır. Bu nedenle, tanıma görevi şu şekilde ortaya çıkar: bir nesnenin belirli bir sınıfa ait olma olasılığını belirlemek.

VS'deki örüntü tanımanın en ilginç alanlarından biri, yüz tanıma algoritmalarının geliştirilmesi ile ilgilidir. Tanıma (doğrulama) algoritması, kayıt algoritmasına yakındır. Mevcut görüntüden çıkarılan özellikler, bileşenleri veri tabanında bulunan tüm vektörlerin karşılık gelen bileşenleriyle karşılaştırılan bir özellik vektöründe birleştirilir.

Laboratuvar #1

Görüntü İşleme Algoritmaları

Evrişim işlemi

Evrişim, hem görüntü ön işleme hem de nesne tanıma ve tanımlama için kullanılabilen çok geniş bir algoritmadır. Görüntünün iki boyutlu bir parlaklık matrisi ile verilmesine izin verin F" ve dürtü tepki matrisi H. Bir matrisin matematiksel olarak evrişimi Fçekirdekli H aşağıdaki formülle tanımlanabilir:

Nerede M2xN2 - evrişim çekirdek matrisinin boyutu. Matris boyutu F(M1+M2-1)x(N1+N2-1)'e eşittir, burada M1xN1 - orijinal matrisin boyutu F" . Matris F orijinalden, gerekli boyuta getirmek için bir kurala göre matrisin kenarlarına elemanlar eklenerek elde edilir. Genellikle, orijinal matris, matrisin genişliğinin yarısı kadar kenarlarda sıfırlarla doldurulur. H sol ve sağ ve sırasıyla, yüksekliğin yarısı yukarı ve aynı aşağı. Daha sonra ortaya çıkan matrisin boyutu R matris ile aynı olacak F" .

Evrişim, yukarıda gösterildiği gibi doğrudan bir matrisi diğerinin üzerinde "çalıştırarak" hesaplanabilir. Şek. 1, evrişimi hesaplama şemasını gösterir (maske matrisinin boyutu 3x3'e eşit alınır). Evrişim operatörü, filtrelenmiş görüntü öğesinin yeni bir değerini elde etmek için toplanan, ardından seçilen görüntü parçasıyla öğe öğe çarpılan bir katsayılar (maskeler) matrisi olarak görülebilir. Bu matris keyfi boyutta olabilir, kare olması gerekmez.

Pirinç. 1. Evrişim işleminin uygulanması.

Egzersiz yapmak

    Bir matris maskesi ile orijinal görüntünün evrişim işlemini gerçekleştiren bir algoritma uygulayın.

    Matris maskesinin boyutu ve türü kullanıcı tarafından belirlenir.

    Çeşitli görüntü işleme algoritmalarını uygulamak için aşağıdaki maske matrislerini kullanın:

    • görüntüdeki paraziti yumuşatmak ve bastırmak için aşağıdaki biçimde bir 3x3 matris maskesi kullanılır:

    konturları vurgulamak için aşağıdaki formdaki matris maskeleri kullanılır:

1/9*

    Aşağıdaki formun maskesi, konturları seçmek için kullanılır:

4. Nokta ve darbe gürültüsünü bastırmak için kullanılan bir medyan filtresi uygulayın. Söz konusu alandaki görüntü pikseli ve komşuları, bir varyasyon serisinde (artan veya azalan piksel değerlerinde) düzenlenir ve bu varyasyon serisinin merkezi değeri, yeni bir piksel değeri olarak seçilir. Ortalama filtrelemenin sonucu, görüntüde bulunan herhangi bir rastgele parazitin etkili bir şekilde ortadan kaldırılmasıdır. Bunun nedeni, incelenmekte olan bölge içindeki piksel yoğunluğundaki rastgele herhangi bir ani değişikliğin sıralanacak olmasıdır, örn. o bölgede sıralanan değerlerin en üstüne veya en altına yerleştirilecek ve yeni eleman değeri için her zaman merkez değer alındığı için sayılmayacaktır.

5. Kabartma algoritmasını uygulayın. Kabartma, ortalama alma veya kenar geliştirme algoritmalarına benzer şekilde yapılır. Görüntüdeki her piksel, 3x3 kabartma çekirdeği (matris maskesi) tarafından işlenir. Örneğin, bir kabartma çekirdeği olarak aşağıdaki maske matrisini alabilirsiniz:

Kabartma motoru tarafından piksel değeri işlendikten sonra buna 128 eklenir.Böylece arka plan piksellerinin değeri ortalama gri renk olur (kırmızı=128, yeşil=128, mavi=128). 255'ten büyük tutarlar 255'e yuvarlanabilir.

Görüntünün kabartmalı versiyonunda, konturlar yüzeyin üzerinde ekstrüde edilmiş gibi görünür. Görüntü vurgulamanın yönü, çekirdekte 1 ve -1 konumları değiştirilerek değiştirilebilir. Örneğin, 1 ve -1 değerleri değiştirilirse, arka ışığın yönü tersine çevrilir.

6. Görüntü sulu boya. Suluboya filtresi görüntüyü dönüştürür ve işledikten sonra suluboya ile yazılmış gibi görünür:

    Sulu boya filtresi uygulamanın ilk adımı, görüntüdeki renkleri yumuşatmaktır. Pürüzsüzleştirmenin bir yolu, her noktada ortalama renk ortalamasını uygulamaktır. Her pikselin ve onun 24 komşusunun renk değeri (matris maskesinin boyutu 5x5'tir), azalan veya artan düzende varyasyonel bir dizi halinde düzenlenir. Varyasyon serisindeki medyan (on üçüncü) renk değeri, merkezi piksele atanır.

    renkleri yumuşattıktan sonra, renk geçişlerinin kenarlarını vurgulamak için bir kenar geliştirme filtresi uygulamanız gerekir.