Filtre de convoluție 3×3 – O alegere populară

În prelucrarea imaginilor, un nucleu, o matrice de convoluție sau o mască este o matrice mică. Este utilizată pentru estomparea, ascuțirea, reliefarea, detectarea marginilor și multe altele. Acest lucru se realizează prin efectuarea unei convoluții între un nucleu și o imagine.

În acest articol, iată câteva convenții pe care le urmăm –

  • Ne referim în mod specific la convoluțiile 2D care se aplică de obicei pe obiecte cu 2 matrice, cum ar fi imaginile. Aceste concepte se aplică, de asemenea, pentru convoluțiile 1D și 3D, dar s-ar putea să nu se coreleze direct.
  • În timp ce se aplică convoluții 2D ca și convoluțiile 3X3 pe imagini, un filtru de convoluție 3X3, în general, va avea întotdeauna o a treia dimensiune în mărime. Acest filtru depinde de (și este egal cu) numărul de canale ale imaginii de intrare. Astfel, aplicăm un filtru de convoluție 3X3X1 pe imagini cu scală de gri (numărul de canale = 1), în timp ce aplicăm un filtru de convoluție 3X3X3 pe o imagine colorată (numărul de canale = 3).
  • Ne vom referi la toate convoluțiile prin primele două dimensiuni ale acestora, indiferent de canale. (Respectăm ipoteza de umplere zero).

Un filtru de convoluție trece peste toți pixelii imaginii în așa fel încât, la un moment dat, luăm „produsul în puncte” al filtrului de convoluție și al pixelilor imaginii pentru a obține o valoare finală de ieșire. Facem acest lucru în speranța că ponderile (sau valorile) din filtrul de convoluție, atunci când sunt înmulțite cu pixelii corespunzători ai imaginii, ne oferă o valoare care reprezintă cel mai bine acei pixeli ai imaginii. Ne putem gândi la fiecare filtru de convoluție ca la extragerea unui anumit tip de caracteristică din imagine.

De aceea, convoluțiile se fac de obicei ținând cont de aceste două lucruri –

  • Cele mai multe dintre caracteristicile unei imagini sunt de obicei locale. Prin urmare, este logic să se ia câțiva pixeli locali deodată și să se aplice convoluții.
  • Majoritatea caracteristicilor se pot găsi în mai multe locuri într-o imagine. Acest lucru înseamnă că are sens să folosim un singur nucleu pe toată imaginea, în speranța de a extrage acea caracteristică în diferite părți ale imaginii.

Acum că avem dimensiunile filtrelor de convoluție ca unul dintre hiperparametrii din care putem alege. Alegerea se poate face între o dimensiune mai mică sau mai mare a filtrului.

Iată anumite lucruri care trebuie luate în considerare la alegerea dimensiunilor filtrelor de convoluție – http://bit.ly/2w2Mcf2

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.