Filtros de convolución 3×3 – Una opción popular

En el procesamiento de imágenes, un núcleo, matriz de convolución o máscara es una pequeña matriz. Se utiliza para el desenfoque, la nitidez, el relieve, la detección de bordes, y más. Esto se logra haciendo una convolución entre un kernel y una imagen.

En este artículo, aquí hay algunas convenciones que estamos siguiendo –

  • Nos estamos refiriendo específicamente a las convoluciones 2D que se aplican generalmente en objetos de 2 matrices como las imágenes. Estos conceptos también se aplican para convoluciones 1D y 3D, pero pueden no correlacionarse directamente.
  • Al aplicar convoluciones 2D como convoluciones 3X3 en imágenes, un filtro de convolución 3X3, en general siempre tendrá una tercera dimensión en tamaño. Este filtro depende (y es igual) al número de canales de la imagen de entrada. Así, aplicamos un filtro de convolución 3X3X1 sobre imágenes en escala de grises (el número de canales = 1) mientras que, aplicamos un filtro de convolución 3X3X3 sobre una imagen en color (el número de canales = 3).
  • Nos referiremos a todas las convoluciones por sus dos primeras dimensiones, independientemente de los canales. (Estamos observando la suposición de relleno cero).

Un filtro de convolución pasa sobre todos los píxeles de la imagen de tal manera que, en un momento dado, tomamos ‘producto punto’ del filtro de convolución y los píxeles de la imagen para obtener un valor final de salida. Hacemos esto con la esperanza de que los pesos (o valores) del filtro de convolución, cuando se multiplican con los píxeles correspondientes de la imagen, nos den un valor que represente mejor esos píxeles de la imagen. Podemos pensar en cada filtro de convolución como la extracción de algún tipo de característica de la imagen.

Por lo tanto, las convoluciones se hacen por lo general teniendo estas dos cosas en mente –

  • La mayoría de las características de una imagen suelen ser locales. Por lo tanto, tiene sentido tomar pocos píxeles locales a la vez y aplicar convoluciones.
  • La mayoría de las características pueden encontrarse en más de un lugar en una imagen. Esto significa que tiene sentido utilizar un solo núcleo en toda la imagen, con la esperanza de extraer esa característica en diferentes partes de la imagen.

Ahora que tenemos tamaños de filtro de convolución como uno de los hiperparámetros para elegir. La elección se puede hacer entre el tamaño del filtro más pequeño o más grande.

Aquí hay ciertas cosas a considerar al elegir los tamaños de filtro de convolución – http://bit.ly/2w2Mcf2

Deja una respuesta

Tu dirección de correo electrónico no será publicada.