3×3 filtros de convolução – Uma escolha popular

No processamento de imagens, um kernel, matriz de convolução ou máscara é uma pequena matriz. Ela é usada para embaçamento, nitidez, relevo, detecção de bordas, e muito mais. Isto é conseguido fazendo uma convolução entre um kernel e uma imagem.

Neste artigo, aqui estão algumas convenções que estamos seguindo –

  • Estamos nos referindo especificamente a convoluções 2D que são normalmente aplicadas em 2 objetos de matriz, como imagens. Estes conceitos também se aplicam a convoluções 1D e 3D, mas podem não se correlacionar diretamente.
  • Apesar de aplicar convoluções 2D como convoluções 3X3 em imagens, um filtro de convoluções 3X3, em geral sempre terá uma terceira dimensão em tamanho. Este filtro depende (e é igual a) o número de canais da imagem de entrada. Assim, aplicamos um filtro de convolução 3X3X1 em imagens em escala de cinza (o número de canais = 1) enquanto que, aplicamos um filtro de convolução 3X3X3 numa imagem colorida (o número de canais = 3).
  • Referimo-nos a todas as convoluções pelas suas duas primeiras dimensões, independentemente dos canais. (Estamos observando a suposição de preenchimento zero).

Um filtro de convolução passa sobre todos os pixels da imagem de tal forma que, em um dado momento, pegamos o ‘produto ponto’ do filtro de convolução e os pixels da imagem para obter um valor final de saída. Fazemos isso esperando que os pesos (ou valores) no filtro de convolução, quando multiplicados pelos pixels correspondentes da imagem, nos dêem um valor que melhor represente esses pixels da imagem. Podemos pensar em cada filtro de convolução como extraindo algum tipo de característica da imagem.

Por isso, as convoluções são feitas normalmente tendo estas duas coisas em mente –

  • A maioria das características de uma imagem são normalmente locais. Portanto, faz sentido pegar poucos pixels locais de uma vez e aplicar convoluções.
  • A maioria das características pode ser encontrada em mais de um lugar em uma imagem. Isto significa que faz sentido usar um único kernel em toda a imagem, esperando extrair essa funcionalidade em diferentes partes da imagem.

Agora temos tamanhos de filtros de convolução como um dos hiper-parâmetros a escolher. A escolha pode ser feita entre tamanho de filtro menor ou maior.

Aqui estão certas coisas a considerar enquanto escolhemos os tamanhos de filtro de convolução – http://bit.ly/2w2Mcf2

Deixe uma resposta

O seu endereço de email não será publicado.