Redes Convolucionais (4/4)

Hiperparâmetros

O funcionamento das redes convolucionais podem ser configuradas através de diretrizes definidos cientista de dados. Essas diretrizes de são chamados Hiperparâmetros. Alguns exemplos:

  • Para cada camada de Convolução, quantas caractéristicas existem e quantos pixels por caracteristica?
  • Para cada camada de subagrupamento, qual o tamanho da janela?
  • Para cada camada extra, quantas unidades ocultas?
  • Que ordem as camadas devem ser inseridas?

Outras aplicações

Normalmente as redes convolucionais sao usadas no processamento de  imagens (tal como nosso exemplo)  No entanto, seguindo algumas regras basicas, elas podem também ser usadas na categorização de dados.  Mas esses dados tem que ser transformado em algo semelhante a uma imagem  Por exemplo, sinais de audio podem ser divididos em pequenos espacos de tempo e então serem classificados baseados em diferentes frequencias ( como graves, médios e agudos). Os sinais podem então ser representados como uma matriz bidimensional onde cada coluna registra um espaco de tempo e cada linha uma frequência.

Pesquisadores da área são bastante criativos e as redes convolucionais ja foram usadas em aplicações distintas como processamento de linguagem, tradução e até desenvolvimento de medicamentos.

O que funciona versus o que não funciona

Típico exemplo de amostras que não funcionam bem em CNNs são dados de clientes. Nesse caso cada linha na tabela representa um cliente e cada coluna, uma informação específica, como nome, endereço, email, etc. Nesse caso, a localização de linhas e colunas não importa. Linhas e colunas podem tem sua sequência alterada sem que haja perda de dados. Em comparação, mudando-se a sequência de linhas e colunas numa imagem, faz com que ela seja corrompida e torne-se inútil.

Como regra básica, se houver perda com a mudança de sequência de colunas, Redes Convolucionais não funcionam. Caso contrário, são perfeitas.

Mais informações (video em Inglês)

 

Se você gosta de “por a mão na massa”, fica abaixo a recomendação de algumas ferramentas de aprendizado para criar uma CNN. Experimente e me diga o que achou.