Experimentos de validação 2.3.1.4

De LCAD
Ir para: navegação, pesquisa

Experimentos de validação 2.3.1.4

Para ajustar o número de neurônios e sinapses por neurônio do WNN, o conjunto de treino(-e-validação) foi dividido em um conjunto de treino, usado para construir indutivamente o categorizador, e um conjunto de validação, usado para avaliar o desempenho do categorizador na série de experimentos para otimização de parâmetros. A tabela abaixo descreve os conjuntos de treino e validação.

Conjuntos de treino e validação. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Dados de Treino Dados de Validação Revisão

do SCAE

Tabela Coluna Limites Dicionário PT CGD PFS Tabela Coluna Limites Nível PT
CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 819

subclasse TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 820 a 1640 SUBCLASSE TF  ?

A Figura 1 apresenta os resultados dos experimentos de validação 2.3.1.4. Esse gráfico mostra o desempenho do classificador em termos de (1 - one-error) em função do número de neurônios e sinapses por neurônio. Podemos observar que os parâmetros ótimos são ?x? neurônios e ? sinapses.

Figura 1: Resultados dos experimentos de validação 2.1.1.4