Validação

De LCAD
Ir para: navegação, pesquisa

Para ajustar os parâmetros do WNN, o conjunto de treino(-e-validação) foi dividido em um conjunto de treino, usado para construir indutivamente o categorizador, e um conjunto de validação, usado para avaliar o desempenho do categorizador na série de experimentos para otimização de parâmetros. A tabela abaixo descreve os conjuntos de treino e validação.

Conjuntos de treino e validação. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Exp. Dados de Treino Dados de Validação Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Dicionário PT CGD PFS Tabela Coluna Limites Nível PT


2.1.x.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 819

subclasse TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 820 a 1640 SUBCLASSE TF 250 ver Figura 1
2.2.x.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 819

completo TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 820 a 1640 SUBCLASSE TF 250 ver Figura 2

As Figuras 1 e 2 apresentam os resultados dos experimentos de validação 2.1.x.4 e 2.2.x.4, respectivamente, empregados para ajustar o número de neurônios e sinapses por neurônio do WNN. Esses gráficos mostram o desempenho do classificador em termos de (1 - one-error) em função do número de neurônios e sinapses por neurônio. Podemos observar que os parâmetros ótimos para o experimento 2.1.4 são 11x11 neurônios e 512 sinapses, e para o experimento 2.2.4 são 12x12 neurônios e 1024 sinapses.

Figura 1: Resultados dos experimentos de validação 2.1.4.v
Figura 2: Resultados dos experimentos de validação 2.2.4.v