Experimentos de validação para o experimento 2.3.1.4

De LCAD
Revisão de 17h44min de 28 de janeiro de 2008 por Claudine (discussão | contribs) (Experimentos de validação para experimento 2.3.1.4)
Ir para: navegação, pesquisa

Experimentos de validação para o experimento 2.3.1.4

Para ajustar os parâmetros do WNN, o conjunto de treino(-e-validação) foi dividido em um conjunto de treino, usado para construir indutivamente o categorizador, e um conjunto de validação, usado para avaliar o desempenho do categorizador na série de experimentos para otimização de parâmetros. A tabela abaixo descreve os conjuntos de treino e validação.

Conjuntos de treino e validação. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Dados de Treino Dados de Validação Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Dicionário PT CGD PFS Tabela Coluna Limites Nível PT
CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 819

subclasse TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 820 a 1640 SUBCLASSE TF  ? ver Figura 1


A Figura 1 apresenta os resultados dos experimentos de validação empregados para ajustar o número de neurônios e sinapses por neurônio do WNN. Esse gráfico mostra o desempenho do classificador em termos de (1 - one-error) em função do número de neurônios e sinapses por neurônio. Podemos observar que os parâmetros ótimos são ?x? neurônios e ? sinapses.

Figura 1: Resultados dos experimentos de validação 2.1.1.4