Mudanças entre as edições de "Experimentos de validação para o experimento 2.1.1.4"

De LCAD
Ir para: navegação, pesquisa
(Experimentos de validação para o experimento 2.1.1.4)
(Experimentos de validação para o experimento 2.1.1.4)
Linha 7: Linha 7:
 
|+ <p align=justify>
 
|+ <p align=justify>
 
Conjuntos de treino e validação.
 
Conjuntos de treino e validação.
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
 
 
</p>
 
</p>
  

Edição das 13h50min de 7 de fevereiro de 2008

Experimentos de validação para o experimento 2.1.1.4

Para ajustar o número de neurônios e sinapses por neurônio do WNN, o conjunto de treino(-e-validação) foi dividido em um conjunto de treino, usado para construir indutivamente o categorizador, e um conjunto de validação, usado para avaliar o desempenho do categorizador na série de experimentos para otimização de parâmetros. A tabela abaixo descreve os conjuntos de treino e validação.

Conjuntos de treino e validação.

Dados de Treino Dados de Validação Revisão

do SCAE

Tabela Coluna Limites Tabela Coluna Limites
CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 819

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 820 a 1639 283

A Figura 1 apresenta os resultados dos experimentos de validação para o experimento 2.1.1.4. Esse gráfico mostra o desempenho do classificador em termos de (1 - one-error) em função do número de neurônios e sinapses por neurônio. Podemos observar que os parâmetros ótimos são 13x13 neurônios e 512 sinapses.

Figura 1: Resultados dos experimentos de validação para o experimento 2.1.1.4