Mudanças entre as edições de "Experimentos de validação para o experimento 2.3.1.4"

De LCAD
Ir para: navegação, pesquisa
(Experimentos de validação para o experimento 2.3.1.4)
(Experimentos de validação para o experimento 2.3.1.4)
Linha 32: Linha 32:
 
|- align="center"
 
|- align="center"
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 819
+
0 a 1164
 
| subclasse
 
| subclasse
 
| TF
 
| TF
 
| art. prep.
 
| art. prep.
 
| 10000
 
| 10000
| DADOS_VITORIA_SUB_110
+
| DADOS_BH_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 820 a 1640
+
| 1165 a 2330
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
Linha 54: Linha 54:
 
Podemos observar que os parâmetros ótimos são ?x? neurônios e ? sinapses.
 
Podemos observar que os parâmetros ótimos são ?x? neurônios e ? sinapses.
  
[[Imagem:Experiment 2.1.1.4.jpg|frame|center|130px|Figura 1: Resultados dos experimentos de validação para o experimento 2.1.1.4]]
+
[[Imagem:Experiment 2.3.1.4.jpg|frame|center|130px|Figura 1: Resultados dos experimentos de validação para o experimento 2.3.1.4]]

Edição das 11h09min de 31 de janeiro de 2008

Experimentos de validação para o experimento 2.3.1.4

Para ajustar o número de neurônios e sinapses por neurônio do WNN, o conjunto de treino(-e-validação) foi dividido em um conjunto de treino, usado para construir indutivamente o categorizador, e um conjunto de validação, usado para avaliar o desempenho do categorizador na série de experimentos para otimização de parâmetros. A tabela abaixo descreve os conjuntos de treino e validação.

Conjuntos de treino e validação. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Dados de Treino Dados de Validação Revisão

do SCAE

Tabela Coluna Limites Dicionário PT CGD PFS Tabela Coluna Limites Nível PT
CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1164

subclasse TF art. prep. 10000 DADOS_BH_SUB_110 OBJETO_SOCIAL 1165 a 2330 SUBCLASSE TF  ?

A Figura 1 apresenta os resultados dos experimentos de validação para o experimento 2.3.1.4. Esse gráfico mostra o desempenho do classificador em termos de (1 - one-error) em função do número de neurônios e sinapses por neurônio. Podemos observar que os parâmetros ótimos são ?x? neurônios e ? sinapses.

Figura 1: Resultados dos experimentos de validação para o experimento 2.3.1.4