Mudanças entre as edições de "Resultados de Pesquisa"

De LCAD
Ir para: navegação, pesquisa
Linha 114: Linha 114:
  
  
|}
 
 
 
 
{| border=1 align="center"
 
|+ <p align=justify>Tabela: Desempenho do WNN. Peso denota a forma como foi calculado o peso dos termos nos documentos, TF denota o modo de cálculo dos pesos dos termos por frequência dos termos, CGD denota as classes gramaticais desconsideradas, PFS denota a frequência acima da qual a palavra não é incluída, Rev. denota o código da revisão dos códigos do sistema SCAE, Des. denota o desempenho atingido pelo algorítmo (calculado na forma Des = 1 - one-error).
 
 
|- align="center"
 
| colspan=7 | '''Dados de Treino'''
 
| colspan=6 Rowspan=2 | '''Dados de Teste'''
 
 
|- align="center"
 
| colspan=5 | '''Lexicon'''
 
| colspan=2 |
 
 
|- align="center"
 
| '''Tabelas'''
 
| '''Colunas'''
 
| '''CGD'''
 
| '''PFS'''
 
| '''Intervalo'''
 
| '''Construção'''
 
| '''Peso'''
 
| '''Tabelas'''
 
| '''Colunas'''
 
| '''Intervalo'''
 
| '''Construção'''
 
| '''Peso'''
 
| '''Rev.'''
 
| '''Des.'''
 
 
|- align="center"
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| art. prep.
 
| 10000
 
| 0 a 1182
 
| COMMON
 
| TF
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| COMMON
 
| TF
 
| 78
 
| 98.48%
 
 
|- align="center"
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| art. prep.
 
| 10000
 
| 0 a 1182
 
| COMMON
 
| TF
 
| DADOS_VITORIA_110
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| COMMON
 
| TF
 
| 78
 
| 63.43%
 
 
|- align="center"
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| art. prep.
 
| 10000
 
| 0 a 1182
 
| COMMON
 
| TF
 
| DADOS_VITORIA_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| COMMON
 
| TF
 
| 78
 
| 66.48%
 
 
|- align="center"
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_110
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
| art. prep.
 
| 10000
 
| 0 a 1182
 
| COMMON
 
| TF
 
| DADOS_VITORIA_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| COMMON
 
| TF
 
|
 
 
 
|}
 
|}

Edição das 20h03min de 26 de novembro de 2007

Resultados do WNN

Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados na tabela abaixo.

Tabela: Desempenho do WNN. CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon; PT denota a função para o cálculo dos pesos dos termos, que pode ser calculada como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)).

Lexicon Dados de Treino Dados de Teste Revisão Desempenho (1 - one-error)
Tabela Coluna Limites CGD PFS Tabela Coluna Construção Limites PT Tabela Coluna Construção Limites PT


CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB COMMON 0 a 1182 TF CNAE_110_SUBCLASSE DESCRICAO_SUB COMMON 0 a 1182 TF 78 98.48%
CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB COMMON 0 a 1182 TF DADOS_VITORIA_110 OBJETO_SOCIAL COMMON 0 a 3280 TF 78 63.43%
CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB COMMON 0 a 1182 TF DADOS_VITORIA_110 OBJETO_SOCIAL COMMON 1640 a 3280 TF 78 66.48%
CNAE_110_SUBCLASSE

DADOS_VITORIA_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

art. prep. 10000 CNAE_110_SUBCLASSE

DADOS_VITORIA_110

DESCRICAO_SUB

OBJETO_SOCIAL

COMMON 0 a 1182

0 a 1639

TF DADOS_VITORIA_110 OBJETO_SOCIAL COMMON 1640 a 3280 TF