|
|
Linha 114: |
Linha 114: |
| | | |
| | | |
− | |}
| |
− |
| |
− |
| |
− |
| |
− | {| border=1 align="center"
| |
− | |+ <p align=justify>Tabela: Desempenho do WNN. Peso denota a forma como foi calculado o peso dos termos nos documentos, TF denota o modo de cálculo dos pesos dos termos por frequência dos termos, CGD denota as classes gramaticais desconsideradas, PFS denota a frequência acima da qual a palavra não é incluída, Rev. denota o código da revisão dos códigos do sistema SCAE, Des. denota o desempenho atingido pelo algorítmo (calculado na forma Des = 1 - one-error).
| |
− |
| |
− | |- align="center"
| |
− | | colspan=7 | '''Dados de Treino'''
| |
− | | colspan=6 Rowspan=2 | '''Dados de Teste'''
| |
− |
| |
− | |- align="center"
| |
− | | colspan=5 | '''Lexicon'''
| |
− | | colspan=2 |
| |
− |
| |
− | |- align="center"
| |
− | | '''Tabelas'''
| |
− | | '''Colunas'''
| |
− | | '''CGD'''
| |
− | | '''PFS'''
| |
− | | '''Intervalo'''
| |
− | | '''Construção'''
| |
− | | '''Peso'''
| |
− | | '''Tabelas'''
| |
− | | '''Colunas'''
| |
− | | '''Intervalo'''
| |
− | | '''Construção'''
| |
− | | '''Peso'''
| |
− | | '''Rev.'''
| |
− | | '''Des.'''
| |
− |
| |
− | |- align="center"
| |
− | | CNAE_110_SUBCLASSE
| |
− | | DESCRICAO_SUB
| |
− | | art. prep.
| |
− | | 10000
| |
− | | 0 a 1182
| |
− | | COMMON
| |
− | | TF
| |
− | | CNAE_110_SUBCLASSE
| |
− | | DESCRICAO_SUB
| |
− | | 0 a 1182
| |
− | | COMMON
| |
− | | TF
| |
− | | 78
| |
− | | 98.48%
| |
− |
| |
− | |- align="center"
| |
− | | CNAE_110_SUBCLASSE
| |
− | | DESCRICAO_SUB
| |
− | | art. prep.
| |
− | | 10000
| |
− | | 0 a 1182
| |
− | | COMMON
| |
− | | TF
| |
− | | DADOS_VITORIA_110
| |
− | | OBJETO_SOCIAL
| |
− | | 0 a 3280
| |
− | | COMMON
| |
− | | TF
| |
− | | 78
| |
− | | 63.43%
| |
− |
| |
− | |- align="center"
| |
− | | CNAE_110_SUBCLASSE
| |
− | | DESCRICAO_SUB
| |
− | | art. prep.
| |
− | | 10000
| |
− | | 0 a 1182
| |
− | | COMMON
| |
− | | TF
| |
− | | DADOS_VITORIA_110
| |
− | | OBJETO_SOCIAL
| |
− | | 1640 a 3280
| |
− | | COMMON
| |
− | | TF
| |
− | | 78
| |
− | | 66.48%
| |
− |
| |
− | |- align="center"
| |
− | | CNAE_110_SUBCLASSE
| |
− | DADOS_VITORIA_110
| |
− | | DESCRICAO_SUB
| |
− | OBJETO_SOCIAL
| |
− | | art. prep.
| |
− | | 10000
| |
− | | 0 a 1182
| |
− | | COMMON
| |
− | | TF
| |
− | | DADOS_VITORIA_110
| |
− | | OBJETO_SOCIAL
| |
− | | 1640 a 3280
| |
− | | COMMON
| |
− | | TF
| |
− | |
| |
− | |
| |
| |} | | |} |
Edição das 20h03min de 26 de novembro de 2007
Resultados do WNN
Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados na tabela abaixo.
Tabela: Desempenho do WNN. CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon; PT denota a função para o cálculo dos pesos dos termos, que pode ser calculada como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)).
Lexicon
|
Dados de Treino
|
Dados de Teste
|
Revisão
|
Desempenho (1 - one-error)
|
Tabela
|
Coluna
|
Limites
|
CGD
|
PFS
|
Tabela
|
Coluna
|
Construção
|
Limites
|
PT
|
Tabela
|
Coluna
|
Construção
|
Limites
|
PT
|
CNAE_110_SUBCLASSE
|
DESCRICAO_SUB
|
0 a 1182
|
art. prep.
|
10000
|
CNAE_110_SUBCLASSE
|
DESCRICAO_SUB
|
COMMON
|
0 a 1182
|
TF
|
CNAE_110_SUBCLASSE
|
DESCRICAO_SUB
|
COMMON
|
0 a 1182
|
TF
|
78
|
98.48%
|
CNAE_110_SUBCLASSE
|
DESCRICAO_SUB
|
0 a 1182
|
art. prep.
|
10000
|
CNAE_110_SUBCLASSE
|
DESCRICAO_SUB
|
COMMON
|
0 a 1182
|
TF
|
DADOS_VITORIA_110
|
OBJETO_SOCIAL
|
COMMON
|
0 a 3280
|
TF
|
78
|
63.43%
|
CNAE_110_SUBCLASSE
|
DESCRICAO_SUB
|
0 a 1182
|
art. prep.
|
10000
|
CNAE_110_SUBCLASSE
|
DESCRICAO_SUB
|
COMMON
|
0 a 1182
|
TF
|
DADOS_VITORIA_110
|
OBJETO_SOCIAL
|
COMMON
|
1640 a 3280
|
TF
|
78
|
66.48%
|
CNAE_110_SUBCLASSE
DADOS_VITORIA_110
|
DESCRICAO_SUB
OBJETO_SOCIAL
|
0 a 1182
0 a 1639
|
art. prep.
|
10000
|
CNAE_110_SUBCLASSE
DADOS_VITORIA_110
|
DESCRICAO_SUB
OBJETO_SOCIAL
|
COMMON
|
0 a 1182
0 a 1639
|
TF
|
DADOS_VITORIA_110
|
OBJETO_SOCIAL
|
COMMON
|
1640 a 3280
|
TF
|
|
|