Mudanças entre as edições de "Resultados de Pesquisa"

De LCAD
Ir para: navegação, pesquisa
(Resultados do WNN)
Linha 1: Linha 1:
==Resultados do WNN==
+
== 2.Resultados do WNN ==
  
 
Os resultados preliminares do classificador ''Weightless Neural Network'' (WNN) são mostrados nas tabelas abaixo.
 
Os resultados preliminares do classificador ''Weightless Neural Network'' (WNN) são mostrados nas tabelas abaixo.
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ <p align=justify>Tabela: Desempenho do WNN com o <b>DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras</b>.  
+
|+ <p align=justify>Tabela 2.2: Desempenho do WNN com o <b>DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras</b>.  
 
O lexicon é composto por 3391 palavras e a rede neural é configurada com uma imagem 59x58, 14x14 neurônios e 512 sinapses.
 
O lexicon é composto por 3391 palavras e a rede neural é configurada com uma imagem 59x58, 14x14 neurônios e 512 sinapses.
 
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
 
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
  
 
|- align="center"
 
|- align="center"
 +
| rowspan=2 | '''Exp.'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=5 | '''Dados de Teste'''  
 
| colspan=5 | '''Dados de Teste'''  
Linha 31: Linha 32:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 46: Linha 48:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 61: Linha 64:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 76: Linha 80:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 94: Linha 99:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 112: Linha 118:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 130: Linha 137:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 148: Linha 156:
  
 
|- align="center"
 
|- align="center"
 +
| 2.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 168: Linha 177:
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ <p align=justify>Tabela: Desempenho do WNN. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''. </p>
+
|+ <p align=justify>Tabela 2.1: Desempenho do WNN. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''. </p>
  
 
|- align="center"
 
|- align="center"
 +
| rowspan=2 | '''Exp.'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=5 | '''Dados de Teste'''  
 
| colspan=5 | '''Dados de Teste'''  
Linha 193: Linha 203:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 208: Linha 219:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 223: Linha 235:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 238: Linha 251:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 256: Linha 270:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 274: Linha 289:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 292: Linha 308:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 310: Linha 327:
  
 
|- align="center"
 
|- align="center"
 +
| 2.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 332: Linha 350:
 
<br />
 
<br />
  
==Resultados do WNN-COR==
+
== 3. Resultados do WNN-COR ==
  
 
Os resultados preliminares do classificador ''Weightless Neural Network with Data Correlation'' (WNN-COR) são mostrados na tabela abaixo.
 
Os resultados preliminares do classificador ''Weightless Neural Network with Data Correlation'' (WNN-COR) são mostrados na tabela abaixo.
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ <p align=justify>Tabela: Desempenho do WNN-COR. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|+ <p align=justify>Tabela 3.1: Desempenho do WNN-COR. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
  
 
|- align="center"
 
|- align="center"
 +
| rowspan=2 | '''Exp.'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=5 | '''Dados de Teste'''  
 
| colspan=5 | '''Dados de Teste'''  
Linha 362: Linha 381:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 377: Linha 397:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 392: Linha 413:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 407: Linha 429:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 425: Linha 448:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 443: Linha 467:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 461: Linha 486:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 479: Linha 505:
  
 
|- align="center"
 
|- align="center"
 +
| 3.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 498: Linha 525:
 
|}
 
|}
  
==Resultados do VS==
+
 
 +
== 1. Resultados do VS ==
  
 
Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados na tabela abaixo.
 
Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados na tabela abaixo.
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ </p><p align=justify>Tabela: Desempenho do VS. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|+ </p><p align=justify>Tabela 1.1: Desempenho do VS. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
  
 
|- align="center"
 
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=5 | '''Dados de Teste'''  
 
| colspan=5 | '''Dados de Teste'''  
Linha 525: Linha 554:
 
| '''Nível'''
 
| '''Nível'''
 
| '''PT'''
 
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 543: Linha 572:
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 558: Linha 588:
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 573: Linha 604:
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 591: Linha 623:
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 609: Linha 642:
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 627: Linha 661:
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 645: Linha 680:
  
 
|- align="center"
 
|- align="center"
 +
| 1.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110

Edição das 17h33min de 11 de janeiro de 2008

2.Resultados do WNN

Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados nas tabelas abaixo.

Tabela 2.2: Desempenho do WNN com o DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras. O lexicon é composto por 3391 palavras e a rede neural é configurada com uma imagem 59x58, 14x14 neurônios e 512 sinapses. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Exp. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT


2.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF
2.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF
2.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF
2.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 197 71.91%
2.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF
2.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF
2.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF
2.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF


Tabela 2.1: Desempenho do WNN. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Exp. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT


2.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF 78 98.48%
2.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF 78 63.43%
2.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 78 66.48%
2.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 109 75.69%
2.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF 122 79.59%
2.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF 122 84.39%
2.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF 122 88.90%
2.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF 122 92.32%




3. Resultados do WNN-COR

Os resultados preliminares do classificador Weightless Neural Network with Data Correlation (WNN-COR) são mostrados na tabela abaixo.

Tabela 3.1: Desempenho do WNN-COR. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Exp. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT


3.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF 110 98.65%
3.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF 110 63.87%
3.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 110 66.48%
3.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 110 80.18%
3.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF 122 81.59%
3.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF 122 84.94%
3.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF 122 90.43%
3.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF 122 93.29%


1. Resultados do VS

Os resultados preliminares do classificador Vector Space (VS) são mostrados na tabela abaixo.

Tabela 1.1: Desempenho do VS. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT
1.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF 78 99.15%
1.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF 78 53.76%
1.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 78 57.22%
1.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 109 80.50%
1.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF 122 82.57%
1.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF 122 86.17%
1.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF 122 89.64%
1.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF 122 92.44%