Mudanças entre as edições de "Resultados de Pesquisa"

De LCAD
Ir para: navegação, pesquisa
Linha 1: Linha 1:
== 2.Resultados do WNN ==
+
== 1. Resultados do VS ==
  
Os resultados preliminares do classificador ''Weightless Neural Network'' (WNN) são mostrados nas tabelas abaixo.
+
Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados na tabela abaixo.
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ <p align=justify>Tabela 2.2: Desempenho do WNN com o <b>DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras</b>.  
+
|+ </p><p align=justify>Tabela 1.1: Desempenho do VS. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
O lexicon é composto por 3391 palavras e a rede neural é configurada com uma imagem 59x58, 14x14 neurônios e 512 sinapses.
 
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
 
  
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=5 | '''Dados de Teste'''  
 
| colspan=5 | '''Dados de Teste'''  
Linha 29: Linha 27:
 
| '''Nível'''
 
| '''Nível'''
 
| '''PT'''
 
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 2.2.1
+
| 1.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 44: Linha 41:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
|  
+
| 78
|  
+
| 99.15%
  
 
|- align="center"
 
|- align="center"
| 2.2.2
+
| 1.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 60: Linha 57:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
|  
+
| 78
|  
+
| 53.76%
  
 
|- align="center"
 
|- align="center"
| 2.2.3
+
| 1.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 76: Linha 73:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
|  
+
| 78
|  
+
| 57.22%
  
 
|- align="center"
 
|- align="center"
| 2.2.4
+
| 1.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 95: Linha 92:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 197
+
| 109
| 71.91%
+
| 80.50%
  
 
|- align="center"
 
|- align="center"
| 2.2.5
+
| 1.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 114: Linha 111:
 
| CLASSE
 
| CLASSE
 
| TF
 
| TF
|  
+
| 122
|  
+
| 82.57%
  
 
|- align="center"
 
|- align="center"
| 2.2.6
+
| 1.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 133: Linha 130:
 
| GRUPO
 
| GRUPO
 
| TF
 
| TF
|  
+
| 122
|  
+
| 86.17%
  
 
|- align="center"
 
|- align="center"
| 2.2.7
+
| 1.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 152: Linha 149:
 
| DIVISÃO
 
| DIVISÃO
 
| TF
 
| TF
|
+
| 122
|  
+
| 89.64%
  
 
|- align="center"
 
|- align="center"
| 2.2.8
+
| 1.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 171: Linha 168:
 
| SEÇÃO
 
| SEÇÃO
 
| TF
 
| TF
|  
+
| 122
|  
+
| 92.44%
 
|}
 
|}
  
 +
<br />
 +
----
 +
<br />
 +
 +
== 2.Resultados do WNN ==
 +
 +
Os resultados preliminares do classificador ''Weightless Neural Network'' (WNN) são mostrados nas tabelas abaixo.
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ <p align=justify>Tabela 2.1: Desempenho do WNN. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''. </p>
+
|+ <p align=justify>Tabela 2.2: Desempenho do WNN com o <b>DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras</b>.
 +
O lexicon é composto por 3391 palavras e a rede neural é configurada com uma imagem 59x58, 14x14 neurônios e 512 sinapses.
 +
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
  
 
|- align="center"
 
|- align="center"
Linha 203: Linha 209:
  
 
|- align="center"
 
|- align="center"
| 2.1.1
+
| 2.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 215: Linha 221:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 78
+
|  
| 98.48%
+
|  
  
 
|- align="center"
 
|- align="center"
| 2.1.2
+
| 2.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 231: Linha 237:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 78
+
|  
| 63.43%
+
|  
  
 
|- align="center"
 
|- align="center"
| 2.1.3
+
| 2.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 247: Linha 253:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 78
+
|  
| 66.48%
+
|  
  
 
|- align="center"
 
|- align="center"
| 2.1.4
+
| 2.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 266: Linha 272:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 109
+
| 197
| 75.69%
+
| 71.91%
  
 
|- align="center"
 
|- align="center"
| 2.1.5
+
| 2.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 285: Linha 291:
 
| CLASSE
 
| CLASSE
 
| TF
 
| TF
| 122
+
|  
| 79.59%
+
|  
  
 
|- align="center"
 
|- align="center"
| 2.1.6
+
| 2.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 304: Linha 310:
 
| GRUPO
 
| GRUPO
 
| TF
 
| TF
| 122
+
|  
| 84.39%
+
|  
  
 
|- align="center"
 
|- align="center"
| 2.1.7
+
| 2.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 323: Linha 329:
 
| DIVISÃO
 
| DIVISÃO
 
| TF
 
| TF
| 122
+
|
| 88.90%
+
|  
  
 
|- align="center"
 
|- align="center"
| 2.1.8
+
| 2.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 342: Linha 348:
 
| SEÇÃO
 
| SEÇÃO
 
| TF
 
| TF
| 122
+
|  
| 92.32%
+
|  
 
|}
 
|}
  
<br />
 
----
 
<br />
 
 
== 3. Resultados do WNN-COR ==
 
 
Os resultados preliminares do classificador ''Weightless Neural Network with Data Correlation'' (WNN-COR) são mostrados na tabela abaixo.
 
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ <p align=justify>Tabela 3.1: Desempenho do WNN-COR. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|+ <p align=justify>Tabela 2.1: Desempenho do WNN. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''. </p>
  
 
|- align="center"
 
|- align="center"
Linha 381: Linha 380:
  
 
|- align="center"
 
|- align="center"
| 3.1.1
+
| 2.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 393: Linha 392:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 110
+
| 78
| 98.65%
+
| 98.48%
  
 
|- align="center"
 
|- align="center"
| 3.1.2
+
| 2.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 409: Linha 408:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 110
+
| 78
| 63.87%
+
| 63.43%
  
 
|- align="center"
 
|- align="center"
| 3.1.3
+
| 2.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 425: Linha 424:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 110
+
| 78
 
| 66.48%
 
| 66.48%
  
 
|- align="center"
 
|- align="center"
| 3.1.4
+
| 2.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 444: Linha 443:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 110
+
| 109
| 80.18%
+
| 75.69%
  
 
|- align="center"
 
|- align="center"
| 3.1.5
+
| 2.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 464: Linha 463:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 81.59%
+
| 79.59%
  
 
|- align="center"
 
|- align="center"
| 3.1.6
+
| 2.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 483: Linha 482:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 84.94%
+
| 84.39%
  
 
|- align="center"
 
|- align="center"
| 3.1.7
+
| 2.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 502: Linha 501:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 90.43%
+
| 88.90%
  
 
|- align="center"
 
|- align="center"
| 3.1.8
+
| 2.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 521: Linha 520:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 93.29%
+
| 92.32%
 
 
 
|}
 
|}
  
 +
<br />
 +
----
 +
<br />
  
== 1. Resultados do VS ==
+
== 3. Resultados do WNN-COR ==
  
Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados na tabela abaixo.
+
Os resultados preliminares do classificador ''Weightless Neural Network with Data Correlation'' (WNN-COR) são mostrados na tabela abaixo.
  
 
{| border=1 align="center"
 
{| border=1 align="center"
|+ </p><p align=justify>Tabela 1.1: Desempenho do VS. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|+ <p align=justify>Tabela 3.1: Desempenho do WNN-COR. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
  
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''EXP.'''
+
| rowspan=2 | '''Exp.'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=6 | '''Dados de Treino'''
 
| colspan=5 | '''Dados de Teste'''  
 
| colspan=5 | '''Dados de Teste'''  
Linha 554: Linha 555:
 
| '''Nível'''
 
| '''Nível'''
 
| '''PT'''
 
| '''PT'''
 +
  
 
|- align="center"
 
|- align="center"
| 1.1.1
+
| 3.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 568: Linha 570:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 78
+
| 110
| 99.15%
+
| 98.65%
  
 
|- align="center"
 
|- align="center"
| 1.1.2
+
| 3.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 584: Linha 586:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 78
+
| 110
| 53.76%
+
| 63.87%
  
 
|- align="center"
 
|- align="center"
| 1.1.3
+
| 3.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
Linha 600: Linha 602:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 78
+
| 110
| 57.22%
+
| 66.48%
  
 
|- align="center"
 
|- align="center"
| 1.1.4
+
| 3.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 619: Linha 621:
 
| SUBCLASSE
 
| SUBCLASSE
 
| TF
 
| TF
| 109
+
| 110
| 80.50%
+
| 80.18%
  
 
|- align="center"
 
|- align="center"
| 1.1.5
+
| 3.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 639: Linha 641:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 82.57%
+
| 81.59%
  
 
|- align="center"
 
|- align="center"
| 1.1.6
+
| 3.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 658: Linha 660:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 86.17%
+
| 84.94%
  
 
|- align="center"
 
|- align="center"
| 1.1.7
+
| 3.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 677: Linha 679:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 89.64%
+
| 90.43%
  
 
|- align="center"
 
|- align="center"
| 1.1.8
+
| 3.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 696: Linha 698:
 
| TF
 
| TF
 
| 122  
 
| 122  
| 92.44%
+
| 93.29%
 +
 
 
|}
 
|}
 
<br />
 
----
 
<br />
 

Edição das 09h01min de 17 de janeiro de 2008

1. Resultados do VS

Os resultados preliminares do classificador Vector Space (VS) são mostrados na tabela abaixo.

</p>

Tabela 1.1: Desempenho do VS. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT
1.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF 78 99.15%
1.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF 78 53.76%
1.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 78 57.22%
1.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 109 80.50%
1.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF 122 82.57%
1.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF 122 86.17%
1.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF 122 89.64%
1.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF 122 92.44%




2.Resultados do WNN

Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados nas tabelas abaixo.

<p align=justify>Tabela 2.2: Desempenho do WNN com o DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras. O lexicon é composto por 3391 palavras e a rede neural é configurada com uma imagem 59x58, 14x14 neurônios e 512 sinapses. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Exp. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT


2.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF
2.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF
2.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF
2.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 197 71.91%
2.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF
2.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF
2.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF
2.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF


Tabela 2.1: Desempenho do WNN. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Exp. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT


2.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF 78 98.48%
2.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF 78 63.43%
2.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 78 66.48%
2.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 109 75.69%
2.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF 122 79.59%
2.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF 122 84.39%
2.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF 122 88.90%
2.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF 122 92.32%




3. Resultados do WNN-COR

Os resultados preliminares do classificador Weightless Neural Network with Data Correlation (WNN-COR) são mostrados na tabela abaixo.

Tabela 3.1: Desempenho do WNN-COR. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF)); CGD denota as classes gramaticais desconsideradas no lexicon; PFS denota a frequência acima da qual a palavra não é incluída no lexicon.

Exp. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites PT CGD PFS Tabela Coluna Limites Nível PT


3.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE TF 110 98.65%
3.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE TF 110 63.87%
3.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 110 66.48%
3.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE TF 110 80.18%
3.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE TF 122 81.59%
3.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO TF 122 84.94%
3.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO TF 122 90.43%
3.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

TF art. prep. 10000 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO TF 122 93.29%