Mudanças entre as edições de "Resultados de Pesquisa"
(→Experimentos removendo combinações de classes gramaticais) |
(→''Tabela 1.5.1'') |
||
Linha 262: | Linha 262: | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | + | 1640 a 3280 | |
| TF | | TF | ||
| art. prep. | | art. prep. | ||
Linha 287: | Linha 287: | ||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| CLASSE | | CLASSE | ||
| TF | | TF | ||
Linha 306: | Linha 306: | ||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| GRUPO | | GRUPO | ||
| TF | | TF | ||
Linha 344: | Linha 344: | ||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SEÇÃO | | SEÇÃO | ||
| TF | | TF |
Edição das 09h39min de 1 de fevereiro de 2008
Índice
Resultados do VS
Os resultados preliminares do classificador Vector Space (VS) são mostrados na tabela abaixo.
Tabela 1.6.1
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.6.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 278 | 99.07% |
1.6.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 278 | 55.32% |
1.6.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 278 | 58.74% |
1.6.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 278 | 80.07% |
1.6.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 278 | 83.36% |
1.6.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 278 | 86.65% |
1.6.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 278 | 90.07% |
1.6.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 278 | 93.78% |
Tabela 1.5.1
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.5.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 268 | 99.49% |
1.5.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 268 | 60.29% |
1.5.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 268 | 63.56% |
1.5.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
1640 a 3280 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 268 | 81.29% |
1.5.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
1640 a 3280 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 268 | 83.42% |
1.5.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
1640 a 3280 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 268 | 86.96% |
1.5.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
1640 a 3280 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 268 | 90.62% |
1.5.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
1640 a 3280 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 268 | 92.63% |
Tabela 1.4.1
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.4.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 268 | 99.49% |
1.4.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | TF | 268 | 55.20% |
1.4.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 268 | 58.20% |
1.4.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 268 | 81.78% |
1.4.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | TF | 268 | 83.97% |
1.4.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | TF | 268 | 87.26% |
1.4.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | TF | 268 | 91.16% |
1.4.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | TF | 268 | 93.66% |
Tabela 1.3.1
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.3.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 253 | 98.39% |
1.3.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | TF | 253 | 22.94% |
1.3.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 253 | 22.92% |
1.3.1.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 253 | 64.12% |
1.3.1.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | TF | 253 | 67.90% |
1.3.1.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | TF | 253 | 75.19% |
1.3.1.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | TF | 253 | 82.92% |
1.3.1.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | TF | 253 | 89.96% |
Tabela 1.2.1
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.2.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 236 | 99.07% |
1.2.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 236 | 53.76% |
1.2.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 57.22% |
1.2.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 81.47% |
1.2.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 236 | 84.28% |
1.2.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 236 | 87.39% |
1.2.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 236 | 91.16% |
1.2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 236 | 93.60% |
Tabela 1.1.1
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.1.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 78 | 99.15% |
1.1.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 78 | 53.76% |
1.1.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 78 | 57.22% |
1.1.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 109 | 80.50% |
1.1.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 122 | 82.57% |
1.1.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 122 | 86.17% |
1.1.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 122 | 89.64% |
1.1.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 122 | 92.44% |
Resultados do WNN
Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados nas tabelas abaixo.
Tabela 2.6.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
2.6.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | % | |
2.6.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | % | |
2.6.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | % | |
2.6.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | % | |
2.6.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | % | |
2.6.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | % | |
2.6.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | % | |
2.6.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | % |
Tabela 2.3.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
2.3.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 258 | 98.14% |
2.3.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | TF | 258 | 28.95% |
2.3.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 258 | 29.70% |
2.3.1.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 258 | 57.25% |
2.3.1.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | TF | 258 | 62.75% |
2.3.1.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | TF | 258 | 68.67% |
2.3.1.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | TF | 258 | 74.16% |
2.3.1.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | TF | 258 | 80.26% |
Tabela 2.2.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
2.2.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 236 | 98.56% |
2.2.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 236 | 63.03% |
2.2.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 66.48% |
2.2.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 72.70% |
2.2.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 236 | 78.61% |
2.2.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 236 | 84.16% |
2.2.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 236 | 90.43% |
2.2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 236 | 92.69% |
Tabela 2.1.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
2.1.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 78 | 98.48% |
2.1.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 78 | 63.43% |
2.1.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 78 | 66.48% |
2.1.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 109 | 75.69% |
2.1.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 122 | 79.59% |
2.1.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 122 | 84.39% |
2.1.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 122 | 88.90% |
2.1.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 122 | 92.32% |
Resultados do WNN-COR
Os resultados preliminares do classificador Weightless Neural Network with Data Correlation (WNN-COR) são mostrados na tabela abaixo.
Tabela 3.3.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
3.3.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 258 | 98.14% |
3.3.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | TF | 258 | 28.95% |
3.3.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 258 | 29.70% |
3.3.1.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | TF | 258 | 62.23% |
3.3.1.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | TF | 258 | 68.24% |
3.3.1.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | TF | 258 | 64.46% |
3.3.1.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | TF | 258 | 73.65% |
3.3.1.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | TF | 258 | 76.31% |
Tabela 3.2.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
3.2.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 236 | 98.56% |
3.2.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 236 | 63.24% |
3.2.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 66.48% |
3.2.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 77.82% |
3.2.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 236 | 79.52% |
3.2.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 236 | 79.52% |
3.2.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 236 | 84.16% |
3.2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 236 | 86.59% |
Tabela 3.1.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
3.1.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 110 | 98.65% |
3.1.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 110 | 63.87% |
3.1.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 110 | 66.48% |
3.1.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 110 | 80.18% |
3.1.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 122 | 81.59% |
3.1.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 122 | 84.94% |
3.1.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 122 | 90.43% |
3.1.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 122 | 93.29% |
Experimentos removendo combinações de classes gramaticais
Os experimentos a seguir foram realizados utilizando o experimento 1.1.x.4 para o VS_CORE. O objetivo deste experimento é combinar diversas classes gramáticais para verificar qual combinação apresenta maior percentual de acerto. As classes gramaticais escolhidas foram:
- Artigo;
- COnjunção;
- Contração;
- Interjeição;
- Preposição;
- Pronome;
Os experimentos foram feitos tanto para o TF quanto para o TFIDF. As tabelas abaixo mostram o resultado dos experimentos realizados.
Considerando TF
CLasses Removidas | Revisão
do SCAE |
Peso | Tamanho
do Lexicon |
Desempenho
(1 - one-error) |
Sem remover | 271 | TF | 1456 | 77,57% |
Artigo | 271 | TF | 1453 | 78,00% |
Conjunção | 271 | TF | 1453 | 76,84% |
Contração | 271 | TF | 1446 | 77,82% |
Interjeição | 271 | TF | 1455 | 77,57% |
Preposição | 271 | TF | 1443 | 80,19% |
Pronome | 271 | TF | 1446 | 77,57% |
Artigo + Interjeição | 271 | TF | 1388 | 77,94% |
Artigo + Preposição | 271 | TF | 1367 | 80,68% |
Interjeição + Preposição | 271 | TF | 1368 | 80,32% |
Artigo + Interjeição + Preposição | 271 | TF | 1366 | 80,68% |
Artigo + Conjunção + Contração + Interjeição
+ Preposição + Pronome |
271 | TF | 1358 | 84,34% |
Considerando TFIDF
CLasses Removidas | Revisão
do SCAE |
Peso | Tamanho
do Lexicon |
Desempenho
(1 - one-error) |
Sem remover | 271 | TFIDF | 1463 | 84,22% |
Artigo | 271 | TFIDF | 1460 | 84.34% |
Conjunção | 271 | TFIDF | 1460 | 83,91% |
Contração | 271 | TFIDF | 1453 | 84,52% |
Interjeição | 271 | TFIDF | 1462 | 84,22% |
Preposição | 271 | TFIDF | 1440 | 84,95% |
Pronome | 271 | TFIDF | 1453 | 83,79% |
Artigo + Interjeição | 271 | TFIDF | 0% | |
Artigo + Preposição | 271 | TFIDF | 1438 | 84,58% |
Interjeição + Preposição | 271 | TFIDF | 0% | |
Artigo + Interjeição + Preposição | 271 | TFIDF | 0% | |
Artigo + Conjunção + Contração + Interjeição
+ Preposição + Pronome |
271 | TFIDF | 1428 | 84,40% |
Como realizar os experimentos
Os experimentos são realizados considerando que o sistema SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos:
1. No diretório code/CORES/DB_CORE executar:
make clean make
2. Construir as tabelas do DB_CORE. No diretório code/CORES/DB_CORE/ existem arquivos .bat para construir as tabelas do DB_CORE. Normalmente, esses arquivos começam com a palavra build. Para maiores esclarecimentos consulte Criando tabelas no DB_CORE.
Para os experimentos que correspondem à tabela CNAE_110_SUBCLASSE-DESCRICAO_SUB rodar o seguinte script:
./build_tables_subclasse_110.bat
Já para os experimentos que correspondem às tabelas CNAE_110_SUBCLASSE-DESCRICAO_SUB e DADOS_VITORIA_SUB_110-OBJETO_SOCIAL rodar o seguinte script
./build_tables_subclasse_110_sub+vit.bat
3. Em code/CORES/DB_CORE, inicializar o servidor DB_CORE:
./db_core init_server ports.cfg
4. No diretório scae/code/CORES/WNN_CORE ou scae/code/CORES/WNN_COR_CORE, editar o arquivo class_cnae.con e definir os valores ótimos para os parâmetros da rede (número de neurônios e sinapses por neurônio):
const NL_WIDTH = 12; const NL_HEIGHT = 12; const SYNAPSES = 512;
Neste exemplo, os parâmetros ótimos são 12x12 neurônios e 512 sinapses.
5. Mudar as categorias (atributo Níveis das tabelas) em cada código fonte para cada "core", quando necessário (default é SUBCLASSE):
Em code/CORES/VS_CORE
kdevelop vector_space.c &
Ou em code/CORES/WNN_CORE/class_cnae_user_functions
kdevelop class_cnae_user_functions.c &
Ou em code/CORES/WNN_COR_CORE/class_cnae_user_functions
kdevelop class_cnae_user_functions.c &
6. Experimentos:
6.1. Para realizar experimentos com o VS_CORE:
No diretório code/CORES/VS_CORE execute:
make clean make ./vs_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experiment_1.1.x.1_train.bat ./experiment_1.1.x.1_test.bat
6.2. Para realizar experimentos com o WNN_CORE:
No diretório code/CORES/WNN_CORE execute:
make clean make ./wnn_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experiment_2.1.x.1_train.bat ./experiment_2.1.x.1_test.bat
6.3. Para realizar experimentos com o WNN_COR_CORE:
No diretório code/CORES/WNN_COR_CORE execute:
make clean make ./wnn_cor_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experiment_3.1.x.1_train.bat ./experiment_3.1.x.1_test.bat
6.4. Para realizar os experimentos de validação com o WNN_COR_CORE (ou WNN_CORE), com o objetivo de ajustar o número de neurônios e sinapses por neurônios:
No diretório code/CORES/USER_INTERFACE, execute o script do experimento de validação:
./experiment_2.1.1.4.bat
Para gerar o gráfico do desempenho (1 - one-error) em função do número de neurônios e sinapses por neurônios, execute:
awk '{if ($1=="NL_WIDTH=")printf("%s %s %s ",$2,$4,$6); if ($13=="HIT")printf("%s\n",$16)}' experiment_2.1.1.4.out > experiment_2.1.1.4.dat gnuplot experiment_2.1.1.4.gp
O gráfico será gerado no arquivo experiment_2.1.1.4.eps.