Resultados de Pesquisa
Índice
Resultados do VS
Os resultados preliminares do classificador Vector Space (VS) são mostrados na tabela abaixo.
Tabela 1.3
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.3.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 253 | 99.15% |
1.3.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 87998 | SUBCLASSE | TF | 253 | |
1.3.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 253 | |
1.3.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 253 | |
1.3.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 253 | |
1.3.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 253 | |
1.3.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 253 | |
1.3.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 253 |
Tabela 1.2
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 236 | 99.07% |
1.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 236 | 53.76% |
1.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 57.22% |
1.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 81.47% |
1.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 236 | 84.28% |
1.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 236 | 87.39% |
1.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 236 | 91.16% |
1.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 236 | 93.60% |
Resultados do WNN
Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados nas tabelas abaixo.
Ajuste de Parâmetros
Para ajustar os parâmetros do WNN, o conjunto de treino(-e-validação) foi dividido em um conjunto de treino, usado para construir indutivamente o categorizador, e um conjunto de validação, usado para avaliar o desempenho do categorizador na série de experimentos para otimização de parâmetros. A tabela abaixo descreve os conjuntos de treino e validação.
Exp. | Dados de Treino | Dados de Validação | Revisão
do SCAE |
Desempenho
(1 - one-error) | ||||||||||
Tabela | Coluna | Limites | Dicionário | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
2.1.4.v | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 819 |
subclasse | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 820 a 1640 | SUBCLASSE | TF | 250 | ver Figura 1 |
2.2.4.v | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 819 |
completo | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 820 a 1640 | SUBCLASSE | TF | 250 | ver Figura 2 |
As Figuras 1 e 2 apresentam os resultados dos experimentos de validação 2.1.4.v e 2.2.4.v, respectivamente, empregados para ajustar o número de neurônios e sinapses por neurônio do WNN. Esses gráficos mostram o desempenho do classificador em termos de (1 - one-error) em função do número de neurônios e sinapses por neurônio.
Tabela 2.2
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
2.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 236 | 98.56% |
2.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 236 | 63.03% |
2.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 66.48% |
2.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 72.70% |
2.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 236 | 78.61% |
2.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 236 | 84.16% |
2.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 236 | 90.43% |
2.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 236 | 92.69% |
Tabela 2.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
2.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 78 | 98.48% |
2.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 78 | 63.43% |
2.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 78 | 66.48% |
2.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 109 | 75.69% |
2.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 122 | 79.59% |
2.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 122 | 84.39% |
2.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 122 | 88.90% |
2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 122 | 92.32% |
Resultados do WNN-COR
Os resultados preliminares do classificador Weightless Neural Network with Data Correlation (WNN-COR) são mostrados na tabela abaixo.
Tabela 3.2
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
3.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 246 | 98.56% |
3.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 246 | 63.03% |
3.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 246 | 65.94% |
3.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 246 | 76.54% |
3.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 246 | 80.56% |
3.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 246 | 77.39% |
3.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 246 | 81.47% |
3.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 246 | 85.37% |
Tabela 3.1
Exp. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT
| |||
3.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 110 | 98.65% |
3.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 110 | 63.87% |
3.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 110 | 66.48% |
3.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 110 | 80.18% |
3.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 122 | 81.59% |
3.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 122 | 84.94% |
3.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 122 | 90.43% |
3.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 122 | 93.29% |
Como realizar os experimentos
Os experimentos são realizados considerando que o sistema SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos:
1. No diretório code/CORES/DB_CORE executar:
make clean make
2. Construir as tabelas do DB_CORE. No diretório code/CORES/DB_CORE/ existem arquivos .bat para construir as tabelas do DB_CORE. Normalmente, esses arquivos começam com a palavra build. Para maiores esclarecimentos consulte Criando tabelas no DB_CORE.
Para os experimentos que correspondem à tabela CNAE_110_SUBCLASSE-DESCRICAO_SUB rodar o seguinte script:
./build_tables_subclasse_110.bat
Já para os experimentos que correspondem às tabelas CNAE_110_SUBCLASSE-DESCRICAO_SUB e DADOS_VITORIA_SUB_110-OBJETO_SOCIAL rodar o seguinte script
./build_tables_subclasse_110_sub+vit.bat
Obs: A cada comando build para os cores que alterem a MAE (WNN_CORE e WNN_COR_CORE), recalcular a raiz quadrada do tamanho do lexicon para posterior edicao dos arquivos class_cnae.con. Após obtida a raiz quadrada, editar, no diretório scae/code/CORES/WNN_CORE ou scae/code/CORES/WNN_COR_CORE, os respectivos arquivos class_cnae.con nas seguintes linhas dos mesmos:
const IN_WIDTH = 37; const IN_HEIGHT = 37; esse caso representa um lexicon de tamanho 1366, cuja funcao teto da raiz quadrada, 37, é o valor mais adequado para const IN_WIDTH e const IN_HEIGHT, de modo que o resultado da multiplicacao dessas constantes mais se aproxima do tamanho do lexicon.
A cada comando build para os cores que alterem a MAE (WNN_CORE e WNN_COR_CORE), usar como valor de const SYNAPSES a potência de 2 mais próxima e menor que aproximadamente 1/4 do tamanho do lexicon.
const SYNAPSES = 256; esse caso representa um lexicon de tamanho 1366. 1/4 desse valor aproximadamente é 342. A potência de 2 que mais se aproxima e é menor que esse valor obtido é 256, o valor a ser preenchido.
3. Em code/CORES/DB_CORE, inicializar o servidor DB_CORE:
./db_core init_server ports.cfg
4. Mudar as categorias (atributo Níveis das tabelas) em cada código fonte para cada "core", quando necessário (default é SUBCLASSE):
Em /home/victor/scae/code/CORES/VS_CORE
kdevelop vector_space.c &
Ou em /home/victor/scae/code/CORES/WNN_CORE/class_cnae_user_functions
kdevelop class_cnae_user_functions.c &
Ou em /home/victor/scae/code/CORES/WNN_COR_CORE/class_cnae_user_functions
kdevelop class_cnae_user_functions.c &
5. Experimentos:
5.1. Para realizar experimentos com o VS_CORE:
No diretório code/CORES/VS_CORE execute:
make clean make ./vs_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experimento_1.1.1_train.bat ./experimento_1.1.1_test.bat
5.2. Para realizar experimentos com o WNN_CORE:
No diretório code/CORES/WNN_CORE execute:
make clean make ./wnn_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experimento_2.1.1_train.bat ./experimento_2.1.1_test.bat
5.3. Para realizar experimentos com o WNN_COR_CORE:
No diretório code/CORES/WNN_COR_CORE execute:
make clean make ./wnn_cor_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experimento_3.1.1_train.bat ./experimento_3.1.1_test.bat