Mudanças entre as edições de "Resultados de Pesquisa"
(→Ajuste de Parâmetros) |
|||
Linha 361: | Linha 361: | ||
<!-- As Figuras 1 e 2 apresentam resultados de uma série de repetições dos experimentos 2.1.4 e 2.2.4, respectivamente, ao variar o número de neurônios e sinapses por neurônio do categorizador WNN. | <!-- As Figuras 1 e 2 apresentam resultados de uma série de repetições dos experimentos 2.1.4 e 2.2.4, respectivamente, ao variar o número de neurônios e sinapses por neurônio do categorizador WNN. | ||
Esses gráficos mostram o desempenho da classificação em termos de (1 - one_error) em função do número de neurônios e sinapses por neurônio. Todos esses experimentos foram executados pela revisão 250 do SCAE. | Esses gráficos mostram o desempenho da classificação em termos de (1 - one_error) em função do número de neurônios e sinapses por neurônio. Todos esses experimentos foram executados pela revisão 250 do SCAE. | ||
− | |||
[[Imagem:Experiment 2.1.4 tune.jpg|frame|center|130px|Figura 1: Ajuste de parâmetros para experimento 2.1.4]] | [[Imagem:Experiment 2.1.4 tune.jpg|frame|center|130px|Figura 1: Ajuste de parâmetros para experimento 2.1.4]] | ||
[[Imagem:Experiment 2.2.4 tune.jpg|frame|center|130px|Figura 2: Ajuste de parâmetros para experimento 2.2.4]] --> | [[Imagem:Experiment 2.2.4 tune.jpg|frame|center|130px|Figura 2: Ajuste de parâmetros para experimento 2.2.4]] --> | ||
+ | |||
+ | |||
+ | {| border=1 align="center" | ||
+ | |+ <p align=justify>Desempenho do VS com o <b>DICIONÁRIO COMPLETO</b>. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p> | ||
+ | |||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=6 | '''Dados de Treino''' | ||
+ | | colspan=5 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''PT''' | ||
+ | | '''CGD''' | ||
+ | | '''PFS''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | | '''PT''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 1.3.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | TF | ||
+ | | art. prep. | ||
+ | | 20000 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | TF | ||
+ | | 253 | ||
+ | | 99.15%} | ||
==== ''Tabela 2.2'' ==== | ==== ''Tabela 2.2'' ==== |
Edição das 14h12min de 24 de janeiro de 2008
Índice
Resultados do VS
Os resultados preliminares do classificador Vector Space (VS) são mostrados na tabela abaixo.
Tabela 1.3
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.3.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 253 | 99.15% |
1.3.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 87998 | SUBCLASSE | TF | 253 | |
1.3.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 253 | |
1.3.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 253 | |
1.3.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 253 | |
1.3.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 253 | |
1.3.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 253 | |
1.3.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 20000 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 253 |
Tabela 1.2
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||
1.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 236 | 99.07% |
1.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | TF | 236 | 53.76% |
1.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 57.22% |
1.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | TF | 236 | 81.47% |
1.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | TF | 236 | 84.28% |
1.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | TF | 236 | 87.39% |
1.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | TF | 236 | 91.16% |
1.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
TF | art. prep. | 10000 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | TF | 236 | 93.60% |
Resultados do WNN
Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados nas tabelas abaixo.
Ajuste de Parâmetros
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Tabela | Coluna | Limites | PT | CGD | PFS | Tabela | Coluna | Limites | Nível | PT | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.3.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | TF | art. prep. | 20000 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | TF | 253 | 99.15%}
Tabela 2.2
Tabela 2.1
Resultados do WNN-COROs resultados preliminares do classificador Weightless Neural Network with Data Correlation (WNN-COR) são mostrados na tabela abaixo. Tabela 3.2
Tabela 3.1
Como realizar os experimentosOs experimentos são realizados considerando que o sistema SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos: 1. No diretório code/CORES/DB_CORE executar: make clean make 2. Construir as tabelas do DB_CORE. No diretório code/CORES/DB_CORE/ existem arquivos .bat para construir as tabelas do DB_CORE. Normalmente, esses arquivos começam com a palavra build. Para maiores esclarecimentos consulte Criando tabelas no DB_CORE. Para os experimentos que correspondem à tabela CNAE_110_SUBCLASSE-DESCRICAO_SUB rodar o seguinte script: ./build_tables_subclasse_110.bat Já para os experimentos que correspondem às tabelas CNAE_110_SUBCLASSE-DESCRICAO_SUB e DADOS_VITORIA_SUB_110-OBJETO_SOCIAL rodar o seguinte script ./build_tables_subclasse_110_sub+vit.bat Obs: A cada comando build para os cores que alterem a MAE (WNN_CORE e WNN_COR_CORE), recalcular a raiz quadrada do tamanho do lexicon para posterior edicao dos arquivos class_cnae.con. Após obtida a raiz quadrada, editar, no diretório scae/code/CORES/WNN_CORE ou scae/code/CORES/WNN_COR_CORE, os respectivos arquivos class_cnae.con nas seguintes linhas dos mesmos: const IN_WIDTH = 37; const IN_HEIGHT = 37; esse caso representa um lexicon de tamanho 1366, cuja funcao teto da raiz quadrada, 37, é o valor mais adequado para const IN_WIDTH e const IN_HEIGHT, de modo que o resultado da multiplicacao dessas constantes mais se aproxima do tamanho do lexicon. A cada comando build para os cores que alterem a MAE (WNN_CORE e WNN_COR_CORE), usar como valor de const SYNAPSES a potência de 2 mais próxima e menor que aproximadamente 1/4 do tamanho do lexicon. const SYNAPSES = 256; esse caso representa um lexicon de tamanho 1366. 1/4 desse valor aproximadamente é 342. A potência de 2 que mais se aproxima e é menor que esse valor obtido é 256, o valor a ser preenchido. 3. Em code/CORES/DB_CORE, inicializar o servidor DB_CORE: ./db_core init_server ports.cfg 4. Mudar as categorias (atributo Níveis das tabelas) em cada código fonte para cada "core", quando necessário (default é SUBCLASSE): Em /home/victor/scae/code/CORES/VS_CORE kdevelop vector_space.c & Ou em /home/victor/scae/code/CORES/WNN_CORE/class_cnae_user_functions kdevelop class_cnae_user_functions.c & Ou em /home/victor/scae/code/CORES/WNN_COR_CORE/class_cnae_user_functions kdevelop class_cnae_user_functions.c & 5. Experimentos: 5.1. Para realizar experimentos com o VS_CORE: No diretório code/CORES/VS_CORE execute: make clean make ./vs_core No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo: ./experimento_1.1.1_train.bat ./experimento_1.1.1_test.bat 5.2. Para realizar experimentos com o WNN_CORE: No diretório code/CORES/WNN_CORE execute: make clean make ./wnn_core No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo: ./experimento_2.1.1_train.bat ./experimento_2.1.1_test.bat 5.3. Para realizar experimentos com o WNN_COR_CORE: No diretório code/CORES/WNN_COR_CORE execute: make clean make ./wnn_cor_core No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo: ./experimento_3.1.1_train.bat ./experimento_3.1.1_test.bat |