Mudanças entre as edições de "Resultados de Pesquisa"

De LCAD
Ir para: navegação, pesquisa
(''Tabela 3.2.1'')
 
(255 revisões intermediárias por 7 usuários não estão sendo mostradas)
Linha 1: Linha 1:
 
__TOC__
 
__TOC__
 +
[[category:SCAE]]
 
== Legenda dos Termos das Tabelas ==
 
== Legenda dos Termos das Tabelas ==
 
*'''PT''': Denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)'');
 
*'''PT''': Denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)'');
 
*'''CGD''': Denota as classes gramaticais desconsideradas no ''lexicon'';  
 
*'''CGD''': Denota as classes gramaticais desconsideradas no ''lexicon'';  
 
*'''PFS''': Denota a freqüência acima da qual a palavra não é incluída no ''lexicon''.
 
*'''PFS''': Denota a freqüência acima da qual a palavra não é incluída no ''lexicon''.
 +
 +
== Características dos Dicionários ==
 +
=== dicionario_subclasse.csv ===
 +
----
 +
 +
=== dicionario_completo.csv ===
 +
----
 +
 +
=== dicionario_110_sub+bh.csv ===
 +
----
 +
A tabela dados_bh_110.csv foi truncada em 14825 linhas.
 +
 +
=== dicionario_sem_stop_stemm_sem_accent.csv ===
 +
----
 +
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [http://ensino.univates.br/~mald/]) que empregou (na ordem de apresentação) as seguintes filtragens: ''remoção de stop words''; ''stemming''; retirada de acentos. O tamanho do dicionário obtido foi de 11550 palavras.
 +
 +
=== dicionario_sem_stop_stemm.csv ===
 +
----
 +
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [http://ensino.univates.br/~mald/]) que empregou (na ordem de apresentação) as seguintes filtragens: ''remoção de stop words'' e ''stemming''. O tamanho do dicionário obtido foi de 11737 palavras.
 +
 +
=== dicionario_completo_corrigido.csv ===
 +
----
 +
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE_CORRIGIDO (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110_CORRIGIDO (coluna objeto social).
 +
 +
=== dicionario_sem_stop_stemm_sem_accent_f2.csv ===
 +
----
 +
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário foram utilizados as seguintes filtragens (na ordem de apresentação): remoção dos acentos, remoção das stop words e por último a remoção de plural. O filtro utilizado foi implentado (em Java) por Patrick. O tamanho do dicionário obtido foi de 12795 palavras.
 +
 +
=== dicionario_completo+bh.csv ===
 +
----
 +
Este dicionário foi gerado mesclando-se o dicionário_completo.csv e o dicionario_110_sub+bh.csv. A tabela dados_bh_110.csv foi truncada em 14825 linhas.
  
 
== Resultados do Corretor Ortográfico ==
 
== Resultados do Corretor Ortográfico ==
Linha 10: Linha 42:
 
== Resultados do VS ==
 
== Resultados do VS ==
  
Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados na tabela abaixo.
+
Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados nas tabelas abaixo.
  
==== ''Tabela 1.8.1'' ====
+
==== ''Tabela 1.8.2'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>Desempenho do VS com o <b>dicionario_completo+bh.csv</b> que foi obtido mesclando-se o dicionário_completo.csv e o dicionario_110_sub+bh.csv (para estes estes a tabela <b>dados_bh_110.csv</b> foi truncada em 14825 linhas). O tempo médio de execução para cada experimento foi de 16,8 minutos (tempo de treino + tempo de teste). O lexicon para este experimento foi criado retirando-se as classes gramaticais artigo, conjunção, contração, interjeição, preposição e pronome, sendo que para os experimentos 1.8.1.1 à 1.8.1.3, o lexicon é composto por 1355 palavras, já para os experimentos 1.8.1.4 à 1.8.1.8, o lexicon é composto por 5725. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
+
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo.2Bbh.csv|dicionario_completo+bh.csv]]
 +
|width="60%"| '''CGD''': prep.
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="60%"| '''PFS''': 20000
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1367
 +
* Linhas 4-8: 5771
 +
|}
  
 +
<br />
 +
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
| rowspan=2 |'''Desempenho'''
+
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
'''(1 - one-error)'''
 
  
 
|- align="center"
 
|- align="center"
Linha 30: Linha 79:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 1.8.1.1
+
| 1.8.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. conj. contr. interj. prep. pron.
 
| 20000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 290
 
 
| 99.07%
 
| 99.07%
  
 
|- align="center"
 
|- align="center"
| 1.8.1.2
+
| 1.8.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 20000
+
| 0 a 3495
| DADOS_BH_SUB_110
+
0 a 3280
DADOS_VITORIA_SUB_110  
 
| OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 3495 <br> 0 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 290
+
| 45.89%
| 42.70%
 
  
 
|- align="center"
 
|- align="center"
| 1.8.1.3
+
| 1.8.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 20000
+
| NOWRAP | 1748 a 3495
| DADOS_BH_SUB_110
+
1640 a 3280
DADOS_VITORIA_SUB_110
+
| SUBCLASSE
| OBJETO_SOCIAL
+
| 350
OBJETO_SOCIAL
+
| 47.12%
| 1748 a 3495 <br> 1640 a 3280
 
| SUBCLASSE
 
| TF
 
| 290
 
| 43.32%
 
  
 
|- align="center"
 
|- align="center"
| 1.8.1.4
+
| 1.8.2.4
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
+
| 0 a 1182 0 a 1747 0 a 1639
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 20000
+
| 1748 a 3495 1640 a 3280
| DADOS_BH_SUB_110
 
DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 1748 a 3495 <br> 1640 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 290
+
| 73.59%
| 73.62%
 
  
 
|- align="center"
 
|- align="center"
| 1.8.1.5
+
| 1.8.2.5
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
+
| 0 a 1182 0 a 1747 0 a 1639
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 20000
+
| 1748 a 3495 1640 a 3280
| DADOS_BH_SUB_110
 
DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 1748 a 3495 <br> 1640 a 3280
 
 
| CLASSE
 
| CLASSE
| TF
+
| 350
| 290
+
| 76.25%
| 76.60%
 
  
 
|- align="center"
 
|- align="center"
| 1.8.1.6
+
| 1.8.2.6
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
+
| 0 a 1182 0 a 1747 0 a 1639
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 20000
+
| 1748 a 3495 1640 a 3280
| DADOS_BH_SUB_110
 
DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 1748 a 3495 <br> 1640 a 3280
 
 
| GRUPO
 
| GRUPO
| TF
+
| 350
| 290
+
| 80.64%
| 81.88%
 
  
 
|- align="center"
 
|- align="center"
| 1.8.1.7
+
| 1.8.2.7
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
+
| 0 a 1182 0 a 1747 0 a 1639
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 20000
+
| 1748 a 3495 1640 a 3280
| DADOS_BH_SUB_110
+
| DIVISÃO
DADOS_VITORIA_SUB_110
+
| 350
| OBJETO_SOCIAL
+
| 85.48%
OBJETO_SOCIAL
+
 
| 1748 a 3495 <br> 1640 a 3280
 
| DIVISÃO
 
| TF
 
| 290
 
| 86.87%
 
 
 
 
|- align="center"
 
|- align="center"
| 1.8.1.8
+
| 1.8.2.8
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
+
| 0 a 1182 0 a 1747 0 a 1639
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 20000
+
| 1748 a 3495 1640 a 3280
| DADOS_BH_SUB_110
 
DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 1748 a 3495 <br> 1640 a 3280
 
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 350
| 290
+
| 89.14%
| 90.94%
 
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 1.7.1'' ====
+
==== ''Tabela 1.8.1'' ====
 
----
 
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo.2Bbh.csv|dicionario_completo+bh.csv]]
 +
|width="60%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="60%"| '''PFS''': 20000
 +
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1355 palavras
 +
* Linhas 4-8: 5725 palavras
 +
|}
 +
 +
<br />
  
{| border=1 align="center"
+
{| border=1 width="100%"
|+ <p align=justify>Desempenho do VS com o <b>dicionario_stop_stemm_accent_f2.csv</b>. Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário foram utilizados as seguintes filtragens (na ordem de apresentação): ''remoção dos acentos'', ''remoção das stop words'' e por último a ''remoção de plural''. O filtro utilizado foi implentado (em Java) por Patrick. O tamanho do dicionário obtido foi de 12795 palavras. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
 
 
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
| rowspan=2 |'''Desempenho'''
+
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
'''(1 - one-error)'''
 
  
 
|- align="center"
 
|- align="center"
Linha 203: Linha 220:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.1
+
| 1.8.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| *
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 290
| 268
+
| 99.07%
| 100.00%
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.2
+
| 1.8.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110  
| *
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 10000
+
| 0 a 3495 <br> 0 a 3280
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 290
| 268
+
| 42.70%
| 59.77%
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.3
+
| 1.8.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| *
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 10000
+
| NOWRAP | 1748 a 3495
| DADOS_VITORIA_SUB_110
+
1640 a 3280
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 290
| 268
+
| 43.32%
| 63.38%
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.4
+
| 1.8.1.4
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 <br> 1640 a 3280
| TF
 
| *
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 290
| 268
+
| 73.62%
| 80.99%
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.5
+
| 1.8.1.5
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| TF
+
| CLASSE
| *
+
| 290
| 10000
+
| 76.60%
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| CLASSE
 
| TF
 
| 268
 
| 82.45%
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.6
+
| 1.8.1.6
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 <br> 1640 a 3280
| TF
 
| *
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| GRUPO
 
| GRUPO
| TF
+
| 290
| 268
+
| 81.88%
| 85.74%
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.7
+
| 1.8.1.7
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 <br> 1640 a 3280
| TF
+
| DIVISÃO
| *
+
| 290
| 10000
+
| 86.87%
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| DIVISÃO
 
| TF
 
| 268
 
| 90.62%
 
  
 
|- align="center"
 
|- align="center"
| 1.7.1.8
+
| 1.8.1.8
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 <br> 0 a 1747 <br> 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 <br> 1640 a 3280
| TF
 
| *
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 290
| 268
+
| 90.94%
| 93.17%
 
 
|}
 
|}
  
 +
<br />
  
<br />
+
==== ''Tabela 1.7.2'' ====
 
----
 
----
<br />
+
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]]
 +
|width="60%"| '''CGD''': -
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="60%"| '''PFS''': 10000
  
==== ''Tabela 1.6.1'' ====
+
|-
----
+
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1372
 +
* Linhas 4-8: 3919
 +
|}
  
{| border=1 align="center"
+
<br />
|+ <p align=justify>Desempenho do VS com o <b>dicionario_completo_corrigido.csv</b>. Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE_CORRIGIDO (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110_CORRIGIDO (coluna objeto social). O tempo médio de execução para cada experimento foi de 4.5 minutos (tempo de treino + tempo de teste). PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 380: Linha 361:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.1
+
| 1.7.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 278
+
| 100.00%
| 99.07%
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.2
+
| 1.7.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 278
+
| 64.74%
| 55.32%
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.3
+
| 1.7.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 278
+
| 68.98%
| 58.74%
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.4
+
| 1.7.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 445: Linha 410:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 278
+
| 82.45%
| 80.07%
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.5
+
| 1.7.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 464: Linha 425:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TF
+
| 350
| 278
+
| 83.85%
| 83.36%
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.6
+
| 1.7.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 483: Linha 440:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TF
+
| 350
| 278
+
| 86.29%
| 86.65%
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.7
+
| 1.7.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 502: Linha 455:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TF
+
| 350
| 278
+
| 89.15%
| 90.07%
 
  
 
|- align="center"
 
|- align="center"
| 1.6.1.8
+
| 1.7.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 521: Linha 470:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 350
| 278
+
| 90.92%
| 93.78%
 
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 1.5.1'' ====
+
==== ''Tabela 1.7.1'' ====
 
----
 
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]]
 +
|width="60%"| '''CGD''': -
  
{| border=1 align="center"
+
|-
|+ <p align=justify>Desempenho do VS com o <b>dicionario_stop_stemm.csv</b>. Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário foram utilizados os seguintes filtros: ''remoção de stop words'' e ''stemming''. O tamanho do dicionário obtido foi de 11737 palavras. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
+
|width="60%"| '''PFS''': 10000
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1372
 +
* Linhas 4-8: 3919
 +
|}
 +
 
 +
<br />
 +
 
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 554: Linha 516:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 1.5.1.1
+
| 1.7.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| *
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 347
| 268
+
| 100.00%
| 99.49%
 
  
 
|- align="center"
 
|- align="center"
| 1.5.1.2
+
| 1.7.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 347
| 268
+
| 59.77%
| 60.29%
 
  
 
|- align="center"
 
|- align="center"
| 1.5.1.3
+
| 1.7.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 347
| 268
+
| 63.38%
| 63.56%
 
  
 
|- align="center"
 
|- align="center"
| 1.5.1.4
+
| 1.7.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 619: Linha 565:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 347
| 268
+
| 80.99%
| 81.29%
 
  
 
|- align="center"
 
|- align="center"
| 1.5.1.5
+
| 1.7.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 638: Linha 580:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TF
+
| 347
| 268
+
| 82.45%
| 83.42%
 
  
 
|- align="center"
 
|- align="center"
| 1.5.1.6
+
| 1.7.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 657: Linha 595:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TF
+
| 347
| 268
+
| 85.74%
| 86.96%
 
  
 
|- align="center"
 
|- align="center"
| 1.5.1.7
+
| 1.7.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 676: Linha 610:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TF
+
| 347
| 268
 
 
| 90.62%
 
| 90.62%
  
 
|- align="center"
 
|- align="center"
| 1.5.1.8
+
| 1.7.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 695: Linha 625:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 347
| 268
+
| 93.17%
| 92.63%
 
 
|}
 
|}
  
 
<br />
 
<br />
 +
 +
==== ''Tabela 1.6.2'' ====
 
----
 
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]]
 +
|width="60%"| '''CGD''': prep.
 +
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="60%"| '''PFS''': 10000
 +
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1365
 +
* Linhas 4-8: 3703
 +
|}
 +
 
<br />
 
<br />
  
==== ''Tabela 1.4.1'' ====
+
{| border=1 width="100%"
----
 
 
 
{| border=1 align="center"
 
|+ <p align=justify>Desempenho do VS com o <b>dicionario_sem_stop_stemm_sem_accent.csv</b>. Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [http://ensino.univates.br/~mald/]) que empregou (na ordem de apresentação) as seguintes filtragens: ''remoção de stop words''; ''stemming''; retirada de acentos. O tamanho do dicionário obtido foi de 11550 palavras. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
 
 
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 730: Linha 671:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.1
+
| 1.6.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| *
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 268
+
| 99.07%
| 99.49%
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.2
+
| 1.6.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 268
+
| 65.28%
| 55.20%
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.3
+
| 1.6.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 268
+
| 68.74%
| 58.20%
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.4
+
| 1.6.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 795: Linha 720:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 350
| 268
+
| 83.73%
| 81.78%
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.5
+
| 1.6.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 814: Linha 735:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TF
+
| 350
| 268
+
| 85.13%
| 83.97%
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.6
+
| 1.6.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 833: Linha 750:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TF
+
| 350
| 268
+
| 87.51%
| 87.26%
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.7
+
| 1.6.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 852: Linha 765:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TF
+
| 350
| 268
+
| 90.49%
| 91.16%
 
  
 
|- align="center"
 
|- align="center"
| 1.4.1.8
+
| 1.6.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 871: Linha 780:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| *
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 350
| 268
+
| 92.08%
| 93.66%
 
 
|}
 
|}
  
 
<br />
 
<br />
 +
 +
==== ''Tabela 1.6.1'' ====
 
----
 
----
<br />
+
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]]
 +
|width="60%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="60%"| '''PFS''': 10000
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1353 palavras
 +
* Linhas 4-8: 3661 palavras
 +
|}
 +
 
 +
<br />  
  
==== ''Tabela 1.3.1'' ====
+
{| border=1 width="100%"
----
 
{| border=1 align="center"
 
|+ <p align=justify>Desempenho do VS com o <b>dicionario_110_sub+bh.csv</b> e com <b>3496</b> atividades econômicas distintas (a tabela <b>dados_bh_110.csv</b> foi truncada em 14825 linhas). O lexicon para este experimento foi criado retirando-se as classes gramaticais artigo, conjunção, contração, interjeição, preposição e pronome, sendo que para os experimentos 1.3.1.1 à 1.3.1.3, o lexicon é composto por 1310 palavras, já para os experimentos 1.3.1.4 à 1.3.1.8, o lexicon é composto por 4517. O tempo médio de execução para cada experimento foi de 5,1 minutos (tempo de treino + tempo de teste). PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.</p>
 
 
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 905: Linha 825:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.1
+
| 1.6.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. conj. contr. interj. prep. pron.
 
| 20000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 278
| 342
+
| 99.07%
| 98.31%
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.2
+
| 1.6.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 0 a 3495
+
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 278
| 342
+
| 62.69%
| 24.57%
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.3
+
| 1.6.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 278
| 342
+
| 66.00%
| 22.92%
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.4
+
| 1.6.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 278
| 342
+
| 82.82%
| 63.69%
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.5
+
| 1.6.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TF
+
| 278
| 342
+
| 84.83%
| 67.55%
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.6
+
| 1.6.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TF
+
| 278
| 342
+
| 88.12%
| 74.51%
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.7
+
| 1.6.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TF
+
| 278
| 342
+
| 91.71%
| 81.46%
 
  
 
|- align="center"
 
|- align="center"
| 1.3.1.8
+
| 1.6.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. conj. contr. interj. prep. pron.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 278
| 342
+
| 93.66%
| 88.24%
 
 
|}
 
|}
  
<br />
 
----
 
 
<br />
 
<br />
  
==== ''Tabela 1.2.2'' ====
+
==== ''Tabela 1.5.2'' ====
 
----
 
----
{| border=0 width="80%"  
+
{| border=0 width="100%"  
 
|-
 
|-
| '''Dicionário''': dicionario_completo.csv
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]]
 +
|width="60%"| '''CGD''': -
  
 
|-
 
|-
| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
| '''PFS''': 10000
+
|width="60%"| '''PFS''': 10000
  
 
|-
 
|-
| '''Construções das tabelas''':  
+
|width="40%"| '''Construções das tabelas''':  
 
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat  
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat  
| '''Tamanhos dos ''lexicons''''':   
+
|width="60%"| '''Tamanhos dos ''lexicons''''':   
* Linhas 1-3: 1367 palavras
+
* Linhas 1-3: 1258 palavras
* Linhas 4-8: 3905 palavras
+
* Linhas 4-8: 3257 palavras
 
|}
 
|}
  
Linha 1 086: Linha 969:
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=4 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 1 097: Linha 980:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 1 104: Linha 986:
  
 
|- align="center"
 
|- align="center"
| 1.2.2.1
+
| 1.5.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| prep.
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 402
| 99,07%
+
| 99.49%
  
 
|- align="center"
 
|- align="center"
| 1.2.2.2
+
| 1.5.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 402
| 62,94%
+
| 62.82%
  
 
|- align="center"
 
|- align="center"
| 1.2.2.3
+
| 1.5.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 402
| 66,79%
+
| 66.97%
  
 
|- align="center"
 
|- align="center"
| 1.2.2.4
+
| 1.5.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 150: Linha 1 029:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 402
| 82,88%
+
| 82.08%
  
 
|- align="center"
 
|- align="center"
| 1.2.2.5
+
| 1.5.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 166: Linha 1 044:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| 324
+
| 402
| 84,34%
+
| 83.79%
 
+
 
 
|- align="center"
 
|- align="center"
| 1.2.2.6
+
| 1.5.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 182: Linha 1 059:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| 324
+
| 402
| 87,08%
+
| 86.65%
  
 
|- align="center"
 
|- align="center"
| 1.2.2.7
+
| 1.5.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 198: Linha 1 074:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| 324
+
| 402
| 90,01%
+
| 89.21%
  
 
|- align="center"
 
|- align="center"
| 1.2.2.8
+
| 1.5.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 214: Linha 1 089:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| 324
+
| 402
| 91,83%
+
| 91.10%
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 1.2.1'' ====
+
==== ''Tabela 1.5.1'' ====
 
----
 
----
{| border=0 width="80%"  
+
{| border=0 width="100%"  
 
|-
 
|-
| '''Dicionário''': dicionario_completo.csv
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]]
 
+
|width="60%"| '''CGD''': -
 
|-
 
|-
| '''Função para o cálculo dos pesos dos termos (PT)''': TF
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
| '''PFS''': 10000
+
|width="60%"| '''PFS''': 10000
  
 
|-
 
|-
| '''Construções das tabelas''':  
+
|width="40%"| '''Construções das tabelas''':  
 
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat  
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat  
| '''Tamanhos dos ''lexicons''''':   
+
|width="60%"| '''Tamanhos dos ''lexicons''''':   
* Linhas 1-3: 1355 palavras
+
* Linhas 1-3: 1258 palavras
* Linhas 4-8: 3863 palavras
+
* Linhas 4-8: 3257 palavras
 
|}
 
|}
  
<br />
+
<br />  
  
 
{| border=1 width="100%"
 
{| border=1 width="100%"
 
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=4 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 1 261: Linha 1 134:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 1 268: Linha 1 140:
  
 
|- align="center"
 
|- align="center"
| 1.2.1.1
+
| 1.5.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 99.07%
+
| 99.49%
  
 
|- align="center"
 
|- align="center"
| 1.2.1.2
+
| 1.5.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 60.74%
+
| 60.29%
  
 
|- align="center"
 
|- align="center"
| 1.2.1.3
+
| 1.5.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 63.92%
+
| 63.56%
  
 
|- align="center"
 
|- align="center"
| 1.2.1.4
+
| 1.5.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 314: Linha 1 183:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 82.45%
+
| 81.29%
  
 
|- align="center"
 
|- align="center"
| 1.2.1.5
+
| 1.5.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 330: Linha 1 198:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| 336
+
| 342
| 84.64%
+
| 83.42%
  
 
|- align="center"
 
|- align="center"
| 1.2.1.6
+
| 1.5.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 346: Linha 1 213:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| 336
+
| 342
| 87.81%
+
| 86.96%
  
 
|- align="center"
 
|- align="center"
| 1.2.1.7
+
| 1.5.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 362: Linha 1 228:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| 336
+
| 342
| 91.53%
+
| 90.62%
  
 
|- align="center"
 
|- align="center"
| 1.2.1.8
+
| 1.5.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 378: Linha 1 243:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| 336
+
| 342
| 93.60%
+
| 92.63%
 
|}
 
|}
  
==== ''Tabela 1.1.2'' ====
+
<br />
 +
 
 +
==== ''Tabela 1.4.2'' ====
 
----
 
----
{| border=0 width="80%"  
+
{| border=0 width="100%"  
 
|-
 
|-
| '''Dicionário''': dicionario_subclasse.csv
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]]
 +
|width="60%"| '''CGD''': -
  
 
|-
 
|-
| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
| '''PFS''': 10000
+
|width="60%"| '''PFS''': 10000
  
 
|-
 
|-
| '''Construções das tabelas''':  
+
|width="40%"| '''Construções das tabelas''':  
 
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat  
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat  
| '''Tamanhos dos ''lexicons''''':   
+
|width="60%"| '''Tamanhos dos ''lexicons''''':   
* Linhas 1-3: 1369 palavras
+
* Linhas 1-3: 1239 palavras
* Linhas 4-8: 1433 palavras
+
* Linhas 4-8: 3147 palavras
 
|}
 
|}
  
Linha 1 411: Linha 1 278:
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=4 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 1 422: Linha 1 289:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 1 429: Linha 1 295:
  
 
|- align="center"
 
|- align="center"
| 1.1.2.1
+
| 1.4.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| prep.
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 342
| 99,15%
+
| 99.49%
  
 
|- align="center"
 
|- align="center"
| 1.1.2.2
+
| 1.4.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 342
| 62,85%
+
| 64.43%
  
 
|- align="center"
 
|- align="center"
| 1.1.2.3
+
| 1.4.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 342
| 66,73%
+
| 67.52%
  
 
|- align="center"
 
|- align="center"
| 1.1.2.4
+
| 1.4.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 475: Linha 1 338:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 324
+
| 342
| 85,31%
+
| 82.51%
  
 
|- align="center"
 
|- align="center"
| 1.1.2.5
+
| 1.4.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 491: Linha 1 353:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| 324
+
| 342
| 86,53%
+
| 84.03%
  
 
|- align="center"
 
|- align="center"
| 1.1.2.6
+
| 1.4.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 507: Linha 1 368:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| 324
+
| 342
| 89,09%
+
| 86.65%
  
 
|- align="center"
 
|- align="center"
| 1.1.2.7
+
| 1.4.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 523: Linha 1 383:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| 324
+
| 342
| 91,47%
+
| 89.15%
  
 
|- align="center"
 
|- align="center"
| 1.1.2.8
+
| 1.4.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 539: Linha 1 398:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| prep.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| 324
+
| 342
| 93,72%
+
| 91.04%
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 1.1.1'' ====
+
==== ''Tabela 1.4.1'' ====
 
----
 
----
{| border=0 width="80%"  
+
{| border=0 width="100%"  
 
|-
 
|-
| '''Dicionário''': dicionario_subclasse.csv
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]]
 +
|width="60%"| '''CGD''': -
  
 
|-
 
|-
| '''Função para o cálculo dos pesos dos termos (PT)''': TF
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
| '''PFS''': 10000
+
|width="60%"| '''PFS''': 10000
  
 
|-
 
|-
| '''Construções das tabelas''':  
+
|width="40%"| '''Construções das tabelas''':  
 
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat  
 
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat  
| '''Tamanhos dos ''lexicons''''':   
+
|width="60%"| '''Tamanhos dos ''lexicons''''':   
* Linhas 1-3: 1385 palavras
+
* Linhas 1-3: 1239 palavras
* Linhas 4-8: 1421 palavras
+
* Linhas 4-8: 3147 palavras
 
|}
 
|}
  
Linha 1 574: Linha 1 433:
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=4 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 1 585: Linha 1 444:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 1 592: Linha 1 450:
  
 
|- align="center"
 
|- align="center"
| 1.1.1.1
+
| 1.4.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 99.15%
+
| 99.49%
  
 
|- align="center"
 
|- align="center"
| 1.1.1.2
+
| 1.4.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 60.74%
+
| 55.20%
  
 
|- align="center"
 
|- align="center"
| 1.1.1.3
+
| 1.4.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 63.92%
+
| 58.20%
  
 
|- align="center"
 
|- align="center"
| 1.1.1.4
+
| 1.4.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 638: Linha 1 493:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 336
+
| 342
| 84.22%
+
| 81.78%
  
 
|- align="center"
 
|- align="center"
| 1.1.1.5
+
| 1.4.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 654: Linha 1 508:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| 336
+
| 342
| 85.92%
+
| 83.97%
  
 
|- align="center"
 
|- align="center"
| 1.1.1.6
+
| 1.4.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 670: Linha 1 523:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| 336
+
| 342
| 89.46%
+
| 87.26%
  
 
|- align="center"
 
|- align="center"
| 1.1.1.7
+
| 1.4.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 686: Linha 1 538:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| 336
+
| 342
| 92.26%
+
| 91.16%
  
 
|- align="center"
 
|- align="center"
| 1.1.1.8
+
| 1.4.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 1 702: Linha 1 553:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| 336
+
| 342
| 94.64%
+
| 93.66%
 
|}
 
|}
  
 
<br />
 
<br />
  
== Resultados do WNN ==
+
==== ''Tabela 1.3.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]]
 +
|width="60%"| '''CGD''': prep.
  
Os resultados preliminares do classificador ''Weightless Neural Network'' (WNN) são mostrados nas tabelas abaixo.
+
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="60%"| '''PFS''': 20000
  
==== ''Tabela 2.6.2'' ====
+
|-
----
+
|width="40%"| '''Construções das tabelas''':
{| border=1 align="center"
+
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
|+ <p align=justify>
+
* Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat
Desempenho do WNN com o <b>dicionario_completo_corrigido.csv. </b>
+
|width="60%"| '''Tamanhos dos ''lexicons'''''
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
* Linhas 1-3: 1321 palavras
 +
* Linhas 4-8: 4553 palavras
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<br />
 
 
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 1 741: Linha 1 599:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 2.6.2.1
+
| 1.3.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 342
| 331
+
| 98.39%
| 98.90%
 
  
 
|- align="center"
 
|- align="center"
| 2.6.2.2
+
| 1.3.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
+
| DADOS_BH_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 0 a 3280
+
| 0 a 3495
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 342
| 331
+
| 29.69%
| 66.44%
+
 
 
 
 
|- align="center"
 
|- align="center"
| 2.6.2.3
+
| 1.3.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
+
| DADOS_BH_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 342
| 331
+
| 28.84%
| 70.20%
 
  
 
|- align="center"
 
|- align="center"
| 2.6.2.4
+
| 1.3.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| TFIDF
+
| DADOS_BH_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 342
| 331
+
| 66.52%
| 69.35%
 
  
 
|- align="center"
 
|- align="center"
| 2.6.2.5
+
| 1.3.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| TFIDF
+
| DADOS_BH_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 342
| 331
+
| 70.39%
| 73.74%
 
  
 
|- align="center"
 
|- align="center"
| 2.6.2.6
+
| 1.3.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| TFIDF
+
| DADOS_BH_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| GRUPO
 
| GRUPO
| TFIDF
+
| 342
| 331
+
| 75.97%
| 79.65%
 
  
 
|- align="center"
 
|- align="center"
| 2.6.2.7
+
| 1.3.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| TFIDF
+
| DADOS_BH_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 342
| 331
+
| 81.72%
| 89.15%
 
  
 
|- align="center"
 
|- align="center"
| 2.6.2.8
+
| 1.3.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| TFIDF
+
| DADOS_BH_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 342
| 331
+
| 87.47%
| 91.96%
 
 
|}
 
|}
  
<br />
 
----
 
 
<br />
 
<br />
  
==== ''Tabela 2.6.1'' ====
+
==== ''Tabela 1.3.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN com o <b>dicionario_completo_corrigido.csv e tabelas corrigidas</b>.
+
|width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]]
 +
|width="60%"| '''CGD''': art. conj. contr. interj. prep. pron.
  
A rede neural é configurada com 15x15 neurônios e 512 sinapses.
+
|-
Para os experimentos 2.6.1.1 à 2.6.1.3, o lexicon é composto por 1353 palavras e a rede neural é configurada com uma imagem 37x37. Já
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
para os experimentos 2.6.1.4 à 2.6.1.8, o lexicon é composto por 3661 palavras e a rede neural é configurada com uma imagem 61x61.
+
|width="60%"| '''PFS''': 20000
A função para o cálculo dos pesos dos termos utilizada foi a freqüência dos termos (term frequency (TF)).
 
  
CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1310 palavras
 +
* Linhas 4-8: 4517 palavras
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<br />
 
 
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=5 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 1 928: Linha 1 754:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 1 936: Linha 1 760:
  
 
|- align="center"
 
|- align="center"
| 2.6.1.1
+
| 1.3.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 342
| 98.90%
+
| 98.31%
  
 
|- align="center"
 
|- align="center"
| 2.6.1.2
+
| 1.3.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 0 a 3280
+
| 0 a 3495
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 342
| 68.12%
+
| 24.57%
  
 
|- align="center"
 
|- align="center"
| 2.6.1.3
+
| 1.3.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 342
| 70.81%
+
| 22.92%
  
 
|- align="center"
 
|- align="center"
| 2.6.1.4
+
| 1.3.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 342
| 69.84%
+
| 63.69%
  
 
|- align="center"
 
|- align="center"
| 2.6.1.5
+
| 1.3.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| CLASSE
 
| CLASSE
| 337
+
| 342
| 74.89%
+
| 67.55%
  
 
|- align="center"
 
|- align="center"
| 2.6.1.6
+
| 1.3.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| GRUPO
 
| GRUPO
| 337
+
| 342
| 81.60%
+
| 74.51%
  
 
|- align="center"
 
|- align="center"
| 2.6.1.7
+
| 1.3.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| DIVISÃO
 
| DIVISÃO
| 337
+
| 342
| 89.03%
+
| 81.46%
  
 
|- align="center"
 
|- align="center"
| 2.6.1.8
+
| 1.3.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110
+
DADOS_BH_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 1639
+
0 a 2330
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110
| 10000
 
| DADOS_VITORIA_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 1640 a 3280
+
| 2331 a 3495
 
| SEÇÃO
 
| SEÇÃO
| 337
+
| 342
| 92.14%
+
| 88.24%
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 2.3.2'' ====
+
==== ''Tabela 1.2.2'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN com o <b>dicionario_110_sub+bh.csv</b> e com <b>3496</b> atividades econômicas distintas (a tabela <b>dados_bh_110.csv</b> foi truncada em 14825 linhas). O tempo médio de execução para cada experimento foi de 13,3 minutos (tempo de treino + tempo de teste).  
+
|width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]]
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|width="60%"| '''CGD''': prep.
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="60%"| '''PFS''': 10000
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.3.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1367 palavras
 +
* Linhas 4-8: 3905 palavras
 +
|}
  
</p>
+
<br />
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 2 089: Linha 1 909:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.1
+
| 1.2.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 20000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 330
+
| 99,07%
| 97.72%
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.2
+
| 1.2.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 0 a 3495
+
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 330
+
| 62,94%
| 29.83%
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.3
+
| 1.2.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 330
+
| 66,79%
| 29.01%
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.4
+
| 1.2.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 330
+
| 82,88%
| 57.34%
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.5
+
| 1.2.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 324
| 330
+
| 84,34%
| 60.34%
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.6
+
| 1.2.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TFIDF
+
| 324
| 330
+
| 87,08%
| 68.41%
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.7
+
| 1.2.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 324
| 330
+
| 90,01%
| 73.65%
 
  
 
|- align="center"
 
|- align="center"
| 2.3.2.8
+
| 1.2.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 324
| 330
+
| 91,83%
| 79.57%
 
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 2.3.1'' ====
+
==== ''Tabela 1.2.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN com o <b>dicionario_110_sub+bh.csv</b> e com <b>3496</b> atividades econômicas distintas (a tabela <b>dados_bh_110.csv</b> foi truncada em 14825 linhas). O tempo médio de execução para cada experimento foi de 13,3 minutos (tempo de treino + tempo de teste).  
+
|width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]]
 +
|width="60%"| '''CGD''': art. conj. contr. interj. prep. pron.
  
A rede neural é configurada com 14x14 neurônios e 512 sinapses.
+
|-
Para os experimentos 2.3.1.1 à 2.3.1.3, o lexicon é composto por 1310 palavras e a rede neural é configurada com uma imagem 37x37. Já
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
para os experimentos 2.3.1.4 à 2.3.1.8, o lexicon é composto por 5179 palavras e a rede neural é configurada com uma imagem 72x72.
+
|width="60%"| '''PFS''': 10000
A função para o cálculo dos pesos dos termos utilizada foi a freqüência dos termos (term frequency (TF)).
 
  
CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1355 palavras
 +
* Linhas 4-8: 3863 palavras
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.3.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<br />
 
 
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=5 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 2 274: Linha 2 064:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
 
  
 
|- align="center"
 
|- align="center"
| 2.3.1.1
+
| 1.2.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
| 20000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 97.63%
+
| 99.07%
  
 
|- align="center"
 
|- align="center"
| 2.3.1.2
+
| 1.2.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
+
| DADOS_VITORIA_SUB_110
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 0 a 3495
+
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 28.83%
+
| 60.74%
  
 
|- align="center"
 
|- align="center"
| 2.3.1.3
+
| 1.2.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
+
| DADOS_VITORIA_SUB_110
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 27.81%
+
| 63.92%
  
 
|- align="center"
 
|- align="center"
| 2.3.1.4
+
| 1.2.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| art. conj. contr. interj. prep. pron.
+
| DADOS_VITORIA_SUB_110
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 54.16%
+
| 82.45%
  
 
|- align="center"
 
|- align="center"
| 2.3.1.5
+
| 1.2.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| art. conj. contr. interj. prep. pron.
+
| DADOS_VITORIA_SUB_110
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| 337
+
| 336
| 58.20%
+
| 84.64%
  
 
|- align="center"
 
|- align="center"
| 2.3.1.6
+
| 1.2.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| art. conj. contr. interj. prep. pron.
+
| DADOS_VITORIA_SUB_110
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| 337
+
| 336
| 65.84%
+
| 87.81%
  
 
|- align="center"
 
|- align="center"
| 2.3.1.7
+
| 1.2.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| art. conj. contr. interj. prep. pron.
+
| DADOS_VITORIA_SUB_110
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| 337
+
| 336
| 71.85%
+
| 91.53%
  
 
|- align="center"
 
|- align="center"
| 2.3.1.8
+
| 1.2.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| art. conj. contr. interj. prep. pron.
+
| DADOS_VITORIA_SUB_110
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| 337
+
| 336
| 79.23%
+
| 93.60%
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 2.2.2'' ====
+
==== ''Tabela 1.1.2'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN com o <b>DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras</b>.
+
|width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]]
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|width="60%"| '''CGD''': prep.
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="60%"| '''PFS''': 10000
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.2.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1369 palavras
 +
* Linhas 4-8: 1433 palavras
 +
|}
  
</p>
+
<br />
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 2 436: Linha 2 219:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.1
+
| 1.1.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 326
+
| 99,15%
| 99,07%
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.2
+
| 1.1.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 326
+
| 62,85%
| 64,19%
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.3
+
| 1.1.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 326
+
| 66,73%
| 67,76%
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.4
+
| 1.1.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 502: Linha 2 268:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 324
| 326
+
| 85,31%
| 72,94%
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.5
+
| 1.1.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 521: Linha 2 283:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 324
| 326
+
| 86,53%
| 79,10%
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.6
+
| 1.1.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 540: Linha 2 298:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TFIDF
+
| 324
| 326
+
| 89,09%
| 83,85%
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.7
+
| 1.1.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 559: Linha 2 313:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 324
| 326
+
| 91,47%
| 88,85%
 
  
 
|- align="center"
 
|- align="center"
| 2.2.2.8
+
| 1.1.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 578: Linha 2 328:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 324
| 326
+
| 93,72%
| 90,60%
 
 
|}
 
|}
  
<br />
 
----
 
 
<br />
 
<br />
  
==== ''Tabela 2.2.1'' ====
+
==== ''Tabela 1.1.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN com o <b>dicionario_completo.csv</b>.  
+
|width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]]
 +
|width="60%"| '''CGD''': art. conj. contr. interj. prep. pron.
  
A rede neural é configurada com 12x12 neurônios e 512 sinapses.
+
|-
Para os experimentos 2.2.1.1 à 2.2.1.3, o lexicon é composto por 1355 palavras e a rede neural é configurada com uma imagem 37x37. Já
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
para os experimentos 2.2.1.4 à 2.2.1.8, o lexicon é composto por 3863 palavras e a rede neural é configurada com uma imagem 63x63.
+
|width="60%"| '''PFS''': 10000
A função para o cálculo dos pesos dos termos utilizada foi a freqüência dos termos (''term frequency (TF)'').
 
  
CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|-
 
+
|width="40%"| '''Construções das tabelas''':
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="60%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1358 palavras
 +
* Linhas 4-8: 1421 palavras
 +
|}
  
</p>
+
<br />
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=5 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 2 624: Linha 2 374:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 2 632: Linha 2 380:
  
 
|- align="center"
 
|- align="center"
| 2.2.1.1
+
| 1.1.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 99.32%
+
| 99.15%
  
 
|- align="center"
 
|- align="center"
| 2.2.1.2
+
| 1.1.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 65.01%
+
| 60.74%
  
 
|- align="center"
 
|- align="center"
| 2.2.1.3
+
| 1.1.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 69.04%
+
| 63.92%
  
 
|- align="center"
 
|- align="center"
| 2.2.1.4
+
| 1.1.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 681: Linha 2 423:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 336
| 71.48%
+
| 84.22%
  
 
|- align="center"
 
|- align="center"
| 2.2.1.5
+
| 1.1.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 698: Linha 2 438:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| 337
+
| 336
| 77.33%
+
| 85.92%
  
 
|- align="center"
 
|- align="center"
| 2.2.1.6
+
| 1.1.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 715: Linha 2 453:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| 337
+
| 336
| 83.00%
+
| 89.46%
  
 
|- align="center"
 
|- align="center"
| 2.2.1.7
+
| 1.1.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 732: Linha 2 468:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| 337
+
| 336
| 88.91%
+
| 92.26%
  
 
|- align="center"
 
|- align="center"
| 2.2.1.8
+
| 1.1.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 2 749: Linha 2 483:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| 337
+
| 336
| 90.07%
+
| 94.64%
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 2.1.2'' ====
+
== Resultados do WNN ==
 +
 
 +
Os resultados preliminares do classificador ''Weightless Neural Network'' (WNN) são mostrados nas tabelas abaixo.
 +
 
 +
==== ''Tabela 2.8.2 '' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN com '''dicionário subclasse''' e '''tabelas não-corrigidas'''.  
+
|width="40%"| '''Dicionário''': dicionario_completo+bh.csv
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.1.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1367
 +
* Linhas 4-8: 5771
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 1024
 +
|}
  
</p>
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
| rowspan=2 |'''Desempenho'''
+
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
'''(1 - one-error)'''
 
  
 
|- align="center"
 
|- align="center"
Linha 2 785: Linha 2 538:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
 
  
 
|- align="center"
 
|- align="center"
| 2.1.2.1
+
| 2.8.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 402
| 326
+
| 99.41%
| 99,24%
 
  
 
|- align="center"
 
|- align="center"
| 2.1.2.2
+
| 2.8.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| prep.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 10000
+
| 0 a 3495
| DADOS_VITORIA_SUB_110
+
0 a 3280
| OBJETO_SOCIAL
 
| 0 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 402
| 326
+
| 44.92%
| 65,01%
 
  
 
|- align="center"
 
|- align="center"
| 2.1.2.3
+
| 2.8.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| prep.
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| 10000
+
| NOWRAP | 1748 a 3495
| DADOS_VITORIA_SUB_110
+
1640 a 3280
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 402
| 326
+
| 46.24%
| 68,37%
+
 
 
 
 
|- align="center"
 
|- align="center"
| 2.1.2.4
+
| 2.8.2.4
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| TFIDF
 
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 402
| 326
+
| 66.54%
| 77,57%
 
  
 
|- align="center"
 
|- align="center"
| 2.1.2.5
+
| 2.8.2.5
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| TFIDF
 
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 402
| 326
+
| 72.41%
| 81,66%
+
 
 +
|- align="center"
 +
| 2.8.2.6
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| GRUPO
 +
| 402
 +
| 79.20%
  
 
|- align="center"
 
|- align="center"
| 2.1.2.6
+
| 2.8.2.7
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| TFIDF
 
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| GRUPO
 
| TFIDF
 
| 326
 
| 85,50%
 
 
 
|- align="center"
 
| 2.1.2.7
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
| 0 a 1182
 
0 a 1639
 
| TFIDF
 
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 402
| 326
+
| 84.51%
| 90,86%
 
  
 
|- align="center"
 
|- align="center"
| 2.1.2.8
+
| 2.8.2.8
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| TFIDF
 
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 402
| 326
+
| 88.70%
| 94,27%
 
 
|}
 
|}
  
<br />
 
----
 
 
<br />
 
<br />
  
==== ''Tabela 2.1.1'' ====
+
==== ''Tabela 2.8.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN para o '''dicionario_subclasse.csv''' e '''tabelas não-corrigidas'''.  
+
|width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
  
A rede neural é configurada com 13x13 neurônios e 512 sinapses.
+
|-
Para os experimentos 2.1.1.1 à 2.1.1.3, o lexicon é composto por 1358 palavras e a rede neural é configurada com uma imagem 37x37. Já
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
para os experimentos 2.1.1.4 à 2.1.1.8, o lexicon é composto por 1421 palavras e a rede neural é configurada com uma imagem 38x38.
+
|width="30%"| '''PFS''': 20000
A função para o cálculo dos pesos dos termos utilizada foi a freqüência dos termos (term frequency (TF)).
+
|width="30%"|
  
CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.  
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1355
 +
* Linhas 4-8: 5725
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 1024
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 2.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 
+
<br />
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=5 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
| rowspan=2 |'''Desempenho'''
+
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
'''(1 - one-error)'''
 
  
 
|- align="center"
 
|- align="center"
Linha 2 973: Linha 2 685:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 2 981: Linha 2 691:
  
 
|- align="center"
 
|- align="center"
| 2.1.1.1
+
| 2.8.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 405
| 99.41%
+
| 99.32%
  
 
|- align="center"
 
|- align="center"
| 2.1.1.2
+
| 2.8.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 10000
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| DADOS_VITORIA_SUB_110
+
| 0 a 3495
| OBJETO_SOCIAL
+
0 a 3280
| 0 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 405
| 65.77%
+
| 45.29%
  
 
|- align="center"
 
|- align="center"
| 2.1.1.3
+
| 2.8.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. conj. contr. interj. prep. pron.
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 10000
+
| OBJETO_SOCIAL OBJETO_SOCIAL
| DADOS_VITORIA_SUB_110
+
| NOWRAP | 1748 a 3495
| OBJETO_SOCIAL
+
1640 a 3280
| 1640 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 405
| 68.80%
+
| 45.50%
  
 
|- align="center"
 
|- align="center"
| 2.1.1.4
+
| 2.8.1.4
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| art. conj. contr. interj. prep. pron.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 405
| 78.55%
+
| 66.42%
  
 
|- align="center"
 
|- align="center"
| 2.1.1.5
+
| 2.8.1.5
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| art. conj. contr. interj. prep. pron.
+
| CLASSE
| 10000
+
| 405
| DADOS_VITORIA_SUB_110
+
| 72.82%
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| CLASSE
 
| 337
 
| 82.82%
 
  
 
|- align="center"
 
|- align="center"
| 2.1.1.6
+
| 2.8.1.6
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| art. conj. contr. interj. prep. pron.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| GRUPO
 
| GRUPO
| 337
+
| 405
| 87.20%
+
| 79.26%
  
 
|- align="center"
 
|- align="center"
| 2.1.1.7
+
| 2.8.1.7
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| art. conj. contr. interj. prep. pron.
 
| 10000
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
 
| DIVISÃO
 
| DIVISÃO
| 337
+
| 405
| 91.65%
+
| 85.57%
  
 
|- align="center"
 
|- align="center"
| 2.1.1.8
+
| 2.8.1.8
| CNAE_110_SUBCLASSE
+
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
DADOS_VITORIA_SUB_110
+
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
| DESCRICAO_SUB
+
| 0 a 1182 0 a 1747 0 a 1639
OBJETO_SOCIAL
+
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
| 0 a 1182
+
| OBJETO_SOCIAL OBJETO_SOCIAL
0 a 1639
+
| 1748 a 3495 1640 a 3280
| art. conj. contr. interj. prep. pron.
+
| SEÇÃO
| 10000
+
| 405
| DADOS_VITORIA_SUB_110
+
| 89.08%
| OBJETO_SOCIAL
+
|}
| 1640 a 3280
+
 
| SEÇÃO
+
<br />
| 337
 
| 95.00%
 
|}
 
  
<br />
+
==== ''Tabela 2.7.2'' ====
 
----
 
----
<br />
+
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
  
== Resultados do WNN-COR ==
+
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
  
Os resultados preliminares do classificador ''Weightless Neural Network with Data Correlation'' (WNN-COR) são mostrados na tabela abaixo.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons'''''
 +
* Linhas 1-3: 1372 palavras
 +
* Linhas 4-8: 3919 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 15
 +
* SYNAPSES: 1024
 +
|}
  
==== ''Tabela 3.6.2'' ====
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
----
+
<br />
{| border=1 align="center"
 
|+ <p align=justify>
 
Desempenho do WNN_COR com o <b>dicionario_completo_corrigido.csv</b>. O lexicon para este experimento foi criado retirando-se as classe gramatical preposição, sendo que para os experimentos 3.6.2.1 à 3.6.2.3, o lexicon é composto por 1365 palavras, já para os experimentos 3.6.2.4 à 3.6.2.8, o lexicon é composto por 3703. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
 
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
 
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 3 137: Linha 2 833:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.1
+
| 2.7.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 351
| 336
+
| 100.00%
| 99.24%
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.2
+
| 2.7.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 351
| 336
+
| 64.13%
| 66.14%
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.3
+
| 2.7.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 351
| 336
+
| 69.35%
| 69.84%
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.4
+
| 2.7.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110  
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110  
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 351
| 336
+
| 74.41%
| 78.79%
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.5
+
| 2.7.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110  
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110  
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 351
| 336
+
| 79.34%
| 81.96%
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.6
+
| 2.7.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110  
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110  
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TFIDF
+
| 351
| 336
+
| 84.10%
| 80.56%
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.7
+
| 2.7.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110  
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110  
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 351
| 336
+
| 91.16%
| 85.37%
 
  
 
|- align="center"
 
|- align="center"
| 3.6.2.8
+
| 2.7.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110  
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
+
| DADOS_VITORIA_SUB_110
| prep.
 
| 10000
 
| DADOS_VITORIA_SUB_110  
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 351
| 336
+
| 93.66%
| 88.67%
 
 
|}
 
|}
  
<br/ >
+
<br />
  
==== ''Tabela 3.6.1'' ====
+
==== ''Tabela 2.7.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN_COR com o <b>dicionario_completo_corrigido.csv</b>.
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]]
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|width="30%"| '''CGD''': -
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
|width="30%"|
</p>
 
  
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1372 palavras
 +
* Linhas 4-8: 3919 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 15
 +
* SYNAPSES: 1024
 +
|}
 +
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 3 314: Linha 2 994:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.1
+
| 2.7.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 351
|
+
| 100.00%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.2
+
| 2.7.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 351
|
+
| 64.34%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.3
+
| 2.7.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 351
|
+
| 69.41%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.4
+
| 2.7.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 380: Linha 3 043:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 351
|
+
| 74.34%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.5
+
| 2.7.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 399: Linha 3 058:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TF
+
| 351
|
+
| 79.59%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.6
+
| 2.7.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 418: Linha 3 073:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TF
+
| 351
|
+
| 84.16%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.7
+
| 2.7.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 437: Linha 3 088:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TF
+
| 351
|
+
| 91.10%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.6.1.8
+
| 2.7.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 456: Linha 3 103:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 351
|
+
| 93.85%
| %
 
 
 
 
|}
 
|}
  
<br/>
+
<br />
  
==== ''Tabela 3.3.2'' ====
+
==== ''Tabela 2.6.2'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN_COR com o <b>dicionario_110_sub+bh.csv</b> e com <b>3496</b> atividades econômicas distintas (a tabela <b>dados_bh_110.csv</b> foi truncada em 14825 linhas). O tempo médio de execução para cada experimento foi de 12.3 minutos (tempo de treino + tempo de teste). A rede neural é configurada com 14x14 neurônios. Para os experimentos 3.3.1.1 à 3.3.1.3, o lexicon é composto por 1310 palavras e a rede neural é configurada com uma imagem 37x37 e 512 sinapses. Já para os experimentos 2.3.1.4 à 2.3.1.8, o lexicon é composto por 4517 palavras e a rede neural é configurada com uma imagem 68x68 e 512 sinapses. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.3.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
  
</p>
+
|-
|- align="center"
+
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1365 palavras
 +
* Linhas 4-8: 3703 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 15
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 
| rowspan=2 | '''EXP.'''
 
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 3 493: Linha 3 155:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.1
+
| 2.6.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 331
|
+
| 98.90%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.2
+
| 2.6.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 331
|
+
| 66.44%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.3
+
| 2.6.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 331
|
+
| 70.20%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.4
+
| 2.6.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110  
 
DADOS_VITORIA_SUB_110  
Linha 3 558: Linha 3 204:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110  
 
| DADOS_VITORIA_SUB_110  
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 331
|
+
| 69.35%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.5
+
| 2.6.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110  
 
DADOS_VITORIA_SUB_110  
Linha 3 577: Linha 3 219:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110  
 
| DADOS_VITORIA_SUB_110  
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 331
|
+
| 73.74%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.6
+
| 2.6.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110  
 
DADOS_VITORIA_SUB_110  
Linha 3 596: Linha 3 234:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110  
 
| DADOS_VITORIA_SUB_110  
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TFIDF
+
| 331
|
+
| 79.65%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.7
+
| 2.6.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110  
 
DADOS_VITORIA_SUB_110  
Linha 3 615: Linha 3 249:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110  
 
| DADOS_VITORIA_SUB_110  
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 331
|
+
| 89.15%
| %
 
  
 
|- align="center"
 
|- align="center"
| 3.3.2.8
+
| 2.6.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110  
 
DADOS_VITORIA_SUB_110  
Linha 3 634: Linha 3 264:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110  
 
| DADOS_VITORIA_SUB_110  
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 331
|
+
| 91.96%
| %
 
 
|}
 
|}
  
==== ''Tabela 3.3.1'' ====
+
<br />
 +
 
 +
==== ''Tabela 2.6.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN_COR com o <b>dicionario_110_sub+bh.csv</b> e com <b>3496</b> atividades econômicas distintas (a tabela <b>dados_bh_110.csv</b> foi truncada em 14825 linhas). O tempo médio de execução para cada experimento foi de 12.3 minutos (tempo de treino + tempo de teste). A rede neural é configurada com 14x14 neurônios. Para os experimentos 3.3.1.1 à 3.3.1.3, o lexicon é composto por 1310 palavras e a rede neural é configurada com uma imagem 37x37 e 512 sinapses. Já para os experimentos 2.3.1.4 à 2.3.1.8, o lexicon é composto por 4517 palavras e a rede neural é configurada com uma imagem 68x68 e 512 sinapses. PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.3.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.  
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1353 palavras
 +
* Linhas 4-8: 3661 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 15
 +
* SYNAPSES: 512
 +
|}
  
</p>
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 3 669: Linha 3 316:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.1
+
| 2.6.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 20000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 337
| 303
+
| 98.90%
| 97.63%
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.2
+
| 2.6.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_VITORIA_SUB_110
| art. prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 0 a 3495
+
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 337
| 303
+
| 68.12%
| 28.83%
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.3
+
| 2.6.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
+
| DADOS_VITORIA_SUB_110
| art. prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 337
| 303
+
| 70.81%
| 27.81%
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.4
+
| 2.6.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 337
| 303
+
| 69.84%
| 62.32%
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.5
+
| 2.6.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TF
+
| 337
| 303
+
| 74.89%
| 67.81%
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.6
+
| 2.6.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TF
+
| 337
| 303
+
| 81.60%
| 65.92%
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.7
+
| 2.6.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TF
+
| 337
| 303
+
| 89.03%
| 74.33%
 
  
 
|- align="center"
 
|- align="center"
| 3.3.1.8
+
| 2.6.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
DADOS_BH_SUB_110
+
DADOS_VITORIA_SUB_110
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
OBJETO_SOCIAL
 
OBJETO_SOCIAL
 
| 0 a 1182
 
| 0 a 1182
0 a 2330
+
0 a 1639
| TF
+
| DADOS_VITORIA_SUB_110
| art. prep.
 
| 20000
 
| DADOS_BH_SUB_110
 
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
| 2331 a 3495
+
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 337
| 303
+
| 92.14%
| 76.82%
 
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 3.2.2'' ====
+
==== ''Tabela 2.5.2'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do '''WNN_COR''' com o '''DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras'''.
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
  
<!-- A rede neural é configurada com 14x14 neurônios. Para os experimentos 3.2.1.1 à 3.2.1.3, o lexicon é composto por 1366 palavras e a rede neural é configurada com uma imagem 37x37 e com 256 sinapses. Já para os experimentos 3.2.1.4 à 3.2.1.8, o lexicon é composto por 3392 palavras e a rede neural é configurada com uma imagem 59x58 e com 512 sinapses. -->
+
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
  
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1258
 +
* Linhas 4-8: 3257
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 19
 +
* SYNAPSES: 512
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 
+
<br />
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 3 852: Linha 3 477:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
 
  
 
|- align="center"
 
|- align="center"
| 3.2.2.1
+
| 2.5.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 408
| 326
+
| 99.58%
| 99,41%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.2.2
+
| 2.5.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 408
| 326
+
| 63.76%
| 64,71%
+
 
 
 
 
|- align="center"
 
|- align="center"
| 3.2.2.3
+
| 2.5.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 408
| 326
+
| 67.76%
| 68,19%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.2.4
+
| 2.5.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 918: Linha 3 526:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 408
| 326
+
| 74.53%
| 76.84%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.2.5
+
| 2.5.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 937: Linha 3 541:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 408
| 326
+
| 79.95%
| 80.93%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.2.6
+
| 2.5.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 956: Linha 3 556:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TFIDF
+
| 408
| 326
+
| 84.52%
| 78.43%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.2.7
+
| 2.5.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 975: Linha 3 571:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 408
| 326
+
| 89.76%
| 83.06%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.8
+
| 2.5.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 3 994: Linha 3 586:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 408
| 326
+
| 91.71%
| 85.50%
 
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 3.2.1'' ====
+
==== ''Tabela 2.5.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do '''WNN_COR''' com o '''DICIONÁRIO COMPLETO, que abrange cerca de 1,2 milhões de palavras'''.
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
  
<!-- A rede neural é configurada com 14x14 neurônios. Para os experimentos 3.2.1.1 à 3.2.1.3, o lexicon é composto por 1366 palavras e a rede neural é configurada com uma imagem 37x37 e com 256 sinapses. Já para os experimentos 3.2.1.4 à 3.2.1.8, o lexicon é composto por 3392 palavras e a rede neural é configurada com uma imagem 59x58 e com 512 sinapses. -->
+
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
  
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1258
 +
* Linhas 4-8: 3257
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 19
 +
* SYNAPSES: 512
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
  
</p>
+
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 4 034: Linha 3 638:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.1
+
| 2.5.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 412
| 236
+
| 99.58%
| 99.41%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.2
+
| 2.5.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 412
| 236
+
| 63.79%
| 65.13%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.3
+
| 2.5.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 412
| 236
+
| 67.64%
| 68.25%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.4
+
| 2.5.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 100: Linha 3 687:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 412
| 236
+
| 74.10%
| 77.70%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.5
+
| 2.5.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 119: Linha 3 702:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TF
+
| 412
| 236
+
| 80.13%
| 80.93%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.6
+
| 2.5.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 138: Linha 3 717:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TF
+
| 412
| 236
+
| 84.34%
| 78.18%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.7
+
| 2.5.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 157: Linha 3 732:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TF
+
| 412
| 236
+
| 89.64%
| 81.60%
 
  
 
|- align="center"
 
|- align="center"
| 3.2.1.8
+
| 2.5.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 176: Linha 3 747:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TF
 
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TF
+
| 412
| 236
+
| 91.83%
| 84.10%
 
 
|}
 
|}
  
 
<br />
 
<br />
  
==== ''Tabela 3.1.2'' ====
+
==== ''Tabela 2.4.2'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
  
Desempenho do WNN-COR.
+
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
  
PT denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons'''''
 +
* Linhas 1-3: 1239 palavras
 +
* Linhas 4-8: 3147 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 20
 +
* SYNAPSES: 512
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 
+
<br />
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=6 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
| colspan=5 | '''Dados de Teste'''  
+
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
 
'''do SCAE'''
 
'''do SCAE'''
Linha 4 216: Linha 3 799:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''PT'''
 
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
 
| '''Nível'''
 
| '''Nível'''
| '''PT'''
 
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.1
+
| 2.4.2.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| TF
+
| 402
| 326
+
| 99.41%
| 99,15%
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.2
+
| 2.4.2.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 402
| 326
+
| 66.08%
| 65,22%
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.3
+
| 2.4.2.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 402
| 326
+
| 69.41%
| 68,49%
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.4
+
| 2.4.2.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 282: Linha 3 848:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| TFIDF
+
| 402
| 326
+
| 74.28%
| 83,06%
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.5
+
| 2.4.2.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 301: Linha 3 863:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| TFIDF
+
| 402
| 326
+
| 79.95%
| 85,07%
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.6
+
| 2.4.2.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 320: Linha 3 878:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| TFIDF
+
| 402
| 326
+
| 85.31%
| 86,84%
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.7
+
| 2.4.2.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 339: Linha 3 893:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| TFIDF
+
| 402
| 326
+
| 89.88%
| 91,59%
 
  
 
|- align="center"
 
|- align="center"
| 3.1.2.8
+
| 2.4.2.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 358: Linha 3 908:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| TFIDF
 
| prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| TFIDF
+
| 402
| 326
+
| 91.59%
| 94,64%
 
 
|}
 
|}
  
<br />
 
----
 
 
<br />
 
<br />
  
==== ''Tabela 3.1.1'' ====
+
==== ''Tabela 2.4.1'' ====
 
----
 
----
{| border=1 align="center"
+
{| border=0 width="100%"  
|+ <p align=justify>
+
|-
Desempenho do WNN-COR para o '''dicionario_subclasse.csv''' e '''tabelas não-corrigidas'''.
+
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
  
A rede neural é configurada com 16x16 neurônios e 512 sinapses.
+
|-
Para os experimentos 3.1.1.1 à 3.1.1.3, o lexicon é composto por 1358 palavras e a rede neural é configurada com uma imagem 37x37. Já
+
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
para os experimentos 3.1.1.4 à 3.1.1.8, o lexicon é composto por 1421 palavras e a rede neural é configurada com uma imagem 38x38.
+
|width="30%"| '''PFS''': 20000
A função para o cálculo dos pesos dos termos utilizada foi a freqüência dos termos (term frequency (TF)).
+
|width="30%"|
  
CGD denota as classes gramaticais desconsideradas no ''lexicon''; PFS denota a frequência acima da qual a palavra não é incluída no ''lexicon''.  
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1239 palavras
 +
* Linhas 4-8: 3147 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 20
 +
* SYNAPSES: 512
 +
|}
  
Veja aqui os resultados dos [[experimentos de validação para o experimento 3.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 
+
<br />
</p>
 
  
 +
{| border=1 width="100%"
 
|- align="center"
 
|- align="center"
| rowspan=2 | '''Exp.'''
+
| rowspan=2 | '''EXP.'''
| colspan=5 | '''Dados de Treino'''
+
| colspan=3 | '''Dados de Treino'''
 
| colspan=4 | '''Dados de Teste'''  
 
| colspan=4 | '''Dados de Teste'''  
 
| rowspan=2 | '''Revisão'''  
 
| rowspan=2 | '''Revisão'''  
Linha 4 404: Linha 3 960:
 
| '''Coluna'''
 
| '''Coluna'''
 
| '''Limites'''
 
| '''Limites'''
| '''CGD'''
 
| '''PFS'''
 
 
| '''Tabela'''
 
| '''Tabela'''
 
| '''Coluna'''
 
| '''Coluna'''
Linha 4 412: Linha 3 966:
  
 
|- align="center"
 
|- align="center"
| 3.1.1.1
+
| 2.4.1.1
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. prep.
 
| 10000
 
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 402
| 99.15%
+
| 99.41%
  
 
|- align="center"
 
|- align="center"
| 3.1.1.2
+
| 2.4.1.2
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 0 a 3280
 
| 0 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 402
| 65.80%
+
| 66.14%
  
 
|- align="center"
 
|- align="center"
| 3.1.1.3
+
| 2.4.1.3
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
| DESCRICAO_SUB
 
| DESCRICAO_SUB
 
| 0 a 1182
 
| 0 a 1182
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 402
| 69.04%
+
| 69.47%
  
 
|- align="center"
 
|- align="center"
| 3.1.1.4
+
| 2.4.1.4
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 461: Linha 4 009:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SUBCLASSE
 
| SUBCLASSE
| 337
+
| 402
| 82.45%
+
| 74.22%
  
 
|- align="center"
 
|- align="center"
| 3.1.1.5
+
| 2.4.1.5
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 478: Linha 4 024:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| CLASSE
 
| CLASSE
| 337
+
| 402
| 85.19%
+
| 79.77%
  
 
|- align="center"
 
|- align="center"
| 3.1.1.6
+
| 2.4.1.6
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 495: Linha 4 039:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| GRUPO
 
| GRUPO
| 337
+
| 402
| 88.12%
+
| 84.95%
  
 
|- align="center"
 
|- align="center"
| 3.1.1.7
+
| 2.4.1.7
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 512: Linha 4 054:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| DIVISÃO
 
| DIVISÃO
| 337
+
| 402
| 93.05%
+
| 90.01%
  
 
|- align="center"
 
|- align="center"
| 3.1.1.8
+
| 2.4.1.8
 
| CNAE_110_SUBCLASSE
 
| CNAE_110_SUBCLASSE
 
DADOS_VITORIA_SUB_110
 
DADOS_VITORIA_SUB_110
Linha 4 529: Linha 4 069:
 
| 0 a 1182
 
| 0 a 1182
 
0 a 1639
 
0 a 1639
| art. prep.
 
| 10000
 
 
| DADOS_VITORIA_SUB_110
 
| DADOS_VITORIA_SUB_110
 
| OBJETO_SOCIAL
 
| OBJETO_SOCIAL
 
| 1640 a 3280
 
| 1640 a 3280
 
| SEÇÃO
 
| SEÇÃO
| 337
+
| 402
| 94.64%
+
| 91.53%
 
|}
 
|}
  
 
<br />
 
<br />
 +
 +
==== ''Tabela 2.3.2'' ====
 
----
 
----
<br />
+
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
  
== Experimentos Removendo Combinações de Classes Gramaticais ==
+
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
  
Os experimentos a seguir foram realizados utilizando o experimento 1.1.x.4 para o VS_CORE utilizando o diconário subclasse. O objetivo deste experimento é combinar diversas classes gramaticais para verificar qual combinação apresenta maior percentual de acerto. As classes gramaticais escolhidas foram:
+
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1321 palavras
 +
* Linhas 4-8: 4553 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 14
 +
* SYNAPSES: 512
 +
|}
  
* Artigo;
+
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.3.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
* Conjunção;
+
<br />
* Contração;
 
* Interjeição;
 
* Preposição;
 
* Pronome;
 
  
Os experimentos foram feitos tanto para o TF quanto para o TFIDF. As tabelas abaixo mostram o resultado dos experimentos realizados.
+
{| border=1 width="100%"
 
+
|- align="center"
=== Considerando TF ===
+
| rowspan=2 | '''EXP.'''
----
+
| colspan=3 | '''Dados de Treino'''
<br />
+
| colspan=4 | '''Dados de Teste'''
{| border=1 align="justify"
+
| rowspan=2 | '''Revisão'''
|- align="center"
+
'''do SCAE'''
| '''Exp.'''
+
| rowspan=2 |'''Desempenho'''
| '''CLasses Removidas'''
+
'''(1 - one-error)'''
| '''Revisão'''  
+
 
'''do SCAE'''
+
|- align="center"
| '''Peso'''  
+
| '''Tabela'''
| '''Tamanho'''
+
| '''Coluna'''
'''do Lexicon'''  
+
| '''Limites'''
| '''Desempenho'''  
+
| '''Tabela'''
'''(1 - one-error)'''
+
| '''Coluna'''
 
+
| '''Limites'''
|- align="center"
+
| '''Nível'''
| 1
+
 
| Sem remover
+
|- align="center"
| 271
+
| 2.3.2.1
| TF
+
| CNAE_110_SUBCLASSE
| 1456
+
| DESCRICAO_SUB
| 77,57%
+
| 0 a 1182
 
+
| CNAE_110_SUBCLASSE
|- align="center"
+
| DESCRICAO_SUB
| 2
+
| 0 a 1182
| Artigo (art.)
+
| SUBCLASSE
| 271
+
| 330
| TF
+
| 97.72%
| 1453
+
 
| 78,00%
+
|- align="center"
 
+
| 2.3.2.2
|- align="center"
+
| CNAE_110_SUBCLASSE
| 3
+
| DESCRICAO_SUB
| Conjunção (conj.)
+
| 0 a 1182
| 271
+
| DADOS_BH_SUB_110
| TF
+
| OBJETO_SOCIAL
| 1453
+
| 0 a 3495
| 76,84%
+
| SUBCLASSE
 
+
| 330
|- align="center"
+
| 29.83%
| 4
+
 
| Contração (contr.)
+
|- align="center"
| 271
+
| 2.3.2.3
| TF
+
| CNAE_110_SUBCLASSE
| 1446
+
| DESCRICAO_SUB
| 77,82%
+
| 0 a 1182
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 330
 +
| 29.01%
 +
 
 +
|- align="center"
 +
| 2.3.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 330
 +
| 57.34%
 +
 
 +
|- align="center"
 +
| 2.3.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| CLASSE
 +
| 330
 +
| 60.34%
 +
 
 +
|- align="center"
 +
| 2.3.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| GRUPO
 +
| 330
 +
| 68.41%
 +
 
 +
|- align="center"
 +
| 2.3.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| DIVISÃO
 +
| 330
 +
| 73.65%
 +
 
 +
|- align="center"
 +
| 2.3.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SEÇÃO
 +
| 330
 +
| 79.57%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 2.3.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1310 palavras
 +
* Linhas 4-8: 4517 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 14
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.3.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 2.3.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 337
 +
| 97.63%
 +
 
 +
|- align="center"
 +
| 2.3.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3495
 +
| SUBCLASSE
 +
| 337
 +
| 28.83%
 +
 
 +
|- align="center"
 +
| 2.3.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 337
 +
| 27.81%
 +
 
 +
|- align="center"
 +
| 2.3.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 337
 +
| 54.16%
 +
 
 +
|- align="center"
 +
| 2.3.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| CLASSE
 +
| 337
 +
| 58.20%
 +
 
 +
|- align="center"
 +
| 2.3.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| GRUPO
 +
| 337
 +
| 65.84%
 +
 
 +
|- align="center"
 +
| 2.3.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| DIVISÃO
 +
| 337
 +
| 71.85%
 +
 
 +
|- align="center"
 +
| 2.3.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SEÇÃO
 +
| 337
 +
| 79.23%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 2.2.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1367 palavras
 +
* Linhas 4-8: 3905 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 12
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.2.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 2.2.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 326
 +
| 99,07%
 +
 
 +
|- align="center"
 +
| 2.2.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 64,19%
 +
 
 +
|- align="center"
 +
| 2.2.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 67,76%
 +
 
 +
|- align="center"
 +
| 2.2.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 72,94%
 +
 
 +
|- align="center"
 +
| 2.2.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 326
 +
| 79,10%
 +
 
 +
|- align="center"
 +
| 2.2.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 326
 +
| 83,85%
 +
 
 +
|- align="center"
 +
| 2.2.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 326
 +
| 88,85%
 +
 
 +
|- align="center"
 +
| 2.2.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 326
 +
| 90,60%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 2.2.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1355 palavras
 +
* Linhas 4-8: 3863 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 12
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 2.2.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 337
 +
| 99.32%
 +
 
 +
|- align="center"
 +
| 2.2.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 65.01%
 +
 
 +
|- align="center"
 +
| 2.2.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 69.04%
 +
 
 +
|- align="center"
 +
| 2.2.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 71.48%
 +
 
 +
|- align="center"
 +
| 2.2.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 337
 +
| 77.33%
 +
 
 +
|- align="center"
 +
| 2.2.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 337
 +
| 83.00%
 +
 
 +
|- align="center"
 +
| 2.2.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 337
 +
| 88.91%
 +
 
 +
|- align="center"
 +
| 2.2.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 337
 +
| 90.07%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 2.1.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1369 palavras
 +
* Linhas 4-8: 1433 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 13
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.1.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 2.1.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 326
 +
| 99,24%
 +
 
 +
|- align="center"
 +
| 2.1.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 65,01%
 +
 
 +
|- align="center"
 +
| 2.1.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 68,37%
 +
 
 +
|- align="center"
 +
| 2.1.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 77,57%
 +
 
 +
|- align="center"
 +
| 2.1.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 326
 +
| 81,66%
 +
 
 +
|- align="center"
 +
| 2.1.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 326
 +
| 85,50%
 +
 
 +
|- align="center"
 +
| 2.1.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 326
 +
| 90,86%
 +
 
 +
|- align="center"
 +
| 2.1.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 326
 +
| 94,27%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 2.1.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1358 palavras
 +
* Linhas 4-8: 1421 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 13
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 2.1.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 337
 +
| 99.41%
 +
 
 +
|- align="center"
 +
| 2.1.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 65.77%
 +
 
 +
|- align="center"
 +
| 2.1.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 68.80%
 +
 
 +
|- align="center"
 +
| 2.1.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 78.55%
 +
 
 +
|- align="center"
 +
| 2.1.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 337
 +
| 82.82%
 +
 
 +
|- align="center"
 +
| 2.1.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 337
 +
| 87.20%
 +
 
 +
|- align="center"
 +
| 2.1.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 337
 +
| 91.65%
 +
 
 +
|- align="center"
 +
| 2.1.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 337
 +
| 95.00%
 +
|}
 +
 
 +
<br />
 +
 
 +
== Resultados do WNN-COR ==
 +
 
 +
Os resultados preliminares do classificador ''Weightless Neural Network with Data Correlation'' (WNN-COR) são mostrados nas tabelas abaixo.
 +
 
 +
==== ''Tabela 3.8.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1367
 +
* Linhas 4-8: 5771
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 11
 +
* SYNAPSES: 1024
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
 
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.8.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 405
 +
| 99.15%
 +
 
 +
|- align="center"
 +
| 3.8.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 3495
 +
0 a 3280
 +
| SUBCLASSE
 +
| 405
 +
| 44.72%
 +
 
 +
|- align="center"
 +
| 3.8.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| NOWRAP | 1748 a 3495
 +
1640 a 3280
 +
| SUBCLASSE
 +
| 405
 +
| 46.36%
 +
 
 +
|- align="center"
 +
| 3.8.2.4
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SUBCLASSE
 +
| 405
 +
| 71.08%
 +
 
 +
|- align="center"
 +
| 3.8.2.5
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| CLASSE
 +
| 405
 +
| 75.33%
 +
 
 +
|- align="center"
 +
| 3.8.2.6
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| GRUPO
 +
| 405
 +
| 76.22%
 +
 
 +
|- align="center"
 +
| 3.8.2.7
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| DIVISÃO
 +
| 405
 +
| 82.77%
 +
 
 +
|- align="center"
 +
| 3.8.2.8
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SEÇÃO
 +
| 405
 +
| 85.57%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.8.1'' ====
 +
----
 +
 
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1355
 +
* Linhas 4-8: 5725
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 11
 +
* SYNAPSES: 1024
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
 
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.8.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 406
 +
| 98.99%
 +
 
 +
|- align="center"
 +
| 3.8.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 3495
 +
0 a 3280
 +
| SUBCLASSE
 +
| 406
 +
| 44.98%
 +
 
 +
|- align="center"
 +
| 3.8.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| NOWRAP | 1748 a 3495
 +
1640 a 3280
 +
| SUBCLASSE
 +
| 406
 +
| 45.32%
 +
 
 +
|- align="center"
 +
| 3.8.1.4
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SUBCLASSE
 +
| 406
 +
| 69.64%
 +
 
 +
|- align="center"
 +
| 3.8.1.5
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| CLASSE
 +
| 406
 +
| 74.33%
 +
 
 +
|- align="center"
 +
| 3.8.1.6
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| GRUPO
 +
| 406
 +
| 75.75%
 +
 
 +
|- align="center"
 +
| 3.8.1.7
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| DIVISÃO
 +
| 406
 +
| 81.50%
 +
 
 +
|- align="center"
 +
| 3.8.1.8
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SEÇÃO
 +
| 406
 +
| 84.86%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.7.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1372
 +
* Linhas 4-8: 3919
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 19
 +
* SYNAPSES: 1024
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
 
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.7.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 402
 +
| 100.00%
 +
 
 +
|- align="center"
 +
| 3.7.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 65.13%
 +
 
 +
|- align="center"
 +
| 3.7.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 68.68%
 +
 
 +
|- align="center"
 +
| 3.7.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 78.79%
 +
 
 +
|- align="center"
 +
| 3.7.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 402
 +
| 82.21%
 +
 
 +
|- align="center"
 +
| 3.7.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 402
 +
| 83.30%
 +
 
 +
|- align="center"
 +
| 3.7.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 402
 +
| 88.36%
 +
 
 +
|- align="center"
 +
| 3.7.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 402
 +
| 92.69%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.7.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1372
 +
* Linhas 4-8: 3919
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 19
 +
* SYNAPSES: 1024
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
 
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.7.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 402
 +
| 100.00%
 +
 
 +
|- align="center"
 +
| 3.7.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 65.22%
 +
 
 +
|- align="center"
 +
| 3.7.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 68.74%
 +
 
 +
|- align="center"
 +
| 3.7.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 79.04%
 +
 
 +
|- align="center"
 +
| 3.7.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 402
 +
| 82.21%
 +
 
 +
|- align="center"
 +
| 3.7.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 402
 +
| 83.06%
 +
 
 +
|- align="center"
 +
| 3.7.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 402
 +
| 88.48%
 +
 
 +
|- align="center"
 +
| 3.7.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 402
 +
| 92.81%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.6.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat
 +
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1365 palavras
 +
* Linhas 4-8: 3703 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.6.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 336
 +
| 99.24%
 +
 
 +
|- align="center"
 +
| 3.6.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 336
 +
| 66.14%
 +
 
 +
|- align="center"
 +
| 3.6.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 336
 +
| 69.84%
 +
 
 +
|- align="center"
 +
| 3.6.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 336
 +
| 78.79%
 +
 
 +
|- align="center"
 +
| 3.6.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 336
 +
| 81.96%
 +
 
 +
|- align="center"
 +
| 3.6.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 336
 +
| 80.56%
 +
 
 +
|- align="center"
 +
| 3.6.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 336
 +
| 85.37%
 +
 
 +
|- align="center"
 +
| 3.6.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 336
 +
| 88.67%
 +
|}
 +
 
 +
<br/ >
 +
 
 +
==== ''Tabela 3.6.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1353 palavras
 +
* Linhas 4-8: 3661 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.6.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 342
 +
| 98.90%
 +
 
 +
|- align="center"
 +
| 3.6.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 342
 +
| 68.70%
 +
 
 +
|- align="center"
 +
| 3.6.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 342
 +
| 71.30%
 +
 
 +
|- align="center"
 +
| 3.6.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 342
 +
| 78.55%
 +
 
 +
|- align="center"
 +
| 3.6.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 342
 +
| 82.75%
 +
 
 +
|- align="center"
 +
| 3.6.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 342
 +
| 81.72%
 +
 
 +
|- align="center"
 +
| 3.6.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 342
 +
| 84.83%
 +
 
 +
|- align="center"
 +
| 3.6.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 342
 +
| 86.84%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.5.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1258
 +
* Linhas 4-8: 3257
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 19
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.5.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 408
 +
| 99.58%
 +
 
 +
|- align="center"
 +
| 3.5.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 408
 +
| 63.76%
 +
 
 +
|- align="center"
 +
| 3.5.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 408
 +
| 67.76%
 +
 
 +
|- align="center"
 +
| 3.5.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 408
 +
| 79.04%
 +
 
 +
|- align="center"
 +
| 3.5.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 408
 +
| 80.62%
 +
 
 +
|- align="center"
 +
| 3.5.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 408
 +
| 80.68%
 +
 
 +
|- align="center"
 +
| 3.5.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 408
 +
| 84.89%
 +
 
 +
|- align="center"
 +
| 3.5.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 408
 +
| 87.14%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.5.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1258
 +
* Linhas 4-8: 3257
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 19
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.5.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 408
 +
| 99.58%
 +
 
 +
|- align="center"
 +
| 3.5.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 408
 +
| 63.79%
 +
 
 +
|- align="center"
 +
| 3.5.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 408
 +
| 67.64%
 +
 
 +
|- align="center"
 +
| 3.5.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 408
 +
| 78.98%
 +
 
 +
|- align="center"
 +
| 3.5.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 408
 +
| 80.26%
 +
 
 +
|- align="center"
 +
| 3.5.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 408
 +
| 80.50%
 +
 
 +
|- align="center"
 +
| 3.5.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 408
 +
| 84.95%
 +
 
 +
|- align="center"
 +
| 3.5.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 408
 +
| 87.14%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.4.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1239 palavras
 +
* Linhas 4-8: 3147 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 17
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.4.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 351
 +
| 99.49%
 +
 
 +
|- align="center"
 +
| 3.4.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 351
 +
| 65.89%
 +
 
 +
|- align="center"
 +
| 3.4.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 351
 +
| 69.71%
 +
 
 +
|- align="center"
 +
| 3.4.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 351
 +
| 77.70%
 +
 
 +
|- align="center"
 +
| 3.4.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 351
 +
| 80.07%
 +
 
 +
|- align="center"
 +
| 3.4.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 351
 +
| 79.89%
 +
 
 +
|- align="center"
 +
| 3.4.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 351
 +
| 84.46%
 +
 
 +
|- align="center"
 +
| 3.4.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 351
 +
| 86.78%
 +
|}
 +
<br />
 +
 
 +
==== ''Tabela 3.4.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1239 palavras
 +
* Linhas 4-8: 3147 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.4.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 337
 +
| 99.32%
 +
 
 +
|- align="center"
 +
| 3.4.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 66.23%
 +
 
 +
|- align="center"
 +
| 3.4.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 68.92%
 +
 
 +
|- align="center"
 +
| 3.4.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 76.72%
 +
 
 +
|- align="center"
 +
| 3.4.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 337
 +
| 79.59%
 +
 
 +
|- align="center"
 +
| 3.4.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 337
 +
| 78.73%
 +
 
 +
|- align="center"
 +
| 3.4.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 337
 +
| 84.46%
 +
 
 +
|- align="center"
 +
| 3.4.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 337
 +
| 87.26%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.3.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_110_sub+bh.csv|dicionario_110_sub+bh.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1321
 +
* Linhas 4-8: 4553
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.3.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.3.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 406
 +
| 97.97%
 +
 
 +
|- align="center"
 +
| 3.3.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3495
 +
| SUBCLASSE
 +
| 406
 +
| 29.55%
 +
 
 +
|- align="center"
 +
| 3.3.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 406
 +
| 29.10%
 +
 
 +
|- align="center"
 +
| 3.3.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 406
 +
| 62.75%
 +
 
 +
|- align="center"
 +
| 3.3.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| CLASSE
 +
| 406
 +
| 69.18%
 +
 
 +
|- align="center"
 +
| 3.3.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| GRUPO
 +
| 406
 +
| 64.64%
 +
 
 +
|- align="center"
 +
| 3.3.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| DIVISÃO
 +
| 406
 +
| 74.76%
 +
 
 +
|- align="center"
 +
| 3.3.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SEÇÃO
 +
| 406
 +
| 76.05%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.3.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_110_sub+bh.csv|dicionario_110_sub+bh.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1310
 +
* Linhas 4-8: 4517
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.3.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.3.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 406
 +
| 98.06%
 +
 
 +
|- align="center"
 +
| 3.3.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3495
 +
| SUBCLASSE
 +
| 406
 +
| 29.72%
 +
 
 +
|- align="center"
 +
| 3.3.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 406
 +
| 28.24%
 +
 
 +
|- align="center"
 +
| 3.3.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SUBCLASSE
 +
| 406
 +
| 63.78%
 +
 
 +
|- align="center"
 +
| 3.3.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| CLASSE
 +
| 406
 +
| 68.58%
 +
 
 +
|- align="center"
 +
| 3.3.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| GRUPO
 +
| 406
 +
| 64.72%
 +
 
 +
|- align="center"
 +
| 3.3.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| DIVISÃO
 +
| 406
 +
| 73.91%
 +
 
 +
|- align="center"
 +
| 3.3.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_BH_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 2330
 +
| DADOS_BH_SUB_110
 +
| OBJETO_SOCIAL
 +
| 2331 a 3495
 +
| SEÇÃO
 +
| 406
 +
| 76.39%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.2.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1367 palavras
 +
* Linhas 4-8: 3905 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 17
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.2.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 326
 +
| 99,41%
 +
 
 +
|- align="center"
 +
| 3.2.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 64,71%
 +
 
 +
|- align="center"
 +
| 3.2.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 68,19%
 +
 
 +
|- align="center"
 +
| 3.2.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 76.84%
 +
 
 +
|- align="center"
 +
| 3.2.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 326
 +
| 80.93%
 +
 
 +
|- align="center"
 +
| 3.2.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 326
 +
| 78.43%
 +
 
 +
|- align="center"
 +
| 3.2.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 326
 +
| 83.06%
 +
 
 +
|- align="center"
 +
| 3.2.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 326
 +
| 85.50%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.2.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1355 palavras
 +
* Linhas 4-8: 3863 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 17
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.2.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 337
 +
| 99.41%
 +
 
 +
|- align="center"
 +
| 3.2.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 65.13%
 +
 
 +
|- align="center"
 +
| 3.2.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 68.25%
 +
 
 +
|- align="center"
 +
| 3.2.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 77.70%
 +
 
 +
|- align="center"
 +
| 3.2.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 337
 +
| 80.93%
 +
 
 +
|- align="center"
 +
| 3.2.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 337
 +
| 78.18%
 +
 
 +
|- align="center"
 +
| 3.2.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 337
 +
| 81.60%
 +
 
 +
|- align="center"
 +
| 3.2.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 337
 +
| 84.10%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.1.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1369 palavras
 +
* Linhas 4-8: 1433 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.1.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 326
 +
| 99,15%
 +
 
 +
|- align="center"
 +
| 3.1.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 65,22%
 +
 
 +
|- align="center"
 +
| 3.1.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 68,49%
 +
 
 +
|- align="center"
 +
| 3.1.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 326
 +
| 83,06%
 +
 
 +
|- align="center"
 +
| 3.1.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 326
 +
| 85,07%
 +
 
 +
|- align="center"
 +
| 3.1.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 326
 +
| 86,84%
 +
 
 +
|- align="center"
 +
| 3.1.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 326
 +
| 91,59%
 +
 
 +
|- align="center"
 +
| 3.1.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 326
 +
| 94,64%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 3.1.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]]
 +
|width="30%"| '''CGD''': art. prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1358 palavras
 +
* Linhas 4-8: 1421 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* NL_WIDTH = NL_HEIGHT = 16
 +
* SYNAPSES: 512
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 3.1.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 337
 +
| 99.15%
 +
 
 +
|- align="center"
 +
| 3.1.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 65.80%
 +
 
 +
|- align="center"
 +
| 3.1.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 69.04%
 +
 
 +
|- align="center"
 +
| 3.1.1.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 337
 +
| 82.45%
 +
 
 +
|- align="center"
 +
| 3.1.1.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 337
 +
| 85.19%
 +
 
 +
|- align="center"
 +
| 3.1.1.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 337
 +
| 88.12%
 +
 
 +
|- align="center"
 +
| 3.1.1.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 337
 +
| 93.05%
 +
 
 +
|- align="center"
 +
| 3.1.1.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 337
 +
| 94.64%
 +
|}
 +
 
 +
<br />
 +
 
 +
== Resultados do PNN ==
 +
 
 +
Os resultados preliminares do classificador ''Probabilistic Neural Network'' (PNN) são mostrados nas tabelas abaixo.
 +
 
 +
==== ''Tabela 7.8.2 '' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]]
 +
|width="30%"| '''CGD''': prep.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1367
 +
* Linhas 4-8: 5771
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* SIGMA: 0.27
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos experimentos de validação para o experimento 7.8.2.4 empregados para ajustar o sigma da rede neural.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 7.8.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 402
 +
| 99.07%
 +
 
 +
|- align="center"
 +
| 7.8.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 3495
 +
0 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 45.89%
 +
 
 +
|- align="center"
 +
| 7.8.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| NOWRAP | 1748 a 3495
 +
1640 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 47.12%
 +
 
 +
|- align="center"
 +
| 7.8.2.4
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SUBCLASSE
 +
| 402
 +
| 69.14%
 +
 
 +
|- align="center"
 +
| 7.8.2.5
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| CLASSE
 +
| 402
 +
| 71.26%
 +
 
 +
|- align="center"
 +
| 7.8.2.6
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| GRUPO
 +
| 402
 +
| 76.21%
 +
 
 +
|- align="center"
 +
| 7.8.2.7
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| DIVISÃO
 +
| 402
 +
| 84.50%
 +
 
 +
|- align="center"
 +
| 7.8.2.8
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SEÇÃO
 +
| 402
 +
| 88.90%
 +
|}
 +
 
 +
<br />
 +
 
 +
==== ''Tabela 7.8.1'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]]
 +
|width="30%"| '''CGD''': art. conj. contr. interj. prep. pron.
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF
 +
|width="30%"| '''PFS''': 20000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''':
 +
* Linhas 1-3: 1355
 +
* Linhas 4-8: 5725
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* SIGMA: 0.24
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 7.8.1.4]] empregados para ajustar o sigma da rede neural.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) '''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 7.8.1.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 405
 +
| 99.07%
 +
 
 +
|- align="center"
 +
| 7.8.1.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 3495
 +
0 a 3280
 +
| SUBCLASSE
 +
| 405
 +
| 42.70%
 +
 
 +
|- align="center"
 +
| 7.8.1.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| NOWRAP | 1748 a 3495
 +
1640 a 3280
 +
| SUBCLASSE
 +
| 405
 +
| 43.32%
 +
 
 +
|- align="center"
 +
| 7.8.1.4
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SUBCLASSE
 +
| 405
 +
| 66.69%
 +
 
 +
|- align="center"
 +
| 7.8.1.5
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| CLASSE
 +
| 405
 +
| 68.89%
 +
 
 +
|- align="center"
 +
| 7.8.1.6
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| GRUPO
 +
| 405
 +
| 74.83%
 +
 
 +
|- align="center"
 +
| 7.8.1.7
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| DIVISÃO
 +
| 405
 +
| 84.50%
 +
 
 +
|- align="center"
 +
| 7.8.1.8
 +
| CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 0 a 1182 0 a 1747 0 a 1639
 +
| DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL OBJETO_SOCIAL
 +
| 1748 a 3495 1640 a 3280
 +
| SEÇÃO
 +
| 405
 +
| 89.35%
 +
|}
 +
 
 +
<br />
 +
 
 +
 
 +
==== ''Tabela 7.7.2'' ====
 +
----
 +
{| border=0 width="100%"
 +
|-
 +
|width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]]
 +
|width="30%"| '''CGD''': -
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF
 +
|width="30%"| '''PFS''': 10000
 +
|width="30%"|
 +
 
 +
|-
 +
|width="40%"| '''Construções das tabelas''':
 +
* Linhas 1-3: build_tables_subclasse_110_tfidf.bat
 +
* Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
 +
|width="30%"| '''Tamanhos dos ''lexicons''''': 
 +
* Linhas 1-3: 1372 palavras
 +
* Linhas 4-8: 3919 palavras
 +
|width="30%"|  '''Constantes (class_cnae.con)''':
 +
* SIGMA = 0.27
 +
|}
 +
 
 +
<small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 7.7.2.4]] empregados para ajustar o sigma da rede neural.</small>
 +
<br />
 +
 
 +
{| border=1 width="100%"
 +
|- align="center"
 +
| rowspan=2 | '''EXP.'''
 +
| colspan=3 | '''Dados de Treino'''
 +
| colspan=4 | '''Dados de Teste'''
 +
| rowspan=2 | '''Revisão'''
 +
'''do SCAE'''
 +
| rowspan=2 |'''Desempenho'''
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Tabela'''
 +
| '''Coluna'''
 +
| '''Limites'''
 +
| '''Nível'''
 +
 
 +
|- align="center"
 +
| 2.7.2.1
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| SUBCLASSE
 +
| 351
 +
| 100.00%
 +
 
 +
|- align="center"
 +
| 2.7.2.2
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 0 a 3280
 +
| SUBCLASSE
 +
| 351
 +
| 64.74%
 +
 
 +
|- align="center"
 +
| 2.7.2.3
 +
| CNAE_110_SUBCLASSE
 +
| DESCRICAO_SUB
 +
| 0 a 1182
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 351
 +
| 68.98%
 +
 
 +
|- align="center"
 +
| 2.7.2.4
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SUBCLASSE
 +
| 351
 +
| 78.73%
 +
 
 +
|- align="center"
 +
| 2.7.2.5
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| CLASSE
 +
| 351
 +
| 80.50%
 +
 
 +
|- align="center"
 +
| 2.7.2.6
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| GRUPO
 +
| 351
 +
| 83.18%
 +
 
 +
|- align="center"
 +
| 2.7.2.7
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| DIVISÃO
 +
| 351
 +
| 89.03%
 +
 
 +
|- align="center"
 +
| 2.7.2.8
 +
| CNAE_110_SUBCLASSE
 +
DADOS_VITORIA_SUB_110
 +
| DESCRICAO_SUB
 +
OBJETO_SOCIAL
 +
| 0 a 1182
 +
0 a 1639
 +
| DADOS_VITORIA_SUB_110
 +
| OBJETO_SOCIAL
 +
| 1640 a 3280
 +
| SEÇÃO
 +
| 351
 +
| 90.43%
 +
|}
 +
 
 +
<br />
 +
 
 +
== Experimentos Removendo Combinações de Classes Gramaticais ==
 +
 
 +
Os experimentos a seguir foram realizados utilizando o experimento 1.1.x.4 para o VS_CORE utilizando o diconário subclasse. O objetivo deste experimento é combinar diversas classes gramaticais para verificar qual combinação apresenta maior percentual de acerto. As classes gramaticais escolhidas foram:
 +
 
 +
* Artigo;
 +
* Conjunção;
 +
* Contração;
 +
* Interjeição;
 +
* Preposição;
 +
* Pronome;
 +
 
 +
Os experimentos foram feitos tanto para o TF quanto para o TFIDF. As tabelas abaixo mostram o resultado dos experimentos realizados.
 +
 
 +
=== Considerando TF ===
 +
----
 +
<br />
 +
{| border=1 align="justify"
 +
|- align="center"
 +
| '''Exp.'''
 +
| '''CLasses Removidas'''
 +
| '''Revisão'''  
 +
'''do SCAE'''
 +
| '''Peso'''  
 +
| '''Tamanho'''
 +
'''do Lexicon'''  
 +
| '''Desempenho'''  
 +
'''(1 - one-error)'''
 +
 
 +
|- align="center"
 +
| 1
 +
| Sem remover
 +
| 271
 +
| TF
 +
| 1456
 +
| 77,57%
 +
 
 +
|- align="center"
 +
| 2
 +
| Artigo (art.)
 +
| 271
 +
| TF
 +
| 1453
 +
| 78,00%
 +
 
 +
|- align="center"
 +
| 3
 +
| Conjunção (conj.)
 +
| 271
 +
| TF
 +
| 1453
 +
| 76,84%
 +
 
 +
|- align="center"
 +
| 4
 +
| Contração (contr.)
 +
| 271
 +
| TF
 +
| 1446
 +
| 77,82%
  
 
|- align="center"
 
|- align="center"
Linha 4 789: Linha 8 305:
  
 
Os experimentos são realizados considerando que o SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos:
 
Os experimentos são realizados considerando que o SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos:
 +
 +
[[Novo Script]] (temporário)
  
 
1. No diretório ''code/CORES/DB_CORE'' executar:
 
1. No diretório ''code/CORES/DB_CORE'' executar:

Edição atual tal como às 17h21min de 14 de setembro de 2012

Índice

Legenda dos Termos das Tabelas

  • PT: Denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF));
  • CGD: Denota as classes gramaticais desconsideradas no lexicon;
  • PFS: Denota a freqüência acima da qual a palavra não é incluída no lexicon.

Características dos Dicionários

dicionario_subclasse.csv


dicionario_completo.csv


dicionario_110_sub+bh.csv


A tabela dados_bh_110.csv foi truncada em 14825 linhas.

dicionario_sem_stop_stemm_sem_accent.csv


Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [1]) que empregou (na ordem de apresentação) as seguintes filtragens: remoção de stop words; stemming; retirada de acentos. O tamanho do dicionário obtido foi de 11550 palavras.

dicionario_sem_stop_stemm.csv


Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [2]) que empregou (na ordem de apresentação) as seguintes filtragens: remoção de stop words e stemming. O tamanho do dicionário obtido foi de 11737 palavras.

dicionario_completo_corrigido.csv


Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE_CORRIGIDO (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110_CORRIGIDO (coluna objeto social).

dicionario_sem_stop_stemm_sem_accent_f2.csv


Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário foram utilizados as seguintes filtragens (na ordem de apresentação): remoção dos acentos, remoção das stop words e por último a remoção de plural. O filtro utilizado foi implentado (em Java) por Patrick. O tamanho do dicionário obtido foi de 12795 palavras.

dicionario_completo+bh.csv


Este dicionário foi gerado mesclando-se o dicionário_completo.csv e o dicionario_110_sub+bh.csv. A tabela dados_bh_110.csv foi truncada em 14825 linhas.

Resultados do Corretor Ortográfico

Os resultados preliminares do Corretor Ortográfico.

Resultados do VS

Os resultados preliminares do classificador Vector Space (VS) são mostrados nas tabelas abaixo.

Tabela 1.8.2


Dicionário: dicionario_completo+bh.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1367
  • Linhas 4-8: 5771


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
1.8.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 350 99.07%
1.8.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495

0 a 3280

SUBCLASSE 350 45.89%
1.8.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 350 47.12%
1.8.2.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SUBCLASSE 350 73.59%
1.8.2.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 350 76.25%
1.8.2.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 GRUPO 350 80.64%
1.8.2.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 DIVISÃO 350 85.48%
1.8.2.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SEÇÃO 350 89.14%


Tabela 1.8.1


Dicionário: dicionario_completo+bh.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1355 palavras
  • Linhas 4-8: 5725 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
1.8.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 290 99.07%
1.8.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495
0 a 3280
SUBCLASSE 290 42.70%
1.8.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 290 43.32%
1.8.1.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495
1640 a 3280
SUBCLASSE 290 73.62%
1.8.1.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 290 76.60%
1.8.1.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182
0 a 1747
0 a 1639
DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495
1640 a 3280
GRUPO 290 81.88%
1.8.1.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182
0 a 1747
0 a 1639
DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495
1640 a 3280
DIVISÃO 290 86.87%
1.8.1.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182
0 a 1747
0 a 1639
DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495
1640 a 3280
SEÇÃO 290 90.94%


Tabela 1.7.2


Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1372
  • Linhas 4-8: 3919


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.7.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 350 100.00%
1.7.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 350 64.74%
1.7.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 350 68.98%
1.7.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 350 82.45%
1.7.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 350 83.85%
1.7.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 350 86.29%
1.7.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 350 89.15%
1.7.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 350 90.92%


Tabela 1.7.1


Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1372
  • Linhas 4-8: 3919


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.7.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 347 100.00%
1.7.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 347 59.77%
1.7.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 347 63.38%
1.7.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 347 80.99%
1.7.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 347 82.45%
1.7.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 347 85.74%
1.7.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 347 90.62%
1.7.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 347 93.17%


Tabela 1.6.2


Dicionário: dicionario_completo_corrigido.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1365
  • Linhas 4-8: 3703


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.6.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 350 99.07%
1.6.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 350 65.28%
1.6.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 350 68.74%
1.6.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 350 83.73%
1.6.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 350 85.13%
1.6.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 350 87.51%
1.6.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 350 90.49%
1.6.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 350 92.08%


Tabela 1.6.1


Dicionário: dicionario_completo_corrigido.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1353 palavras
  • Linhas 4-8: 3661 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.6.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 278 99.07%
1.6.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 278 62.69%
1.6.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 278 66.00%
1.6.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 278 82.82%
1.6.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 278 84.83%
1.6.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 278 88.12%
1.6.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 278 91.71%
1.6.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 278 93.66%


Tabela 1.5.2


Dicionário: dicionario_sem_stop_stemm.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1258 palavras
  • Linhas 4-8: 3257 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.5.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 402 99.49%
1.5.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 402 62.82%
1.5.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 66.97%
1.5.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 82.08%
1.5.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 402 83.79%
1.5.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 402 86.65%
1.5.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 402 89.21%
1.5.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 402 91.10%


Tabela 1.5.1


Dicionário: dicionario_sem_stop_stemm.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1258 palavras
  • Linhas 4-8: 3257 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.5.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 342 99.49%
1.5.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 342 60.29%
1.5.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 63.56%
1.5.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 81.29%
1.5.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 342 83.42%
1.5.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 342 86.96%
1.5.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 342 90.62%
1.5.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 342 92.63%


Tabela 1.4.2


Dicionário: dicionario_sem_stop_stemm_sem_accent.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1239 palavras
  • Linhas 4-8: 3147 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.4.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 342 99.49%
1.4.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 342 64.43%
1.4.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 67.52%
1.4.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 82.51%
1.4.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 342 84.03%
1.4.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 342 86.65%
1.4.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 342 89.15%
1.4.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 342 91.04%


Tabela 1.4.1


Dicionário: dicionario_sem_stop_stemm_sem_accent.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1239 palavras
  • Linhas 4-8: 3147 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.4.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 342 99.49%
1.4.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 342 55.20%
1.4.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 58.20%
1.4.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 81.78%
1.4.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 342 83.97%
1.4.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 342 87.26%
1.4.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 342 91.16%
1.4.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 342 93.66%


Tabela 1.3.2


Dicionário: dicionario_110_sub+bh.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1321 palavras
  • Linhas 4-8: 4553 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.3.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 342 98.39%
1.3.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 0 a 3495 SUBCLASSE 342 29.69%
1.3.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 342 28.84%
1.3.2.4 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 342 66.52%
1.3.2.5 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 CLASSE 342 70.39%
1.3.2.6 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 GRUPO 342 75.97%
1.3.2.7 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 DIVISÃO 342 81.72%
1.3.2.8 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SEÇÃO 342 87.47%


Tabela 1.3.1


Dicionário: dicionario_110_sub+bh.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1310 palavras
  • Linhas 4-8: 4517 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.3.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 342 98.31%
1.3.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 0 a 3495 SUBCLASSE 342 24.57%
1.3.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 342 22.92%
1.3.1.4 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 342 63.69%
1.3.1.5 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 CLASSE 342 67.55%
1.3.1.6 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 GRUPO 342 74.51%
1.3.1.7 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 DIVISÃO 342 81.46%
1.3.1.8 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SEÇÃO 342 88.24%


Tabela 1.2.2


Dicionário: dicionario_completo.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1367 palavras
  • Linhas 4-8: 3905 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.2.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 324 99,07%
1.2.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 324 62,94%
1.2.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 324 66,79%
1.2.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 324 82,88%
1.2.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 324 84,34%
1.2.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 324 87,08%
1.2.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 324 90,01%
1.2.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 324 91,83%


Tabela 1.2.1


Dicionário: dicionario_completo.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1355 palavras
  • Linhas 4-8: 3863 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.2.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 336 99.07%
1.2.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 336 60.74%
1.2.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 336 63.92%
1.2.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 336 82.45%
1.2.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 336 84.64%
1.2.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 336 87.81%
1.2.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 336 91.53%
1.2.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 336 93.60%


Tabela 1.1.2


Dicionário: dicionario_subclasse.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1369 palavras
  • Linhas 4-8: 1433 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.1.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 324 99,15%
1.1.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 324 62,85%
1.1.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 324 66,73%
1.1.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 324 85,31%
1.1.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 324 86,53%
1.1.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 324 89,09%
1.1.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 324 91,47%
1.1.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 324 93,72%


Tabela 1.1.1


Dicionário: dicionario_subclasse.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1358 palavras
  • Linhas 4-8: 1421 palavras


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
1.1.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 336 99.15%
1.1.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 336 60.74%
1.1.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 336 63.92%
1.1.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 336 84.22%
1.1.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 336 85.92%
1.1.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 336 89.46%
1.1.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 336 92.26%
1.1.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 336 94.64%


Resultados do WNN

Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados nas tabelas abaixo.

Tabela 2.8.2


Dicionário: dicionario_completo+bh.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1367
  • Linhas 4-8: 5771
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
2.8.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 402 99.41%
2.8.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495

0 a 3280

SUBCLASSE 402 44.92%
2.8.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 402 46.24%
2.8.2.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SUBCLASSE 402 66.54%
2.8.2.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 402 72.41%
2.8.2.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 GRUPO 402 79.20%
2.8.2.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 DIVISÃO 402 84.51%
2.8.2.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SEÇÃO 402 88.70%


Tabela 2.8.1


Dicionário: dicionario_completo+bh.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1355
  • Linhas 4-8: 5725
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
2.8.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 405 99.32%
2.8.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495

0 a 3280

SUBCLASSE 405 45.29%
2.8.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 405 45.50%
2.8.1.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SUBCLASSE 405 66.42%
2.8.1.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 405 72.82%
2.8.1.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 GRUPO 405 79.26%
2.8.1.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 DIVISÃO 405 85.57%
2.8.1.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SEÇÃO 405 89.08%


Tabela 2.7.2


Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1372 palavras
  • Linhas 4-8: 3919 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 15
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.7.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 351 100.00%
2.7.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 351 64.13%
2.7.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 69.35%
2.7.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 74.41%
2.7.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 351 79.34%
2.7.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 351 84.10%
2.7.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 351 91.16%
2.7.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 351 93.66%


Tabela 2.7.1


Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1372 palavras
  • Linhas 4-8: 3919 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 15
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.7.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 351 100.00%
2.7.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 351 64.34%
2.7.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 69.41%
2.7.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 74.34%
2.7.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 351 79.59%
2.7.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 351 84.16%
2.7.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 351 91.10%
2.7.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 351 93.85%


Tabela 2.6.2


Dicionário: dicionario_completo_corrigido.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1365 palavras
  • Linhas 4-8: 3703 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 15
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.6.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 331 98.90%
2.6.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 331 66.44%
2.6.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 331 70.20%
2.6.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 331 69.35%
2.6.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 331 73.74%
2.6.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 331 79.65%
2.6.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 331 89.15%
2.6.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 331 91.96%


Tabela 2.6.1


Dicionário: dicionario_completo_corrigido.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1353 palavras
  • Linhas 4-8: 3661 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 15
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.6.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 337 98.90%
2.6.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 337 68.12%
2.6.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 70.81%
2.6.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 69.84%
2.6.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 337 74.89%
2.6.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 337 81.60%
2.6.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 337 89.03%
2.6.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 337 92.14%


Tabela 2.5.2


Dicionário: dicionario_sem_stop_stemm.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1258
  • Linhas 4-8: 3257
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 19
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.5.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 408 99.58%
2.5.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 408 63.76%
2.5.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 408 67.76%
2.5.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 408 74.53%
2.5.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 408 79.95%
2.5.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 408 84.52%
2.5.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 408 89.76%
2.5.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 408 91.71%


Tabela 2.5.1


Dicionário: dicionario_sem_stop_stemm.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1258
  • Linhas 4-8: 3257
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 19
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.5.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 412 99.58%
2.5.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 412 63.79%
2.5.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 412 67.64%
2.5.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 412 74.10%
2.5.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 412 80.13%
2.5.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 412 84.34%
2.5.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 412 89.64%
2.5.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 412 91.83%


Tabela 2.4.2


Dicionário: dicionario_sem_stop_stemm_sem_accent.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1239 palavras
  • Linhas 4-8: 3147 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 20
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.4.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 402 99.41%
2.4.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 402 66.08%
2.4.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 69.41%
2.4.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 74.28%
2.4.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 402 79.95%
2.4.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 402 85.31%
2.4.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 402 89.88%
2.4.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 402 91.59%


Tabela 2.4.1


Dicionário: dicionario_sem_stop_stemm_sem_accent.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1239 palavras
  • Linhas 4-8: 3147 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 20
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.4.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 402 99.41%
2.4.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 402 66.14%
2.4.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 69.47%
2.4.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 74.22%
2.4.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 402 79.77%
2.4.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 402 84.95%
2.4.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 402 90.01%
2.4.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 402 91.53%


Tabela 2.3.2


Dicionário: dicionario_110_sub+bh.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1321 palavras
  • Linhas 4-8: 4553 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 14
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.3.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.3.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 330 97.72%
2.3.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 0 a 3495 SUBCLASSE 330 29.83%
2.3.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 330 29.01%
2.3.2.4 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 330 57.34%
2.3.2.5 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 CLASSE 330 60.34%
2.3.2.6 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 GRUPO 330 68.41%
2.3.2.7 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 DIVISÃO 330 73.65%
2.3.2.8 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SEÇÃO 330 79.57%


Tabela 2.3.1


Dicionário: dicionario_110_sub+bh.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1310 palavras
  • Linhas 4-8: 4517 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 14
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.3.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.3.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 337 97.63%
2.3.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 0 a 3495 SUBCLASSE 337 28.83%
2.3.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 337 27.81%
2.3.1.4 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 337 54.16%
2.3.1.5 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 CLASSE 337 58.20%
2.3.1.6 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 GRUPO 337 65.84%
2.3.1.7 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 DIVISÃO 337 71.85%
2.3.1.8 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SEÇÃO 337 79.23%


Tabela 2.2.2


Dicionário: dicionario_completo.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1367 palavras
  • Linhas 4-8: 3905 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 12
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.2.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.2.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 326 99,07%
2.2.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 326 64,19%
2.2.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 67,76%
2.2.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 72,94%
2.2.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 326 79,10%
2.2.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 326 83,85%
2.2.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 326 88,85%
2.2.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 326 90,60%


Tabela 2.2.1


Dicionário: dicionario_completo.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1355 palavras
  • Linhas 4-8: 3863 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 12
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.2.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.2.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 337 99.32%
2.2.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 337 65.01%
2.2.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 69.04%
2.2.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 71.48%
2.2.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 337 77.33%
2.2.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 337 83.00%
2.2.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 337 88.91%
2.2.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 337 90.07%


Tabela 2.1.2


Dicionário: dicionario_subclasse.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1369 palavras
  • Linhas 4-8: 1433 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 13
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.1.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.1.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 326 99,24%
2.1.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 326 65,01%
2.1.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 68,37%
2.1.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 77,57%
2.1.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 326 81,66%
2.1.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 326 85,50%
2.1.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 326 90,86%
2.1.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 326 94,27%


Tabela 2.1.1


Dicionário: dicionario_subclasse.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1358 palavras
  • Linhas 4-8: 1421 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 13
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.1.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.1.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 337 99.41%
2.1.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 337 65.77%
2.1.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 68.80%
2.1.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 78.55%
2.1.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 337 82.82%
2.1.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 337 87.20%
2.1.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 337 91.65%
2.1.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 337 95.00%


Resultados do WNN-COR

Os resultados preliminares do classificador Weightless Neural Network with Data Correlation (WNN-COR) são mostrados nas tabelas abaixo.

Tabela 3.8.2


Dicionário: dicionario_completo+bh.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1367
  • Linhas 4-8: 5771
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 11
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
3.8.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 405 99.15%
3.8.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495

0 a 3280

SUBCLASSE 405 44.72%
3.8.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 405 46.36%
3.8.2.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SUBCLASSE 405 71.08%
3.8.2.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 405 75.33%
3.8.2.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 GRUPO 405 76.22%
3.8.2.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 DIVISÃO 405 82.77%
3.8.2.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SEÇÃO 405 85.57%


Tabela 3.8.1


Dicionário: dicionario_completo+bh.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1355
  • Linhas 4-8: 5725
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 11
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
3.8.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 406 98.99%
3.8.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495

0 a 3280

SUBCLASSE 406 44.98%
3.8.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 406 45.32%
3.8.1.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SUBCLASSE 406 69.64%
3.8.1.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 406 74.33%
3.8.1.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 GRUPO 406 75.75%
3.8.1.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 DIVISÃO 406 81.50%
3.8.1.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SEÇÃO 406 84.86%


Tabela 3.7.2


Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1372
  • Linhas 4-8: 3919
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 19
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.7.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 402 100.00%
3.7.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 402 65.13%
3.7.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 68.68%
3.7.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 78.79%
3.7.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 402 82.21%
3.7.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 402 83.30%
3.7.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 402 88.36%
3.7.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 402 92.69%


Tabela 3.7.1


Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1372
  • Linhas 4-8: 3919
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 19
  • SYNAPSES: 1024

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.


EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.7.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 402 100.00%
3.7.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 402 65.22%
3.7.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 68.74%
3.7.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 402 79.04%
3.7.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 402 82.21%
3.7.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 402 83.06%
3.7.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 402 88.48%
3.7.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 402 92.81%


Tabela 3.6.2


Dicionário: dicionario_completo_corrigido.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1365 palavras
  • Linhas 4-8: 3703 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.6.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 336 99.24%
3.6.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 336 66.14%
3.6.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 336 69.84%
3.6.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 336 78.79%
3.6.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 336 81.96%
3.6.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 336 80.56%
3.6.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 336 85.37%
3.6.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 336 88.67%


Tabela 3.6.1


Dicionário: dicionario_completo_corrigido.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1353 palavras
  • Linhas 4-8: 3661 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.6.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 342 98.90%
3.6.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 342 68.70%
3.6.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 71.30%
3.6.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 342 78.55%
3.6.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 342 82.75%
3.6.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 342 81.72%
3.6.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 342 84.83%
3.6.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 342 86.84%


Tabela 3.5.2


Dicionário: dicionario_sem_stop_stemm.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1258
  • Linhas 4-8: 3257
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 19
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.5.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 408 99.58%
3.5.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 408 63.76%
3.5.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 408 67.76%
3.5.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 408 79.04%
3.5.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 408 80.62%
3.5.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 408 80.68%
3.5.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 408 84.89%
3.5.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 408 87.14%


Tabela 3.5.1


Dicionário: dicionario_sem_stop_stemm.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1258
  • Linhas 4-8: 3257
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 19
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.5.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 408 99.58%
3.5.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 408 63.79%
3.5.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 408 67.64%
3.5.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 408 78.98%
3.5.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 408 80.26%
3.5.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 408 80.50%
3.5.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 408 84.95%
3.5.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 408 87.14%


Tabela 3.4.2


Dicionário: dicionario_sem_stop_stemm_sem_accent.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1239 palavras
  • Linhas 4-8: 3147 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 17
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.4.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 351 99.49%
3.4.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 351 65.89%
3.4.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 69.71%
3.4.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 77.70%
3.4.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 351 80.07%
3.4.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 351 79.89%
3.4.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 351 84.46%
3.4.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 351 86.78%


Tabela 3.4.1


Dicionário: dicionario_sem_stop_stemm_sem_accent.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1239 palavras
  • Linhas 4-8: 3147 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.4.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 337 99.32%
3.4.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 337 66.23%
3.4.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 68.92%
3.4.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 76.72%
3.4.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 337 79.59%
3.4.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 337 78.73%
3.4.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 337 84.46%
3.4.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 337 87.26%


Tabela 3.3.2


Dicionário: dicionario_110_sub+bh.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1321
  • Linhas 4-8: 4553
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.3.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.3.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 406 97.97%
3.3.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 0 a 3495 SUBCLASSE 406 29.55%
3.3.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 406 29.10%
3.3.2.4 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 406 62.75%
3.3.2.5 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 CLASSE 406 69.18%
3.3.2.6 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 GRUPO 406 64.64%
3.3.2.7 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 DIVISÃO 406 74.76%
3.3.2.8 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SEÇÃO 406 76.05%


Tabela 3.3.1


Dicionário: dicionario_110_sub+bh.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1310
  • Linhas 4-8: 4517
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.3.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.3.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 406 98.06%
3.3.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 0 a 3495 SUBCLASSE 406 29.72%
3.3.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 406 28.24%
3.3.1.4 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SUBCLASSE 406 63.78%
3.3.1.5 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 CLASSE 406 68.58%
3.3.1.6 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 GRUPO 406 64.72%
3.3.1.7 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 DIVISÃO 406 73.91%
3.3.1.8 CNAE_110_SUBCLASSE

DADOS_BH_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 2330

DADOS_BH_SUB_110 OBJETO_SOCIAL 2331 a 3495 SEÇÃO 406 76.39%


Tabela 3.2.2


Dicionário: dicionario_completo.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1367 palavras
  • Linhas 4-8: 3905 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 17
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.2.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.2.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 326 99,41%
3.2.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 326 64,71%
3.2.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 68,19%
3.2.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 76.84%
3.2.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 326 80.93%
3.2.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 326 78.43%
3.2.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 326 83.06%
3.2.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 326 85.50%


Tabela 3.2.1


Dicionário: dicionario_completo.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1355 palavras
  • Linhas 4-8: 3863 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 17
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.2.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.2.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 337 99.41%
3.2.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 337 65.13%
3.2.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 68.25%
3.2.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 77.70%
3.2.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 337 80.93%
3.2.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 337 78.18%
3.2.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 337 81.60%
3.2.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 337 84.10%


Tabela 3.1.2


Dicionário: dicionario_subclasse.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1369 palavras
  • Linhas 4-8: 1433 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.1.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.1.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 326 99,15%
3.1.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 326 65,22%
3.1.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 68,49%
3.1.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 326 83,06%
3.1.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 326 85,07%
3.1.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 326 86,84%
3.1.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 326 91,59%
3.1.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 326 94,64%


Tabela 3.1.1


Dicionário: dicionario_subclasse.csv CGD: art. prep.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1358 palavras
  • Linhas 4-8: 1421 palavras
Constantes (class_cnae.con):
  • NL_WIDTH = NL_HEIGHT = 16
  • SYNAPSES: 512

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.1.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
3.1.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 337 99.15%
3.1.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 337 65.80%
3.1.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 69.04%
3.1.1.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 337 82.45%
3.1.1.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 337 85.19%
3.1.1.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 337 88.12%
3.1.1.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 337 93.05%
3.1.1.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 337 94.64%


Resultados do PNN

Os resultados preliminares do classificador Probabilistic Neural Network (PNN) são mostrados nas tabelas abaixo.

Tabela 7.8.2


Dicionário: dicionario_completo+bh.csv CGD: prep.
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1367
  • Linhas 4-8: 5771
Constantes (class_cnae.con):
  • SIGMA: 0.27

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 7.8.2.4 empregados para ajustar o sigma da rede neural.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
7.8.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 402 99.07%
7.8.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495

0 a 3280

SUBCLASSE 402 45.89%
7.8.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 402 47.12%
7.8.2.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SUBCLASSE 402 69.14%
7.8.2.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 402 71.26%
7.8.2.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 GRUPO 402 76.21%
7.8.2.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 DIVISÃO 402 84.50%
7.8.2.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SEÇÃO 402 88.90%


Tabela 7.8.1


Dicionário: dicionario_completo+bh.csv CGD: art. conj. contr. interj. prep. pron.
Função para o cálculo dos pesos dos termos (PT): TF PFS: 20000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1355
  • Linhas 4-8: 5725
Constantes (class_cnae.con):
  • SIGMA: 0.24

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 7.8.1.4 empregados para ajustar o sigma da rede neural.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho
(1 - one-error)
Tabela Coluna Limites Tabela Coluna Limites Nível
7.8.1.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 405 99.07%
7.8.1.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 0 a 3495

0 a 3280

SUBCLASSE 405 42.70%
7.8.1.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495

1640 a 3280

SUBCLASSE 405 43.32%
7.8.1.4 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SUBCLASSE 405 66.69%
7.8.1.5 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 CLASSE 405 68.89%
7.8.1.6 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 GRUPO 405 74.83%
7.8.1.7 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 DIVISÃO 405 84.50%
7.8.1.8 CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL 0 a 1182 0 a 1747 0 a 1639 DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL OBJETO_SOCIAL 1748 a 3495 1640 a 3280 SEÇÃO 405 89.35%



Tabela 7.7.2


Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv CGD: -
Função para o cálculo dos pesos dos termos (PT): TFIDF PFS: 10000
Construções das tabelas:
  • Linhas 1-3: build_tables_subclasse_110_tfidf.bat
  • Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat
Tamanhos dos lexicons:
  • Linhas 1-3: 1372 palavras
  • Linhas 4-8: 3919 palavras
Constantes (class_cnae.con):
  • SIGMA = 0.27

OBS: Veja aqui os resultados dos experimentos de validação para o experimento 7.7.2.4 empregados para ajustar o sigma da rede neural.

EXP. Dados de Treino Dados de Teste Revisão

do SCAE

Desempenho

(1 - one-error)

Tabela Coluna Limites Tabela Coluna Limites Nível
2.7.2.1 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 SUBCLASSE 351 100.00%
2.7.2.2 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 0 a 3280 SUBCLASSE 351 64.74%
2.7.2.3 CNAE_110_SUBCLASSE DESCRICAO_SUB 0 a 1182 DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 68.98%
2.7.2.4 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SUBCLASSE 351 78.73%
2.7.2.5 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 CLASSE 351 80.50%
2.7.2.6 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 GRUPO 351 83.18%
2.7.2.7 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 DIVISÃO 351 89.03%
2.7.2.8 CNAE_110_SUBCLASSE

DADOS_VITORIA_SUB_110

DESCRICAO_SUB

OBJETO_SOCIAL

0 a 1182

0 a 1639

DADOS_VITORIA_SUB_110 OBJETO_SOCIAL 1640 a 3280 SEÇÃO 351 90.43%


Experimentos Removendo Combinações de Classes Gramaticais

Os experimentos a seguir foram realizados utilizando o experimento 1.1.x.4 para o VS_CORE utilizando o diconário subclasse. O objetivo deste experimento é combinar diversas classes gramaticais para verificar qual combinação apresenta maior percentual de acerto. As classes gramaticais escolhidas foram:

  • Artigo;
  • Conjunção;
  • Contração;
  • Interjeição;
  • Preposição;
  • Pronome;

Os experimentos foram feitos tanto para o TF quanto para o TFIDF. As tabelas abaixo mostram o resultado dos experimentos realizados.

Considerando TF



Exp. CLasses Removidas Revisão

do SCAE

Peso Tamanho

do Lexicon

Desempenho

(1 - one-error)

1 Sem remover 271 TF 1456 77,57%
2 Artigo (art.) 271 TF 1453 78,00%
3 Conjunção (conj.) 271 TF 1453 76,84%
4 Contração (contr.) 271 TF 1446 77,82%
5 Interjeição (interj.) 271 TF 1455 77,57%
6 Preposição (prep.) 271 TF 1433 80,19%
7 Pronome (pron.) 271 TF 1446 77,57%
8 Artigo + Contração 271 TF 1443 78,12%
9 Artigo + Preposição 271 TF 1431 80,50%
10 Contração + Preposição 271 TF 1433 80,19%
11 Artigo + Contração + Preposição 271 TF 1431 80,50%
12 Artigo + Conjunção + Contração + Interjeição

+ Preposição + Pronome

271 TF 1421 84,22%


Considerando TFIDF



Exp. CLasses Removidas Revisão

do SCAE

Peso Tamanho

do Lexicon

Desempenho

(1 - one-error)

1 Sem remover 271 TFIDF 1456 84,16%
2 Artigo 271 TFIDF 1453 84.22%
3 Conjunção 271 TFIDF 1453 83,97%
4 Contração 271 TFIDF 1446 84,58%
5 Interjeição 271 TFIDF 1455 84,16%
6 Preposição 271 TFIDF 1433 85,31%
7 Pronome 271 TFIDF 1446 84,10%
8 Artigo + Contração 271 TFIDF 1443 84,64%
9 Artigo + Preposição 271 TFIDF 1431 84,83%
10 Contração + Preposição 271 TFIDF 1433 85,31%
11 Artigo + Contração + Preposição 271 TFIDF 1431 84,83%
12 Artigo + Conjunção + Contração + Interjeição

+ Preposição + Pronome

271 TFIDF 1421 84,52%


Como Realizar os Experimentos

Os experimentos são realizados considerando que o SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos:

Novo Script (temporário)

1. No diretório code/CORES/DB_CORE executar:

make clean
make 

2. Construir as tabelas do DB_CORE. No diretório code/CORES/DB_CORE/ existem arquivos .bat para construir as tabelas do DB_CORE. Normalmente, esses arquivos começam com a palavra build. Para maiores esclarecimentos consulte Criando tabelas no DB_CORE.

Para os experimentos que correspondem à tabela CNAE_110_SUBCLASSE-DESCRICAO_SUB rodar o seguinte script:

./build_tables_subclasse_110.bat 

Já para os experimentos que correspondem às tabelas CNAE_110_SUBCLASSE-DESCRICAO_SUB e DADOS_VITORIA_SUB_110-OBJETO_SOCIAL rodar o seguinte script

./build_tables_subclasse_110_sub+vit.bat


3. Em code/CORES/DB_CORE, inicializar o servidor DB_CORE:

./db_core init_server ports.cfg

4. No diretório scae/code/CORES/WNN_CORE ou scae/code/CORES/WNN_COR_CORE, editar o arquivo class_cnae.con e definir os valores ótimos para os parâmetros da rede (número de neurônios e sinapses por neurônio):

   const NL_WIDTH	= 12;
   const NL_HEIGHT	= 12;
   const SYNAPSES      = 512;

Neste exemplo, os parâmetros ótimos são 12x12 neurônios e 512 sinapses.

5. Mudar as categorias (atributo Níveis das tabelas) em cada código fonte para cada "core", quando necessário (default é SUBCLASSE):

Em code/CORES/VS_CORE

kdevelop vector_space.c &

Ou em code/CORES/WNN_CORE/class_cnae_user_functions

kdevelop class_cnae_user_functions.c &

Ou em code/CORES/WNN_COR_CORE/class_cnae_user_functions

kdevelop class_cnae_user_functions.c &

6. Experimentos:

6.1. Para realizar experimentos com o VS_CORE:

No diretório code/CORES/VS_CORE execute:

make clean
make
./vs_core

No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:

./experiment_1.1.x.1_train.bat
./experiment_1.1.x.1_test.bat

6.2. Para realizar experimentos com o WNN_CORE:

No diretório code/CORES/WNN_CORE execute:

make clean
make
./wnn_core

No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:

./experiment_2.1.x.1_train.bat
./experiment_2.1.x.1_test.bat

6.3. Para realizar experimentos com o WNN_COR_CORE:

No diretório code/CORES/WNN_COR_CORE execute:

make clean
make
./wnn_cor_core

No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:

./experiment_3.1.x.1_train.bat
./experiment_3.1.x.1_test.bat

6.4. Para realizar os experimentos de validação com o WNN_COR_CORE (ou WNN_CORE), com o objetivo de ajustar o número de neurônios e sinapses por neurônios:

No diretório code/CORES/USER_INTERFACE, execute o script do experimento de validação:

 ./experiment_2.1.1.4.bat 

Para gerar o gráfico do desempenho (1 - one-error) em função do número de neurônios e sinapses por neurônios, execute:

 awk '{if ($1=="NL_WIDTH=")printf("%s %s %s ",$2,$4,$6); if ($13=="HIT")printf("%s\n",$16)}' experiment_2.1.1.4.out > experiment_2.1.1.4.dat
 gnuplot experiment_2.1.1.4.gp

O gráfico será gerado no arquivo experiment_2.1.1.4.eps.

Para listar os parâmetros em ordem decrescente de desempenho, execute:

 sed 's/\./,/'  experiment_2.1.1.4.dat | sort -n -r -k 4,4 | awk '{printf("* %ix%i neurônios e %i sinapses (%.2f%)\n", $1, $2, $3, $4)}'