Mudanças entre as edições de "Resultados de Pesquisa"
(→''Tabela 1.7.1'') |
|||
(183 revisões intermediárias por 6 usuários não estão sendo mostradas) | |||
Linha 1: | Linha 1: | ||
__TOC__ | __TOC__ | ||
+ | [[category:SCAE]] | ||
== Legenda dos Termos das Tabelas == | == Legenda dos Termos das Tabelas == | ||
*'''PT''': Denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); | *'''PT''': Denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (''term frequency (TF)'') ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (''inverse document frequency (TFIDF)''); | ||
*'''CGD''': Denota as classes gramaticais desconsideradas no ''lexicon''; | *'''CGD''': Denota as classes gramaticais desconsideradas no ''lexicon''; | ||
*'''PFS''': Denota a freqüência acima da qual a palavra não é incluída no ''lexicon''. | *'''PFS''': Denota a freqüência acima da qual a palavra não é incluída no ''lexicon''. | ||
+ | |||
+ | == Características dos Dicionários == | ||
+ | === dicionario_subclasse.csv === | ||
+ | ---- | ||
+ | |||
+ | === dicionario_completo.csv === | ||
+ | ---- | ||
+ | |||
+ | === dicionario_110_sub+bh.csv === | ||
+ | ---- | ||
+ | A tabela dados_bh_110.csv foi truncada em 14825 linhas. | ||
+ | |||
+ | === dicionario_sem_stop_stemm_sem_accent.csv === | ||
+ | ---- | ||
+ | Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [http://ensino.univates.br/~mald/]) que empregou (na ordem de apresentação) as seguintes filtragens: ''remoção de stop words''; ''stemming''; retirada de acentos. O tamanho do dicionário obtido foi de 11550 palavras. | ||
+ | |||
+ | === dicionario_sem_stop_stemm.csv === | ||
+ | ---- | ||
+ | Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [http://ensino.univates.br/~mald/]) que empregou (na ordem de apresentação) as seguintes filtragens: ''remoção de stop words'' e ''stemming''. O tamanho do dicionário obtido foi de 11737 palavras. | ||
+ | |||
+ | === dicionario_completo_corrigido.csv === | ||
+ | ---- | ||
+ | Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE_CORRIGIDO (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110_CORRIGIDO (coluna objeto social). | ||
+ | |||
+ | === dicionario_sem_stop_stemm_sem_accent_f2.csv === | ||
+ | ---- | ||
+ | Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário foram utilizados as seguintes filtragens (na ordem de apresentação): remoção dos acentos, remoção das stop words e por último a remoção de plural. O filtro utilizado foi implentado (em Java) por Patrick. O tamanho do dicionário obtido foi de 12795 palavras. | ||
+ | |||
+ | === dicionario_completo+bh.csv === | ||
+ | ---- | ||
+ | Este dicionário foi gerado mesclando-se o dicionário_completo.csv e o dicionario_110_sub+bh.csv. A tabela dados_bh_110.csv foi truncada em 14825 linhas. | ||
== Resultados do Corretor Ortográfico == | == Resultados do Corretor Ortográfico == | ||
Linha 10: | Linha 42: | ||
== Resultados do VS == | == Resultados do VS == | ||
− | Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados | + | Os resultados preliminares do classificador ''Vector Space'' (VS) são mostrados nas tabelas abaixo. |
==== ''Tabela 1.8.2'' ==== | ==== ''Tabela 1.8.2'' ==== | ||
Linha 16: | Linha 48: | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': dicionario_completo+bh.csv | + | |width="40%"| '''Dicionário''': [[#dicionario_completo.2Bbh.csv|dicionario_completo+bh.csv]] |
|width="60%"| '''CGD''': prep. | |width="60%"| '''CGD''': prep. | ||
Linha 157: | Linha 189: | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': dicionario_completo+bh.csv | + | |width="40%"| '''Dicionário''': [[#dicionario_completo.2Bbh.csv|dicionario_completo+bh.csv]] |
|width="60%"| '''CGD''': art. conj. contr. interj. prep. pron. | |width="60%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
Linha 172: | Linha 204: | ||
* Linhas 4-8: 5725 palavras | * Linhas 4-8: 5725 palavras | ||
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
Linha 296: | Linha 326: | ||
==== ''Tabela 1.7.2'' ==== | ==== ''Tabela 1.7.2'' ==== | ||
− | |||
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': - |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
|width="60%"| '''PFS''': 10000 | |width="60%"| '''PFS''': 10000 | ||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
* Linhas 1-3: 1372 | * Linhas 1-3: 1372 | ||
Linha 338: | Linha 367: | ||
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 346: | Linha 375: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
| 100.00% | | 100.00% | ||
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 358: | Linha 387: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
− | | | + | | 64.74% |
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 370: | Linha 399: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
− | | | + | | 68.98% |
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 385: | Linha 414: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
− | | | + | | 82.45% |
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 400: | Linha 429: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 350 |
− | | | + | | 83.85% |
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 415: | Linha 444: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 350 |
− | | | + | | 86.29% |
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 430: | Linha 459: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 350 |
− | | | + | | 89.15% |
|- align="center" | |- align="center" | ||
− | | 1.7. | + | | 1.7.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 445: | Linha 474: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 350 |
− | | | + | | 90.92% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1. | + | ==== ''Tabela 1.7.1'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': - |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF |
|width="60%"| '''PFS''': 10000 | |width="60%"| '''PFS''': 10000 | ||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1372 |
− | * Linhas 4-8: | + | * Linhas 4-8: 3919 |
|} | |} | ||
Linha 493: | Linha 522: | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 501: | Linha 530: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 347 |
− | | | + | | 100.00% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 513: | Linha 542: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 347 |
− | | | + | | 59.77% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 525: | Linha 554: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 347 |
− | | | + | | 63.38% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 540: | Linha 569: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 347 |
− | | | + | | 80.99% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 555: | Linha 584: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 347 |
− | | | + | | 82.45% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 570: | Linha 599: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 347 |
− | | | + | | 85.74% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 585: | Linha 614: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 347 |
− | | 90. | + | | 90.62% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.7.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 600: | Linha 629: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 347 |
− | | | + | | 93.17% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1.6. | + | ==== ''Tabela 1.6.2'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': dicionario_completo_corrigido.csv | + | |width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': prep. |
+ | |||
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
|width="60%"| '''PFS''': 10000 | |width="60%"| '''PFS''': 10000 | ||
|- | |- | ||
− | |width="40%"| '''Construções das tabelas''': | + | |width="40%"| '''Construções das tabelas''': |
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat |
− | |width="60%"| '''Tamanhos dos ''lexicons''''': | + | |width="60%"| '''Tamanhos dos ''lexicons''''': |
− | * Linhas 1-3: | + | * Linhas 1-3: 1365 |
− | * Linhas 4-8: | + | * Linhas 4-8: 3703 |
|} | |} | ||
− | + | <br /> | |
− | |||
− | <br /> | ||
{| border=1 width="100%" | {| border=1 width="100%" | ||
Linha 649: | Linha 677: | ||
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 657: | Linha 685: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
| 99.07% | | 99.07% | ||
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 669: | Linha 697: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
− | | | + | | 65.28% |
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 681: | Linha 709: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
− | | | + | | 68.74% |
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 696: | Linha 724: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 350 |
− | | | + | | 83.73% |
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 711: | Linha 739: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 350 |
− | | | + | | 85.13% |
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 726: | Linha 754: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 350 |
− | | | + | | 87.51% |
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 741: | Linha 769: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 350 |
− | | | + | | 90.49% |
|- align="center" | |- align="center" | ||
− | | 1.6. | + | | 1.6.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 756: | Linha 784: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 350 |
− | | | + | | 92.08% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1. | + | ==== ''Tabela 1.6.1'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': art. conj. contr. interj. prep. pron. |
|- | |- | ||
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
Linha 774: | Linha 802: | ||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1353 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 3661 palavras |
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
Linha 805: | Linha 831: | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 813: | Linha 839: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 278 |
− | | 99. | + | | 99.07% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 825: | Linha 851: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 278 |
− | | | + | | 62.69% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 837: | Linha 863: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 278 |
− | | | + | | 66.00% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 852: | Linha 878: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 278 |
− | | | + | | 82.82% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 867: | Linha 893: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 278 |
− | | 83 | + | | 84.83% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 882: | Linha 908: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 278 |
− | | | + | | 88.12% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 897: | Linha 923: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 278 |
− | | | + | | 91.71% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.6.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 912: | Linha 938: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 278 |
− | | | + | | 93.66% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1. | + | ==== ''Tabela 1.5.2'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': - |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
|width="60%"| '''PFS''': 10000 | |width="60%"| '''PFS''': 10000 | ||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1258 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 3257 palavras |
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
Linha 962: | Linha 986: | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 970: | Linha 994: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
| 99.49% | | 99.49% | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 982: | Linha 1 006: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 62.82% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 994: | Linha 1 018: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 66.97% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 009: | Linha 1 033: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 82.08% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 024: | Linha 1 048: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 402 |
− | | 83. | + | | 83.79% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 039: | Linha 1 063: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 402 |
− | | | + | | 86.65% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 054: | Linha 1 078: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 402 |
− | | | + | | 89.21% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 069: | Linha 1 093: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 402 |
− | | | + | | 91.10% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1. | + | ==== ''Tabela 1.5.1'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': - |
− | |||
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF |
− | |width="60%"| '''PFS''': | + | |width="60%"| '''PFS''': 10000 |
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1258 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 3257 palavras |
|} | |} | ||
− | |||
− | <br /> | + | <br /> |
{| border=1 width="100%" | {| border=1 width="100%" | ||
Linha 1 118: | Linha 1 140: | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 127: | Linha 1 149: | ||
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | | + | | 99.49% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | 0 a | + | | 0 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | 29 | + | | 60.29% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | | + | | 63.56% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | | + | | 81.29% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| CLASSE | | CLASSE | ||
| 342 | | 342 | ||
− | | | + | | 83.42% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| GRUPO | | GRUPO | ||
| 342 | | 342 | ||
− | | | + | | 86.96% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| DIVISÃO | | DIVISÃO | ||
| 342 | | 342 | ||
− | | | + | | 90.62% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.5.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SEÇÃO | | SEÇÃO | ||
| 342 | | 342 | ||
− | | | + | | 92.63% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1. | + | ==== ''Tabela 1.4.2'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': - |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
− | |width="60%"| '''PFS''': | + | |width="60%"| '''PFS''': 10000 |
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1239 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 3147 palavras |
|} | |} | ||
− | |||
<br /> | <br /> | ||
Linha 1 274: | Linha 1 295: | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 283: | Linha 1 304: | ||
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | | + | | 99.49% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | 0 a | + | | 0 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | | + | | 64.43% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | | + | | 67.52% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
| 342 | | 342 | ||
− | | | + | | 82.51% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| CLASSE | | CLASSE | ||
| 342 | | 342 | ||
− | | | + | | 84.03% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| GRUPO | | GRUPO | ||
| 342 | | 342 | ||
− | | | + | | 86.65% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| DIVISÃO | | DIVISÃO | ||
| 342 | | 342 | ||
− | | | + | | 89.15% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SEÇÃO | | SEÇÃO | ||
| 342 | | 342 | ||
− | | | + | | 91.04% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1. | + | ==== ''Tabela 1.4.1'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': - |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF |
|width="60%"| '''PFS''': 10000 | |width="60%"| '''PFS''': 10000 | ||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1239 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 3147 palavras |
|} | |} | ||
Linha 1 429: | Linha 1 450: | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 437: | Linha 1 458: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | 99 | + | | 99.49% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 449: | Linha 1 470: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 55.20% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 461: | Linha 1 482: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 58.20% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 476: | Linha 1 497: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 81.78% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 491: | Linha 1 512: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 342 |
− | | | + | | 83.97% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 506: | Linha 1 527: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 342 |
− | | 87 | + | | 87.26% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 521: | Linha 1 542: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 342 |
− | | | + | | 91.16% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.4.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 536: | Linha 1 557: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 342 |
− | | | + | | 93.66% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1.2 | + | ==== ''Tabela 1.3.2'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': prep. |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
− | |width="60%"| '''PFS''': | + | |width="60%"| '''PFS''': 20000 |
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1321 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 4553 palavras |
|} | |} | ||
Linha 1 584: | Linha 1 605: | ||
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 592: | Linha 1 613: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 98.39% |
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | 0 a | + | | 0 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 29.69% |
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 28.84% |
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 66.52% |
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| CLASSE | | CLASSE | ||
− | | | + | | 342 |
− | | | + | | 70.39% |
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| GRUPO | | GRUPO | ||
− | | | + | | 342 |
− | | | + | | 75.97% |
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 342 |
− | | | + | | 81.72% |
|- align="center" | |- align="center" | ||
− | | 1.2 | + | | 1.3.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 342 |
− | | | + | | 87.47% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1.1 | + | ==== ''Tabela 1.3.1'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]] |
− | |width="60%"| '''CGD''': prep. | + | |width="60%"| '''CGD''': art. conj. contr. interj. prep. pron. |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF |
− | |width="60%"| '''PFS''': | + | |width="60%"| '''PFS''': 20000 |
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1310 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 4517 palavras |
|} | |} | ||
Linha 1 739: | Linha 1 760: | ||
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 747: | Linha 1 768: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 98.31% |
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | 0 a | + | | 0 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 24.57% |
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 22.92% |
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 342 |
− | | | + | | 63.69% |
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| CLASSE | | CLASSE | ||
− | | | + | | 342 |
− | | | + | | 67.55% |
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| GRUPO | | GRUPO | ||
− | | | + | | 342 |
− | | | + | | 74.51% |
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 342 |
− | | | + | | 81.46% |
|- align="center" | |- align="center" | ||
− | | 1.1 | + | | 1.3.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 342 |
− | | | + | | 88.24% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 1. | + | ==== ''Tabela 1.2.2'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]] |
− | |width="60%"| '''CGD''': | + | |width="60%"| '''CGD''': prep. |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
|width="60%"| '''PFS''': 10000 | |width="60%"| '''PFS''': 10000 | ||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1367 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 3905 palavras |
|} | |} | ||
Linha 1 894: | Linha 1 915: | ||
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 902: | Linha 1 923: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | 99 | + | | 99,07% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 914: | Linha 1 935: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | | + | | 62,94% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 1 926: | Linha 1 947: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | | + | | 66,79% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 941: | Linha 1 962: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | | + | | 82,88% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 956: | Linha 1 977: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 324 |
− | | | + | | 84,34% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 971: | Linha 1 992: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 324 |
− | | | + | | 87,08% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 1 986: | Linha 2 007: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 324 |
− | | | + | | 90,01% |
|- align="center" | |- align="center" | ||
− | | 1. | + | | 1.2.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 2 001: | Linha 2 022: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 324 |
− | | | + | | 91,83% |
|} | |} | ||
<br /> | <br /> | ||
− | == | + | ==== ''Tabela 1.2.1'' ==== |
− | |||
− | |||
− | |||
− | |||
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]] |
− | |width="60%"| '''CGD''': prep. | + | |width="60%"| '''CGD''': art. conj. contr. interj. prep. pron. |
|- | |- | ||
Linha 2 024: | Linha 2 041: | ||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat |
|width="60%"| '''Tamanhos dos ''lexicons''''': | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: 1355 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 3863 palavras |
|} | |} | ||
− | |||
<br /> | <br /> | ||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
− | + | |- align="center" | |
− | + | | '''Tabela''' | |
− | + | | '''Coluna''' | |
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
− | = | + | |- align="center" |
− | + | | 1.2.1.1 | |
− | + | | CNAE_110_SUBCLASSE | |
− | | | + | | DESCRICAO_SUB |
− | | | + | | 0 a 1182 |
− | | | + | | CNAE_110_SUBCLASSE |
− | | | + | | DESCRICAO_SUB |
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 336 | ||
+ | | 99.07% | ||
− | |- | + | |- align="center" |
− | + | | 1.2.1.2 | |
− | | | + | | CNAE_110_SUBCLASSE |
− | | | + | | DESCRICAO_SUB |
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 336 | ||
+ | | 60.74% | ||
− | |- | + | |- align="center" |
− | + | | 1.2.1.3 | |
− | + | | CNAE_110_SUBCLASSE | |
− | + | | DESCRICAO_SUB | |
− | | | + | | 0 a 1182 |
− | + | | DADOS_VITORIA_SUB_110 | |
− | + | | OBJETO_SOCIAL | |
− | | | + | | 1640 a 3280 |
− | + | | SUBCLASSE | |
− | + | | 336 | |
+ | | 63.92% | ||
− | | | + | |- align="center" |
− | + | | 1.2.1.4 | |
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 336 | ||
+ | | 82.45% | ||
− | + | |- align="center" | |
+ | | 1.2.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 336 | ||
+ | | 84.64% | ||
− | + | |- align="center" | |
− | + | | 1.2.1.6 | |
− | + | | CNAE_110_SUBCLASSE | |
− | + | DADOS_VITORIA_SUB_110 | |
− | + | | DESCRICAO_SUB | |
− | | | + | OBJETO_SOCIAL |
− | | | + | | 0 a 1182 |
− | | | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 336 | ||
+ | | 87.81% | ||
− | |- | + | |- align="center" |
− | + | | 1.2.1.7 | |
− | | | + | | CNAE_110_SUBCLASSE |
− | | | + | DADOS_VITORIA_SUB_110 |
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 336 | ||
+ | | 91.53% | ||
− | |- | + | |- align="center" |
− | + | | 1.2.1.8 | |
− | + | | CNAE_110_SUBCLASSE | |
− | + | DADOS_VITORIA_SUB_110 | |
− | | | + | | DESCRICAO_SUB |
− | + | OBJETO_SOCIAL | |
− | + | | 0 a 1182 | |
− | | | + | 0 a 1639 |
− | + | | DADOS_VITORIA_SUB_110 | |
− | + | | OBJETO_SOCIAL | |
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 336 | ||
+ | | 93.60% | ||
|} | |} | ||
− | < | + | <br /> |
+ | |||
+ | ==== ''Tabela 1.1.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]] | ||
+ | |width="60%"| '''CGD''': prep. | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="60%"| '''PFS''': 10000 | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="60%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1369 palavras | ||
+ | * Linhas 4-8: 1433 palavras | ||
+ | |} | ||
<br /> | <br /> | ||
Linha 2 119: | Linha 2 225: | ||
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 2 127: | Linha 2 233: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | | + | | 99,15% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 2 139: | Linha 2 245: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | | + | | 62,85% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 2 151: | Linha 2 257: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | | + | | 66,73% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | | DADOS_VITORIA_SUB_110 | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 324 |
− | | | + | | 85,31% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | | DADOS_VITORIA_SUB_110 | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 324 |
− | | | + | | 86,53% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | | DADOS_VITORIA_SUB_110 | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 324 |
− | | | + | | 89,09% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | | DADOS_VITORIA_SUB_110 | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 324 |
− | | | + | | 91,47% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | | DADOS_VITORIA_SUB_110 | + | | DADOS_VITORIA_SUB_110 |
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 324 |
− | | | + | | 93,72% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela | + | ==== ''Tabela 1.1.1'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]] |
− | |width=" | + | |width="60%"| '''CGD''': art. conj. contr. interj. prep. pron. |
− | |||
|- | |- | ||
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
− | |width=" | + | |width="60%"| '''PFS''': 10000 |
− | |||
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat |
− | |width=" | + | |width="60%"| '''Tamanhos dos ''lexicons''''': |
− | * Linhas 1-3: | + | * Linhas 1-3: 1358 palavras |
− | * Linhas 4-8: | + | * Linhas 4-8: 1421 palavras |
− | |||
− | |||
− | |||
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
Linha 2 281: | Linha 2 380: | ||
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 2 289: | Linha 2 388: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 336 |
− | | | + | | 99.15% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 2 301: | Linha 2 400: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 336 |
− | | | + | | 60.74% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 2 313: | Linha 2 412: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 336 |
− | | | + | | 63.92% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 2 328: | Linha 2 427: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 336 |
− | | | + | | 84.22% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 2 343: | Linha 2 442: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 336 |
− | | | + | | 85.92% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 2 358: | Linha 2 457: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 336 |
− | | | + | | 89.46% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 2 373: | Linha 2 472: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 336 |
− | | | + | | 92.26% |
|- align="center" | |- align="center" | ||
− | | | + | | 1.1.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 2 388: | Linha 2 487: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 336 |
− | | | + | | 94.64% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 2. | + | == Resultados do WNN == |
+ | |||
+ | Os resultados preliminares do classificador ''Weightless Neural Network'' (WNN) são mostrados nas tabelas abaixo. | ||
+ | |||
+ | ==== ''Tabela 2.8.2 '' ==== | ||
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': dicionario_completo+bh.csv |
− | |width="30%"| '''CGD''': | + | |width="30%"| '''CGD''': prep. |
|width="30%"| | |width="30%"| | ||
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
|width="30%"| '''PFS''': 20000 | |width="30%"| '''PFS''': 20000 | ||
|width="30%"| | |width="30%"| | ||
|- | |- | ||
− | |width="40%"| '''Construções das tabelas''': | + | |width="40%"| '''Construções das tabelas''': |
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat |
− | |width="30%"| '''Tamanhos dos ''lexicons''''': | + | |width="30%"| '''Tamanhos dos ''lexicons''''': |
− | * Linhas 1-3: | + | * Linhas 1-3: 1367 |
− | * Linhas 4-8: | + | * Linhas 4-8: 5771 |
|width="30%"| '''Constantes (class_cnae.con)''': | |width="30%"| '''Constantes (class_cnae.con)''': | ||
− | * NL_WIDTH = NL_HEIGHT = | + | * NL_WIDTH = NL_HEIGHT = 16 |
− | * SYNAPSES: | + | * SYNAPSES: 1024 |
|} | |} | ||
− | <small>'''OBS''': | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
− | |||
<br /> | <br /> | ||
Linha 2 430: | Linha 2 532: | ||
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
− | | rowspan=2 |'''Desempenho | + | | rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) ''' |
− | |||
|- align="center" | |- align="center" | ||
Linha 2 443: | Linha 2 544: | ||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 2 451: | Linha 2 552: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | 99. | + | | 99.41% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | DADOS_VITORIA_SUB_110 | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | OBJETO_SOCIAL | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | | 0 a 3280 | + | | 0 a 3495 |
+ | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 44.92% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | DADOS_VITORIA_SUB_110 | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | OBJETO_SOCIAL | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | | 1640 a 3280 | + | | NOWRAP | 1748 a 3495 |
+ | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 46.24% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.4 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_VITORIA_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a 1639 | + | | 1748 a 3495 1640 a 3280 |
− | | DADOS_VITORIA_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 66.54% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.5 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_VITORIA_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a 1639 | + | | 1748 a 3495 1640 a 3280 |
− | | DADOS_VITORIA_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 402 |
− | | | + | | 72.41% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.6 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_VITORIA_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a 1639 | + | | 1748 a 3495 1640 a 3280 |
− | | DADOS_VITORIA_SUB_110 | + | | GRUPO |
− | | OBJETO_SOCIAL | + | | 402 |
− | | 1640 a 3280 | + | | 79.20% |
− | | GRUPO | ||
− | | | ||
− | | | ||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.7 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_VITORIA_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a 1639 | + | | 1748 a 3495 1640 a 3280 |
− | | DADOS_VITORIA_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 402 |
− | | | + | | 84.51% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.2.8 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_VITORIA_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a 1639 | + | | 1748 a 3495 1640 a 3280 |
− | | DADOS_VITORIA_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 402 |
− | | | + | | 88.70% |
|} | |} | ||
− | ==== ''Tabela 2. | + | <br /> |
+ | |||
+ | ==== ''Tabela 2.8.1'' ==== | ||
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]] | |
− | + | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | |
+ | |width="30%"| | ||
− | + | |- | |
− | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | |
− | + | |width="30%"| '''PFS''': 20000 | |
+ | |width="30%"| | ||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1355 | ||
+ | * Linhas 4-8: 5725 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 1024 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
| rowspan=2 | '''EXP.''' | | rowspan=2 | '''EXP.''' | ||
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
− | | rowspan=2 |'''Desempenho | + | | rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) ''' |
− | |||
|- align="center" | |- align="center" | ||
Linha 2 578: | Linha 2 685: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 405 |
− | | | + | | 99.32% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | |
− | + | | OBJETO_SOCIAL OBJETO_SOCIAL | |
− | |||
− | | DADOS_BH_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
| 0 a 3495 | | 0 a 3495 | ||
+ | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 405 |
− | + | | 45.29% | |
− | | 29 | ||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | |
− | + | | OBJETO_SOCIAL OBJETO_SOCIAL | |
− | + | | NOWRAP | 1748 a 3495 | |
− | | DADOS_BH_SUB_110 | + | 1640 a 3280 |
− | | OBJETO_SOCIAL | ||
− | | | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 405 |
− | | | + | | 45.50% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.4 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_BH_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a | + | | 1748 a 3495 1640 a 3280 |
− | |||
− | |||
− | |||
− | | DADOS_BH_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 405 |
− | | | + | | 66.42% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.5 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_BH_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a | + | | 1748 a 3495 1640 a 3280 |
− | |||
− | |||
− | |||
− | | DADOS_BH_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | | ||
| CLASSE | | CLASSE | ||
− | | | + | | 405 |
− | | | + | | 72.82% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.6 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_BH_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a | + | | 1748 a 3495 1640 a 3280 |
− | |||
− | |||
− | |||
− | | DADOS_BH_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | | ||
| GRUPO | | GRUPO | ||
− | | | + | | 405 |
− | | | + | | 79.26% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.7 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_BH_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a | + | | 1748 a 3495 1640 a 3280 |
− | |||
− | |||
− | |||
− | | DADOS_BH_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 405 |
− | | | + | | 85.57% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.8.1.8 |
− | | CNAE_110_SUBCLASSE | + | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | DADOS_BH_SUB_110 | + | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 1182 0 a 1747 0 a 1639 |
− | OBJETO_SOCIAL | + | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 |
− | | 0 a 1182 | + | | OBJETO_SOCIAL OBJETO_SOCIAL |
− | 0 a | + | | 1748 a 3495 1640 a 3280 |
− | |||
− | |||
− | |||
− | | DADOS_BH_SUB_110 | ||
− | | OBJETO_SOCIAL | ||
− | | | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 405 |
− | | | + | | 89.08% |
− | |||
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 2. | + | ==== ''Tabela 2.7.2'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]] | |
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
− | + | |- | |
− | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | |
− | + | |width="30%"| '''PFS''': 10000 | |
− | + | |width="30%"| | |
− | |||
− | |||
− | + | |- | |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1372 palavras | ||
+ | * Linhas 4-8: 3919 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 15 | ||
+ | * SYNAPSES: 1024 | ||
+ | |} | ||
− | </ | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
+ | <br /> | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
| colspan=4 | '''Dados de Teste''' | | colspan=4 | '''Dados de Teste''' | ||
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
Linha 2 763: | Linha 2 833: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 100.00% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_VITORIA_SUB_110 |
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | 0 a | + | | 0 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 64.13% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_VITORIA_SUB_110 |
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 69.35% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 74.41% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| CLASSE | | CLASSE | ||
− | | | + | | 351 |
− | | | + | | 79.34% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| GRUPO | | GRUPO | ||
− | | | + | | 351 |
− | | | + | | 84.10% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 351 |
− | | | + | | 91.16% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_VITORIA_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 1639 |
− | | | + | | DADOS_VITORIA_SUB_110 |
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 1640 a 3280 |
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 351 |
− | | | + | | 93.66% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 2. | + | ==== ''Tabela 2.7.1'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]] | |
− | + | |width="30%"| '''CGD''': - | |
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1372 palavras | ||
+ | * Linhas 4-8: 3919 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 15 | ||
+ | * SYNAPSES: 1024 | ||
+ | |} | ||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 2 925: | Linha 2 994: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 100.00% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | + | | 64.34% | |
− | | 64 | ||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 69.41% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 2 991: | Linha 3 043: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 74.34% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 010: | Linha 3 058: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 351 |
− | + | | 79.59% | |
− | | 79 | ||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 029: | Linha 3 073: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 351 |
− | | | + | | 84.16% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 048: | Linha 3 088: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 351 |
− | | | + | | 91.10% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.7.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 067: | Linha 3 103: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 351 |
− | | | + | | 93.85% |
− | |||
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
− | ==== ''Tabela 2.2 | + | ==== ''Tabela 2.6.2'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]] | |
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
− | + | |- | |
− | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | |
− | + | |width="30%"| '''PFS''': 10000 | |
− | + | |width="30%"| | |
− | + | |- | |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1365 palavras | ||
+ | * Linhas 4-8: 3703 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 15 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
− | Veja aqui os resultados dos [[experimentos de validação para o experimento 2. | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
− | + | <br /> | |
− | </ | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
| colspan=4 | '''Dados de Teste''' | | colspan=4 | '''Dados de Teste''' | ||
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
Linha 3 113: | Linha 3 155: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
Linha 3 121: | Linha 3 161: | ||
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 331 |
− | | | + | | 98.90% |
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 331 |
− | | | + | | 66.44% |
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 331 |
− | | | + | | 70.20% |
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 331 |
− | | | + | | 69.35% |
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 331 |
− | | | + | | 73.74% |
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 331 |
− | | | + | | 79.65% |
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 331 |
− | | | + | | 89.15% |
|- align="center" | |- align="center" | ||
− | | 2.2 | + | | 2.6.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 331 |
− | | | + | | 91.96% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela 2.1 | + | ==== ''Tabela 2.6.1'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]] | |
− | + | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | |
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1353 palavras | ||
+ | * Linhas 4-8: 3661 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 15 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
− | </ | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
+ | <br /> | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 3 274: | Linha 3 316: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | | | + | | 98.90% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | | | + | | 68.12% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | | | + | | 70.81% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 340: | Linha 3 365: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | | | + | | 69.84% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 359: | Linha 3 380: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 337 |
− | | | + | | 74.89% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 378: | Linha 3 395: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 337 |
− | | | + | | 81.60% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 397: | Linha 3 410: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 337 |
− | | | + | | 89.03% |
− | |||
|- align="center" | |- align="center" | ||
− | | 2.1 | + | | 2.6.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 416: | Linha 3 425: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 337 |
− | | | + | | 92.14% |
− | |||
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
− | ==== ''Tabela 2. | + | ==== ''Tabela 2.5.2'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]] | |
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
− | + | |- | |
− | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | |
− | + | |width="30%"| '''PFS''': 10000 | |
− | + | |width="30%"| | |
− | + | |- | |
− | + | |width="40%"| '''Construções das tabelas''': | |
− | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | |
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1258 | ||
+ | * Linhas 4-8: 3257 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 19 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
− | </ | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
+ | <br /> | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
| colspan=4 | '''Dados de Teste''' | | colspan=4 | '''Dados de Teste''' | ||
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
Linha 3 462: | Linha 3 477: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
Linha 3 470: | Linha 3 483: | ||
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 408 |
− | | 99. | + | | 99.58% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 408 |
− | | | + | | 63.76% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 408 |
− | | | + | | 67.76% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 519: | Linha 3 526: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 408 |
− | | | + | | 74.53% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 536: | Linha 3 541: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 408 |
− | | | + | | 79.95% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 553: | Linha 3 556: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 408 |
− | | | + | | 84.52% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 570: | Linha 3 571: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 408 |
− | | | + | | 89.76% |
|- align="center" | |- align="center" | ||
− | | 2. | + | | 2.5.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 587: | Linha 3 586: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 408 |
− | | | + | | 91.71% |
|} | |} | ||
<br /> | <br /> | ||
+ | |||
+ | ==== ''Tabela 2.5.1'' ==== | ||
---- | ---- | ||
− | + | {| border=0 width="100%" | |
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
− | == | + | |- |
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1258 | ||
+ | * Linhas 4-8: 3257 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 19 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
− | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | |
− | + | <br /> | |
− | |||
− | |||
− | |||
− | Veja aqui os resultados dos [[experimentos de validação para o experimento | ||
− | </ | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
| rowspan=2 | '''EXP.''' | | rowspan=2 | '''EXP.''' | ||
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 3 626: | Linha 3 638: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 412 |
− | + | | 99.58% | |
− | | 99. | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 412 |
− | | | + | | 63.79% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 412 |
− | | | + | | 67.64% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 412 |
− | | | + | | 74.10% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 412 |
− | | | + | | 80.13% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 412 |
− | | | + | | 84.34% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 412 |
− | | | + | | 89.64% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.5.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | DADOS_VITORIA_SUB_110 | + | DADOS_VITORIA_SUB_110 |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | + | | DADOS_VITORIA_SUB_110 | |
− | |||
− | |||
− | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 412 |
− | | | + | | 91.83% |
− | |||
|} | |} | ||
− | <br/ > | + | <br /> |
− | ==== ''Tabela | + | ==== ''Tabela 2.4.2'' ==== |
---- | ---- | ||
− | |||
− | |||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]] |
− | |width="30%"| '''CGD''': | + | |width="30%"| '''CGD''': - |
− | |width="30%"| | + | |width="30%"| |
|- | |- | ||
− | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF |
− | |width="30%"| '''PFS''': | + | |width="30%"| '''PFS''': 20000 |
− | |width="30%"| | + | |width="30%"| |
|- | |- | ||
|width="40%"| '''Construções das tabelas''': | |width="40%"| '''Construções das tabelas''': | ||
− | * Linhas 1-3: | + | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat |
− | * Linhas 4-8: build_tables_subclasse_110_sub+ | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat |
|width="30%"| '''Tamanhos dos ''lexicons''''': | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
* Linhas 1-3: 1239 palavras | * Linhas 1-3: 1239 palavras | ||
* Linhas 4-8: 3147 palavras | * Linhas 4-8: 3147 palavras | ||
− | | | + | |width="30%"| '''Constantes (class_cnae.con)''': |
− | + | * NL_WIDTH = NL_HEIGHT = 20 | |
+ | * SYNAPSES: 512 | ||
|} | |} | ||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
<br /> | <br /> | ||
Linha 3 829: | Linha 3 805: | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 3 837: | Linha 3 813: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 99.41% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 3 849: | Linha 3 825: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 66.08% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 3 861: | Linha 3 837: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 69.41% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 876: | Linha 3 852: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 74.28% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 891: | Linha 3 867: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 402 |
− | | | + | | 79.95% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 906: | Linha 3 882: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 402 |
− | | | + | | 85.31% |
− | + | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 921: | Linha 3 897: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 402 |
− | | | + | | 89.88% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 3 936: | Linha 3 912: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 402 |
− | | | + | | 91.59% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela | + | ==== ''Tabela 2.4.1'' ==== |
---- | ---- | ||
{| border=0 width="100%" | {| border=0 width="100%" | ||
|- | |- | ||
− | |width="40%"| '''Dicionário''': | + | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]] |
− | |width="30%"| '''CGD''': | + | |width="30%"| '''CGD''': - |
− | |width="30%"| | + | |width="30%"| |
|- | |- | ||
|width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
− | |width="30%"| '''PFS''': | + | |width="30%"| '''PFS''': 20000 |
− | |width="30%"| | + | |width="30%"| |
|- | |- | ||
Linha 3 962: | Linha 3 938: | ||
* Linhas 1-3: 1239 palavras | * Linhas 1-3: 1239 palavras | ||
* Linhas 4-8: 3147 palavras | * Linhas 4-8: 3147 palavras | ||
− | | | + | |width="30%"| '''Constantes (class_cnae.con)''': |
− | + | * NL_WIDTH = NL_HEIGHT = 20 | |
+ | * SYNAPSES: 512 | ||
|} | |} | ||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
<br /> | <br /> | ||
Linha 3 988: | Linha 3 966: | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 3 996: | Linha 3 974: | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | 99. | + | | 99.41% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 4 008: | Linha 3 986: | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | 66. | + | | 66.14% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
Linha 4 020: | Linha 3 998: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 69.47% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 035: | Linha 4 013: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 402 |
− | | | + | | 74.22% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 050: | Linha 4 028: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 402 |
− | | 79. | + | | 79.77% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 065: | Linha 4 043: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 402 |
− | | | + | | 84.95% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 080: | Linha 4 058: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 402 |
− | | | + | | 90.01% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.4.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 095: | Linha 4 073: | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 402 |
− | | | + | | 91.53% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela | + | ==== ''Tabela 2.3.2'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]] | |
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
− | Veja aqui os resultados dos [[experimentos de validação para o experimento | + | |- |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1321 palavras | ||
+ | * Linhas 4-8: 4553 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 14 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.3.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
− | + | {| border=1 width="100%" | |
|- align="center" | |- align="center" | ||
| rowspan=2 | '''EXP.''' | | rowspan=2 | '''EXP.''' | ||
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 4 123: | Linha 4 121: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 330 |
− | + | | 97.72% | |
− | | % | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_BH_SUB_110 |
− | |||
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | 0 a | + | | 0 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 330 |
− | + | | 29.83% | |
− | | % | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | | | + | | DADOS_BH_SUB_110 |
− | |||
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 330 |
− | + | | 29.01% | |
− | | % | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
− | |||
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 330 |
− | + | | 57.34% | |
− | | % | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
− | |||
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| CLASSE | | CLASSE | ||
− | | | + | | 330 |
− | + | | 60.34% | |
− | | % | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
− | |||
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| GRUPO | | GRUPO | ||
− | | | + | | 330 |
− | + | | 68.41% | |
− | | % | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
− | |||
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 330 |
− | + | | 73.65% | |
− | | % | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
− | + | DADOS_BH_SUB_110 | |
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
OBJETO_SOCIAL | OBJETO_SOCIAL | ||
| 0 a 1182 | | 0 a 1182 | ||
− | 0 a | + | 0 a 2330 |
− | | | + | | DADOS_BH_SUB_110 |
− | |||
− | |||
− | |||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
− | | | + | | 2331 a 3495 |
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 330 |
− | + | | 79.57% | |
− | | % | ||
|} | |} | ||
− | ==== ''Tabela | + | <br /> |
+ | |||
+ | ==== ''Tabela 2.3.1'' ==== | ||
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_110_sub.2Bbh.csv|dicionario_110_sub+bh.csv]] | |
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
− | </ | + | |- |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1310 palavras | ||
+ | * Linhas 4-8: 4517 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 14 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.3.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 4 299: | Linha 4 282: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | |||
| 97.63% | | 97.63% | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_BH_SUB_110 | | DADOS_BH_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3495 | | 0 a 3495 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | |||
| 28.83% | | 28.83% | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_BH_SUB_110 | | DADOS_BH_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 2331 a 3495 | | 2331 a 3495 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | |||
| 27.81% | | 27.81% | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_BH_SUB_110 | DADOS_BH_SUB_110 | ||
Linha 4 365: | Linha 4 331: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 2330 | 0 a 2330 | ||
− | |||
− | |||
− | |||
| DADOS_BH_SUB_110 | | DADOS_BH_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 2331 a 3495 | | 2331 a 3495 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 337 |
− | | | + | | 54.16% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_BH_SUB_110 | DADOS_BH_SUB_110 | ||
Linha 4 384: | Linha 4 346: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 2330 | 0 a 2330 | ||
− | |||
− | |||
− | |||
| DADOS_BH_SUB_110 | | DADOS_BH_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 2331 a 3495 | | 2331 a 3495 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 337 |
− | | | + | | 58.20% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_BH_SUB_110 | DADOS_BH_SUB_110 | ||
Linha 4 403: | Linha 4 361: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 2330 | 0 a 2330 | ||
− | |||
− | |||
− | |||
| DADOS_BH_SUB_110 | | DADOS_BH_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 2331 a 3495 | | 2331 a 3495 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 337 |
− | + | | 65.84% | |
− | | 65. | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_BH_SUB_110 | DADOS_BH_SUB_110 | ||
Linha 4 422: | Linha 4 376: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 2330 | 0 a 2330 | ||
− | |||
− | |||
− | |||
| DADOS_BH_SUB_110 | | DADOS_BH_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 2331 a 3495 | | 2331 a 3495 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 337 |
− | | | + | | 71.85% |
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.3.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_BH_SUB_110 | DADOS_BH_SUB_110 | ||
Linha 4 441: | Linha 4 391: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 2330 | 0 a 2330 | ||
− | |||
− | |||
− | |||
| DADOS_BH_SUB_110 | | DADOS_BH_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 2331 a 3495 | | 2331 a 3495 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 337 |
− | | | + | | 79.23% |
− | |||
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela | + | ==== ''Tabela 2.2.2'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]] | |
− | + | |width="30%"| '''CGD''': prep. | |
− | + | |width="30%"| | |
− | + | |- | |
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1367 palavras | ||
+ | * Linhas 4-8: 3905 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 12 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
− | </ | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.2.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
+ | <br /> | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 4 482: | Linha 4 443: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | 99, | + | | 99,07% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | 64, | + | | 64,19% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 67,76% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 548: | Linha 4 492: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 72,94% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 567: | Linha 4 507: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 79,10% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 586: | Linha 4 522: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 83,85% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 605: | Linha 4 537: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 88,85% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 624: | Linha 4 552: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 90,60% |
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela | + | ==== ''Tabela 2.2.1'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]] | |
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1355 palavras | ||
+ | * Linhas 4-8: 3863 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 12 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
− | Veja aqui os resultados dos [[experimentos de validação para o experimento | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
+ | <br /> | ||
− | + | {| border=1 width="100%" | |
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 4 664: | Linha 4 604: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 337 | | 337 | ||
− | | 99. | + | | 99.32% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 337 | | 337 | ||
− | | 65. | + | | 65.01% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 337 | | 337 | ||
− | | | + | | 69.04% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 730: | Linha 4 653: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | + | | 337 | |
− | | 337 | + | | 71.48% |
− | | | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 749: | Linha 4 668: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | + | | 337 | |
− | | 337 | + | | 77.33% |
− | | | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 768: | Linha 4 683: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | + | | 337 | |
− | | 337 | + | | 83.00% |
− | | | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 787: | Linha 4 698: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | + | | 337 | |
− | | 337 | + | | 88.91% |
− | | | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.2.1.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 806: | Linha 4 713: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | + | | 337 | |
− | | 337 | + | | 90.07% |
− | | | ||
|} | |} | ||
<br /> | <br /> | ||
− | ==== ''Tabela | + | ==== ''Tabela 2.1.2'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
+ | |width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]] | ||
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
− | + | |- | |
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1369 palavras | ||
+ | * Linhas 4-8: 1433 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 13 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
− | Veja aqui os resultados dos [[experimentos de validação para o experimento | + | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.1.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> |
− | + | <br /> | |
− | </ | ||
+ | {| border=1 width="100%" | ||
|- align="center" | |- align="center" | ||
− | | rowspan=2 | ''' | + | | rowspan=2 | '''EXP.''' |
− | | colspan= | + | | colspan=3 | '''Dados de Treino''' |
− | | colspan= | + | | colspan=4 | '''Dados de Teste''' |
| rowspan=2 | '''Revisão''' | | rowspan=2 | '''Revisão''' | ||
'''do SCAE''' | '''do SCAE''' | ||
Linha 4 846: | Linha 4 765: | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
− | |||
− | |||
− | |||
| '''Tabela''' | | '''Tabela''' | ||
| '''Coluna''' | | '''Coluna''' | ||
| '''Limites''' | | '''Limites''' | ||
| '''Nível''' | | '''Nível''' | ||
− | |||
− | |||
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.1 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | 99, | + | | 99,24% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.2 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | 65, | + | | 65,01% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | 68, | + | | 68,37% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 912: | Linha 4 814: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 77,57% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 931: | Linha 4 829: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | + | | 326 | |
− | | 326 | + | | 81,66% |
− | | | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 950: | Linha 4 844: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | + | | 326 | |
− | | 326 | + | | 85,50% |
− | | | ||
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 969: | Linha 4 859: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | |||
| 326 | | 326 | ||
− | | | + | | 90,86% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.1.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 4 988: | Linha 4 874: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | |||
| 326 | | 326 | ||
− | | 94, | + | | 94,27% |
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
− | ==== ''Tabela | + | ==== ''Tabela 2.1.1'' ==== |
---- | ---- | ||
− | {| border= | + | {| border=0 width="100%" |
− | | | + | |- |
− | + | |width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]] | |
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
− | + | |- | |
− | + | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | |
− | + | |width="30%"| '''PFS''': 10000 | |
− | + | |width="30%"| | |
− | + | |- | |
− | + | |width="40%"| '''Construções das tabelas''': | |
− | Veja aqui os resultados dos [[experimentos de validação para o experimento | + | * Linhas 1-3: build_tables_subclasse_110_tf.bat |
− | + | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | |
− | </ | + | |width="30%"| '''Tamanhos dos ''lexicons''''': |
− | + | * Linhas 1-3: 1358 palavras | |
− | |- align="center" | + | * Linhas 4-8: 1421 palavras |
− | | rowspan=2 | ''' | + | |width="30%"| '''Constantes (class_cnae.con)''': |
− | | colspan= | + | * NL_WIDTH = NL_HEIGHT = 13 |
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 2.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
| colspan=4 | '''Dados de Teste''' | | colspan=4 | '''Dados de Teste''' | ||
− | | rowspan=2 | '''Revisão''' | + | | rowspan=2 | '''Revisão''' |
− | '''do SCAE''' | + | '''do SCAE''' |
− | | rowspan=2 |'''Desempenho''' | + | | rowspan=2 |'''Desempenho''' |
− | '''(1 - one-error)''' | + | '''(1 - one-error)''' |
− | + | ||
− | |- align="center" | + | |- align="center" |
− | | '''Tabela''' | + | | '''Tabela''' |
− | | '''Coluna''' | + | | '''Coluna''' |
− | | '''Limites | + | | '''Limites''' |
− | + | | '''Tabela''' | |
− | + | | '''Coluna''' | |
− | | '''Tabela''' | + | | '''Limites''' |
− | | '''Coluna''' | + | | '''Nível''' |
− | | '''Limites''' | + | |
− | | '''Nível''' | + | |- align="center" |
− | + | | 2.1.1.1 | |
− | |- align="center" | + | | CNAE_110_SUBCLASSE |
− | | | + | | DESCRICAO_SUB |
− | | CNAE_110_SUBCLASSE | + | | 0 a 1182 |
− | | DESCRICAO_SUB | + | | CNAE_110_SUBCLASSE |
− | | 0 a 1182 | + | | DESCRICAO_SUB |
− | + | | 0 a 1182 | |
− | + | | SUBCLASSE | |
− | | CNAE_110_SUBCLASSE | + | | 337 |
− | | DESCRICAO_SUB | + | | 99.41% |
− | | 0 a 1182 | + | |
− | | SUBCLASSE | + | |- align="center" |
− | | 337 | + | | 2.1.1.2 |
− | | 99. | + | | CNAE_110_SUBCLASSE |
− | + | | DESCRICAO_SUB | |
− | |- align="center" | + | | 0 a 1182 |
− | | | + | | DADOS_VITORIA_SUB_110 |
− | | CNAE_110_SUBCLASSE | + | | OBJETO_SOCIAL |
− | | DESCRICAO_SUB | + | | 0 a 3280 |
− | | 0 a 1182 | + | | SUBCLASSE |
− | | | + | | 337 |
− | | 10000 | + | | 65.77% |
− | | DADOS_VITORIA_SUB_110 | + | |
+ | |- align="center" | ||
+ | | 2.1.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 68.80% | ||
+ | |||
+ | |- align="center" | ||
+ | | 2.1.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 78.55% | ||
+ | |||
+ | |- align="center" | ||
+ | | 2.1.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 337 | ||
+ | | 82.82% | ||
+ | |||
+ | |- align="center" | ||
+ | | 2.1.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 337 | ||
+ | | 87.20% | ||
+ | |||
+ | |- align="center" | ||
+ | | 2.1.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 337 | ||
+ | | 91.65% | ||
+ | |||
+ | |- align="center" | ||
+ | | 2.1.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 337 | ||
+ | | 95.00% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | == Resultados do WNN-COR == | ||
+ | |||
+ | Os resultados preliminares do classificador ''Weightless Neural Network with Data Correlation'' (WNN-COR) são mostrados nas tabelas abaixo. | ||
+ | |||
+ | ==== ''Tabela 3.8.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]] | ||
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1367 | ||
+ | * Linhas 4-8: 5771 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 11 | ||
+ | * SYNAPSES: 1024 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) ''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 99.15% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 3495 | ||
+ | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 44.72% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | NOWRAP | 1748 a 3495 | ||
+ | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 46.36% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.4 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 71.08% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.5 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 405 | ||
+ | | 75.33% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.6 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 405 | ||
+ | | 76.22% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.7 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 405 | ||
+ | | 82.77% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.2.8 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 405 | ||
+ | | 85.57% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.8.1'' ==== | ||
+ | ---- | ||
+ | |||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]] | ||
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1355 | ||
+ | * Linhas 4-8: 5725 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 11 | ||
+ | * SYNAPSES: 1024 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.8.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) ''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 98.99% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 3495 | ||
+ | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 44.98% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | NOWRAP | 1748 a 3495 | ||
+ | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 45.32% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.4 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 69.64% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.5 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 406 | ||
+ | | 74.33% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.6 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 406 | ||
+ | | 75.75% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.7 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 406 | ||
+ | | 81.50% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.8.1.8 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 406 | ||
+ | | 84.86% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.7.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1372 | ||
+ | * Linhas 4-8: 3919 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 19 | ||
+ | * SYNAPSES: 1024 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 100.00% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 65.13% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 68.68% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 78.79% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 402 | ||
+ | | 82.21% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 402 | ||
+ | | 83.30% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 402 | ||
+ | | 88.36% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.2.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 402 | ||
+ | | 92.69% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.7.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1372 | ||
+ | * Linhas 4-8: 3919 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 19 | ||
+ | * SYNAPSES: 1024 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.7.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 100.00% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 65.22% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 68.74% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 79.04% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 402 | ||
+ | | 82.21% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 402 | ||
+ | | 83.06% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 402 | ||
+ | | 88.48% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.7.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 402 | ||
+ | | 92.81% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.6.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]] | ||
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_corrigido_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tfidf.bat | ||
+ | |||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1365 palavras | ||
+ | * Linhas 4-8: 3703 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 336 | ||
+ | | 99.24% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 336 | ||
+ | | 66.14% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 336 | ||
+ | | 69.84% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 336 | ||
+ | | 78.79% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 336 | ||
+ | | 81.96% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 336 | ||
+ | | 80.56% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 336 | ||
+ | | 85.37% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.2.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 336 | ||
+ | | 88.67% | ||
+ | |} | ||
+ | |||
+ | <br/ > | ||
+ | |||
+ | ==== ''Tabela 3.6.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo_corrigido.csv|dicionario_completo_corrigido.csv]] | ||
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_corrigido_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_corrigido_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1353 palavras | ||
+ | * Linhas 4-8: 3661 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.6.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 342 | ||
+ | | 98.90% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 342 | ||
+ | | 68.70% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 342 | ||
+ | | 71.30% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 342 | ||
+ | | 78.55% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 342 | ||
+ | | 82.75% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 342 | ||
+ | | 81.72% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 342 | ||
+ | | 84.83% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.6.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 342 | ||
+ | | 86.84% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.5.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1258 | ||
+ | * Linhas 4-8: 3257 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 19 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 99.58% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 63.76% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 67.76% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 79.04% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 408 | ||
+ | | 80.62% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 408 | ||
+ | | 80.68% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 408 | ||
+ | | 84.89% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.2.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 408 | ||
+ | | 87.14% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.5.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm.csv|dicionario_sem_stop_stemm.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1258 | ||
+ | * Linhas 4-8: 3257 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 19 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.5.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 99.58% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 63.79% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 67.64% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 408 | ||
+ | | 78.98% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 408 | ||
+ | | 80.26% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 408 | ||
+ | | 80.50% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 408 | ||
+ | | 84.95% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.5.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 408 | ||
+ | | 87.14% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.4.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1239 palavras | ||
+ | * Linhas 4-8: 3147 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 17 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 351 | ||
+ | | 99.49% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 351 | ||
+ | | 65.89% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 351 | ||
+ | | 69.71% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 351 | ||
+ | | 77.70% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 351 | ||
+ | | 80.07% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 351 | ||
+ | | 79.89% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 351 | ||
+ | | 84.46% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.2.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 351 | ||
+ | | 86.78% | ||
+ | |} | ||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.4.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent.csv|dicionario_sem_stop_stemm_sem_accent.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1239 palavras | ||
+ | * Linhas 4-8: 3147 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.4.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 99.32% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 66.23% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 68.92% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 76.72% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 337 | ||
+ | | 79.59% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 337 | ||
+ | | 78.73% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 337 | ||
+ | | 84.46% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.4.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 337 | ||
+ | | 87.26% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.3.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_110_sub+bh.csv|dicionario_110_sub+bh.csv]] | ||
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1321 | ||
+ | * Linhas 4-8: 4553 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.3.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 97.97% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3495 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 29.55% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 29.10% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 62.75% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | CLASSE | ||
+ | | 406 | ||
+ | | 69.18% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | GRUPO | ||
+ | | 406 | ||
+ | | 64.64% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | DIVISÃO | ||
+ | | 406 | ||
+ | | 74.76% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.2.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | SEÇÃO | ||
+ | | 406 | ||
+ | | 76.05% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.3.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_110_sub+bh.csv|dicionario_110_sub+bh.csv]] | ||
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1310 | ||
+ | * Linhas 4-8: 4517 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.3.2.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 98.06% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3495 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 29.72% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 28.24% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | SUBCLASSE | ||
+ | | 406 | ||
+ | | 63.78% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | CLASSE | ||
+ | | 406 | ||
+ | | 68.58% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | GRUPO | ||
+ | | 406 | ||
+ | | 64.72% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | DIVISÃO | ||
+ | | 406 | ||
+ | | 73.91% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.3.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_BH_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 2330 | ||
+ | | DADOS_BH_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 2331 a 3495 | ||
+ | | SEÇÃO | ||
+ | | 406 | ||
+ | | 76.39% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.2.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]] | ||
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1367 palavras | ||
+ | * Linhas 4-8: 3905 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 17 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 99,41% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 64,71% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 68,19% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.2.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 76.84% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.2.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 326 | ||
+ | | 80.93% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.2.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 326 | ||
+ | | 78.43% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.2.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 326 | ||
+ | | 83.06% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 326 | ||
+ | | 85.50% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.2.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo.csv|dicionario_completo.csv]] | ||
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1355 palavras | ||
+ | * Linhas 4-8: 3863 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 17 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.2.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 99.41% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 65.13% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 68.25% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 77.70% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 337 | ||
+ | | 80.93% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 337 | ||
+ | | 78.18% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 337 | ||
+ | | 81.60% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.2.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 337 | ||
+ | | 84.10% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.1.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]] | ||
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1369 palavras | ||
+ | * Linhas 4-8: 1433 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 99,15% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 65,22% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 68,49% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 326 | ||
+ | | 83,06% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 326 | ||
+ | | 85,07% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 326 | ||
+ | | 86,84% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 326 | ||
+ | | 91,59% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.2.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 326 | ||
+ | | 94,64% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 3.1.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_subclasse.csv|dicionario_subclasse.csv]] | ||
+ | |width="30%"| '''CGD''': art. prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1358 palavras | ||
+ | * Linhas 4-8: 1421 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * NL_WIDTH = NL_HEIGHT = 16 | ||
+ | * SYNAPSES: 512 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 3.1.1.4]] empregados para ajustar o número de neurônios e sinapses por neurônios.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 99.15% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 65.80% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 69.04% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.4 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 337 | ||
+ | | 82.45% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.5 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 337 | ||
+ | | 85.19% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.6 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 337 | ||
+ | | 88.12% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.7 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 337 | ||
+ | | 93.05% | ||
+ | |||
+ | |- align="center" | ||
+ | | 3.1.1.8 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB | ||
+ | OBJETO_SOCIAL | ||
+ | | 0 a 1182 | ||
+ | 0 a 1639 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL | ||
+ | | 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 337 | ||
+ | | 94.64% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | == Resultados do PNN == | ||
+ | |||
+ | Os resultados preliminares do classificador ''Probabilistic Neural Network'' (PNN) são mostrados nas tabelas abaixo. | ||
+ | |||
+ | ==== ''Tabela 7.8.2 '' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]] | ||
+ | |width="30%"| '''CGD''': prep. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1367 | ||
+ | * Linhas 4-8: 5771 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * SIGMA: 0.27 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos experimentos de validação para o experimento 7.8.2.4 empregados para ajustar o sigma da rede neural.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) ''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 99.07% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 3495 | ||
+ | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 45.89% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | NOWRAP | 1748 a 3495 | ||
+ | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 47.12% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.4 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 402 | ||
+ | | 69.14% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.5 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 402 | ||
+ | | 71.26% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.6 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 402 | ||
+ | | 76.21% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.7 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 402 | ||
+ | | 84.50% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.2.8 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 402 | ||
+ | | 88.90% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | ==== ''Tabela 7.8.1'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_completo+bh.csv|dicionario_completo+bh.csv]] | ||
+ | |width="30%"| '''CGD''': art. conj. contr. interj. prep. pron. | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TF | ||
+ | |width="30%"| '''PFS''': 20000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+bh+vit_tf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1355 | ||
+ | * Linhas 4-8: 5725 | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * SIGMA: 0.24 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 7.8.1.4]] empregados para ajustar o sigma da rede neural.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 NOWRAP |'''Desempenho<br> (1 - one-error) ''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 99.07% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 3495 | ||
+ | 0 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 42.70% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.3 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | NOWRAP | 1748 a 3495 | ||
+ | 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 43.32% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.4 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SUBCLASSE | ||
+ | | 405 | ||
+ | | 66.69% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.5 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | CLASSE | ||
+ | | 405 | ||
+ | | 68.89% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.6 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | GRUPO | ||
+ | | 405 | ||
+ | | 74.83% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.7 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | DIVISÃO | ||
+ | | 405 | ||
+ | | 84.50% | ||
+ | |||
+ | |- align="center" | ||
+ | | 7.8.1.8 | ||
+ | | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 0 a 1182 0 a 1747 0 a 1639 | ||
+ | | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | ||
+ | | OBJETO_SOCIAL OBJETO_SOCIAL | ||
+ | | 1748 a 3495 1640 a 3280 | ||
+ | | SEÇÃO | ||
+ | | 405 | ||
+ | | 89.35% | ||
+ | |} | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | |||
+ | ==== ''Tabela 7.7.2'' ==== | ||
+ | ---- | ||
+ | {| border=0 width="100%" | ||
+ | |- | ||
+ | |width="40%"| '''Dicionário''': [[#dicionario_sem_stop_stemm_sem_accent_f2.csv|dicionario_sem_stop_stemm_sem_accent_f2.csv]] | ||
+ | |width="30%"| '''CGD''': - | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Função para o cálculo dos pesos dos termos (PT)''': TFIDF | ||
+ | |width="30%"| '''PFS''': 10000 | ||
+ | |width="30%"| | ||
+ | |||
+ | |- | ||
+ | |width="40%"| '''Construções das tabelas''': | ||
+ | * Linhas 1-3: build_tables_subclasse_110_tfidf.bat | ||
+ | * Linhas 4-8: build_tables_subclasse_110_sub+vit_tfidf.bat | ||
+ | |width="30%"| '''Tamanhos dos ''lexicons''''': | ||
+ | * Linhas 1-3: 1372 palavras | ||
+ | * Linhas 4-8: 3919 palavras | ||
+ | |width="30%"| '''Constantes (class_cnae.con)''': | ||
+ | * SIGMA = 0.27 | ||
+ | |} | ||
+ | |||
+ | <small>'''OBS''': Veja aqui os resultados dos [[experimentos de validação para o experimento 7.7.2.4]] empregados para ajustar o sigma da rede neural.</small> | ||
+ | <br /> | ||
+ | |||
+ | {| border=1 width="100%" | ||
+ | |- align="center" | ||
+ | | rowspan=2 | '''EXP.''' | ||
+ | | colspan=3 | '''Dados de Treino''' | ||
+ | | colspan=4 | '''Dados de Teste''' | ||
+ | | rowspan=2 | '''Revisão''' | ||
+ | '''do SCAE''' | ||
+ | | rowspan=2 |'''Desempenho''' | ||
+ | '''(1 - one-error)''' | ||
+ | |||
+ | |- align="center" | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Tabela''' | ||
+ | | '''Coluna''' | ||
+ | | '''Limites''' | ||
+ | | '''Nível''' | ||
+ | |||
+ | |- align="center" | ||
+ | | 2.7.2.1 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | SUBCLASSE | ||
+ | | 351 | ||
+ | | 100.00% | ||
+ | |||
+ | |- align="center" | ||
+ | | 2.7.2.2 | ||
+ | | CNAE_110_SUBCLASSE | ||
+ | | DESCRICAO_SUB | ||
+ | | 0 a 1182 | ||
+ | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 0 a 3280 | | 0 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 64.74% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.7.2.3 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
| DESCRICAO_SUB | | DESCRICAO_SUB | ||
| 0 a 1182 | | 0 a 1182 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 68.98% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.7.2.4 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 5 091: | Linha 7 989: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SUBCLASSE | | SUBCLASSE | ||
− | | | + | | 351 |
− | | | + | | 78.73% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.7.2.5 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 5 108: | Linha 8 004: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| CLASSE | | CLASSE | ||
− | | | + | | 351 |
− | | | + | | 80.50% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.7.2.6 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 5 125: | Linha 8 019: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| GRUPO | | GRUPO | ||
− | | | + | | 351 |
− | | | + | | 83.18% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.7.2.7 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 5 142: | Linha 8 034: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| DIVISÃO | | DIVISÃO | ||
− | | | + | | 351 |
− | | | + | | 89.03% |
|- align="center" | |- align="center" | ||
− | | | + | | 2.7.2.8 |
| CNAE_110_SUBCLASSE | | CNAE_110_SUBCLASSE | ||
DADOS_VITORIA_SUB_110 | DADOS_VITORIA_SUB_110 | ||
Linha 5 159: | Linha 8 049: | ||
| 0 a 1182 | | 0 a 1182 | ||
0 a 1639 | 0 a 1639 | ||
− | |||
− | |||
| DADOS_VITORIA_SUB_110 | | DADOS_VITORIA_SUB_110 | ||
| OBJETO_SOCIAL | | OBJETO_SOCIAL | ||
| 1640 a 3280 | | 1640 a 3280 | ||
| SEÇÃO | | SEÇÃO | ||
− | | | + | | 351 |
− | | | + | | 90.43% |
|} | |} | ||
− | |||
− | |||
<br /> | <br /> | ||
Linha 5 419: | Linha 8 305: | ||
Os experimentos são realizados considerando que o SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos: | Os experimentos são realizados considerando que o SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos: | ||
+ | |||
+ | [[Novo Script]] (temporário) | ||
1. No diretório ''code/CORES/DB_CORE'' executar: | 1. No diretório ''code/CORES/DB_CORE'' executar: |
Edição atual tal como às 17h21min de 14 de setembro de 2012
Índice
Legenda dos Termos das Tabelas
- PT: Denota a função para o cálculo dos pesos dos termos, que podem ser computados como a freqüência dos termos (term frequency (TF)) ou como a freqüência dos termos multiplicada pela freqüência inversa nos documentos (inverse document frequency (TFIDF));
- CGD: Denota as classes gramaticais desconsideradas no lexicon;
- PFS: Denota a freqüência acima da qual a palavra não é incluída no lexicon.
Características dos Dicionários
dicionario_subclasse.csv
dicionario_completo.csv
dicionario_110_sub+bh.csv
A tabela dados_bh_110.csv foi truncada em 14825 linhas.
dicionario_sem_stop_stemm_sem_accent.csv
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [1]) que empregou (na ordem de apresentação) as seguintes filtragens: remoção de stop words; stemming; retirada de acentos. O tamanho do dicionário obtido foi de 11550 palavras.
dicionario_sem_stop_stemm.csv
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário também foi utilizado um stemmer (proposto na tese de mestrado de Maria Abadia Lacerda Dias e disponível em [2]) que empregou (na ordem de apresentação) as seguintes filtragens: remoção de stop words e stemming. O tamanho do dicionário obtido foi de 11737 palavras.
dicionario_completo_corrigido.csv
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE_CORRIGIDO (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110_CORRIGIDO (coluna objeto social).
dicionario_sem_stop_stemm_sem_accent_f2.csv
Este dicionário foi gerado a partir das tabelas CNAE_110_SUBCLASSE (coluna descrição da subclasse) e DADOS_VITORIA_SUB_110 (coluna objeto social). Para a construção deste dicionário foram utilizados as seguintes filtragens (na ordem de apresentação): remoção dos acentos, remoção das stop words e por último a remoção de plural. O filtro utilizado foi implentado (em Java) por Patrick. O tamanho do dicionário obtido foi de 12795 palavras.
dicionario_completo+bh.csv
Este dicionário foi gerado mesclando-se o dicionário_completo.csv e o dicionario_110_sub+bh.csv. A tabela dados_bh_110.csv foi truncada em 14825 linhas.
Resultados do Corretor Ortográfico
Os resultados preliminares do Corretor Ortográfico.
Resultados do VS
Os resultados preliminares do classificador Vector Space (VS) são mostrados nas tabelas abaixo.
Tabela 1.8.2
Dicionário: dicionario_completo+bh.csv | CGD: prep. |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.8.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 350 | 99.07% |
1.8.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495
0 a 3280 |
SUBCLASSE | 350 | 45.89% |
1.8.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 350 | 47.12% |
1.8.2.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SUBCLASSE | 350 | 73.59% |
1.8.2.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 350 | 76.25% |
1.8.2.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | GRUPO | 350 | 80.64% |
1.8.2.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | DIVISÃO | 350 | 85.48% |
1.8.2.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SEÇÃO | 350 | 89.14% |
Tabela 1.8.1
Dicionário: dicionario_completo+bh.csv | CGD: art. conj. contr. interj. prep. pron. |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.8.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 290 | 99.07% |
1.8.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495 0 a 3280 |
SUBCLASSE | 290 | 42.70% |
1.8.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 290 | 43.32% |
1.8.1.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 |
SUBCLASSE | 290 | 73.62% |
1.8.1.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 290 | 76.60% |
1.8.1.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 |
DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 |
GRUPO | 290 | 81.88% |
1.8.1.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 |
DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 |
DIVISÃO | 290 | 86.87% |
1.8.1.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 |
DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 |
SEÇÃO | 290 | 90.94% |
Tabela 1.7.2
Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv | CGD: - |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.7.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 350 | 100.00% |
1.7.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 350 | 64.74% |
1.7.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 350 | 68.98% |
1.7.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 350 | 82.45% |
1.7.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 350 | 83.85% |
1.7.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 350 | 86.29% |
1.7.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 350 | 89.15% |
1.7.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 350 | 90.92% |
Tabela 1.7.1
Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv | CGD: - |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.7.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 347 | 100.00% |
1.7.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 347 | 59.77% |
1.7.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 347 | 63.38% |
1.7.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 347 | 80.99% |
1.7.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 347 | 82.45% |
1.7.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 347 | 85.74% |
1.7.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 347 | 90.62% |
1.7.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 347 | 93.17% |
Tabela 1.6.2
Dicionário: dicionario_completo_corrigido.csv | CGD: prep. |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.6.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 350 | 99.07% |
1.6.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 350 | 65.28% |
1.6.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 350 | 68.74% |
1.6.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 350 | 83.73% |
1.6.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 350 | 85.13% |
1.6.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 350 | 87.51% |
1.6.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 350 | 90.49% |
1.6.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 350 | 92.08% |
Tabela 1.6.1
Dicionário: dicionario_completo_corrigido.csv | CGD: art. conj. contr. interj. prep. pron. |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.6.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 278 | 99.07% |
1.6.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 278 | 62.69% |
1.6.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 278 | 66.00% |
1.6.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 278 | 82.82% |
1.6.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 278 | 84.83% |
1.6.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 278 | 88.12% |
1.6.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 278 | 91.71% |
1.6.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 278 | 93.66% |
Tabela 1.5.2
Dicionário: dicionario_sem_stop_stemm.csv | CGD: - |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.5.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 402 | 99.49% |
1.5.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 402 | 62.82% |
1.5.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 66.97% |
1.5.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 82.08% |
1.5.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 402 | 83.79% |
1.5.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 402 | 86.65% |
1.5.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 402 | 89.21% |
1.5.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 402 | 91.10% |
Tabela 1.5.1
Dicionário: dicionario_sem_stop_stemm.csv | CGD: - |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.5.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 342 | 99.49% |
1.5.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 342 | 60.29% |
1.5.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 63.56% |
1.5.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 81.29% |
1.5.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 342 | 83.42% |
1.5.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 342 | 86.96% |
1.5.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 342 | 90.62% |
1.5.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 342 | 92.63% |
Tabela 1.4.2
Dicionário: dicionario_sem_stop_stemm_sem_accent.csv | CGD: - |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.4.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 342 | 99.49% |
1.4.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 342 | 64.43% |
1.4.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 67.52% |
1.4.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 82.51% |
1.4.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 342 | 84.03% |
1.4.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 342 | 86.65% |
1.4.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 342 | 89.15% |
1.4.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 342 | 91.04% |
Tabela 1.4.1
Dicionário: dicionario_sem_stop_stemm_sem_accent.csv | CGD: - |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.4.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 342 | 99.49% |
1.4.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 342 | 55.20% |
1.4.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 58.20% |
1.4.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 81.78% |
1.4.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 342 | 83.97% |
1.4.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 342 | 87.26% |
1.4.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 342 | 91.16% |
1.4.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 342 | 93.66% |
Tabela 1.3.2
Dicionário: dicionario_110_sub+bh.csv | CGD: prep. |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.3.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 342 | 98.39% |
1.3.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | 342 | 29.69% |
1.3.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 342 | 28.84% |
1.3.2.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 342 | 66.52% |
1.3.2.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | 342 | 70.39% |
1.3.2.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | 342 | 75.97% |
1.3.2.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | 342 | 81.72% |
1.3.2.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | 342 | 87.47% |
Tabela 1.3.1
Dicionário: dicionario_110_sub+bh.csv | CGD: art. conj. contr. interj. prep. pron. |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.3.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 342 | 98.31% |
1.3.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | 342 | 24.57% |
1.3.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 342 | 22.92% |
1.3.1.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 342 | 63.69% |
1.3.1.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | 342 | 67.55% |
1.3.1.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | 342 | 74.51% |
1.3.1.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | 342 | 81.46% |
1.3.1.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | 342 | 88.24% |
Tabela 1.2.2
Dicionário: dicionario_completo.csv | CGD: prep. |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.2.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 324 | 99,07% |
1.2.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 324 | 62,94% |
1.2.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 324 | 66,79% |
1.2.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 324 | 82,88% |
1.2.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 324 | 84,34% |
1.2.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 324 | 87,08% |
1.2.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 324 | 90,01% |
1.2.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 324 | 91,83% |
Tabela 1.2.1
Dicionário: dicionario_completo.csv | CGD: art. conj. contr. interj. prep. pron. |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.2.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 336 | 99.07% |
1.2.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 336 | 60.74% |
1.2.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 336 | 63.92% |
1.2.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 336 | 82.45% |
1.2.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 336 | 84.64% |
1.2.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 336 | 87.81% |
1.2.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 336 | 91.53% |
1.2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 336 | 93.60% |
Tabela 1.1.2
Dicionário: dicionario_subclasse.csv | CGD: prep. |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.1.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 324 | 99,15% |
1.1.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 324 | 62,85% |
1.1.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 324 | 66,73% |
1.1.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 324 | 85,31% |
1.1.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 324 | 86,53% |
1.1.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 324 | 89,09% |
1.1.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 324 | 91,47% |
1.1.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 324 | 93,72% |
Tabela 1.1.1
Dicionário: dicionario_subclasse.csv | CGD: art. conj. contr. interj. prep. pron. |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
1.1.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 336 | 99.15% |
1.1.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 336 | 60.74% |
1.1.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 336 | 63.92% |
1.1.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 336 | 84.22% |
1.1.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 336 | 85.92% |
1.1.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 336 | 89.46% |
1.1.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 336 | 92.26% |
1.1.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 336 | 94.64% |
Resultados do WNN
Os resultados preliminares do classificador Weightless Neural Network (WNN) são mostrados nas tabelas abaixo.
Tabela 2.8.2
Dicionário: dicionario_completo+bh.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.8.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 402 | 99.41% |
2.8.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495
0 a 3280 |
SUBCLASSE | 402 | 44.92% |
2.8.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 402 | 46.24% |
2.8.2.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SUBCLASSE | 402 | 66.54% |
2.8.2.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 402 | 72.41% |
2.8.2.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | GRUPO | 402 | 79.20% |
2.8.2.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | DIVISÃO | 402 | 84.51% |
2.8.2.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SEÇÃO | 402 | 88.70% |
Tabela 2.8.1
Dicionário: dicionario_completo+bh.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.8.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 405 | 99.32% |
2.8.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495
0 a 3280 |
SUBCLASSE | 405 | 45.29% |
2.8.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 405 | 45.50% |
2.8.1.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SUBCLASSE | 405 | 66.42% |
2.8.1.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 405 | 72.82% |
2.8.1.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | GRUPO | 405 | 79.26% |
2.8.1.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | DIVISÃO | 405 | 85.57% |
2.8.1.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SEÇÃO | 405 | 89.08% |
Tabela 2.7.2
Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.7.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 351 | 100.00% |
2.7.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 351 | 64.13% |
2.7.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 69.35% |
2.7.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 74.41% |
2.7.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 351 | 79.34% |
2.7.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 351 | 84.10% |
2.7.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 351 | 91.16% |
2.7.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 351 | 93.66% |
Tabela 2.7.1
Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.7.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 351 | 100.00% |
2.7.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 351 | 64.34% |
2.7.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 69.41% |
2.7.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 74.34% |
2.7.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 351 | 79.59% |
2.7.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 351 | 84.16% |
2.7.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 351 | 91.10% |
2.7.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 351 | 93.85% |
Tabela 2.6.2
Dicionário: dicionario_completo_corrigido.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.6.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 331 | 98.90% |
2.6.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 331 | 66.44% |
2.6.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 331 | 70.20% |
2.6.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 331 | 69.35% |
2.6.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 331 | 73.74% |
2.6.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 331 | 79.65% |
2.6.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 331 | 89.15% |
2.6.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 331 | 91.96% |
Tabela 2.6.1
Dicionário: dicionario_completo_corrigido.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.6.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 337 | 98.90% |
2.6.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 337 | 68.12% |
2.6.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 70.81% |
2.6.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 69.84% |
2.6.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 337 | 74.89% |
2.6.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 337 | 81.60% |
2.6.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 337 | 89.03% |
2.6.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 337 | 92.14% |
Tabela 2.5.2
Dicionário: dicionario_sem_stop_stemm.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.5.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 408 | 99.58% |
2.5.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 408 | 63.76% |
2.5.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 408 | 67.76% |
2.5.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 408 | 74.53% |
2.5.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 408 | 79.95% |
2.5.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 408 | 84.52% |
2.5.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 408 | 89.76% |
2.5.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 408 | 91.71% |
Tabela 2.5.1
Dicionário: dicionario_sem_stop_stemm.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.5.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 412 | 99.58% |
2.5.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 412 | 63.79% |
2.5.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 412 | 67.64% |
2.5.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 412 | 74.10% |
2.5.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 412 | 80.13% |
2.5.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 412 | 84.34% |
2.5.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 412 | 89.64% |
2.5.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 412 | 91.83% |
Tabela 2.4.2
Dicionário: dicionario_sem_stop_stemm_sem_accent.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.4.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 402 | 99.41% |
2.4.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 402 | 66.08% |
2.4.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 69.41% |
2.4.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 74.28% |
2.4.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 402 | 79.95% |
2.4.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 402 | 85.31% |
2.4.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 402 | 89.88% |
2.4.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 402 | 91.59% |
Tabela 2.4.1
Dicionário: dicionario_sem_stop_stemm_sem_accent.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.4.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 402 | 99.41% |
2.4.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 402 | 66.14% |
2.4.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 69.47% |
2.4.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 74.22% |
2.4.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 402 | 79.77% |
2.4.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 402 | 84.95% |
2.4.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 402 | 90.01% |
2.4.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 402 | 91.53% |
Tabela 2.3.2
Dicionário: dicionario_110_sub+bh.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.3.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.3.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 330 | 97.72% |
2.3.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | 330 | 29.83% |
2.3.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 330 | 29.01% |
2.3.2.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 330 | 57.34% |
2.3.2.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | 330 | 60.34% |
2.3.2.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | 330 | 68.41% |
2.3.2.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | 330 | 73.65% |
2.3.2.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | 330 | 79.57% |
Tabela 2.3.1
Dicionário: dicionario_110_sub+bh.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.3.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.3.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 337 | 97.63% |
2.3.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | 337 | 28.83% |
2.3.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 337 | 27.81% |
2.3.1.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 337 | 54.16% |
2.3.1.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | 337 | 58.20% |
2.3.1.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | 337 | 65.84% |
2.3.1.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | 337 | 71.85% |
2.3.1.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | 337 | 79.23% |
Tabela 2.2.2
Dicionário: dicionario_completo.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.2.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.2.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 326 | 99,07% |
2.2.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 326 | 64,19% |
2.2.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 67,76% |
2.2.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 72,94% |
2.2.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 326 | 79,10% |
2.2.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 326 | 83,85% |
2.2.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 326 | 88,85% |
2.2.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 326 | 90,60% |
Tabela 2.2.1
Dicionário: dicionario_completo.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.2.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.2.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 337 | 99.32% |
2.2.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 337 | 65.01% |
2.2.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 69.04% |
2.2.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 71.48% |
2.2.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 337 | 77.33% |
2.2.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 337 | 83.00% |
2.2.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 337 | 88.91% |
2.2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 337 | 90.07% |
Tabela 2.1.2
Dicionário: dicionario_subclasse.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.1.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.1.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 326 | 99,24% |
2.1.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 326 | 65,01% |
2.1.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 68,37% |
2.1.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 77,57% |
2.1.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 326 | 81,66% |
2.1.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 326 | 85,50% |
2.1.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 326 | 90,86% |
2.1.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 326 | 94,27% |
Tabela 2.1.1
Dicionário: dicionario_subclasse.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 2.1.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.1.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 337 | 99.41% |
2.1.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 337 | 65.77% |
2.1.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 68.80% |
2.1.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 78.55% |
2.1.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 337 | 82.82% |
2.1.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 337 | 87.20% |
2.1.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 337 | 91.65% |
2.1.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 337 | 95.00% |
Resultados do WNN-COR
Os resultados preliminares do classificador Weightless Neural Network with Data Correlation (WNN-COR) são mostrados nas tabelas abaixo.
Tabela 3.8.2
Dicionário: dicionario_completo+bh.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.8.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 405 | 99.15% |
3.8.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495
0 a 3280 |
SUBCLASSE | 405 | 44.72% |
3.8.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 405 | 46.36% |
3.8.2.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SUBCLASSE | 405 | 71.08% |
3.8.2.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 405 | 75.33% |
3.8.2.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | GRUPO | 405 | 76.22% |
3.8.2.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | DIVISÃO | 405 | 82.77% |
3.8.2.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SEÇÃO | 405 | 85.57% |
Tabela 3.8.1
Dicionário: dicionario_completo+bh.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.8.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.8.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 406 | 98.99% |
3.8.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495
0 a 3280 |
SUBCLASSE | 406 | 44.98% |
3.8.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 406 | 45.32% |
3.8.1.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SUBCLASSE | 406 | 69.64% |
3.8.1.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 406 | 74.33% |
3.8.1.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | GRUPO | 406 | 75.75% |
3.8.1.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | DIVISÃO | 406 | 81.50% |
3.8.1.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SEÇÃO | 406 | 84.86% |
Tabela 3.7.2
Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.7.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 402 | 100.00% |
3.7.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 402 | 65.13% |
3.7.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 68.68% |
3.7.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 78.79% |
3.7.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 402 | 82.21% |
3.7.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 402 | 83.30% |
3.7.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 402 | 88.36% |
3.7.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 402 | 92.69% |
Tabela 3.7.1
Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.7.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.7.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 402 | 100.00% |
3.7.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 402 | 65.22% |
3.7.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 68.74% |
3.7.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 402 | 79.04% |
3.7.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 402 | 82.21% |
3.7.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 402 | 83.06% |
3.7.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 402 | 88.48% |
3.7.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 402 | 92.81% |
Tabela 3.6.2
Dicionário: dicionario_completo_corrigido.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.6.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 336 | 99.24% |
3.6.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 336 | 66.14% |
3.6.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 336 | 69.84% |
3.6.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 336 | 78.79% |
3.6.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 336 | 81.96% |
3.6.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 336 | 80.56% |
3.6.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 336 | 85.37% |
3.6.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 336 | 88.67% |
Tabela 3.6.1
Dicionário: dicionario_completo_corrigido.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.6.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.6.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 342 | 98.90% |
3.6.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 342 | 68.70% |
3.6.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 71.30% |
3.6.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 342 | 78.55% |
3.6.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 342 | 82.75% |
3.6.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 342 | 81.72% |
3.6.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 342 | 84.83% |
3.6.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 342 | 86.84% |
Tabela 3.5.2
Dicionário: dicionario_sem_stop_stemm.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.5.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 408 | 99.58% |
3.5.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 408 | 63.76% |
3.5.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 408 | 67.76% |
3.5.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 408 | 79.04% |
3.5.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 408 | 80.62% |
3.5.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 408 | 80.68% |
3.5.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 408 | 84.89% |
3.5.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 408 | 87.14% |
Tabela 3.5.1
Dicionário: dicionario_sem_stop_stemm.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.5.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.5.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 408 | 99.58% |
3.5.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 408 | 63.79% |
3.5.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 408 | 67.64% |
3.5.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 408 | 78.98% |
3.5.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 408 | 80.26% |
3.5.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 408 | 80.50% |
3.5.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 408 | 84.95% |
3.5.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 408 | 87.14% |
Tabela 3.4.2
Dicionário: dicionario_sem_stop_stemm_sem_accent.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.4.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 351 | 99.49% |
3.4.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 351 | 65.89% |
3.4.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 69.71% |
3.4.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 77.70% |
3.4.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 351 | 80.07% |
3.4.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 351 | 79.89% |
3.4.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 351 | 84.46% |
3.4.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 351 | 86.78% |
Tabela 3.4.1
Dicionário: dicionario_sem_stop_stemm_sem_accent.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.4.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.4.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 337 | 99.32% |
3.4.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 337 | 66.23% |
3.4.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 68.92% |
3.4.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 76.72% |
3.4.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 337 | 79.59% |
3.4.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 337 | 78.73% |
3.4.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 337 | 84.46% |
3.4.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 337 | 87.26% |
Tabela 3.3.2
Dicionário: dicionario_110_sub+bh.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.3.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.3.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 406 | 97.97% |
3.3.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | 406 | 29.55% |
3.3.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 406 | 29.10% |
3.3.2.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 406 | 62.75% |
3.3.2.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | 406 | 69.18% |
3.3.2.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | 406 | 64.64% |
3.3.2.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | 406 | 74.76% |
3.3.2.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | 406 | 76.05% |
Tabela 3.3.1
Dicionário: dicionario_110_sub+bh.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.3.2.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.3.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 406 | 98.06% |
3.3.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 0 a 3495 | SUBCLASSE | 406 | 29.72% |
3.3.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 406 | 28.24% |
3.3.1.4 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SUBCLASSE | 406 | 63.78% |
3.3.1.5 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | CLASSE | 406 | 68.58% |
3.3.1.6 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | GRUPO | 406 | 64.72% |
3.3.1.7 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | DIVISÃO | 406 | 73.91% |
3.3.1.8 | CNAE_110_SUBCLASSE
DADOS_BH_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 2330 |
DADOS_BH_SUB_110 | OBJETO_SOCIAL | 2331 a 3495 | SEÇÃO | 406 | 76.39% |
Tabela 3.2.2
Dicionário: dicionario_completo.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.2.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.2.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 326 | 99,41% |
3.2.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 326 | 64,71% |
3.2.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 68,19% |
3.2.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 76.84% |
3.2.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 326 | 80.93% |
3.2.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 326 | 78.43% |
3.2.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 326 | 83.06% |
3.2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 326 | 85.50% |
Tabela 3.2.1
Dicionário: dicionario_completo.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.2.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.2.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 337 | 99.41% |
3.2.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 337 | 65.13% |
3.2.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 68.25% |
3.2.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 77.70% |
3.2.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 337 | 80.93% |
3.2.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 337 | 78.18% |
3.2.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 337 | 81.60% |
3.2.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 337 | 84.10% |
Tabela 3.1.2
Dicionário: dicionario_subclasse.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.1.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.1.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 326 | 99,15% |
3.1.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 326 | 65,22% |
3.1.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 68,49% |
3.1.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 326 | 83,06% |
3.1.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 326 | 85,07% |
3.1.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 326 | 86,84% |
3.1.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 326 | 91,59% |
3.1.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 326 | 94,64% |
Tabela 3.1.1
Dicionário: dicionario_subclasse.csv | CGD: art. prep. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 3.1.1.4 empregados para ajustar o número de neurônios e sinapses por neurônios.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
3.1.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 337 | 99.15% |
3.1.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 337 | 65.80% |
3.1.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 69.04% |
3.1.1.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 337 | 82.45% |
3.1.1.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 337 | 85.19% |
3.1.1.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 337 | 88.12% |
3.1.1.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 337 | 93.05% |
3.1.1.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 337 | 94.64% |
Resultados do PNN
Os resultados preliminares do classificador Probabilistic Neural Network (PNN) são mostrados nas tabelas abaixo.
Tabela 7.8.2
Dicionário: dicionario_completo+bh.csv | CGD: prep. | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 7.8.2.4 empregados para ajustar o sigma da rede neural.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
7.8.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 402 | 99.07% |
7.8.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495
0 a 3280 |
SUBCLASSE | 402 | 45.89% |
7.8.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 402 | 47.12% |
7.8.2.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SUBCLASSE | 402 | 69.14% |
7.8.2.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 402 | 71.26% |
7.8.2.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | GRUPO | 402 | 76.21% |
7.8.2.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | DIVISÃO | 402 | 84.50% |
7.8.2.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SEÇÃO | 402 | 88.90% |
Tabela 7.8.1
Dicionário: dicionario_completo+bh.csv | CGD: art. conj. contr. interj. prep. pron. | |
Função para o cálculo dos pesos dos termos (PT): TF | PFS: 20000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 7.8.1.4 empregados para ajustar o sigma da rede neural.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho (1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
7.8.1.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 405 | 99.07% |
7.8.1.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 3495
0 a 3280 |
SUBCLASSE | 405 | 42.70% |
7.8.1.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495
1640 a 3280 |
SUBCLASSE | 405 | 43.32% |
7.8.1.4 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SUBCLASSE | 405 | 66.69% |
7.8.1.5 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | CLASSE | 405 | 68.89% |
7.8.1.6 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | GRUPO | 405 | 74.83% |
7.8.1.7 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | DIVISÃO | 405 | 84.50% |
7.8.1.8 | CNAE_110_SUBCLASSE DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | DESCRICAO_SUB OBJETO_SOCIAL OBJETO_SOCIAL | 0 a 1182 0 a 1747 0 a 1639 | DADOS_BH_SUB_110 DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL OBJETO_SOCIAL | 1748 a 3495 1640 a 3280 | SEÇÃO | 405 | 89.35% |
Tabela 7.7.2
Dicionário: dicionario_sem_stop_stemm_sem_accent_f2.csv | CGD: - | |
Função para o cálculo dos pesos dos termos (PT): TFIDF | PFS: 10000 | |
Construções das tabelas:
|
Tamanhos dos lexicons:
|
Constantes (class_cnae.con):
|
OBS: Veja aqui os resultados dos experimentos de validação para o experimento 7.7.2.4 empregados para ajustar o sigma da rede neural.
EXP. | Dados de Treino | Dados de Teste | Revisão
do SCAE |
Desempenho
(1 - one-error) | |||||
Tabela | Coluna | Limites | Tabela | Coluna | Limites | Nível | |||
2.7.2.1 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | SUBCLASSE | 351 | 100.00% |
2.7.2.2 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 0 a 3280 | SUBCLASSE | 351 | 64.74% |
2.7.2.3 | CNAE_110_SUBCLASSE | DESCRICAO_SUB | 0 a 1182 | DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 68.98% |
2.7.2.4 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SUBCLASSE | 351 | 78.73% |
2.7.2.5 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | CLASSE | 351 | 80.50% |
2.7.2.6 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | GRUPO | 351 | 83.18% |
2.7.2.7 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | DIVISÃO | 351 | 89.03% |
2.7.2.8 | CNAE_110_SUBCLASSE
DADOS_VITORIA_SUB_110 |
DESCRICAO_SUB
OBJETO_SOCIAL |
0 a 1182
0 a 1639 |
DADOS_VITORIA_SUB_110 | OBJETO_SOCIAL | 1640 a 3280 | SEÇÃO | 351 | 90.43% |
Experimentos Removendo Combinações de Classes Gramaticais
Os experimentos a seguir foram realizados utilizando o experimento 1.1.x.4 para o VS_CORE utilizando o diconário subclasse. O objetivo deste experimento é combinar diversas classes gramaticais para verificar qual combinação apresenta maior percentual de acerto. As classes gramaticais escolhidas foram:
- Artigo;
- Conjunção;
- Contração;
- Interjeição;
- Preposição;
- Pronome;
Os experimentos foram feitos tanto para o TF quanto para o TFIDF. As tabelas abaixo mostram o resultado dos experimentos realizados.
Considerando TF
Exp. | CLasses Removidas | Revisão
do SCAE |
Peso | Tamanho
do Lexicon |
Desempenho
(1 - one-error) |
1 | Sem remover | 271 | TF | 1456 | 77,57% |
2 | Artigo (art.) | 271 | TF | 1453 | 78,00% |
3 | Conjunção (conj.) | 271 | TF | 1453 | 76,84% |
4 | Contração (contr.) | 271 | TF | 1446 | 77,82% |
5 | Interjeição (interj.) | 271 | TF | 1455 | 77,57% |
6 | Preposição (prep.) | 271 | TF | 1433 | 80,19% |
7 | Pronome (pron.) | 271 | TF | 1446 | 77,57% |
8 | Artigo + Contração | 271 | TF | 1443 | 78,12% |
9 | Artigo + Preposição | 271 | TF | 1431 | 80,50% |
10 | Contração + Preposição | 271 | TF | 1433 | 80,19% |
11 | Artigo + Contração + Preposição | 271 | TF | 1431 | 80,50% |
12 | Artigo + Conjunção + Contração + Interjeição
+ Preposição + Pronome |
271 | TF | 1421 | 84,22% |
Considerando TFIDF
Exp. | CLasses Removidas | Revisão
do SCAE |
Peso | Tamanho
do Lexicon |
Desempenho
(1 - one-error) |
1 | Sem remover | 271 | TFIDF | 1456 | 84,16% |
2 | Artigo | 271 | TFIDF | 1453 | 84.22% |
3 | Conjunção | 271 | TFIDF | 1453 | 83,97% |
4 | Contração | 271 | TFIDF | 1446 | 84,58% |
5 | Interjeição | 271 | TFIDF | 1455 | 84,16% |
6 | Preposição | 271 | TFIDF | 1433 | 85,31% |
7 | Pronome | 271 | TFIDF | 1446 | 84,10% |
8 | Artigo + Contração | 271 | TFIDF | 1443 | 84,64% |
9 | Artigo + Preposição | 271 | TFIDF | 1431 | 84,83% |
10 | Contração + Preposição | 271 | TFIDF | 1433 | 85,31% |
11 | Artigo + Contração + Preposição | 271 | TFIDF | 1431 | 84,83% |
12 | Artigo + Conjunção + Contração + Interjeição
+ Preposição + Pronome |
271 | TFIDF | 1421 | 84,52% |
Como Realizar os Experimentos
Os experimentos são realizados considerando que o SCAE esteja instalado. Para realizar os experimentos, siga os seguintes passos:
Novo Script (temporário)
1. No diretório code/CORES/DB_CORE executar:
make clean make
2. Construir as tabelas do DB_CORE. No diretório code/CORES/DB_CORE/ existem arquivos .bat para construir as tabelas do DB_CORE. Normalmente, esses arquivos começam com a palavra build. Para maiores esclarecimentos consulte Criando tabelas no DB_CORE.
Para os experimentos que correspondem à tabela CNAE_110_SUBCLASSE-DESCRICAO_SUB rodar o seguinte script:
./build_tables_subclasse_110.bat
Já para os experimentos que correspondem às tabelas CNAE_110_SUBCLASSE-DESCRICAO_SUB e DADOS_VITORIA_SUB_110-OBJETO_SOCIAL rodar o seguinte script
./build_tables_subclasse_110_sub+vit.bat
3. Em code/CORES/DB_CORE, inicializar o servidor DB_CORE:
./db_core init_server ports.cfg
4. No diretório scae/code/CORES/WNN_CORE ou scae/code/CORES/WNN_COR_CORE, editar o arquivo class_cnae.con e definir os valores ótimos para os parâmetros da rede (número de neurônios e sinapses por neurônio):
const NL_WIDTH = 12; const NL_HEIGHT = 12; const SYNAPSES = 512;
Neste exemplo, os parâmetros ótimos são 12x12 neurônios e 512 sinapses.
5. Mudar as categorias (atributo Níveis das tabelas) em cada código fonte para cada "core", quando necessário (default é SUBCLASSE):
Em code/CORES/VS_CORE
kdevelop vector_space.c &
Ou em code/CORES/WNN_CORE/class_cnae_user_functions
kdevelop class_cnae_user_functions.c &
Ou em code/CORES/WNN_COR_CORE/class_cnae_user_functions
kdevelop class_cnae_user_functions.c &
6. Experimentos:
6.1. Para realizar experimentos com o VS_CORE:
No diretório code/CORES/VS_CORE execute:
make clean make ./vs_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experiment_1.1.x.1_train.bat ./experiment_1.1.x.1_test.bat
6.2. Para realizar experimentos com o WNN_CORE:
No diretório code/CORES/WNN_CORE execute:
make clean make ./wnn_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experiment_2.1.x.1_train.bat ./experiment_2.1.x.1_test.bat
6.3. Para realizar experimentos com o WNN_COR_CORE:
No diretório code/CORES/WNN_COR_CORE execute:
make clean make ./wnn_cor_core
No diretório code/CORES/USER_INTERFACE execute o experimento, por exemplo:
./experiment_3.1.x.1_train.bat ./experiment_3.1.x.1_test.bat
6.4. Para realizar os experimentos de validação com o WNN_COR_CORE (ou WNN_CORE), com o objetivo de ajustar o número de neurônios e sinapses por neurônios:
No diretório code/CORES/USER_INTERFACE, execute o script do experimento de validação:
./experiment_2.1.1.4.bat
Para gerar o gráfico do desempenho (1 - one-error) em função do número de neurônios e sinapses por neurônios, execute:
awk '{if ($1=="NL_WIDTH=")printf("%s %s %s ",$2,$4,$6); if ($13=="HIT")printf("%s\n",$16)}' experiment_2.1.1.4.out > experiment_2.1.1.4.dat gnuplot experiment_2.1.1.4.gp
O gráfico será gerado no arquivo experiment_2.1.1.4.eps.
Para listar os parâmetros em ordem decrescente de desempenho, execute:
sed 's/\./,/' experiment_2.1.1.4.dat | sort -n -r -k 4,4 | awk '{printf("* %ix%i neurônios e %i sinapses (%.2f%)\n", $1, $2, $3, $4)}'