Mudanças entre as edições de "Manual do SCAE"
(→Introdução) |
(→Introdução) |
||
Linha 264: | Linha 264: | ||
Aplicação (SA) do SCAE. Este módulo, por sua vez, se comunica com os outros dois módulos do SCAE: Core e Banco de Dados (BD). | Aplicação (SA) do SCAE. Este módulo, por sua vez, se comunica com os outros dois módulos do SCAE: Core e Banco de Dados (BD). | ||
− | [[imagem:arquitetura_do_scae.gif|frame|right| | + | [[imagem:arquitetura_do_scae.gif|frame|right|130px|Figura 1: Arquitetura do SCAE]] |
Em uma solicitação de classificação de atividade econômica, o usuário, por meio da Interface, envia ao SA uma descrição de atividade econômica. O SA, por sua vez, envia esta descrição para o Core, que a classifica e retorna códigos CNAE e medidas de confiança quanto às associações destes códigos com a descrição de atividade econômica recebida. De posse dos códigos CNAE, o SA requisita ao BD o texto associado aos códigos CNAE. | Em uma solicitação de classificação de atividade econômica, o usuário, por meio da Interface, envia ao SA uma descrição de atividade econômica. O SA, por sua vez, envia esta descrição para o Core, que a classifica e retorna códigos CNAE e medidas de confiança quanto às associações destes códigos com a descrição de atividade econômica recebida. De posse dos códigos CNAE, o SA requisita ao BD o texto associado aos códigos CNAE. |
Edição das 19h55min de 12 de novembro de 2007
Introdução
Este manual visa explicar como utilizar o SCAE, desde sua instalação e manutenção até sua utilização.
Organização do SCAE
O sistema foi projetado para funcionar em Módulos que se comunicam entre si através de xmlrpc. Os módulos são divididos basicamente em 3 categorias:
- Interface (WEB e linha de comando)
- Classificadores (Redes Neurais, Espaço Vetorial, ..)
- Banco de Dados (DB_CORE)
Módulos do SCAE (CORE's)
Cada módulo é descrito a seguir.
DB_CORE
Core responsável por armazenar as tabelas de dados do sistema.
Tabelas Existentes no sistema e suas colunas:
Coluna | Comentários |
PALAVRA | a própria palavra |
---|---|
CLASSE | classe gramatical |
PALAVRA_CANONICA | palavra canônica |
GENERO | gênero |
GRAU | grau |
LISTA_ELEMENTOS | lista de elementos |
LISTA_PREPOSICOES | lista de preposições |
LISTA_REGENCIAS | lista de regências |
MODO_TEMPO_FORMANOMINAL | modo e/ou tempo e/ou forma nominal |
NUMERO | número |
LISTA_PAPEIS | lista de papéis |
PESSOA | pessoa |
CODIGO_PALAVRA_CANONICA | código da palavra canônica |
CODIGO_PALAVRA | código da palavra |
Coluna | Comentários |
CODIGO_SUB_SEC | Código Sequencial da subclasse |
---|---|
CODIGO_SEC | |
CODIGO_DIV | |
CODIGO_GRP | |
CODIGO_CLA | |
CODIGO_SUB | |
DV_SUB | |
DESCRICAO_SUB | |
CCOMPRE_SUB | |
TCOMPRE_SUB | |
NCOMPRE_SUB | |
NOTAS_SUB | |
CODIGO_CNAE_SUBCLASSE | |
VETOR_CODIGOS_CNAE |
Coluna | Comentários |
CODIGO_SUB_SEC | Código Sequencial da subclasse |
---|---|
CODIGO_SEC | |
CODIGO_DIV | |
CODIGO_GRP | |
CODIGO_CLA | |
CODIGO_SUB | |
DV_SUB | |
DESCRICAO_SUB | |
CCOMPRE_SUB | |
TCOMPRE_SUB | |
NCOMPRE_SUB | |
NOTAS_SUB | |
CODIGO_CNAE_SUBCLASSE | |
VETOR_CODIGOS_CNAE |
Coluna | Comentários |
NO_IDENTIFICADOR | Um número de identificação que veio junto aos dados que recebemos |
---|---|
OBJETO_SOCIAL | Texto descritivo do objeto em questão |
CNAE_FISCAL | Um código CNAE para o qual esta atividade foi classificada; Formato direto de 7 dígitos, sem '-' ou '/' |
VETOR_CODIGOS_CNAE | Neste campo, sempre o valor zero, ele é preenchido pelo DB_CORE com os sequenciais que representam as classificações |
Coluna | Comentários |
NO_IDENTIFICADOR | Um número de identificação que veio junto aos dados que recebemos |
---|---|
OBJETO_SOCIAL | Texto descritivo do objeto em questão |
CNAE_FISCAL | Um código CNAE para o qual esta atividade foi classificada; Formato direto de 7 dígitos, sem '-' ou '/' |
VETOR_CODIGOS_CNAE | Neste campo, sempre o valor zero, ele é preenchido pelo DB_CORE com os sequenciais que representam as classificações |
MAE
Implementação do classificador que utiliza Redes Neurais.
VS_CORE
Implementação do classificador que utiliza Espaço Vetorial.
WISARD_CORE
???
BAYESIAN_CORE
???
Como acessar o Repositório SCAE
É possível acessar o repositório do SCAE através do seu navegador ou ainda baixar os códigos direto para sua máquina. O acesso só é permitido a usuários do Projeto SCAE cadastrados e com conta no LCAD.
Organização do Repositório
O Repositório está dividido da seguinte maneira:
- code
- CORES (Código dos classificadores)
- DB_SERVER
- MAE
- USER_INTERFACE
- VS_CORE
- WISARD_CORE
- config
- db_server (Código da API do Oracle -- em desuso no momento)
- scaeweb (Código da Interface WEB)
- CORES (Código dos classificadores)
- data (Dados do Oracle -- em desuso no momento)
- install (Diretório de instalações)
Para acessar o repositório de um navegador basta seguir para http://www.lcad.inf.ufes.br/svn/scae e utilizar sua conta/senha do LCAD.
Baixando o SCAE para sua máquina
Antes de baixar o repositório do SCAE, recomenda-se navegar pelo mesmo e identificar qual(is) parte(s) dele serão utilizadas. Dessa forma, é possível fazer o download apenas das partes de interesse, evitando um longo download de todo o conteúdo.
Para baixar o repositório do SCAE completo para sua máquina utilize
svn co http://www.lcad.inf.ufes.br/svn/scae
Para baixar apenas uma parte, por exemplo, um diretório da árvore do repositório, acrescente o caminho ao endereço. Exemplos:
- Download de apenas a instalação das bibliotecas necessárias para isntalação do xmlrpc
svn co http://www.lcad.inf.ufes.br/svn/scae/install/xmlrpc
- Download de apenas os códigos-fonte dos CORES
svn co http://www.lcad.inf.ufes.br/svn/scae/code/CORES
Maiores informações sobre o svn podem ser encontradas no nosso manual de Uso básico do Subversion.
Tutorial do SCAE
Introdução
O Sistema de Codificação Automática de Atividades Econômicas (SCAE) possui a arquitetura mostrada na Figura 1. A Interface do usuário com o sistema é um navegador Internet (browser), que se comunica com o módulo Servidor de Aplicação (SA) do SCAE. Este módulo, por sua vez, se comunica com os outros dois módulos do SCAE: Core e Banco de Dados (BD).
Em uma solicitação de classificação de atividade econômica, o usuário, por meio da Interface, envia ao SA uma descrição de atividade econômica. O SA, por sua vez, envia esta descrição para o Core, que a classifica e retorna códigos CNAE e medidas de confiança quanto às associações destes códigos com a descrição de atividade econômica recebida. De posse dos códigos CNAE, o SA requisita ao BD o texto associado aos códigos CNAE.
O Core também se comunica com o módulo BD, que é responsável por armazenar todo o conhecimento do SCAE (dicionário eletrônico, representação interna ao sistema da tabela CNAE, representação interna ao sistema de descrições de atividades econômicas usadas para treinamento, etc). Além de realizar a classificação, o Core manipula as tabelas do sistema (cria, insere dados, remove dados, etc) guardadas em BD. Diferentes submódulos do Core são responsáveis por esta manipulação. O SA está sendo desenvolvido em PHP, o BD em C, e o Core em C, Perl e Java.
Para instalar o SCAE, siga os passos abaixo (um roteiro de instalação mais detalhado pode ser encontrado em http://www.lcad.inf.ufes.br/svn/scae/Roteiros).