Planejamento de Experimentos, Implementação de Funcionalidades, Estudos e Pesquisas - Relato 4

Índice

Implementar novo protótipo – Dijalma (Set/2009)
- Colocar a Wizard no SCAE (inclusive interface 8) – Ramon (Jan/2009)
- Desenvolver scripts para 10-fold cross-validation e para validação
- Colocar o CORE mais rápido na primeira opção da interface 8 – Felipe (Jan/2009)
- Incluir correção ortográfica
Criação de novos benchmarking para realização de comparações entre os métodos (bases) – Eliana (Dez/2009)
Criação de novos benchmarking para realização de comparações entre os métodos (métricas) – Claudine (Jan/2009)
Criação de makefile de teste para cada CORE - Dijalma (Jan/2009)
- WNN – Felipe Pedroni (Jan/2009)
- WNN_COR – Felipe Pedroni (Jan/2009)
- BN – Hannu (Jan/2009)
- VS – Elias (Jan/2009)
- ENSEMBLE – Ramón e Charles (Jan/2009)
Criar uma sistemática incremental para a criação de uma base de dados atividade econômica x descritores
Reescrever os descritores de forma mais natural
- Avaliar se inverter os descritores (ponto e vírgula) resolve

Medir quais os tipos de erro humano mais freqüentes
Fazer o Corte na Lista de Resultados Apresentada pelos Sistemas de Codificação Desenvolvidos
- Usar as técnicas apresentadas pelo Caribe
- Usar os categorizadores de texto que temos para aprender o número de subclasses por documento
Descobrir Qual a Quantidade Mínima de Documentos por Subclasse para ter um Bom Desempenho dos Codificadores
Descobrir Qual é Influência de Erros na Base de Dados de Treinamento no Desempenho de um Categorizador
- Inferir experimentalmente (incluir % de erros e medir o impacto)?
- Precisamos saber como o ser humano erra...
- Investigar se é possível formular um modelo analítico da influência de erros na base de treino e/ou na base de teste no desempenho de um categorizador

Gerar dados segundo as métricas para análise estatística
- Wizard – Ramon (Mai/2009)
- WNN – Claudine (Mai/2009)
- Novo mecanismo de codificação baseado em redes Bayesianas – Hannu (Mai/2009)
- Novo mecanismo de codificação baseado em Latent Semantic Indexing (centroides) – Elias (Mai/2009)
- Novo mecanismo de composição dos resultados da codificação através de neurais artificiais, redes Bayesianas e Latent Semantic Indexing em uma única codificação, mais robusta – Charles (Mai/2009)
Gerar novo mecanismo de codificação baseado em redes Bayesianas – Hannu (Mai/2009)
Gerar novo mecanismo de codificação baseado em Latent Semantic Indexing (centroides) – Elias (Mai/2009)
Gerar novo mecanismo de composição dos resultados da codificação através de neurais artificiais, redes Bayesianas e Latent Semantic Indexing em uma única codificação, mais robusta – Charles (Mai/2009)
Nova avaliação: apresentar análise estatística dos desempenhos dos categorizadores – Eliana (Ago/2009)
Apresentar a Saída dos Codificadores como Medidas de Certeza da Codificação
- Medir usando a base de calibração e fazer um ajuste de curva saída do codificador x percentual de acertos observado na calibração
- Examinar a literatura
- Usar a medida de quão freqüentemente um termo aparece em documentos associados a uma subclasse (naive Bayes?)

Realizar dois seminários (os presentes no meeting, ocorrido em 22/11/2008, se comprometeram a participar de um seminário em agosto/setembro)
Discutir com a Receita a dificuldade de apresentar os resultados de categorização na forma de descritores