Planejamento de Experimentos, Implementação de Funcionalidades, Estudos e Pesquisas - Relato 4

De LCAD
Revisão de 07h18min de 5 de dezembro de 2008 por Dijalma (discussão | contribs) (Implementações)
Ir para: navegação, pesquisa

Implementações

  • Implementar novo protótipo – Dijalma (Set/2009)
    • Colocar a Wizard no SCAE (inclusive interface 8) – Ramon (Jan/2009)
    • Desenvolver scripts para 10-fold cross-validation e para validação
    • Colocar o CORE mais rápido na primeira opção da interface 8 – Felipe (Jan/2009)
    • Incluir correção ortográfica
  • Criação de novos benchmarking para realização de comparações entre os métodos (bases) – Eliana (Dez/2009)
  • Criação de novos benchmarking para realização de comparações entre os métodos (métricas) – Claudine (Jan/2009)
  • Criação de makefile de teste para cada CORE - Dijalma (Jan/2009)
    • WNN – Felipe Pedroni (Jan/2009)
    • WNN_COR – Felipe Pedroni (Jan/2009)
    • BN – Hannu (Jan/2009)
    • VS – Elias (Jan/2009)
    • ENSEMBLE – Ramón e Charles (Jan/2009)
  • Criar uma sistemática incremental para a criação de uma base de dados atividade econômica x descritores
  • Reescrever os descritores de forma mais natural
    • Avaliar se inverter os descritores (ponto e vírgula) resolve

Empacotamento de Código

Documentação

  • Processo de Iniciação do FCA – Dijalma (Fev/2009)
  • Processo de Elaboração do FCA – Dijalma (Abr/2009)
  • Criar mecanismo de divulgação de alterações no SCAE – Dijalma (Jan/2009)
  • Mudar o nome do VS para 1NN – Elias (Fev/2009)

Experimentos

  • Medir quais os tipos de erro humano mais freqüentes
  • Fazer o Corte na Lista de Resultados Apresentada pelos Sistemas de Codificação Desenvolvidos
    • Usar as técnicas apresentadas pelo Caribe
    • Usar os categorizadores de texto que temos para aprender o número de subclasses por documento
  • Descobrir Qual a Quantidade Mínima de Documentos por Subclasse para ter um Bom Desempenho dos Codificadores
  • Descobrir Qual é Influência de Erros na Base de Dados de Treinamento no Desempenho de um Categorizador
    • Inferir experimentalmente (incluir % de erros e medir o impacto)?
    • Precisamos saber como o ser humano erra...
    • Investigar se é possível formular um modelo analítico da influência de erros na base de treino e/ou na base de teste no desempenho de um categorizador

Estudos e Pesquisas

  • Gerar dados segundo as métricas para análise estatística
    • Wizard – Ramon (Mai/2009)
    • WNN – Claudine (Mai/2009)
    • Novo mecanismo de codificação baseado em redes Bayesianas – Hannu (Mai/2009)
    • Novo mecanismo de codificação baseado em Latent Semantic Indexing (centroides) – Elias (Mai/2009)
    • Novo mecanismo de composição dos resultados da codificação através de neurais artificiais, redes Bayesianas e Latent Semantic Indexing em uma única codificação, mais robusta – Charles (Mai/2009)
  • Gerar novo mecanismo de codificação baseado em redes Bayesianas – Hannu (Mai/2009)
  • Gerar novo mecanismo de codificação baseado em Latent Semantic Indexing (centroides) – Elias (Mai/2009)
  • Gerar novo mecanismo de composição dos resultados da codificação através de neurais artificiais, redes Bayesianas e Latent Semantic Indexing em uma única codificação, mais robusta – Charles (Mai/2009)
  • Nova avaliação: apresentar análise estatística dos desempenhos dos categorizadores – Eliana (Ago/2009)
  • Apresentar a Saída dos Codificadores como Medidas de Certeza da Codificação
    • Medir usando a base de calibração e fazer um ajuste de curva saída do codificador x percentual de acertos observado na calibração
    • Examinar a literatura
    • Usar a medida de quão freqüentemente um termo aparece em documentos associados a uma subclasse (naive Bayes?)

Seminários

  • Realizar dois seminários (os presentes no meeting, ocorrido em 22/11/2008, se comprometeram a participar de um seminário em agosto/setembro)
  • Discutir com a Receita a dificuldade de apresentar os resultados de categorização na forma de descritores