Planejamento de Experimentos e Implementação de Funcionalidades

De LCAD
Revisão de 09h07min de 11 de fevereiro de 2008 por Claudine (discussão | contribs)
Ir para: navegação, pesquisa
  • Remover MAE do SCAE e colocá-la como uma biblioteca: Felipe - 18/01/2008 (concluído em 15/01/2008)
  • Implementar outras métricas: Claudine - 14/02/2008
    • Estamos implementando tais funções fora do SCAE, enquanto os cores dos categorizadores estão sendo modificados para calcular o ranking para cada documento de teste (classes e probabilidades associadas)
      • One error (concluída em 30/01/2008; falta inserir no SCAE)
    • Coverage (concluída em 30/01/2008; falta inserir no SCAE)
    • Average precision (concluída em 30/01/2008; falta inserir no SCAE)
    • Ranking loss
    • Precision and recall
    • Hit rate, given by the ratio between the number of hits and the number of appropriate classes. The ranking returned by the classifier is pruned in the number of appropriate classes
    • Hamming loss
  • Refazer os scripts e experimentos com a nova versão do SCAE: Felipe - 14/01/2008 (concluído em 14/01/2008)
  • Calibrar parâmetros da WNN para o dicionário velho: Claudine - 28/01/2008 (concluído em 26/01/2008, refeito em 11/02/2008)
  • Refazer os experimentos WNN com o dicionário velho se houver promessa de maior desempenho: Claudine - 14/02/2008
  • Examinar os dados de Belo Horizonte: Fernando - 21/02/2008 (concluído em 18/01/2008)
  • Fazer experimentos com bases de dados de mais de um município: Fernando - 03/02/2008
    • Estamos fazendo primeiro experimentos em separado para verificar o desempenho com a base de dados de BH antes de combinar;
  • Calibrar parâmetros da WNN para o novo dicionário: Claudine - 14/02/2008 (concluído em 26/01/2008, refeito em 11/02/2008)
  • Fazer experimentos com o novo dicionário: Bruno - 25/02/2008 (concluído em 25/01/2008)
  • Fazer experimentos com outras combinações de classes gramaticais: Bruno - 03/02/2008 (concluído em 31/01/2008)
  • Implementar TFIDF: Bruno - 04/02/2008 (concluído em 21/01/2008)
  • Fazer experimentos com TFIDF: Bruno - 18/02/2008
  • Reimplementar Knowledge Correlate: Alberto - 28/01/2008 (concluído em 27/01/2008)
  • Fazer experimentos com Knowledge Correlate: Alberto - 14/02/2008 (Detectei que rodar um experimento com Knowledge Correlate demorará mais de um ano no meu laptop. Melhorias teóricas em VG-RAM WNN que estão sendo estudadas pelo Valmir aparentemente são a saída preferencial para rodar os experimentos com Knowledge Correlate. Alternativamente, implementei a solução que faz apenas prunning da WNN que roda um experimento em cerca de 200 horas. em 14/01/2008)
  • Implementar a funcionalidade de filtro: Felipe - 28/01/2008 (concluído em 29/01/2008)
  • Implementar filtro de acentos: Felipe - 14/02/2008 (concluído em 29/01/2008)
  • Implementar filtro de stopwords: Felipe - 14/02/2008 (concluído em 29/01/2008)
  • Implementar filtro de stemming: Felipe - 25/02/2008 (concluído em 29/01/2008)
  • Fazer experimentos com as palavras (sem acentos, sem stemming e sem palavras canônicas, sem stopwords, etc): Alberto - 25/02/2008
  • Fazer experimentos com stemming e sem stopwords: Alberto - 03/03/2008
  • Implementar corretor ortográfico automático: Bruno - 03/03/2008
  • Validar os resultados usando 10-fold cross validation
  • Inserir no SCAE novos cores para categorizadores multi-label disponíveis na literatura (RankSVM, Boostexter, ML-KNN)
  • Implementar novas idéias em novos cores categorizadores