Planejamento de Experimentos e Implementação de Funcionalidades

De LCAD
Revisão de 08h57min de 11 de fevereiro de 2008 por Claudine (discussão | contribs)
Ir para: navegação, pesquisa
  • Remover MAE do SCAE e colocá-la como uma biblioteca: Felipe - 18/01/2008 (concluído em 15/01/2008)
  • Implementar outras métricas: Claudine - 14/02/2008
    • One error
    • Coverage
    • Average precision
    • Ranking loss
    • Hamming loss
    • Hit rate, given by the ratio between the number of hits and the number of appropriate classes. The ranking returned by the classifier is pruned in the number of appropriate classes.
  • Refazer os scripts e experimentos com a nova versão do SCAE: Felipe - 14/01/2008 (concluído em 14/01/2008)
  • Calibrar parâmetros da WNN para o dicionário velho: Claudine - 28/01/2008 (concluído em 26/01/2008, refeito em 11/02/2008)
  • Refazer os experimentos WNN com o dicionário velho se houver promessa de maior desempenho: Claudine - 14/02/2008
  • Examinar os dados de Belo Horizonte: Fernando - 21/02/2008 (concluído em 18/01/2008)
  • Fazer experimentos com bases de dados de mais de um município: Fernando - 03/02/2008
    • Estamos fazendo primeiro experimentos em separado para verificar o desempenho com a base de dados de BH antes de combinar;
  • Calibrar parâmetros da WNN para o novo dicionário: Claudine - 14/02/2008 (concluído em 26/01/2008, refeito em 11/02/2008)
  • Fazer experimentos com o novo dicionário: Bruno - 25/02/2008 (concluído em 25/01/2008)
  • Fazer experimentos com outras combinações de classes gramaticais: Bruno - 03/02/2008 (concluído em 31/01/2008)
  • Implementar TFIDF: Bruno - 04/02/2008 (concluído em 21/01/2008)
  • Fazer experimentos com TFIDF: Bruno - 18/02/2008
  • Reimplementar Knowledge Correlate: Alberto - 28/01/2008 (concluído em 27/01/2008)
  • Fazer experimentos com Knowledge Correlate: Alberto - 14/02/2008 (Detectei que rodar um experimento com Knowledge Correlate demorará mais de um ano no meu laptop. Melhorias teóricas em VG-RAM WNN que estão sendo estudadas pelo Valmir aparentemente são a saída preferencial para rodar os experimentos com Knowledge Correlate. Alternativamente, implementei a solução que faz apenas prunning da WNN que roda um experimento em cerca de 200 horas. em 14/01/2008)
  • Implementar a funcionalidade de filtro: Felipe - 28/01/2008 (concluído em 29/01/2008)
  • Implementar filtro de acentos: Felipe - 14/02/2008 (concluído em 29/01/2008)
  • Implementar filtro de stopwords: Felipe - 14/02/2008 (concluído em 29/01/2008)
  • Implementar filtro de stemming: Felipe - 25/02/2008 (concluído em 29/01/2008)
  • Fazer experimentos com as palavras (sem acentos, sem stemming e sem palavras canônicas, sem stopwords, etc): Alberto - 25/02/2008
  • Fazer experimentos com stemming e sem stopwords: Alberto - 03/03/2008
  • Implementar corretor ortográfico automático: Bruno - 03/03/2008
  • Validar os resultados usando 10-fold cross validation
  • Inserir no SCAE novos cores para categorizadores multi-label disponíveis na literatura (RankSVM, Boostexter, ML-KNN)
  • Implementar novas idéias em novos cores categorizadores