Planejamento de Experimentos, Implementação de Funcionalidades, Estudos e Pesquisas

De LCAD
Ir para: navegação, pesquisa

Implementações

  • Fazer código para gerar bases de dados conforme especificado pela Eliana - Felipe (concluído em 10/07/2008);
  • Colocar a Interface 8 para funcionar com os cores WNN, WNN_COR, VS e BN - Bruno (27/06/2008)(concluído em 20/06/2008);
  • Identificar, junto à equipe, que funcionalidades adicionais seriam necessárias no DB_CORE - Fernando (20/06/2008) (assumido pelo Dijalma em 22/11/2008);
  • Adquirir o HD para o novo servidor - Renderson (03/04/2008) (concluído em 25/04/2008);
    • Orçamentos passados para a FEST em 01/03/2008;
  • Atualizar o SO do Cluster para Fedora 8 - Fernando (04/04/2008) (concluído em 05/05/2008);
    • A pedido do Alberto, não faremos mais via "dd", estamos estudando como fazer a instalação das máquinas via rede;
      • Devido ao hardware das máquinas antigas do lcad, teremos que utilizar "dd"... instalação via rede será estudada para as novas;
    • Aguardando a compra do HD para migração completa em um só passo, como pediu o Alberto;
  • Incorporar o core WISARD no SCAE - Felipe França (04/04/2008);
  • Alteração da forma de execução dos scripts para obter maior confiabilidade e facilidade de uso - Ricardo/Rickson (concluído em 27/05/2008);
  • Modificar scripts para possibilitar realizar experimentos com 10-fold cross validation para validação e teste - Ricardo (04/08/2008);
  • Gerar um core Ml-knn a partir do VS para o artigo do WITCC, temos código em Matlab - Felipe (11/04/2008) (concluído em 28/03/2008);
  • Incorporar o Boostexter para o artigo do WITCC, temos somente o executável - Bruno (11/04/2008) (concluído em 28/03/2008);
  • Incorporar o Rank-SVM para o artigo do WITCC, temos código em Matlab - Bruno (11/04/2008) (esta atividade foi suspensa porque o Rank-SVM não roda com a base de dados de Vitória pois esta possui muitas categorias e o código do Rank-SVM aloca muita memória em função disso - várias matrizes são geradas em função do número de categorias, que é grande para o problema SCAE);
  • Incorporar mecanismos de composição dos resultados da codificação através de neurais artificiais, redes Bayesianas e VS em uma única codificação, mais robusta - Felipe França (11/04/2008);
  • Implementar verificador ortográfico na Interface 8 - Ricardo (25/07/2008):
    • Etapa 1: simplesmente marcar as palavras erradas - Ricardo;
    • Etapa 2: adicionar a opção de sugestões com seleção via mouse por palavra errada - Ricardo;
  • Alterar a interface 8 para quando for fazer uma classificação ressetar a semente de WNN - Felipe (25/04/2008) (concluído em 17/04/2008);
  • Verificar possibilidade de bug no WNN_COR relacionado aos níveis da tabela acima de subclasse – fazer reconstituição da correção de bug antigo para ver se a correção está contemplada no código atual – Alberto, Felipe e Fernando (30/04/2008) (concluído em 05/05/2008);
  • Incorporar a funcionalidade de filtros à Interface 8 (Classificação) - Felipe (15/05/2008) (basta assegurar que o dicionário filtrado foi carregado pelo DB_CORE, concluído em 17/04/2008);
  • Disponibilizar funcionalidades do DB_CORE na biblioteca shared para os CORES - Felipe (25/05/2008) (concluído em 09/09/2008);
    • get_table_num_lines;
    • get_table_column;
  • Implantar Roteiro de Verificação Periódica do SCAE
    • Montar equipe - Fernando (12/05/2008) (concluído em 28/05/2008);
    • Implantar roteiro - Fernando (definir na reunião) (assumido pelo Dijalma em 22/11/2008);
  • Solicitar e disponibilizar dados que o Jun tem que nós não temos – Alberto e Elias (05/2008);
  • Criar novos conjuntos de treinamento e teste (2007/Meta 3.1) – Eliana (05/2008);
  • Implementar core do Wagner dentro do SCAE – Gustavo, Fernando (06/2008) (assumido pelo Dijalma em 22/11/2008);
  • Gerar novas tabelas, criar funcionalidades no DB_CORE e fazer scripts para os conjuntos de treinamento e teste do Wagner – Gustavo, Fernando (07/2008) (assumido pelo Dijalma em 22/11/2008);
  • Implementar o teste t no SCAE – Eliana e Fernando (08/2008) (assumido pelo Dijalma em 22/11/2008);
  • Implementar os índices Kappa e Mc Nemar – Eliana e Fernando (08/2008) (assumido pelo Dijalma em 22/11/2008);
  • Embutir técnica de uso da ordem das palavras na biblioteca shared para poder ser usada por qualquer core – Fernando (08/2008) (assumido pelo Dijalma em 22/11/2008);
  • Implementar um categorizador hierárquico – Wagner (10/2008);
  • Desenhar um experimento para descobrir como os categorizadores humanos devem atuar na preparação da base de dados de categorizações “corretas” – Eliana (10/2008);
  • Implementar core que usa a ordem das palavras para aumentar o desempenho de categorização – Charles, Felipe França, Ramon, Priscila (12/2008);

Empacotamento de Código

  • Colocar a scaeaspell como biblioteca estática dentro do scae - Bruno (15/05/2008) (concluído em 10/06/2008);
  • Criar mecanismo de empacotamento da MAE como uma biblioteca pública - Fernando (11/07/2008) (assumido pelo Dijalma em 22/11/2008);
  • Preparar versão instalável do sistema - Fernando (11/07/2008) (assumido pelo Dijalma em 22/11/2008);
    • Preparar pacote RPM/Automake, ou outra forma de empacotamento e instalação do sistema - Fernando/Felipe/Bruno; (concluído em 19/08/2008)
    • MAE não vai! Tem que estar disponível uma versão compilada para download - Felipe/Alberto (concluído em 08/09/2008);
    • Remover da "MAE sem interface" bibliotecas desnecessárias para compilação de exemplos da "MAE sem interface" (envolve adequar o Makefile e talvez o MAE/include/mae.h)- Felipe/Alberto (concluído em 21/05/2008);

Documentação

  • Entregar versões finais das apresentações para Panmella/Fabiana – TODOS, (18/04/2008);
  • Preparar a documentação guia de desenvolvimento do LCAD/SCAE - Fernando (30/04/2008);(concluído em 07/05/2008 - Primeira Versão);
  • Preparar os templates de Artefatos do LCAD/SCAE - Fernando (30/04/2008);(concluído em 07/05/2008 - Primeira Versão);
  • Criar guidelines para documentação do código - Fernando (04/05/2008) (assumido pelo Dijalma em 22/11/2008);
  • Preencher os artefatos para próxima entrega - Alberto (30/05/2008);
  • Documentar o fluxo de dados da funcionalidade de filtro - Felipe (30/05/2008);
  • Documentar adequadamente o código - Bruno e Felipe (30/05/2008);
    • Remover comentários desnecessários e adicionar comentários essencias no padrão Doxygen;
    • Dividir adequadamente os módulos dos cores, em especial o DB_CORE;
  • Levantar requisitos para inclusão de cores no SCAE – Fernando e TODOS (05/2008) (assumido pelo Dijalma em 22/11/2008);
  • Avaliar o que deve aparecer nas interfaces com o usuário final leigo – Elias (05/2008);
  • Consertar a figura da arquitetura (Perl) em todos os documentos – Fernando (07/2008) (assumido pelo Dijalma em 22/11/2008);
  • Discutir com a Receita como eles vão usar o sistema (interface com outros sistemas) – Alberto (08/2008);

Experimentos

  • Definir experimentos para o artigo WITCC'08 - Claudine (02/04/2008)(concluído em 21/05/2008);
  • Rodar Knowledge Correlate no Laptop LG - Alberto (11/04/2008) (concluído em 01/04/2008);
  • Rodar experimentos com WNN, WNN_COR, VS, Ml-knn, Boostexter e Rank-SVM com dados de Vitória usando 10-fold cross validation para o paper WITCC: - Bruno (25/04/2008)(concluído em 21/05/2008)
    • Rodar experimentos de validação para todos os cores, Métricas: One-Error, Ranking Loss, Coverage e Average Precision (concluído em 21/05/2008);
    • Rodar experimentos com parâmetros escolhidos (concluído em 21/05/2008);
  • Analisar os resultados e escrever o paper para o WITCC - Alberto (01/05/2008) (concluído em 21/05/2008);
  • Testar o teste t em 10 folds – Alberto (09/2008) (concluído em 21/05/2008);

Estudos e Pesquisas

  • Rever sequencia de desativações das máquinas quando faltar energia - Renderson (15/05/2008);
  • Refletir restrições de hardware e SO no código do SCAE para permitir a manipulação de grandes bases de dados - Alberto (30/05/2008) (concluído em 10/11/2008);
    • Estruturar para 1 milhão de documentos (Basta usar vetores comprimidos e máquinas de 64bits. Mas, para se obter desempenho, teremos que paralelizar - CUDA é correntemente a melhor solução.);
    • Estudar compressão das TTVs e outras estruturas (guardar elementos não nulos apenas);
  • Examinar outras formulações de TFIDF - Elias (30/05/2008);
  • Analisar alternativas de paralelização dos Cores - Alberto (30/05/2008) (concluído em 10/11/2008 -> CUDA);
  • Avaliar a possibilidade de escrever um trabalho sobre correção ortográfica + categorização para o TIL – Alberto (05/2008) (concluído em 07/2008 -> decidimos não trabalhar no artigo);
  • Utilizar estruturas conceituais (frases, ação-objeto, etc.) na construção de vetores de treinamento e teste – Priscila, Charles, Elias e Felipe França (06/06/2008);
  • Examinar o custo de treinar e testar SVM para as bases disponíveis – Wagner (07/2008);
  • Escrever um novo paper (para a Neurocomputing?) sobre knowledge correlated VG-RAM com a prova do Valmir – Valmir, Alberto (07/2008) (concluído em 03/06/2008);
  • Avaliar o potencial de feedback no SCAE durante o uso (semi-supervised learning) – Wagner (10/2008);
  • Examinar novas formas para tirar proveito das atividades (descritores) – Charles, Wagner, Priscila e Felipe França(10/2008);
  • Usar pesos para os documentos para valorizar documentos raros, Usar pesos para as subclasses para valorizar subclasses raras e Fazer os itens acima para diferentes categorizadores em combinação de categorizadores – Charles e Wagner (11/2008);
  • Investigar o uso de um tagger para melhor escolher as palavras canônicas no momento da montagem dos vetores de treinamento e teste – Rickson e Claudine (01/2009);
  • Examinar novas heurísticas para redução da dimensionalidade sináptica de WNN VG-RAM (WNN KCOR) - Valmir (10/2008);

Seminários

  • Planejar WorkShop para explicar como utilizar embutir um CORE no SCAE - Fernando (25/03/2008 - 14h) (concluído em 25/03/2008);
  • Organizar e divulgar o WITCC 2008 – Felipe e Alberto (12/04/2008) (concluído em 12/04/2008);
  • Fazer nova vídeo conferência sobre como incluir um core no SCAE – Fernando (30/04/2008) (assumido pelo Dijalma em 22/11/2008);
  • Preparar seminário sobre Propriedade Intelectual - Fernando (20/05/2008) (assumido pelo Dijalma em 22/11/2008);