19 de Fevereiro de 2008, terça-feira
Fernando
- Arrumação da sala no NPD para o novo Cluster;
- Recebimento das novas máquinas do Cluster e teste simples nelas (todas ligam normalmente e possuem 2GB de Memória);
Ricardo
- Arrumação da sala no NPD para o novo Cluster;
- Estudo de Javascrip e PHP
18 de Fevereiro de 2008, segunda-feira
Fernando
- Preparando documento com os passos do "Conjunto mínimo completo" (Continuação);
- Selecionando artefatos de suporte (Continuação);
- Estudo do documento sobre UML da RF;
- Elaboração preliminar do "Passos do Conjunto Mínimo completo", eviando para Alberto para avaliarmos;
Rickson
- Teste com script para altomatizar experimentos.
Renderson
- Verificacao do Status do Cluster
- Instalacao do Fedora 8 na maquina da Claudine (Causa: Problemas com a instalacao da impressora Dell 1815dn)
- Mais uma vez reinstalado o Fedora 8 na Quad-Core por problemas de acesso de usuarios cadastrados.
- Coloquei mais 4 maquinas no ar no cluster (maquinas haviam desligado) 27 maquinas on-line
Ricardo
Bruno
- Acerto das horas das máquinas
- Limpeza do filtro do ar condicionado
- Tentativa de inserção do código que obtém o score do Aspell
- Experimentos com VS_CORE para as tabelas 1.1.2 e 1.2.2
15 de Fevereiro de 2008, sexta-feira
Fernando
- Preparando documento com os passos do "Conjunto mínimo completo";
- Selecionando artefatos de suporte;
- Ajuda ao Alberto com a burocracia do Projeto do NPD;
- Coaching ao Ricardo;
Rickson
- Teste com script para altomatizar experimentos.
Felipe
- Reunião com o Alberto;
- Auxílio ao Victor sobre a implementação do código que calculará as métricas;
- Auxílio ao Bruno na criação da função replace_char_field (a ser inserida ao DB_CORE);
- Estudo do Doxygen;
- Criação do guia de utilização do Doxygen Doxygen;
- Implementação das funções begin_training (), end_training (), begin_test (), end_test() nos CORES classificadores (todos os CORES). Estas funções são chamadas pela biblioteca shared. Ao começar um treino, o shared chamará a função begin_traiinng e ao término a função end_traininfg. O racioçionio é o mesmo para o procedimento de test.
- Atualização do repositório. Foram atualizados: SHARED, DB_CORE, WNN_CORE, WNN_COR_CORE, WNN_KCOR_CORE e VS_CORE.
Victor
- Modificacao para o SCAE da implementacao em C da métrica Ranking Loss, ou seja, foi modicicado a forma de gerar o conjunto complementar do de pertinencia. Anteriormente esse era gerado lendo os arquivos de entrada em um funcao fora do escopo da funcao compute_metrics. Agora, esse e gerado a partir dos conjuntos de pertinencia e predicao dentro da funcao compute_metrics, mas especificamente na funcao compute_r_loss, funcoes que serao reconhecidas pelo SCAE.
- Teste das metricas usando os arquivos de pertinencia e predicao do SCAE e nao os de teste usados anteriormente.
- Comentarios dos codigos referentes as metricas concluidas.
Renderson
- Verificacao do Status do LCAD - Tudo OK
- Diagnostico do problema de leitura no DVDRW externo
- Remocao do DVDRW da LCAD3 para utilizar no modulo USB Externo
- Email para a Panmella providenciar a troca das pecas defeituosas
- Instalacao do Fedora 8 na maquina Quad-Core devido a problemas com senhas de usuarios da ultima instalacao (14.02.08)
- Inicio da configuracao do NIS-NFS e instalacao da LAM-MPI
Bruno
- Implementação das funções para testar as bases corrigidas pelo Aspell;
- Testes com as bases corrigidas pelo Aspell;
- Explicação do sistema SCAE para o Ricardo;
Ricardo
- Estudando o manual do SCAE;
- Discutindo/entendendo o Sistema com Bruno e Fernando
- Leitura dos relatórios do Projeto;
14 de Fevereiro de 2008, quinta-feira
Felipe
- Alteração da função de comparação utilizada pelo qsort no módulo statistics.c do shared;
- Auxílio ao Ramon sobre a compilação do shared e do VS_CORE;
- Conversa com o Fernando explicando o funcionamento das funções de filtro presentes no DB_CORE;
- Criação da função add_table_to_known_tables ao DB_CORE.
Rickson
- Teste com script para altomatizar experimentos.
Renderson
- Verificacao do status do LCAD
- Nova instalacao do Fedora 8 na maquina admin do minicluster (quad-core)
Bruno
- Explicação ao Ricardo sobre os serviços da lcad2;
- Implementação da técnica de estatística no corretor ortográfico;
- Teste com a técnica de estatística;
Fernando
- Revisão junto com o Ricardo do Manual do SCAE e explicação do mesmo, esclarecimento de dúvidas;
- Instalação da MAE no /opt de todas as máquinas DELL;
- Investigação dos problemas de compilação com g++ e gcc, juntamente com o Felipe;
- Iniciando a seleção de artefatos do QoSRF;
Ricardo
- Leitura dos relatórios do Projeto;
- Estudando o manual do SCAE;
13 de Fevereiro de 2008, quarta-feira
Victor
- Implementacao em C da métrica Ranking Loss.
- Organizacao dos comentarios dos codigos referentes as metricas concluidas.
Renderson
- Testes com isntalacao da biblioteca MPICH no minicluster
- Estudando o manual da LAM_MPI
Felipe
- Procura por outros dicionário de sinônimos na internet (nenhum continha mais palavras do que o achado anteriormente);
- Criação do diretório THESAURUS no DB_CORE (não subi para o svn, pois depende de aprovação);
- Implementação das funções que carregam o arquivo thesaurus.txt, cujo formato pode ser explicado em Formato;
- Implementação das funções que criam um dicionário de sinônimos em .csv thesaurus_table.csv no formato:
palavra; código_palavra; palavra_sinônima; código_palavra_sinônima
Rickson
- Refazendo testes com a base de BH.
Fernando
Ricardo
- Análise das informações no website do LCAD/SCAE;
- Estudando o manual do SCAE;
Bruno
- Testes do corretor ortográfico com o dicionário scae + o dicionário aspell;
- Procura de como customizar o Aspell para aceitar a correção ortográfica baseado em frequência;
- Testes do Aspell considerando tipografia;
- Correção de algumas palavras do dicionário do scae;
12 de Fevereiro de 2008, terça-feira
Felipe
- Alteração da função que realiza o feedback no VS_CORE;
- Após a alteração, realizou-se o seguinte experimento:
- treina com CNAE_110_SUBCLASSE e
- 1º teste com DADOS_VITORIA => taxa de acerto de 57.79%;
- 3º teste com DADOS_VITORIA => taxa de acerto de 61.38%;
- 6º teste com DADOS_VITORIA => taxa de acerto de 66.26%;
- 9º teste com DADOS_VITORIA => taxa de acerto de 67.30%;
- 12º teste com DADOS_VITORIA => taxa de acerto de 68.42%;
- 15º teste com DADOS_VITORIA => taxa de acerto de 68.91%;
- 18º teste com DADOS_VITORIA => taxa de acerto de 69.03%;
- Tentativa de utilizar um dicionário de sinônimos a fim de mapear palavras sinônimas para uma mesma palavra (o que diminuiria o tamanho do lexicon);
- Procura na internet por um dicionário de sinônimos. Um bom dicionário de sinônimos foi encontrado em Dicionário de Sinônimos.
Fernando
Ricardo
- Análise das informações no website do LCAD/SCAE;
Rickson
- Refazendo testes com a base de BH.
11 de Fevereiro de 2008, segunda-feira
Rickson
- Refazendo testes com a base de BH.
Felipe
- Realização de novos testes com várias dicionários filtrados (combinação das filtragens possíveis: STOP WORD, STEMMING, ACCENT). A maior taxa de acerto (teste 1.x.1.4) foi de 84.34% com o dicionário filtrado somente com stemming. O resultado foi 0.12% maior do que o obtido com palvra canônica;
- Criação de uma funçào que realiza o feedback no VS_CORE (não subi para o svn, pois depende de aprovação);
- A função só seria chamada se a classificação não teve sucesso;
- Conversa com a Claudine sobre Relevance Feedback;
- Realização de alguns teste com o VS_CORE utilizando Relevance Feedback;
- No exemplo face_recog_without_filters, alteri o código de forma que seja possível executar sem interface gráfica;
- Realização de testes, com o face_recog_without_filters, nas lcads, na Master e na tpol20 a fim de garantir que os testes poderão ser realizados em qualquer máquina (todos rodaram).
Fernando
Ricardo
- Conversa inicial sobre o SCAE/LCAD com o Fernando;
- Esclarecimento de dúvidas;
- Estabelecimento de prioridades iniciais;
Janeiro de 2008
Dezembro de 2007