scriptLattes V8 ----------------- SINOPSIS scriptLattes.py REQUISITOS Para a compilação precisam-se de alguns módulos Python. Para instalar esses módulos execute como root: # apt-get install python-all python-setuptools python-utidylib python-matplotlib python-levenshtein python-pygraphviz python-numpy tidy python-scipy python-scipy # easy_install pytidylib EXECUÇÃO Teste o scriptLattes com os seguintes exemplos de compilação na linha de comando: (*) EXEMPLO A: $ cd $ ./scriptLattes.py ./exemplo/teste.config Nesse exemplo consideram-se todas as produções cujos anos de publicações estão entre 2006 e 2012. Rótulos para os membros não foram considerados. Os IDs Lattes dos 3 membros está listada em: ./exemplo/teste.list O resultado da execução estará disponível em: ./exemplo/teste/ (*) EXEMPLO B: $ cd $ ./scriptLattes.py ./exemplo/vision-ime-usp.config Nesse exemplo consideram-se todas as produções cadastradas nos CVs Lattes. São considerados rótulos para os membros do grupo (professor, colaborador, aluno) Os IDs Lattes dos 10 membros está listada em: ./exemplo/vision-ime-usp.list O resultado da execução estará disponível em: ./exemplo/vision-ime-usp/ IDEALIZADORES DO PROJETO Jesús P. Mena-Chalco Roberto M. Cesar-Jr URL DO PROJETO http://scriptlattes.sourceforge.net/ ========================================================================================= LOG Dom Ago 12 08:12:39 BRT 2012 -- A classe parserLattes foi adaptada para suportar o novo formato HTML dos CVs Lattes. -- O critério utilizado para comparar produções bibliográficas foi atualizado. Duas produções são consideradas iguais (ou similares) se a distância Levenshtein entre eles for menor ou igual do que 5. Ter Jun 12 22:30:15 BRT 2012 -- As vezes os IDs Lattes cadastrados nos CVs Lattes não são válidos (erros na escrita), assim, o scriptLattes tenta 5 vezes baixar o CV. Caso contrário o CV é desconsiderado. Thu Jun 7 14:13:35 BRT 2012 -- Foi corrigido o procedimento para baixar os CVs Lattes. -- O parâmetro 'mapa-google_map_key' não é mais requerido para o Mapa de Geolocalização. A versão 2 da API do google maps está obsoleta. Atualmente usamos a versão 3. Assim, não é mais necessário ter um cadastro no googleMaps. -- A página de membros foi atualizada. Foi acrescentada uma coluna com o rótulo de cada membro (se este for informado no arquivo .config). Essa informação é útil para na criação de relatórios que contenham membros afastados temporariamente do grupo (e.g. professores aposentados, professores transferidos a outra unidade). -- Foi corrigido um erro de codificação no pygraphviz (python 2.7.3 disponível na distribuição Ubuntu 12.04) Tue Feb 28 12:00:34 BRT 2012 -- São utilizados estruturas de dados que permitam representar as matrizes de coautoria através de matrizes esparsas. Nesse caso deve de se instalar o pacote python-scipy (a instrução para a instalar o pacote está indicada na seção 'Requisitos'). -- Compatibilidade com exceções (except) de python. -- Melhora de alguns procedimentos pontuais. Não é necessário carregar o X para a geração dos gráficos de barras. Mon Jan 23 11:49:54 BRST 2012 -- Foi considerado, mediante um novo parâmetro 'global-diretorio_de_armazenamento_de_cvs', o armazenamento temporário (cache) de CVs. Esta característica permite realizar diferentes análises baixando apenas uma vez cada CV. Se nenhum valor for indicado para o parâmetro não for indicado, então serão utilizadas as últimas versões dos CVs. Isto é, para toda nova execução serão baixados os CVs. -- São consideradas inúmeras tentativas para baixar os CVs Lattes. Algumas vezes o servidor Lattes não consegue distribuir o CV. Nesse caso, o programa faz uma pausa de 20seg para, seguidamente, realizar uma nova tentativa. Sat Oct 15 23:32:21 BRT 2011 -- Foi melhorado o procedimento para baixar CVs da Plataforma Lattes. Sun Jul 3 12:01:50 BRT 2011 -- Foi corrigido o procedimento para baixar CVs Lattes. Qua Mai 4 16:38:51 BRT 2011 -- Foi considerado, mediante novos parâmetros, os seguintes relatórios adicionais: - Participação em eventos. - Organização de eventos. Seg Abr 11 07:40:23 BRT 2011 -- O scriptLattes foi re-programado inteiramente em Python. Foram acrescentadas novas características como a criação de novos grafos de colaboração, relatórios de projetos de pesquisa, relatórios de prêmios, arquivos RIS com a lista de publicações, matrizes de adjacência. Em particular a abordagem usada para o tratamento de redundâncias foi modificada. Sat Apr 17 13:47:32 BRT 2010 -- Foi acrescentado um ícone para a indicação do DOI nas publicações. Wed Mar 24 14:44:38 BRT 2010 -- Foram consideradas, mediante novos parâmetros, os seguintes relatórios adicionais: - Projetos de pesquisa. - Prêmios. -- As páginas correspondentes aos curriculums mostram também: - Formação acadêmica/Titulação. - Áreas de atuação. -- O arquivo database.json contêm todas essas novas informações. Mon Mar 15 08:02:22 BRT 2010 -- Melhoramento da função de comparação. Em média o algoritmo de comparação da versão 7.02 é 13X mais rápido que o anterior. -- Criação do grafo de colaborações com indicadores de produção usando um mapa de cores (hotcolors). -- Foram consideradas, mediante novos parâmetros, os seguintes relatórios adicionais: - Participação em bancas examinadoras. - Participação em comissões julgadoras. - Eventos. Ter Out 20 13:32:13 BRST 2009 -- Geração de relatórios disponíveis para os idiomas: inglês, português e espanhol. -- Criação de uma página de 'detalhe de colaborações'. Clique nas arestas do Grafo de colaborações para listar as publicações realizadas entre os membros. -- Melhoramento da função de localização geográfica (com suporte para endereços do exterior). Utilize o arquivo 'scriptLattes.cep' para refinar a localização no googleMaps. -- Criação de listas de produções em formato JSON: 'database.json'. Tais listas poderiam ser utilizadas para exportar as produções ou popular bancos de dados. -- Melhoramento na visualização/apresentação/compilação dos relatórios. O scriptLattes não usa o script 'terminalTags.sh'. Sáb Abr 18 16:23:31 BRT 2009 -- Foram considerados nas Produções técnicas os "Processos ou técnicas" -- Foram considerados nas Orientações as "Monografias de conclusão de curso de aperfeiçoamento/especialização" -- O procedimento para identificação do ano nas produções foi corrigido. -- "Itens sem ano" estão sendo listados no final de cada relatório. Ter Mar 24 07:59:43 BRT 2009 -- Mapa de pesquisa, considerando os alunos com doutorado concluído. -- Foram corrigidos alguns pequenos erros de inicialização de variáveis. Qua Mar 4 12:45:40 BRT 2009 -- Uso de um arquivo de configuração. -- Delimitação de produções por períodos (global e local). -- Mapa de pesquisa (usando o maps.google.com). -- Produções técnicas e artísticas foram consideradas nos relatórios. -- Criação de páginas para cada pesquisador. -- Produção automática de páginas JSP (opcional) -- Divisão automática de produções em páginas (ex. 1000 produções por página). -- CSS para todas as páginas. -- Refatoração do script. Sáb Nov 8 16:11:46 BRST 2008 -- Versão interativa e postscript do grafo de colaborações. -- Lista de pesquisadores considerados na execução. -- Criação de um indice geral. Seg Mar 24 12:30:03 BRT 2008 -- Refatoração. -- Link para busca da publicação no Google. -- Compilação de orientações (em andamento/concluídas). Sex Fev 8 18:24:33 BRST 2008 -- Criadas as funções de compilação de todas as publicações. -- Geração automática da página index.html. -- Geração automática de um grafo de colaborações. Ter Mar 13 12:04:40 BRT 2007 : -- Barras estatísticas das publicações (uso do GD::Graph do perl). -- Criada a função de similaridade LCS (longest common sequence). -- Modificada a função de extração de datas das publicações. Seg Mar 20 17:50:21 BRT 2006 : -- Atualização das funções básicas. Sex Mar 25 13:04:27 BRT 2005 : -- Criada a função de similaridade básica. =========================================================================================