Tamanho da fonte:
Aprimoramento da busca por Portarias Institucionais
Última alteração: 29-11-2022
Resumo
Institutos e universidades federais bem como outros órgãos de caráter público utilizam da elaboração e disponibilização de portarias para atender o aspecto de transparência de suas funções. Nestas portarias são encontradas informações sobre nomeações, demissões e progressões dos servidores, dentre outras informações. No local de disponibilização destas portarias, não encontram-se ferramentas de pesquisa suficientes para garantir o acesso eficiente à informação contida nelas. Atualmente, para encontrar tópicos de interesse dentro de uma portaria, é necessário saber sua data de publicação, dificultando que o usuário encontre as portarias de seu interesse. Este projeto dá prosseguimento ao trabalho iniciado em projetos anteriores, que visa o desenvolvimento de uma ferramenta para facilitar a busca por portarias institucionais. A ferramenta, desenvolvida na linguagem Java, coleta as portarias nos sites institucionais, que estão em documentos PDF. Após, esses documentos são convertidos para TXT. Em seguida, o texto dos documentos são processados e semi-estruturados em documentos XML, onde são identificados o número, a data e o conteúdo de cada portaria publicada em cada documento. Por fim, esses documentos semi-estruturados podem ser pesquisados por meio de uma busca por palavras-chave. O presente projeto dá continuidade à ferramenta fazendo a manutenção da mesma, bem como aplicando técnicas de inteligência artificial para reconhecer automaticamente o objetivo da portaria. No presente projeto, o bolsista iniciou estudando a linguagem Java, uma vez que está no primeiro semestre do curso de Ciência da Computação. Após, o bolsista iniciou a refatoração do código que faz a coleta das portarias nos diferentes repositórios institucionais, fase que se encontra o projeto atualmente. A próxima etapa será realizar a coleta, conversão, pré-processamento e semi-estruturação das portarias publicadas após o último projeto. Por fim, será realizada a aplicação de técnicas de mineração de dados para identificar automaticamente o objetivo de cada portaria. Por exemplo, se é uma portaria de progressão. Essa identificação será feita utilizando classificadores de texto disponíveis na ferramenta Weka. Para avaliar a qualidade da identificação, serão utilizadas as seguintes métricas: precisão, revocação e medida F1.
Palavras-chave
Mineração de dados. Classificação. Sistemas de recuperação de informação.