Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz

O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundaçã...

Full description

Bibliographic Details
Main Authors: Marcel de Moraes Pedroso, Jefferson da Costa Lima, Vinicius Belchior Assef Neto
Format: Article
Language:English
Published: Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz) 2017-11-01
Series:RECIIS
Subjects:
Online Access:https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417
_version_ 1811251871718834176
author Marcel de Moraes Pedroso
Jefferson da Costa Lima
Vinicius Belchior Assef Neto
author_facet Marcel de Moraes Pedroso
Jefferson da Costa Lima
Vinicius Belchior Assef Neto
author_sort Marcel de Moraes Pedroso
collection DOAJ
description O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação.
first_indexed 2024-04-12T16:26:40Z
format Article
id doaj.art-89f0f8fb731646ebb0adf8f9f78af22d
institution Directory Open Access Journal
issn 1981-6278
language English
last_indexed 2024-04-12T16:26:40Z
publishDate 2017-11-01
publisher Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz)
record_format Article
series RECIIS
spelling doaj.art-89f0f8fb731646ebb0adf8f9f78af22d2022-12-22T03:25:21ZengInstituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz)RECIIS1981-62782017-11-011110.29397/reciis.v11i0.14171117Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo CruzMarcel de Moraes Pedroso0Jefferson da Costa Lima1Vinicius Belchior Assef Neto2Fundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, BrasilFundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, BrasilFundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, BrasilO repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação.https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417Ciência de DadosArmazenamento e Recuperação da InformaçãoMineração de DadosAprendizagem de MáquinaRepositórios Institucionais.
spellingShingle Marcel de Moraes Pedroso
Jefferson da Costa Lima
Vinicius Belchior Assef Neto
Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
RECIIS
Ciência de Dados
Armazenamento e Recuperação da Informação
Mineração de Dados
Aprendizagem de Máquina
Repositórios Institucionais.
title Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
title_full Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
title_fullStr Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
title_full_unstemmed Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
title_short Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
title_sort ciencia de dados aplicada ao arca desenvolvimento e disponibilizacao de ferramentas para recuperacao da informacao no repositorio institucional da fundacao oswaldo cruz
topic Ciência de Dados
Armazenamento e Recuperação da Informação
Mineração de Dados
Aprendizagem de Máquina
Repositórios Institucionais.
url https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417
work_keys_str_mv AT marceldemoraespedroso cienciadedadosaplicadaaoarcadesenvolvimentoedisponibilizacaodeferramentaspararecuperacaodainformacaonorepositorioinstitucionaldafundacaooswaldocruz
AT jeffersondacostalima cienciadedadosaplicadaaoarcadesenvolvimentoedisponibilizacaodeferramentaspararecuperacaodainformacaonorepositorioinstitucionaldafundacaooswaldocruz
AT viniciusbelchiorassefneto cienciadedadosaplicadaaoarcadesenvolvimentoedisponibilizacaodeferramentaspararecuperacaodainformacaonorepositorioinstitucionaldafundacaooswaldocruz