Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundaçã...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz)
2017-11-01
|
Series: | RECIIS |
Subjects: | |
Online Access: | https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417 |
_version_ | 1811251871718834176 |
---|---|
author | Marcel de Moraes Pedroso Jefferson da Costa Lima Vinicius Belchior Assef Neto |
author_facet | Marcel de Moraes Pedroso Jefferson da Costa Lima Vinicius Belchior Assef Neto |
author_sort | Marcel de Moraes Pedroso |
collection | DOAJ |
description | O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação. |
first_indexed | 2024-04-12T16:26:40Z |
format | Article |
id | doaj.art-89f0f8fb731646ebb0adf8f9f78af22d |
institution | Directory Open Access Journal |
issn | 1981-6278 |
language | English |
last_indexed | 2024-04-12T16:26:40Z |
publishDate | 2017-11-01 |
publisher | Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz) |
record_format | Article |
series | RECIIS |
spelling | doaj.art-89f0f8fb731646ebb0adf8f9f78af22d2022-12-22T03:25:21ZengInstituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz)RECIIS1981-62782017-11-011110.29397/reciis.v11i0.14171117Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo CruzMarcel de Moraes Pedroso0Jefferson da Costa Lima1Vinicius Belchior Assef Neto2Fundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, BrasilFundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, BrasilFundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, BrasilO repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação.https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417Ciência de DadosArmazenamento e Recuperação da InformaçãoMineração de DadosAprendizagem de MáquinaRepositórios Institucionais. |
spellingShingle | Marcel de Moraes Pedroso Jefferson da Costa Lima Vinicius Belchior Assef Neto Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz RECIIS Ciência de Dados Armazenamento e Recuperação da Informação Mineração de Dados Aprendizagem de Máquina Repositórios Institucionais. |
title | Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz |
title_full | Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz |
title_fullStr | Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz |
title_full_unstemmed | Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz |
title_short | Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz |
title_sort | ciencia de dados aplicada ao arca desenvolvimento e disponibilizacao de ferramentas para recuperacao da informacao no repositorio institucional da fundacao oswaldo cruz |
topic | Ciência de Dados Armazenamento e Recuperação da Informação Mineração de Dados Aprendizagem de Máquina Repositórios Institucionais. |
url | https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417 |
work_keys_str_mv | AT marceldemoraespedroso cienciadedadosaplicadaaoarcadesenvolvimentoedisponibilizacaodeferramentaspararecuperacaodainformacaonorepositorioinstitucionaldafundacaooswaldocruz AT jeffersondacostalima cienciadedadosaplicadaaoarcadesenvolvimentoedisponibilizacaodeferramentaspararecuperacaodainformacaonorepositorioinstitucionaldafundacaooswaldocruz AT viniciusbelchiorassefneto cienciadedadosaplicadaaoarcadesenvolvimentoedisponibilizacaodeferramentaspararecuperacaodainformacaonorepositorioinstitucionaldafundacaooswaldocruz |