Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos

El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones d...

Full description

Bibliographic Details
Main Authors: Danny Murillo, Dalys Saavedra, Erika Quintero
Format: Article
Language:Spanish
Published: Editorial Universitaria 2018-06-01
Series:Revista de I + D Tecnológico
Subjects:
Online Access:https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807
_version_ 1819041474531033088
author Danny Murillo
Dalys Saavedra
Erika Quintero
author_facet Danny Murillo
Dalys Saavedra
Erika Quintero
author_sort Danny Murillo
collection DOAJ
description El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada.
first_indexed 2024-12-21T09:25:34Z
format Article
id doaj.art-83797facf31647f4ad382447d53386a2
institution Directory Open Access Journal
issn 1680-8894
2219-6714
language Spanish
last_indexed 2024-12-21T09:25:34Z
publishDate 2018-06-01
publisher Editorial Universitaria
record_format Article
series Revista de I + D Tecnológico
spelling doaj.art-83797facf31647f4ad382447d53386a22022-12-21T19:08:54ZspaEditorial UniversitariaRevista de I + D Tecnológico1680-88942219-67142018-06-011419410410.33412/idt.v14.1.18071807Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datosDanny Murillo0Dalys Saavedra1Erika Quintero2Universidad Tecnológica de PanamáUniversidad Tecnológica de PanamáUniversidad Tecnológica de PanamáEl objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada.https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807web scrapinggoogle scholarminería de datoslenguaje ranálisis de datos.
spellingShingle Danny Murillo
Dalys Saavedra
Erika Quintero
Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
Revista de I + D Tecnológico
web scraping
google scholar
minería de datos
lenguaje r
análisis de datos.
title Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_full Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_fullStr Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_full_unstemmed Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_short Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_sort extraccion de datos de perfiles en google scholar utilizando un algoritmo en el lenguaje r para hacer mineria de datos
topic web scraping
google scholar
minería de datos
lenguaje r
análisis de datos.
url https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807
work_keys_str_mv AT dannymurillo extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos
AT dalyssaavedra extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos
AT erikaquintero extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos