Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones d...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | Spanish |
Published: |
Editorial Universitaria
2018-06-01
|
Series: | Revista de I + D Tecnológico |
Subjects: | |
Online Access: | https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807 |
_version_ | 1819041474531033088 |
---|---|
author | Danny Murillo Dalys Saavedra Erika Quintero |
author_facet | Danny Murillo Dalys Saavedra Erika Quintero |
author_sort | Danny Murillo |
collection | DOAJ |
description | El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada. |
first_indexed | 2024-12-21T09:25:34Z |
format | Article |
id | doaj.art-83797facf31647f4ad382447d53386a2 |
institution | Directory Open Access Journal |
issn | 1680-8894 2219-6714 |
language | Spanish |
last_indexed | 2024-12-21T09:25:34Z |
publishDate | 2018-06-01 |
publisher | Editorial Universitaria |
record_format | Article |
series | Revista de I + D Tecnológico |
spelling | doaj.art-83797facf31647f4ad382447d53386a22022-12-21T19:08:54ZspaEditorial UniversitariaRevista de I + D Tecnológico1680-88942219-67142018-06-011419410410.33412/idt.v14.1.18071807Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datosDanny Murillo0Dalys Saavedra1Erika Quintero2Universidad Tecnológica de PanamáUniversidad Tecnológica de PanamáUniversidad Tecnológica de PanamáEl objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada.https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807web scrapinggoogle scholarminería de datoslenguaje ranálisis de datos. |
spellingShingle | Danny Murillo Dalys Saavedra Erika Quintero Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos Revista de I + D Tecnológico web scraping google scholar minería de datos lenguaje r análisis de datos. |
title | Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_full | Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_fullStr | Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_full_unstemmed | Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_short | Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos |
title_sort | extraccion de datos de perfiles en google scholar utilizando un algoritmo en el lenguaje r para hacer mineria de datos |
topic | web scraping google scholar minería de datos lenguaje r análisis de datos. |
url | https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807 |
work_keys_str_mv | AT dannymurillo extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos AT dalyssaavedra extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos AT erikaquintero extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos |