ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL

Introducción: Mantener informada a la comunidad sobre la reciente pandemia causada por el COVID-19, se ha convertido en una necesidad haciéndose indispensable el uso de canales de comunicación confiables, información precisa y basada en la evidencia. Objetivo: Este trabajo tiene como objetivo princi...

Full description

Bibliographic Details
Main Authors:	Ariel Guillermo Sánchez Paipilla, Mónica Katherine Durán Vaca, Angela María González Amarillo, Javier Antonio Ballesteros Ricaurte
Format:	Article
Language:	English
Published:	Universidad de la Costa 2020-10-01
Series:	Inge-Cuc
Subjects:	análisis de datos bases de datos nosql comunicación digital extracción de información página web
Online Access:	https://revistascientificas.cuc.edu.co/ingecuc/article/view/3280

_version_	1819012123595898880
author	Ariel Guillermo Sánchez Paipilla Mónica Katherine Durán Vaca Angela María González Amarillo Javier Antonio Ballesteros Ricaurte
author_facet	Ariel Guillermo Sánchez Paipilla Mónica Katherine Durán Vaca Angela María González Amarillo Javier Antonio Ballesteros Ricaurte
author_sort	Ariel Guillermo Sánchez Paipilla
collection	DOAJ
description	Introducción: Mantener informada a la comunidad sobre la reciente pandemia causada por el COVID-19, se ha convertido en una necesidad haciéndose indispensable el uso de canales de comunicación confiables, información precisa y basada en la evidencia. Objetivo: Este trabajo tiene como objetivo principal crear ScraCOVID-19 una plataforma web de contenido digital dedicada a acceder a las noticias actualizadas y de manera rápida. Como caso de estudio se manejan cuatro medios digitales con licencia a nivel nacional. Las noticias se presentan de manera resumida para permitir a los lectores, en función de su interés, leer las noticias mediante algunos filtros como: desempleo, educación, maltrato, corrupción y discriminación. Metodología: ScraCOVID-19 se crea a partir de la técnica de extracción Scraping, mediante el uso de BeautifulSoup, librería que permite extraer información en formato HTML de varios sitios web, utilizando el lenguaje de programación Python. Resultado: Se describe un modelo para realizar la categorización que extrae información útil para clasificar información en categorías haciendo referencia a las URL. Conclusión: A partir de técnicas de extracción utilizadas en conjunto con herramientas de almacenamiento de datos no estructurados, se obtiene información de diferentes páginas web y se administran todos los datos recogidos en una misma web generada dinámicamente.
first_indexed	2024-12-21T01:39:03Z
format	Article
id	doaj.art-eea040fa8ae3499095e3b1dc42bd06d8
institution	Directory Open Access Journal
issn	0122-6517 2382-4700
language	English
last_indexed	2024-12-21T01:39:03Z
publishDate	2020-10-01
publisher	Universidad de la Costa
record_format	Article
series	Inge-Cuc
spelling	doaj.art-eea040fa8ae3499095e3b1dc42bd06d82022-12-21T19:20:12ZengUniversidad de la CostaInge-Cuc0122-65172382-47002020-10-0116122923710.17981/ingecuc.16.2.2020.18ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQLAriel Guillermo Sánchez Paipilla0https://orcid.org/0000-0001-7181-1466Mónica Katherine Durán Vaca1Angela María González Amarillo2https://orcid.org/0000-0002-3568-7530Javier Antonio Ballesteros Ricaurte3https://orcid.org/0000-0001-9164-4597Universidad Pedagógica y Tecnológica de Colombia. Sogamoso, ColombiaUniversidad Pedagógica y Tecnológica de Colombia. Sogamoso, ColombiaUniversidad Nacional Abierta y a Distancia. Tunja, ColombiaUniversidad Pedagógica y Tecnológica de Colombia. Tunja, ColombiaIntroducción: Mantener informada a la comunidad sobre la reciente pandemia causada por el COVID-19, se ha convertido en una necesidad haciéndose indispensable el uso de canales de comunicación confiables, información precisa y basada en la evidencia. Objetivo: Este trabajo tiene como objetivo principal crear ScraCOVID-19 una plataforma web de contenido digital dedicada a acceder a las noticias actualizadas y de manera rápida. Como caso de estudio se manejan cuatro medios digitales con licencia a nivel nacional. Las noticias se presentan de manera resumida para permitir a los lectores, en función de su interés, leer las noticias mediante algunos filtros como: desempleo, educación, maltrato, corrupción y discriminación. Metodología: ScraCOVID-19 se crea a partir de la técnica de extracción Scraping, mediante el uso de BeautifulSoup, librería que permite extraer información en formato HTML de varios sitios web, utilizando el lenguaje de programación Python. Resultado: Se describe un modelo para realizar la categorización que extrae información útil para clasificar información en categorías haciendo referencia a las URL. Conclusión: A partir de técnicas de extracción utilizadas en conjunto con herramientas de almacenamiento de datos no estructurados, se obtiene información de diferentes páginas web y se administran todos los datos recogidos en una misma web generada dinámicamente.https://revistascientificas.cuc.edu.co/ingecuc/article/view/3280análisis de datosbases de datos nosqlcomunicación digitalextracción de informaciónpágina web
spellingShingle	Ariel Guillermo Sánchez Paipilla Mónica Katherine Durán Vaca Angela María González Amarillo Javier Antonio Ballesteros Ricaurte ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL Inge-Cuc análisis de datos bases de datos nosql comunicación digital extracción de información página web
title	ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL
title_full	ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL
title_fullStr	ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL
title_full_unstemmed	ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL
title_short	ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL
title_sort	scracovid 19 plataforma informativa de contenido digital mediante scraping y almacenamiento nosql
topic	análisis de datos bases de datos nosql comunicación digital extracción de información página web
url	https://revistascientificas.cuc.edu.co/ingecuc/article/view/3280
work_keys_str_mv	AT arielguillermosanchezpaipilla scracovid19plataformainformativadecontenidodigitalmediantescrapingyalmacenamientonosql AT monicakatherineduranvaca scracovid19plataformainformativadecontenidodigitalmediantescrapingyalmacenamientonosql AT angelamariagonzalezamarillo scracovid19plataformainformativadecontenidodigitalmediantescrapingyalmacenamientonosql AT javierantonioballesterosricaurte scracovid19plataformainformativadecontenidodigitalmediantescrapingyalmacenamientonosql

ScraCOVID-19: Plataforma informativa de contenido digital mediante Scraping y almacenamiento NoSQL

Similar Items