Summary: | Con la alta disponibilidad de datos producidos a diario en el mundo de la informática, las técnicas convencionales para su obtención no suelen aprovechar al máximo la información de valor en los mismos. Se hace necesario para ello, implementar nuevas técnicas y herramientas que sirvan de ayuda para solucionar esta problemática. El objetivo de este trabajo, enmarcado en la Universidad de las Ciencias Informáticas, es el desarrollo de una herramienta informática que permita llevar a cabo el proceso de monitoreo y seguimiento de la información contenida en las publicaciones web y sus comentarios utilizando el método de Web Scraping o Raspado Web, sirviendo de apoyo empresas o entidades en la toma de decisiones respecto a la información recopilada. En el documento se abordan, aspectos esenciales como son: características, ventajas, arquitectura e importancia de las herramientas de recopilación de información web y aporta también, el análisis y diseño necesario para lograr el desarrollo de la solución. La herramienta desarrollada permite a los usuarios: la obtención de los datos que conforman tanto las publicaciones web, como los datos en cada uno de sus comentarios; la actualización de las publicaciones existentes en la base de datos del sistema, así como el envío de reportes por correo electrónico con los resultados de cada operación. La investigación describe los beneficios alcanzados al utilizar la herramienta, en cuanto a la reducción de tiempo y esfuerzo para ejecutar el proceso de monitoreo y seguimiento desde la Web.
|