Minería de datos en las colecciones del Internet Archive

Las colecciones del Internet Archive incluyen una gran cantidad de fuentes históricas digitalizadas. Muchas de ellas contienen datos bibliográficos importantes en un formato llamado MARC. En esta lección aprenderás a usar Python para automatizar la descarga de archivos MARC en grandes cantidades des...

Full description

Bibliographic Details
Main Author: Caleb McDaniel
Format: Article
Language:Spanish
Published: Editorial Board of the Programming Historian 2017-10-01
Series:The Programming Historian en Español
Online Access:https://programminghistorian.org/es/lecciones/mineria-de-datos-en-internet-archive
Description
Summary:Las colecciones del Internet Archive incluyen una gran cantidad de fuentes históricas digitalizadas. Muchas de ellas contienen datos bibliográficos importantes en un formato llamado MARC. En esta lección aprenderás a usar Python para automatizar la descarga de archivos MARC en grandes cantidades desde el Internet Archive, así como el análisis sintáctico de archivos MARC con información específica tal como autores, lugar de publicación y fechas. La lección puede aplicarse de una manera general para otros elementos del Internet Archive así como en archivos MARC en cualquier otro repositorio.
ISSN:2517-5769
2517-5769