Minería de datos en las colecciones del Internet Archive
Las colecciones del Internet Archive incluyen una gran cantidad de fuentes históricas digitalizadas. Muchas de ellas contienen datos bibliográficos importantes en un formato llamado MARC. En esta lección aprenderás a usar Python para automatizar la descarga de archivos MARC en grandes cantidades des...
Main Author: | |
---|---|
Format: | Article |
Language: | Spanish |
Published: |
Editorial Board of the Programming Historian
2017-10-01
|
Series: | The Programming Historian en Español |
Online Access: | https://programminghistorian.org/es/lecciones/mineria-de-datos-en-internet-archive |
Summary: | Las colecciones del Internet Archive incluyen una gran cantidad de fuentes históricas digitalizadas. Muchas de ellas contienen datos bibliográficos importantes en un formato llamado MARC. En esta lección aprenderás a usar Python para automatizar la descarga de archivos MARC en grandes cantidades desde el Internet Archive, así como el análisis sintáctico de archivos MARC con información específica tal como autores, lugar de publicación y fechas. La lección puede aplicarse de una manera general para otros elementos del Internet Archive así como en archivos MARC en cualquier otro repositorio. |
---|---|
ISSN: | 2517-5769 2517-5769 |