Minería de datos en las colecciones del Internet Archive

Las colecciones del Internet Archive incluyen una gran cantidad de fuentes históricas digitalizadas. Muchas de ellas contienen datos bibliográficos importantes en un formato llamado MARC. En esta lección aprenderás a usar Python para automatizar la descarga de archivos MARC en grandes cantidades des...

Full description

Bibliographic Details
Main Author: Caleb McDaniel
Format: Article
Language:Spanish
Published: Editorial Board of the Programming Historian 2017-10-01
Series:The Programming Historian en Español
Online Access:https://programminghistorian.org/es/lecciones/mineria-de-datos-en-internet-archive
_version_ 1818925078775070720
author Caleb McDaniel
author_facet Caleb McDaniel
author_sort Caleb McDaniel
collection DOAJ
description Las colecciones del Internet Archive incluyen una gran cantidad de fuentes históricas digitalizadas. Muchas de ellas contienen datos bibliográficos importantes en un formato llamado MARC. En esta lección aprenderás a usar Python para automatizar la descarga de archivos MARC en grandes cantidades desde el Internet Archive, así como el análisis sintáctico de archivos MARC con información específica tal como autores, lugar de publicación y fechas. La lección puede aplicarse de una manera general para otros elementos del Internet Archive así como en archivos MARC en cualquier otro repositorio.
first_indexed 2024-12-20T02:35:31Z
format Article
id doaj.art-bb4c9d8e60d74c04a3699f6ff7645ba0
institution Directory Open Access Journal
issn 2517-5769
2517-5769
language Spanish
last_indexed 2024-12-20T02:35:31Z
publishDate 2017-10-01
publisher Editorial Board of the Programming Historian
record_format Article
series The Programming Historian en Español
spelling doaj.art-bb4c9d8e60d74c04a3699f6ff7645ba02022-12-21T19:56:27ZspaEditorial Board of the Programming HistorianThe Programming Historian en Español2517-57692517-57692017-10-01110.46430/phes0019Minería de datos en las colecciones del Internet ArchiveCaleb McDaniel0Rice UniversityLas colecciones del Internet Archive incluyen una gran cantidad de fuentes históricas digitalizadas. Muchas de ellas contienen datos bibliográficos importantes en un formato llamado MARC. En esta lección aprenderás a usar Python para automatizar la descarga de archivos MARC en grandes cantidades desde el Internet Archive, así como el análisis sintáctico de archivos MARC con información específica tal como autores, lugar de publicación y fechas. La lección puede aplicarse de una manera general para otros elementos del Internet Archive así como en archivos MARC en cualquier otro repositorio.https://programminghistorian.org/es/lecciones/mineria-de-datos-en-internet-archive
spellingShingle Caleb McDaniel
Minería de datos en las colecciones del Internet Archive
The Programming Historian en Español
title Minería de datos en las colecciones del Internet Archive
title_full Minería de datos en las colecciones del Internet Archive
title_fullStr Minería de datos en las colecciones del Internet Archive
title_full_unstemmed Minería de datos en las colecciones del Internet Archive
title_short Minería de datos en las colecciones del Internet Archive
title_sort mineria de datos en las colecciones del internet archive
url https://programminghistorian.org/es/lecciones/mineria-de-datos-en-internet-archive
work_keys_str_mv AT calebmcdaniel mineriadedatosenlascoleccionesdelinternetarchive