SciELO - Scientific Electronic Library Online

 
vol.16 issue3A Quantitative Overview over the first four decades of South-Central Andes ZooarchaeologyJoined up Thinking: Aggregating archaeological datasets at an international scale author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


Revista del Museo de Antropología

Print version ISSN 1852-060XOn-line version ISSN 1852-4826

Abstract

AGUILAR, Humberto. Raspando la Arqueología: Una Aproximación Metodológica desde el Web Scraping y Text Mining. Rev. Mus. Antropol. [online]. 2023, vol.16, n.3, pp.439-450.  Epub Dec 28, 2023. ISSN 1852-060X.  http://dx.doi.org/10.31048/1852.4826.v16.n2.41094.

A medida que la cantidad de información disponible en la web aumenta, también lo hace la tarea de localizarla y analizarla, por lo cual realizar esta tarea de forma manual puede ser costosa en función al tiempo y esfuerzo invertido. Aunque los buscadores y los motores de bases de datos pueden ayudar a encontrar la información requerida, en infraestructuras digitales grandes donde los resultados de búsqueda se cuentan por millares - o más- se precisan de nuevas herramientas para obtener el contenido buscado de manera efectiva. Este trabajo propone la aplicación de Web Scraping y Text Mining como insumos metodológicos para poder compilar y procesar grandes volúmenes de datos en infraestructuras digitales de una forma más automatizada. La automatización de ambos procesos aporta una gran ventaja al analizar corpus textuales de miles de registros lo cual simplifica de manera significativa la obtención de diferentes tipos de datos, facilitando el trabajo considerablemente. Se espera que esta contribución permita ampliar las posibilidades de la comunidad arqueológica en clave de una metodología novedosa para la obtención y el manejo de datos estructurados y no estructurados que pueden ser integrados a las investigaciones de la comunidad arqueológica en general.

Keywords : R; Web scraping; Text mining; Análisis de datos; Arqueología digital.

        · abstract in English     · text in Spanish     · Spanish ( pdf )