Introducción
La arqueología en Japón es principalmente un esfuerzo administrativo. Entre 1976 y 2022, solo hubo 15,261 excavaciones arqueológicas impulsadas por preguntas de investigación en comparación con las 331,574 excavaciones de rescate realizadas antes de proyectos de desarrollo (Maizō bunkazai kankei tōkei shiryō, 2023).
Las excavaciones de rescate en Japón se llevan a cabo dentro de un marco más amplio preocupado por la protección de sitios arqueológicos, que a su vez es parte de un programa más grande para la preservación de bienes culturales. Las actividades de preservación dentro de este marco se basan en la Ley para la Protección de Bienes Culturales (promulgada en 1950, última enmienda en 2022) (Tanaka, 1984) y se centran en objetos (Okamura, 2011).
La ley establece que es importante “preservar” (hozon), así como “utilizar” (katsuyō) “bienes culturales” (bunkazai), y el concepto de “protección” (hogo) incluye ambas actividades. (Para una traducción al inglés relativamente reciente y completa de la Ley, consulte Japón: Ley para la Protección de Bienes Culturales, 2009). El proceso real de protección implica tareas como excavar, recopilar, analizar objetos, seleccionar objetos para designar como bienes culturales, reparar y restaurar objetos, compartir conocimientos adquiridos sobre los objetos con el público, exhibir objetos en museos y preservar objetos. Todas estas actividades forman un ciclo de trabajo administrativo (Nishiyama, 2015).
La maquinaria administrativa que se ocupa de la protección de bienes culturales está descentralizada. A nivel nacional, está coordinada por la Agencia de Asuntos Culturales, adscrita al Ministerio de Educación, Cultura, Deportes, Ciencia y Tecnología; a niveles prefecturales y municipales, la gestionan las Juntas de Educación locales (Tanaka, 1984).
En otras palabras, el 95% de las excavaciones realizadas en los últimos cincuenta años en Japón fueron llevadas a cabo por agencias administrativas como parte de sus actividades de preservación de bienes culturales.
Aunque ninguna legislación lo afirma explícitamente, en este marco, los informes finales de trabajo de campo se consideran los productos finales de las excavaciones arqueológicas. Según la Agencia de Asuntos Culturales, los informes de trabajo de campo son “los más centrales entre los registros dejados para las futuras generaciones como reemplazos de bienes culturales enterrados que no se pudieron preservar en su estado original, y permiten la difusión y utilización de los resultados de las excavaciones” (Gyōsei mokuteki de okonau maizō bunkazai no chōsa ni tsuite no hyōjun, 2004: 5). Además, la Agencia afirma en otro lugar que “debido a que los informes de trabajo de campo son registros de bienes culturales enterrados que resumen con precisión los resultados de las excavaciones, es necesario tomar medidas para preservarlos perpetuamente y hacerlos públicos para que las personas puedan reclamar la propiedad común y utilizarlos” (Bunkachō Bunkazai Bu Kinenbutsu Ka & Nara Bunkazai Kenkyūjo, 2010).
Sin embargo, debido a la naturaleza descentralizada de la maquinaria administrativa japonesa, la producción y difusión de la literatura gris no se gestiona de manera coherente. Como resultado, ni la extensión de la literatura gris arqueológica ni la medida en la que se ha publicado son fácilmente identificables en Japón.
Se han realizado varios intentos en el pasado para resolver este problema, siendo el más reciente el desarrollo de la Base de Datos Integral de Informes de Sitios Arqueológicos en Japón (SORAN), un índice en línea de informes de trabajo de campo, actualmente gestionado por el Instituto Nacional de Investigación de Bienes Culturales de Nara (NABUNKEN).
En este documento, presentaremos brevemente SORAN y los esfuerzos relacionados para mejorar la “Encontrabilidad”, Accesibilidad, Interoperabilidad y Reutilización (FAIRness) de la literatura gris arqueológica japonesa.
El nacimiento de SORAN
SORAN es actualmente gestionado por NABUNKEN. NABUNKEN fue establecido en 1952 como una organización auxiliar bajo la Comisión Nacional para la Protección de Bienes Culturales (posteriormente la Agencia de Asuntos Culturales) para el estudio in situ de bienes culturales muebles e inmuebles en la región de Nara. Es miembro de los Institutos Nacionales de Patrimonio Cultural, una entidad paraguas formada en 2007 que comprende nueve entidades legales especializadas en asuntos relacionados con el patrimonio cultural. NABUNKEN se encarga de liderar y educar a la comunidad japonesa de expertos en patrimonio cultural, especialmente a la comunidad arqueológica. Desde su creación el instituto en sí, es un productor activo de información arqueológica, ya que ha participado en innumerables excavaciones en Japón y en el extranjero. También gestiona tres museos que exhiben sus hallazgos y se esfuerza constantemente por mejorar los métodos actuales de preservación, conservación, restauración, presentación y mantenimiento de bienes culturales (Nara Bunkazai Kenkyujō, 2022).
Por otro lado, SORAN surgió como respuesta a la necesidad de mejorar la localización y accesibilidad de la literatura gris arqueológica japonesa y la información contenida en ella. En 2008, cinco bibliotecas universitarias nacionales ubicadas en el extremo occidental de Japón, con la Biblioteca de la Universidad de Shimane a la cabeza, formaron una alianza para publicar los textos completos de informes locales de trabajo de campo arqueológico en Internet. Este esfuerzo se convirtió eventualmente en un proyecto a nivel nacional con la participación de veintiuna bibliotecas universitarias nacionales llamado el Proyecto de Repositorios de Información de Sitios Arqueológicos a Nivel Nacional. Durante la duración de este proyecto, se digitalizaron casi 20,000 informes y se pusieron a disposición gratuitamente en línea. Aunque el proyecto fue un esfuerzo conjunto, los conjuntos de datos de las prefecturas se gestionaron por separado. No fue hasta que NABUNKEN asumió las responsabilidades de gestión en junio de 2015 que los datos acumulados se fusionaron en la base de datos monolítica SORAN (Maizō bunkazai hogo gyōsei ni okeru dejitaru gijutsu no dōnyū ni tsuite 2, 2017).
El contenido de SORAN y servicios relacionados
En los últimos años, SORAN ha crecido considerablemente con la ayuda de un número creciente de proveedores de datos de todo Japón. Contiene más datos y más tipos de datos cada año, y nuevos servicios se implementan gradualmente en el portal. A partir del 26 de julio de 2023, contiene la siguiente información pública:
- 126,455 piezas de información bibliográfica sobre literatura gris relacionada con bienes culturales elaborada por administraciones locales y museos.
- 143,857 conjuntos de metadatos basados en resúmenes de informes de trabajo de campo.
- 118,105 piezas de información bibliográfica sobre artículos académicos publicados dentro de informes de trabajo de campo y otras revistas no arbitradas y oscuras.
- 665,621 piezas de ubicaciones geográficas relacionadas con bienes culturales.
- 35 modelos tridimensionales de restos estructurales.
Políticas sobre datos digitales
El principio FAIR no es ampliamente conocido ni aplicado en Japón, especialmente en las ciencias sociales, y no existen repositorios públicos donde los investigadores puedan cargar datos o preimpresiones de manera gratuita. La Sociedad Japonesa para la Promoción de la Ciencia, la única agencia independiente de financiamiento en Japón, gestiona un portal llamado Catálogo de Datos de Japón para las Humanidades y Ciencias Sociales (JDCat), que es un sitio de agregación de metadatos donde se puede analizar y descargar metadatos a granel. Sin embargo, el portal aún está en sus inicios: hasta julio de 2023, solo cuenta con la participación de cinco instituciones. Se cree que esta situación mejorará gradualmente a partir de este año, ya que JDCat acaba de comenzar a buscar nuevos socios. Es importante destacar que el proyecto solo acepta solicitudes de bases de datos con una trayectoria bajo los principios FAIR.
Por otro lado, la Agencia de Asuntos Culturales compartió su política con respecto a los datos arqueológicos digitales en tres volúmenes entre 2017 y 2019 (Maizō bunkazai hogo gyōsei ni okeru dejitaru gijutsu no dōnyū ni tsuite 1-3, 2017-2019). El primer volumen trata sobre la digitalización de fotografías y la fotografía digital, el segundo sobre la digitalización de informes de trabajo de campo, y el tercero sobre la digitalización de fuentes primarias y el manejo adecuado de fuentes primarias digitales como mediciones realizadas con dispositivos digitales. Estas pautas promueven la digitalización de materiales físicos con fines de respaldo y para mejorar la accesibilidad. Al mismo tiempo, también destacan la importancia de la gestión adecuada de archivos digitales nativos. Sin embargo, estas son solo pautas, y depende de las administraciones locales seguirlas o no.
¿Qué tan justo es SORAN?
NABUNKEN ha aprendido mucho sobre el principio FAIR y otras mejores prácticas de gestión de datos a través de varios proyectos internacionales en los que participó, como ARIADNE (Infraestructura de Investigación Arqueológica para la Red de Datos Arqueológicos en Europa) y SEADDA (Salvando la Arqueología Europea de la Era Digital Oscura) y lanzó una traducción al japonés de las Guías de Buenas Prácticas de ADS (https://archaeologydataservice.ac.uk/help-guidance/guides-to-good-practice/) en 2022. Sin embargo, aplicar todo ese conocimiento a SORAN llevará tiempo. A continuación, evaluaremos brevemente qué tan FAIR es SORAN hasta 2023 basándonos en los principios rectores disponibles en el sitio web de GO FAIR (https://www.go-fair.org/).
La información bibliográfica sobre informes de trabajo de campo es fundamental para el conjunto de datos de SORAN. Cada pieza de información bibliográfica tiene una URL única que puede ser utilizada para referirse a ella. Los datos bibliográficos en sí no son muy útiles cuando se trata de informes de trabajo de campo arqueológicos porque no transmiten mucho más allá de los nombres y tipo de sitio. Para resolver este problema, la Agencia de Asuntos Culturales comenzó a solicitar a los gobiernos locales que adjuntaran información a través de formularios semiestructurados a los informes desde 1994 (Morimoto, 2017). Estos formularios deben contener información sobre cada intervención arqueológica sobrelos informes de trabajos de campo y registrar los nombres, direcciones, coordenadas, tamaños, tipos y edades de los sitios excavados, las fechas y los motivos de las excavaciones, así como listas de los tipos de restos estructurales y artefactos encontrados. NABUNKEN comenzó a agregar la información de estas hojas de datos en una base de datos electrónica pública en 2003. Esta base de datos se fusionó con SORAN en 2019 y ahora proporciona metadatos detallados sobre los informes de trabajo de campo y está junto a la información bibliográfica relevante. A partir de 2019, la nueva información se carga directamente en SORAN a través de una interfaz web. Para generar metadatos sistemáticamente para informes anteriores a 1994, la Agencia de Asuntos Culturales envía un aviso anual pidiendo a todas las partes relevantes que preparen datos para un año específico. Por ejemplo, en 2023, la Agencia solicitó la creación de metadatos para informes publicados en 1973. La información recién preparada para informes anteriores a 1994 no se adjunta a las copias en papel, sino que solo existe dentro de SORAN.
Además, cuando se adjuntan archivos PDF a la información bibliográfica, la página con los metadatos se le asigna un DOI para facilitar aún más la referencia a la publicación.
Toda esta información, incluido el texto completo de los archivos PDF, se indexa y es buscable en SORAN.
SORAN no requiere registro de usuarios. Los archivos PDF se pueden descargar de forma gratuita, y la información bibliográfica está disponible en formatos BibTeX, TSV y JSON. De los tres, el formato JSON es el más informativo e incluye referencias relacionadas con metadatos en bases de datos externas, como la Biblioteca Nacional sobre Dietas.
En SORAN, se indican claramente las licencias de uso tanto de los informes de trabajo de campo como de los metadatos, y el proceso de creación de metadatos está bien documentado y disponible en el portal. Además, los metadatos en SORAN son muy completos, ya que se basan en los resúmenes adjuntos a los informes de trabajo de campo, y los usuarios pueden verificar fácilmente la validez de los metadatos contra las páginas respectivas de los informes.
En resumen, los informes de trabajo de campo y los metadatos relacionados en SORAN, en su mayoría, pueden considerarse FAIR, aunque no fueron diseñados con el principio FAIR en mente. Los dos mayores problemas que deben resolverse antes de que se pueda considerar verdaderamente FAIR son: 1) los metadatos basados en las hojas de datos no siguen estándares internacionales como Dublin Core, y 2) dichos metadatos no están disponibles para su descarga. Este último es el problema más complicado, ya que requiere negociaciones con los proveedores de datos de SORAN. En otras palabras, es necesario convencer a las administraciones locales de que es de interés común que los metadatos estén disponibles para su descarga gratuita.
Conclusión
La administración de la información arqueológica en Japón es una carrera contra el tiempo. Las personas involucradas en excavaciones de rescate intentan extraer la mayor cantidad de información posible de los sitios arqueológicos antes de que comiencen los proyectos de desarrollo y luego continúan procesando los artefactos e información hasta que, eventualmente, terminan compilando todo lo que han interpretado en los informes finales de trabajo de campo. Luego, reinician el proceso una y otra vez. En este marco, los informes de trabajo de campo se han convertido en los productos finales de facto de las excavaciones y se consideran el registro más completo y fácilmente comprensible que queda de los sitios. Por lo tanto, hoy en día hay un enfoque más orientado a la preparación y preservación de estos informes que a la difusión de la información que contienen. SORAN de NABUNKEN surgió como respuesta a la necesidad de mejorar la localización y accesibilidad de esta literatura gris arqueológica. Lo hace proporcionando un portal donde los interesados pueden cargar el texto completo de sus informes en formato PDF junto con metadatos detallados sobre las excavaciones. SORAN ha mejorado considerablemente la FAIRness de la literatura gris arqueológica japonesa, pero aún hay margen para mejorar. Hasta julio de 2023, solo alrededor del 25% de los informes de trabajo de campo publicados en Japón están disponibles en la web en línea. Además, no todos los metadatos están disponibles para su descarga, ya que requiere más discusiones con los proveedores de datos. Finalmente, en el futuro, para lograr una arqueología verdaderamente basada en datos, SORAN debe ser capaz de extraer y proporcionar datos de mayor detalle, basados en los archivos PDF. Con este enfoque de la administración de los datos de la arqueología japonesa centrados en los conceptos de velocidad y eficiencia, y el enfoque del gobierno japonés en “utilizar” activos culturales, se cree que la calidad de los datos digitales disponibles en línea mejorará y se volverá más FAIR día a día.