banner
Centro de Noticias
Te sorprenderán nuestros precios asequibles y nuestra calidad superior.

Aprendizaje automático

Jul 02, 2023

Datos científicos volumen 10, número de artículo: 558 (2023) Citar este artículo

278 Accesos

1 altmétrica

Detalles de métricas

En nuestro estudio, nos propusimos recopilar un conjunto de datos multimodal anotado para la detección remota de la arqueología maya, que sea adecuado para el aprendizaje profundo. El conjunto de datos cubre el área alrededor de Chactún, uno de los centros urbanos mayas antiguos más grandes en la península central de Yucatán. El conjunto de datos incluye cinco tipos de registros de datos: visualizaciones rasterizadas y modelos de altura del dosel a partir de datos de escaneo láser aéreo (ALS), datos satelitales Sentinel-1 y Sentinel-2, y anotaciones de datos manuales. Las anotaciones manuales (utilizadas como máscaras binarias) representan tres tipos diferentes de estructuras mayas antiguas (etiquetas de clase: edificios, plataformas y aguadas – reservorios artificiales) dentro del área de estudio, sus ubicaciones exactas y límites. El conjunto de datos está listo para su uso con aprendizaje automático, incluidas redes neuronales convolucionales (CNN) para reconocimiento de objetos, localización (detección) de objetos y segmentación semántica. Nos gustaría proporcionar este conjunto de datos para ayudar a más equipos de investigación a desarrollar sus propios modelos de visión por computadora para investigaciones de arqueología maya o mejorar los existentes.

Los estudios de escaneo láser aéreo (ALS) han demostrado ser cruciales para el avance del conocimiento sobre la distribución de los “sitios” arqueológicos, particularmente en las regiones boscosas de los antiguos mayas1,2,3, ya que han acelerado y ampliado enormemente los estudios de paisajes arqueológicos tradicionales. El uso de investigación de ALS en arqueología del paisaje generalmente implica la identificación, localización, registro e investigación de características naturales y culturales para una variedad de contextos, generalmente interrelacionados, que incluyen, entre otros, el mapeo y análisis de asentamientos, urbanismo, producción agrícola y gestión del agua4,5,6,7,8,9,10,11.

Los arqueólogos suelen inspeccionar los datos de ALS en forma de visualizaciones rasterizadas, que mejoran la percepción de las características de la superficie12,13,14. El análisis visual humano y la digitalización requieren mucho tiempo y el examen de cientos de kilómetros cuadrados puede llevar meses, dependiendo del nivel de detalle, la cantidad de estructuras y el método de registro. A pesar de la falta de conjuntos de datos ALS de gran escala, de alta resolución y disponibles públicamente de la antigua región maya, la financiación pública y privada dispersa ha hecho posible realizar no sólo estudios de paisaje específicos del sitio en unos pocos kilómetros cuadrados, por ejemplo7,15,16 ,17,18, pero también estudios a gran escala de varios cientos o incluso miles de kilómetros cuadrados, por ejemplo 3,5,11,19,20,21,22,23. El volumen de datos dificulta anotar conjuntos de datos completos, especialmente si se debe indicar no sólo la ubicación de los objetos, sino también su forma. La subjetividad de la inspección visual humana y la digitalización y la variabilidad entre los intérpretes humanos también son un problema24. Por lo tanto, existe una necesidad apremiante de emplear métodos de visión por computadora que puedan encontrar objetos arqueológicos y delimitar sus límites automáticamente25,26. Entre los diversos enfoques de aprendizaje automático, las redes neuronales convolucionales profundas (CNN) son el estado actual del arte para la visión por computadora, pero generalmente requieren una gran cantidad de muestras ya etiquetadas27 para su entrenamiento. Esto hace que los conjuntos de datos etiquetados sean cruciales para desarrollar y probar los métodos.

En uno de nuestros estudios anteriores, ya hemos demostrado que las CNN pueden clasificar objetos arqueológicos mayas antiguos a partir de visualizaciones DEM, logrando hasta un 95% de precisión28. Sin embargo, los modelos de clasificación no tienen el potencial de reemplazar la inspección y el etiquetado manuales, para los cuales se requiere segmentación semántica. La segmentación semántica se aplica fácilmente en teledetección27, pero aún más en imágenes médicas, donde las CNN a menudo superan a los expertos29,30,31,32,33,34.

La intención original de recopilar datos de ALS en el área alrededor de Chactún, uno de los mayores centros urbanos mayas antiguos conocidos hasta ahora en las tierras bajas centrales de la Península de Yucatán, era comprender mejor la gestión del agua, la agricultura, la dinámica de los asentamientos y las cuestiones sociopolíticas. organización de los antiguos mayas que habitaron esta zona11,35.

Generamos un conjunto de datos etiquetados que puede usarse para el análisis de la arqueología maya antigua que comprende más de 10,000 objetos, divididos en tres clases diferentes; edificaciones, andenes, aguadas (cuencas de agua artificiales). Usamos contornos poligonales de objetos para crear máscaras rasterizadas binarias. El conjunto de datos multimodal asociado contiene datos de tres fuentes de teledetección:

Visualizaciones de datos ALS con resolución de 0,5 m28 (factor de visión del cielo, apertura positiva, pendiente),

Modelo de altura de dosel ALS con resolución de 1,0 m,

Datos del satélite Sentinel-1 de radar de apertura corta (SAR) con resolución de 10 m (promedio anual Sigma0), y

Datos del satélite óptico Sentinel-2 con resolución de 10, 20 y 60 m (12 bandas + máscara de nubes sin nubes s2, 17 fechas).

Las misiones de observación de la Tierra Sentinel-1 y 2 forman parte del Programa Copernicus de la Unión Europea. En la Fig. 1 se presenta una descripción general del flujo de trabajo experimental utilizado para generar y analizar los datos.

Una descripción general del flujo de trabajo experimental utilizado para generar y analizar los datos.

La aplicación de los métodos CNN en la prospección arqueológica acaba de comenzar a ganar impulso, por ejemplo,28,36,37,38,39,40,41; Sin embargo, actualmente sólo hay unos pocos estudios de segmentación semántica basados ​​en CNN realizados con datos de ALS26,42,43,44,45,46, y aún menos modelos de segmentación de instancias publicados en este campo en particular47. Por lo tanto, los conjuntos de datos etiquetados arqueológicamente y de fácil acceso adecuados para el aprendizaje automático son extremadamente raros. Creemos que compartir un gran conjunto de datos etiquetados que permite la segmentación semántica, porque se basa en objetos poligonizados en lugar de centroides, puntos o cuadros delimitadores simples, tiene un gran valor de reutilización. Este conjunto de datos también es único porque es multimodal y, hasta la fecha, el único en la región maya. Un conjunto de datos tan rico permite a los grupos de investigación relacionados desarrollar o mejorar sus propios modelos de segmentación. Esto ya ha dado lugar a mejoras en las tasas de reconocimiento, ya que el conjunto de datos se utilizó en el concurso Descubriendo los misterios del aprendizaje automático maya48,49. Los equipos que participaron en este desafío de aprendizaje automático lograron un rendimiento de segmentación de más de 0,83 para la intersección sobre la unión (IoU, también conocido como índice Jaccard) al aprender de los datos de ALS. Sin embargo, la mayoría de los equipos no incluyeron datos satelitales en su modelo final. El aprendizaje profundo a partir de visualizaciones ALS por sí solo produjo mejores resultados con mucho menos esfuerzo de ingeniería de aprendizaje automático. Sin embargo, al proporcionar un conjunto de datos multimodal para una reutilización más amplia, esperamos que otros equipos puedan desarrollar nuevos modelos basados ​​en arquitecturas que puedan aprovechar mejor la información de los datos satelitales.

El área alrededor de Chactún (Fig. 2) es kárstica y por lo tanto carece de agua perenne y corrientes de agua permanentes. Las colinas bajas suelen elevarse hasta 30 m por encima de los humedales estacionales (bajos) circundantes. El clima en las tierras bajas mayas es tropical e isotérmico50,51 y dentro de la región interior elevada las precipitaciones son altamente estacionales y espacialmente variables. Normalmente, el 90% de las precipitaciones se producen durante la temporada de lluvias9. Toda el área de estudio está cubierta por bosques y arbustos tropicales semideciduos naturales, no gestionados, que rara vez superan los 20 m de altura. El bosque puede clasificarse como bosque primario, donde no ha habido actividad agrícola ni de pastoreo durante un milenio. Antes del establecimiento de la Reserva de la Biosfera de Calakmul en 1989, la tala selectiva para obtener madera valiosa y la recolección de chicle eran las principales actividades económicas.

Ubicación del área de estudio con el área delineada de la misión de escaneo láser aerotransportado. De su parte sur (coloreada en rojo) se extrajeron registros de datos adaptados de28.

Šprajc y su equipo descubrieron el núcleo urbano de Chactún, compuesto por tres concentraciones de arquitectura monumental, en 201352. Templos-pirámides, enormes edificios tipo palacio y dos juegos de pelota rodean sus diversas plazas. Un gran depósito de agua rectangular se encuentra inmediatamente al oeste de los principales grupos de estructuras. La cerámica recolectada de la superficie del suelo, las características arquitectónicas y los monumentos fechados indican que el centro comenzó a florecer en el período Preclásico (c. 1000 a. C.-250 d. C.) y alcanzó su clímax durante el Clásico Tardío (c. 600-1000 d. C.) desempeñando un papel importante en la jerarquía política regional52,53. Al sur de Chactún se encuentran Lagunita y Tamchén, ambos centros urbanos destacados. Numerosos grupos de edificios más pequeños se encuentran dispersos en las colinas que los rodean54,55.

Todo el conjunto de datos incluye cinco tipos diferentes de registros de datos:

visualizaciones rasterizadas de escaneo láser aerotransportado (ALS),

Modelo de altura del dosel derivado de datos de ALS,

Datos del satélite de radar de apertura sintética Sentinel-1,

Datos del satélite óptico Sentinel-2, y

anotaciones de datos.

La parte principal del conjunto de datos consiste en datos visualizados de escaneo láser aéreo recopilados con el sistema Titan por el Centro Nacional de Mapeo Láser Aerotransportado (NCALM) al final (pico) de la estación seca en mayo de 2016. Planificación de la misión, adquisición de datos y datos El procesamiento se llevó a cabo con objetivos arqueológicos claros en mente56,57. La densidad de la nube de puntos final y la calidad del modelo de elevación derivado con una resolución espacial de 0,5 m (Tabla 1) demostraron ser excelentes para la detección e interpretación de características arqueológicas con diferencias de elevación diminutas muy claramente definidas.

El control de calidad técnica de los datos incluyó la verificación de la densidad de escaneo, la precisión horizontal absoluta (mejor que 20 cm), la precisión vertical absoluta (mejor que 15 cm) y la precisión temática del modelo de elevación producido.

Los puntos del terreno se clasificaron utilizando el software Terrascan (versión 016.013), que utiliza un algoritmo adaptativo de densificación de redes triangulares irregulares58. La configuración del algoritmo se optimizó para eliminar solo la cubierta vegetal, dejando los restos de actividades humanas pasadas lo más intactos posible (Tabla 2). Por lo tanto, los puntos de tierra incluyen restos de edificios, muros, terrazas, montículos, chultunes (cisternas), sacbeob (caminos pavimentados elevados) y canales de drenaje (Fig. 3). Las áreas raras sin retornos terrestres incluyen aguadas con agua. Muchas características del paisaje, como zanjas y muros bajos de campo, eran esencialmente invisibles en el campo, debido a la densa vegetación, y muy probablemente habrían pasado desapercibidas mediante el mapeo de superficie convencional. Como lo revela la verificación sobre el terreno, el modelo de elevación contiene muy pocos artefactos de recopilación y procesamiento de datos (errores de comisión y omisión). Los casos de errores de omisión se limitan a objetos más pequeños, como altares, mientras que los errores de comisión incluyen principalmente troncos de árboles más grandes. En algunos lugares, partes de los edificios están deformes, por ejemplo, las paredes se clasifican como vegetación porque un árbol crece en una cámara en lo alto de un edificio piramidal.

Ejemplos de edificios (a–g,i,j), plataformas (a–j) y aguadas (k–o) que han sido anotados y están incluidos en el conjunto de datos. Otras estructuras artificiales como muros, canales, terrazas, pilotes de rocas, etc. no fueron anotadas (p – t). Todos los paneles tienen la misma escala y cubren aproximadamente una cuarta parte de un área de registro de datos (Fig. 5). La visualización es sólo para fines ilustrativos; Combina un modelo de relieve local simplificado en color con una visualización combinada para la topografía arqueológica.

Utilizamos visualizaciones de datos ALS rasterizados para respaldar la interpretación de la visión humana de los objetos y como un conjunto de datos de tres bandas para los registros de datos. Las visualizaciones de datos ráster de ALS son derivados computacionales de un modelo de elevación digital que proporciona información sobre el paisaje. Pueden tener un valor puramente presentacional o pueden relacionarse con cantidades físicas59. De hecho, facilitan "leer y explorar" el paisaje en busca de información significativa. La visualización principal fue una visualización combinada para topografía arqueológica (IVA)13. Combina dos combinaciones de cuatro visualizaciones distintas: sombreado analítico, pendiente, apertura positiva y factor de visión del cielo (SVF)12, calculado con configuraciones para terreno normal y plano (Tabla 3). Los métodos de visualización individuales son complementarios, representan pequeñas variaciones topográficas de diferentes maneras y la imagen combinada conserva sus características positivas. Antes de la combinación, las visualizaciones se normalizan y se les aplica una extensión de histograma personalizada. Tener una única visualización combinada para considerar tiene ventajas, incluida una mejor representación de las estructuras en una gama más amplia de tipos de terreno, la conservación del espacio en disco y una visualización más rápida. El IVA se creó en Relief Visualization Toolbox (RVT; https://github.com/EarthObservation/RVT_py). El cálculo tarda aproximadamente medio minuto por km2 para datos con una resolución de 0,5 m en un portátil de oficina normal. El IVA ya se ha utilizado para estudios de peatones en una variedad de entornos, desde los bosques tropicales semideciduos de México hasta los brezales y matorrales en gran parte abiertos del oeste de Escocia y el terreno kárstico y accidentado del Mediterráneo. La visualización no introduce artefactos y muestra bien las características a pequeña escala, independientemente de su orientación y forma. Sin embargo, no es completamente independiente de la orientación, ya que el sombreado se utiliza como capa base. Ayuda a la interpretación de la visión humana, pero utiliza una fuente de luz direccional y, por lo tanto, no es adecuado para técnicas de aumento de datos como la rotación y la inversión. Por lo tanto, para crear registros de datos de tres bandas (RGB) solo se utilizaron el factor de visión del cielo, la apertura positiva y la pendiente, que son independientes de la dirección. Estos también ocuparon el puesto más alto en nuestro estudio sobre el rendimiento de diferentes visualizaciones y combinaciones de visualizaciones para la tarea de clasificación con CNN28. La dominancia local12 sirvió como una ayuda adicional para la interpretación de la visión humana de los límites exteriores de las aguadas, que generalmente se elevan muy débilmente sobre el terreno plano circundante.

Además, proporcionamos un modelo de altura del dosel (CHM) con una resolución de 1 m, calculado con un algoritmo sin picos60 implementado en la herramienta LAStools las2dem (versión 230330). Los parámetros de procesamiento se enumeran en la Tabla 4. Según la inspección visual, eliminamos todos los puntos que están a más de 30 m sobre el suelo (o un edificio), ya que representan ruido en lugar de una medición real de las alturas de los árboles.

Los datos sin procesar de ALS fueron proporcionados por ZRC SAZU como parte de una colaboración entre los autores de este artículo. Como Chactún, Lagunita y Tamchén han sido (re)descubiertos recientemente y son remotos y de difícil acceso, el público en general desconoce su ubicación exacta. La densidad de estructuras antropogénicas mayas antiguas y modificaciones del terreno en esta área es asombrosa, alcanzando el nivel de centros urbanos importantes como Tikal, pero aún está casi completamente inexplorada arqueológicamente. Para evitar saqueos, la ubicación de los núcleos urbanos y de los numerosos grupos de asentamientos más pequeños está reservada a los investigadores. Por lo tanto, los datos completos de ALS no están disponibles públicamente. Sin embargo, los investigadores que deseen utilizarlo para una aplicación específica deben acercarse directamente a ZRC SAZU contactando al autor correspondiente, describiendo el tema y los objetivos de su proyecto.

La constelación de satélites Sentinel-1 proporciona datos de radar de apertura sintética (SAR) de banda C. El primer satélite, Sentinel-1A, se lanzó en abril de 2014, seguido por Sentinel-2 en abril de 2016. Este último fue dado de baja después de que cesara la recopilación de datos debido a un corte de energía el 23 de diciembre de 2021. La constelación dual tenía una frecuencia de repetición de 6 días. y una frecuencia de revisita (en órbita ascendente y descendente) de 3 días en el ecuador. Un solo satélite tiene una frecuencia de revisita de 6 días en el ecuador.

Para este estudio, utilizamos datos adquiridos por ambos satélites en el modo de franja interferométrica ancha (IW), ya que este es el modo de adquisición principal en tierra con el archivo de datos más grande. Utilizamos el producto Nivel 1, rango de terreno detectado (GRD) con polarización dual (Transmisión vertical - Polarización de recepción horizontal (VV) y Transmisión vertical - Polarización de recepción vertical (VH)) para órbitas ascendentes (ASC) y descendentes (DES). . El coeficiente de retrodispersión utilizado fue Sigma0. Los valores del coeficiente de retrodispersión se convirtieron de potencia lineal a decibeles (dB), se ajustaron a un intervalo de [−30, 5] dB y se normalizaron al rango [0, 1].

Utilizamos datos de SAR para los años 2017-2020, con 114 imágenes de órbita ascendente (ASC) y 205 imágenes de órbita descendente (DES), recopiladas desde Sentinel Hub61. Se adquirieron un total de 319 imágenes Sentinel-1 en el área de estudio, cada una de las cuales contiene datos de polarización VV y VH con una resolución espacial de 10 m. Calculamos las siguientes estadísticas temporales para cada píxel: media, mediana, desviación estándar, coeficiente de varianza y percentiles 5 y 95. Calculamos las estadísticas para cada año dentro del período de observación y para todo el período. Los datos se almacenaron como un ráster multibanda (120 bandas) en el formato Tagged Image File Format (TIFF) (Fig. 5 y Tabla 8). Todo el procesamiento se realizó con nuestro propio código y los paquetes de Python eolearn (versión 1.4.2) y sentinelhub (versión 3.9.1).

Debido a la ausencia total de objetos antropogénicos modernos y dispersores permanentes medidos en nuestra área de estudio, fue imposible verificar la precisión posicional de los datos SAR. Sin embargo, según el Informe de rendimiento anual de Sentinel-162, la precisión de geolocalización de los productos en modo de franja IW sin correcciones geométricas es de −3,5 m para el alcance y 2,1 m para el acimut. Por lo tanto, el error absoluto de localización está muy por debajo de los requisitos de la misión de 10 m con un 95% de confianza.

La misión del satélite óptico Sentinel-2 comenzó con el lanzamiento de Sentinel-2A en junio de 2015, seguido del Sentinel-2B en marzo de 2017. Ambos satélites llevan un único instrumento multiespectral (MSI) con 13 canales espectrales en el espectro visible/cercano. infrarrojo (VNIR) y rango espectral infrarrojo de onda corta (SWIR). La resolución espacial es de 10 m para cuatro bandas, 20 m para seis bandas y 60 m para tres bandas (Tabla 5).

Las características geográficas y climáticas de la zona de estudio se manifiestan en una alta proporción de imágenes satelitales ópticas nubladas. De 658 imágenes de Nivel 2A adquiridas entre 2017 y 202061, 78 tienen una cobertura de nubes inferior al 5 %, sin embargo, en la mayoría de ellas hay pequeñas nubes convectivas o neblina. Calculamos una máscara de nubes con una resolución de 10 m para cada fecha de adquisición y realizamos una inspección visual manual del conjunto para finalmente seleccionar las 17 imágenes sin nubosidad sobre el área de estudio. Volvimos a muestrear todas las bandas con una resolución de 10 m utilizando el método de remuestreo del vecino más cercano. Por lo tanto, el conjunto de datos comprende 12 bandas espectrales (excluyendo la banda 10) y una máscara de nube correspondiente, calculada usando s2cloudless63 (disponible en https://github.com/sentinel-hub/sentinel2-cloud-detector) ajustada a una resolución de 10 m, durante 17 fechas (Fig. 4) (221 bandas en total), guardadas en formato TIFF (Fig. 5 y Tabla 8). Excluimos la banda espectral 10 (también conocida como banda cirro) porque no contiene información de superficie. Se utiliza para correcciones atmosféricas y, por lo tanto, no está incluido en el producto Nivel 2 A con corrección atmosférica. Todo el procesamiento se realizó con nuestro propio código y los paquetes de Python eolearn (versión 1.4.2) y sentinelhub (versión 3.9.1).

La adquisición de Sentinel-2 seleccionada data sobre el área de estudio con vistas de primer plano.

Un único registro de datos (por ejemplo, 1469) contiene (a) máscaras binarias de estructuras, (b) un mosaico con visualizaciones de datos ALS, (c) un mosaico con un modelo de altura de dosel, (d) un mosaico con estadísticas anuales para Sentinel-1 Coeficientes de retrodispersión Sigma0 y (e) un mosaico con bandas Sentinel-2 para 17 escenas sin nubes.

Según el Informe de rendimiento anual de Sentinel-264, la precisión geométrica absoluta de los datos de Sentinel-2 L2A es mejor que 6 m, el registro conjunto multitemporal del mismo o de diferentes satélites en la misma órbita repetida es mejor que 5 m a 95 El % de confianza y el co-registro multitemporal en diferentes órbitas repetidas es mejor que 5 m.

Muchos estudios de aprendizaje automático y aprendizaje profundo en prospección arqueológica utilizan visualizaciones ALS con anotaciones simples que no delinean los límites exactos de los objetos. Dichos estudios utilizan principalmente puntos y cuadros delimitadores simples como anotaciones, lo que los hace principalmente adecuados para tareas relacionadas con la clasificación o localización (detección) de objetos, en lugar de la segmentación semántica. Para fines de segmentación, los límites exactos de un objeto son un requisito previo.

Para crear un conjunto de datos adecuado para la segmentación supervisada, delineamos polígonos para objetos arqueológicos. La anotación de los datos fue realizada por una sola persona. El trabajo manual tomó aproximadamente 8 meses completos de trabajo y resultó en 9303 edificios y 2110 andenes anotados en la parte sur (130 km2), y 95 aguadas anotadas en toda el área de estudio (220 km2) (Tabla 6). Las plataformas son aparentemente artificiales, superficies planas que se destacan del terreno circundante, sostienen otras estructuras o probablemente tenían esta función, aunque actualmente no se ven edificios. Los edificios incluyen varios tipos de estructuras elevadas, como templos-pirámides, edificios tipo palacio, canchas de béisbol, casas de una o varias habitaciones y complejos residenciales. Las aguadas son en su mayoría depresiones revestidas de arcilla capaces de retener agua durante la estación seca ver también35.

Se dibujó el polígono perimetral alrededor de un edificio o plataforma donde el intérprete podía definir el límite entre terreno artificial (modificado) y natural en VAT. Siempre que sea posible, un único polígono representa una única instancia, una única estructura. Sin embargo, debido a que los edificios suelen estar estrechamente conectados arquitectónicamente o debido al material colapsado, a veces es difícil determinar un límite preciso entre las estructuras. Como resultado, un único polígono suele contener más de un edificio. Los polígonos de edificios y plataformas se superponen regularmente, pero también hay muchos ejemplos de plataformas sin edificios y de edificios que no están sobre una plataforma.

Usamos visualización de dominancia local (LD) para complementar el VAT para anotar aguadas y reservorios de agua más grandes. LD es especialmente adecuado para representar sus terraplenes ligeramente elevados.

Todos los polígonos del mismo tipo (edificio, plataforma o aguada) se guardaron como capas vectoriales separadas. Las anotaciones fueron revisadas y seleccionadas por un arqueólogo experto con un profundo conocimiento local de la zona. En casos muy ambiguos en los que era difícil determinar si una formación es natural o antropogénica, por ejemplo si un objeto es una pequeña plataforma erosionada o un terreno naturalmente nivelado, se llegó a un consenso dentro de un panel de expertos. Discutimos los temas individualmente o acordamos una nueva regla si había muchos ejemplos similares.

El paisaje modificado contiene muchos otros tipos de estructuras antropogénicas como terrazas, canteras, muros, sacbeob (caminos pavimentados elevados), chultunob (cámaras de almacenamiento subterráneas), canales, montones de rocas, etc. Para ahorrar tiempo, no los anotamos inicialmente, ya que Estábamos interesados ​​principalmente en el número y el volumen acumulado de edificios y el volumen de agua disponible para determinar el número de personas que viven en el área y la mano de obra requerida para construir las estructuras en cuestión. Debido a que el estudio no priorizó los aspectos agrícolas, posteriormente se delinearon áreas con canales en bajos y de terrazas y estos datos no se incluyen en los registros de datos. Otras estructuras antropogénicas más pequeñas y menos pronunciadas, como los muros cortos, también son numerosas y a menudo están erosionadas, lo que las hace más difíciles de distinguir de las formaciones naturales. Con los datos sin etiquetar ahora disponibles, los futuros investigadores pueden anotar estos registros existentes para futuros proyectos relacionados con el uso de la tierra de los antiguos mayas.

Se rasterizaron polígonos vectoriales que representan cada clase de objeto para crear una máscara de segmentación binaria para esa clase. La rasterización se realizó utilizando la Biblioteca de abstracción de datos geoespaciales (GDAL). Las máscaras se convirtieron a archivos TIFF y sirven como datos etiquetados para capacitación, validación y pruebas.

El área completamente anotada de aproximadamente 130 km2 se dividió en mosaicos de 240 × 240 metros. Cada registro de datos consta de mosaicos con múltiples capas, excepto el CHM que tiene una sola capa (Fig. 5):

tres máscaras de segmentación binaria (una para cada clase de edificio, plataforma y aguada),

el mosaico de visualizaciones ALS con tres capas,

el modelo de altura del dosel,

el mosaico de imagen Sentinel-1 con múltiples capas, y

el mosaico de imagen Sentinel-2 con múltiples capas.

De acuerdo con la resolución DEM original de 0,5 m, las visualizaciones y los mosaicos de máscara binaria tienen cada uno un tamaño de 480 × 480 píxeles, el CHM tiene un tamaño de 240 × 240 píxeles, mientras que los datos de Sentinel-1 y 2 tienen 24 × 24 píxeles. . Las losas vecinas no se tocan ni se superponen, sino que están separadas por un espacio de separación de 20 metros. La ubicación geográfica de los mosaicos se eligió para que coincidiera con la cuadrícula de 10 m de datos de Sentinel-2.

Las máscaras binarias en mosaico, las visualizaciones de ALS y los datos de los satélites Sentinel-1 y Sentinel-2 se archivan en el repositorio en línea de Figshare65. El conjunto de datos contiene 2094 registros de datos con un objeto en al menos una de las máscaras de segmentación. El conjunto seleccionado aleatoriamente de 1765 registros de datos (mosaicos 0-1764) se publicó inicialmente para los participantes del desafío en línea Descubra los misterios de los mayas que organizamos en el marco de la Conferencia Europea sobre Aprendizaje Automático y Principios y Práctica del Descubrimiento del Conocimiento. en Bases de datos (ECML PKDD 2021)48,49, mientras que los 329 restantes (mosaicos 1765-2093) se retuvieron para probar los modelos de aprendizaje profundo presentados (Fig. 6). El formato de archivo para todos los mosaicos es TIFF sin comprimir. Se omitieron intencionalmente datos de geolocalización para evitar revelar la ubicación exacta de los restos arqueológicos. Los mosaicos se numeraron aleatoriamente para evitar la reconstrucción de toda el área de estudio. Un ejemplo de un registro de datos con detalles de cada mosaico se puede encontrar en la Fig. 5 y en las Tablas 7, 8.

La estructura del nombre de archivo para cada registro de datos es mosaico__.tif, donde la fuente de datos puede especificar una máscara, visualizaciones ALS (lidar), CHM o datos Sentinel (S1 o S2). El número secuencial es un identificador único de un registro de datos; todos los archivos con el mismo número secuencial representan la misma área geográfica, pero difieren en el número de píxeles (480 × 480 píxeles, 240 × 240 píxeles o 24 × 24 píxeles) y la profundidad de bits (entero de 8 bits o flotante de 32 bits) (Tabla 7).

Cada mosaico Sentinel-1 consta de 120 bandas (5 períodos × 24 bandas) ordenadas de la siguiente manera (Fig. 5 y Tabla 8):

Los datos se ordenan primero por año y, al final, todo el período (2017, 2018, 2019, 2020, 2017-2020), luego se ordenan

ordenado por la órbita (ascendente – ASC, descendente – DES),

ordenados por la polarización correspondiente (VV, VH), y finalmente

ordenados por las estadísticas calculadas (media, mediana, desviación estándar – std, coeficiente de varianza – var, percentil 5 – p5, percentil 95 – p95).

Cada mosaico de Sentinel-2 consta de 221 bandas (17 fechas × 13 bandas), ordenadas por fecha de adquisición (de la más nueva a la más antigua), las bandas espectrales correspondientes y la máscara de nubes asociada (Fig. 5 y Tabla 8).

Un solo registro de datos tiene un tamaño de 2,35 Mb, mientras que el tamaño total por tipo es el siguiente: 1.449 MB para máscaras, 1.449 MB para visualizaciones de ALS, 484 MB para CHM, 581 MB para Sentinel-1 y 1.070 MB para Sentnel-2. (un total de 5.033 MB). El repositorio almacena datos comprimidos ZIP, compilados por tipo (máscaras, lidar, CHM, S1, S2). El tamaño total de los archivos comprimidos es de 2214 MB.

Debido a la amplia variedad de datos utilizados para crear los registros de datos, hemos descrito el proceso para obtener la mejor entrada posible para cada una de las fuentes en la sección correspondiente del capítulo Métodos. Los límites de los objetos resultantes de la interpretación de los datos de ALS sirven como verdad fundamental. Con base en el buffer de 10 m desde las vías terrestres de las campañas de verificación de campo de 2017 y 2018, verificamos el 33.3% de las aguadas, el 22.4% de las edificaciones y el 24.2% de las plataformas en el campo (Fig. 6). Dada la extrema dificultad del trabajo de campo en una zona remota y densamente vegetal, se trata de cifras muy elevadas. No registramos los errores de forma sistemática y no podemos dar frecuencias exactas para los objetos pasados ​​por alto. Sin embargo, la calidad de nuestros datos ALS y la naturaleza de las estructuras arqueológicas inspeccionadas sugieren que es probable que la cantidad de estructuras que hayamos pasado por alto o mal etiquetado sea muy pequeña. La experiencia de los arqueólogos que trabajan en el Neotrópico muestra que las interpretaciones derivadas de los datos de ALS son muy confiables y que la verificación de campo puede ser menos consistente en áreas más grandes ya que las condiciones hacen imposible una investigación eficiente.

Mosaicos de aprendizaje (entrenamiento y validación) y prueba con pistas terrestres de dos campañas de verificación de campo.

Las visualizaciones de ALS se calcularon con Relief Visualization Toolbox (versión 2.2.1), disponible en https://github.com/EarthObservation/RVT_py.

El código para crear los registros de datos satelitales de Sentinel-1 y Sentinel-2 está disponible en https://github.com/EarthObservation/Sentinel-S1-S2-ML-patches-workflow.

Chase, AF, Reese-Taylor, K., Fernandez-Diaz, JC & Chase, DZ Progresión y problemas en la revolución geoespacial mesoamericana: una introducción. Avances en la práctica arqueológica 4, 219–231 (2016).

Artículo de Google Scholar

Playa, T. et al. Impactos de los antiguos mayas en la superficie de la Tierra: ¿un análogo del Antropoceno temprano? Reseñas de ciencias cuaternarias 124, 1–30 (2015).

ADS del artículo Google Scholar

Canuto, MA et al. La complejidad de las antiguas tierras bajas mayas revelada por un escaneo láser aéreo del norte de Guatemala. Ciencia 361, eau0137 (2018).

Artículo ADS PubMed Google Scholar

Chase, AF y cols. LiDAR aéreo, arqueología y el antiguo paisaje maya en Caracol, Belice. Revista de Ciencias Arqueológicas 38, 387–398 (2011).

Artículo de Google Scholar

Chase, AF y cols. El uso de LiDAR para comprender el paisaje maya antiguo: Caracol y Belice occidental. Avances en la práctica arqueológica 2, 208–221 (2014).

Artículo de Google Scholar

Ebert, CE, Hoggarth, JA y Awe, JJ Integración del análisis cuantitativo Lidar y la encuesta de asentamiento en el valle del río Belice. Avances en la práctica arqueológica 4, 284–300 (2016).

Artículo de Google Scholar

Fisher, CT, Cohen, AS, Fernandez-Diaz, JC & Leisz, SJ La aplicación de cartografía aérea LiDAR para la documentación de ciudades y regiones antiguas en regiones tropicales. Cuaternario Internacional 448, 129-138 (2017).

ADS del artículo Google Scholar

Playa, T. et al. Campos de humedales mayas antiguos revelados bajo el dosel del bosque tropical a partir de escaneo láser y evidencia multiproxy. PNAS 116, 21469–21477 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Dunning, NP y cols. Margen de error: Geomorfología antropogénica de los bordes del Bajo en las Tierras Bajas Mayas. Geomorfología 331, 127-145 (2019).

ADS del artículo Google Scholar

Stanton, TW y cols. Densidad, área y volumen de 'estructura' como herramientas complementarias para comprender el asentamiento maya: un análisis de datos lidar a lo largo de la gran carretera entre Cobá y Yaxuna. Revista de Ciencias Arqueológicas: Informes 29, 102178 (2020).

Google Académico

Šprajc, I. et al. Gestión del agua, agricultura y sociedad de los antiguos mayas en el área de Chactún, Campeche, México. Revista de Arqueología Antropológica 61, 101261 ​​(2021).

Artículo de Google Scholar

Kokalj, Ž. & Hesse, R. Visualización de datos rasterizados con escaneo láser aerotransportado: una guía de buenas prácticas. (Editorial ZRC, 2017).

Kokalj, Ž. & Somrak, M. ¿Por qué no una sola imagen? Combinando visualizaciones para facilitar el trabajo de campo y el mapeo en pantalla. Teledetección 11, 747 (2019).

ADS del artículo Google Scholar

Devereux, BJ, Amable, GS y Crow, P. Visualización de modelos de terreno LiDAR para la detección de elementos arqueológicos. Antigüedad 82, 470–479 (2008).

Artículo de Google Scholar

Horn, SW III & Ford, A. Más allá de la varita mágica: desarrollos metodológicos y resultados de la encuesta Lidar integrada en el antiguo Centro Maya El Pilar. STAR: Ciencia y tecnología de la investigación arqueológica 0, 1–15 (2019).

Google Académico

Hutson, SR Adaptación de datos LiDAR para la variación regional en los trópicos: un estudio de caso de las tierras bajas mayas del norte. Revista de ciencia arqueológica: informes 4, 252–263 (2015).

Google Académico

Inomata, T. y col. Arquitectura monumental de Aguada Fénix y el surgimiento de la civilización maya. Naturaleza 582, 530–533 (2020).

Artículo ADS CAS PubMed Google Scholar

von Schwerin, J. y col. Adquisición, posprocesamiento y verificación de precisión de LiDAR aéreo para un WebGIS 3D de Copán, Honduras. Journal of Archaeological Science: Informes ume 5, 85–104 (2016).

Google Académico

Chase, AF & Chase, DZ Detección de ruinas mayas mediante LiDAR: aplicaciones, estudio de caso y problemas. en Sensing the Past: From artefacto to historic site (eds. Masini, N. & Soldovieri, F.) 455–468, https://doi.org/10.1007/978-3-319-50518-3_22 (Springer International Publishing , 2017).

Hansen, RD y cols. Dinámica del desarrollo, energía e interacciones económicas complejas de los primeros mayas de la cuenca Mirador-Calakmul, Guatemala y Campeche, México. en Pathways to Complexity (eds. Brown, MK & Bey, GJ) 147–194, https://doi.org/10.2307/j.ctvx075hx.12 (University Press of Florida, 2018).

Inomata, T. y col. Aplicación arqueológica de LiDAR aéreo con técnicas de visualización y clasificación de vegetación basada en objetos en el sitio maya de tierras bajas de Ceibal, Guatemala. Sensores remotos 9, 563 (2017).

ADS del artículo Google Scholar

Jantz, P., Goetz, S. & Laporte, N. Corredores de reservas de carbono para mitigar el cambio climático y promover la biodiversidad en los trópicos. Naturaleza Cambio Climático 4, 138-142 (2014).

Artículo ADS CAS Google Scholar

Ruhl, T., Dunning, NP y Carr, C. Lidar revela una posible red de antiguos mercados mayas en el suroeste de Campeche, México. Mexicano 40, 83–91 (2018).

Google Académico

Banaszek, Ł., Cowley, DC y Middleton, M. Hacia la cartografía arqueológica nacional. Evaluación de la metodología y los datos fuente: un estudio de caso de Escocia. Geociencias 8, 272 (2018).

ADS del artículo Google Scholar

Verschoof-van der Vaart, WB & Lambers, K. Aprendiendo a mirar LiDAR: el uso de R-CNN en la detección automatizada de objetos arqueológicos en datos LiDAR de los Países Bajos. Revista de aplicaciones informáticas en arqueología 2, 31–40 (2019).

Artículo de Google Scholar

Bundzel, M. y col. Segmentación semántica de datos LiDAR aéreos en arqueología maya. Teledetección 12, 3685 (2020).

ADS del artículo Google Scholar

Neupane, B., Horanont, T. & Aryal, J. Segmentación semántica de características urbanas basada en el aprendizaje profundo en imágenes de satélite: una revisión y un metanálisis. Teledetección 13, 808 (2021).

ADS del artículo Google Scholar

Somrak, M., Džeroski, S. y Kokalj, Ž. Aprender a clasificar estructuras en visualizaciones derivadas de ALS de antiguos asentamientos mayas con CNN. Teledetección 12, 2215 (2020).

ADS del artículo Google Scholar

Esteva, A. et al. Clasificación a nivel dermatólogo del cáncer de piel con redes neuronales profundas. Naturaleza 542, 115-118 (2017).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Tj, B. et al. Las redes neuronales profundas son superiores a los dermatólogos en la clasificación de imágenes de melanoma. Revista europea de cáncer (Oxford, Inglaterra: 1990) 119, (2019).

Rc, M. y col. Rendimiento superior sistemático de 112 dermatólogos en la clasificación de imágenes de cáncer de piel multiclase mediante redes neuronales convolucionales. Revista europea de cáncer (Oxford, Inglaterra: 1990) 119 (2019).

Eskreis-Winkler, S. et al. Categorización de mejora del parénquima de antecedentes de resonancia magnética de mama mediante aprendizaje profundo: superando al radiólogo. Revista de imágenes por resonancia magnética 56, 1068–1076 (2022).

Artículo PubMed Google Scholar

Pei, L., Vidyaratne, L., Rahman, MM & Iftekharuddin, KM Aprendizaje profundo consciente del contexto para la segmentación de tumores cerebrales, clasificación de subtipos y predicción de supervivencia mediante imágenes radiológicas. Representante de ciencia ficción 10, 1-11 (2020).

Artículo de Google Scholar

Hirsch, L. y col. Rendimiento a nivel de radiólogo mediante el uso del aprendizaje profundo para la segmentación de cánceres de mama en exploraciones por resonancia magnética. Radiología: Inteligencia Artificial, https://doi.org/10.1148/ryai.200231 (2021).

Šprajc, I. et al. Paisaje arqueológico, dinámica de asentamiento y organización sociopolítica en el área de Chactún de las Tierras Bajas Mayas centrales. MÁS UNO 17, e0262921 (2022).

Artículo PubMed PubMed Central Google Scholar

Caspari, G. & Crespo, P. Redes neuronales convolucionales para la detección de sitios arqueológicos: búsqueda de tumbas “principescas”. Revista de Ciencias Arqueológicas 110, 104998 (2019).

Artículo de Google Scholar

Bonhage, A. y col. Un enfoque de red neuronal convolucional basado en la región de Máscara modificado para la detección automatizada de sitios arqueológicos en detección de luz de alta resolución y modelos de elevación digitales derivados de rango en las tierras bajas del norte de Alemania. Prospección arqueológica 28, 177–186 (2021).

Artículo de Google Scholar

Davis, DS, Caspari, G., Lipo, CP y Sanger, MC El aprendizaje profundo revela el alcance de las prácticas arcaicas de construcción de anillos de conchas de los nativos americanos. Revista de Ciencias Arqueológicas 132, 105433 (2021).

Artículo de Google Scholar

Davis, DS y Lundin, J. Localización de sitios de producción de carbón vegetal en Suecia mediante LiDAR, algoritmos hidrológicos y aprendizaje profundo. Teledetección 13 (2021).

Verschoof-van der Vaart, WB & Lambers, K. Aplicación de la detección automatizada de objetos en la práctica arqueológica: un estudio de caso del sur de los Países Bajos. Prospección arqueológica 1–17, https://doi.org/10.1002/arp.1833 (2021).

Verschoof-van der Vaart, WB y Landauer, J. Uso de CarcassonNet para detectar y rastrear automáticamente carreteras huecas en datos LiDAR de los Países Bajos. Revista de Patrimonio Cultural 47, 143-154 (2021).

Artículo de Google Scholar

Kazimi, B., Thiemann, F. & Sester, M. Segmentación semántica de estructuras paisajísticas artificiales en modelos digitales del terreno. ISPRS Annals of Photogrametry, Remote Sensing and Spatial Information Sciences 42W7, 87–94 (2019).

Artículo de Google Scholar

Soroush, M., Mehrtash, A., Khazraee, E. & Ur, JA Aprendizaje profundo en teledetección arqueológica: detección automatizada de Qanat en la región del Kurdistán de Irak. Teledetección 12, 500 (2020).

ADS del artículo Google Scholar

Guyot, A., Lennon, M., Lorho, T. y Hubert-Moy, L. Detección y segmentación combinadas de estructuras arqueológicas a partir de datos LiDAR mediante un enfoque de aprendizaje profundo. Revista de aplicaciones informáticas en arqueología 4, 1–19 (2021).

Artículo de Google Scholar

Banasiak, PZ et al. Segmentación semántica (U-Net) de elementos arqueológicos en escaneo láser aéreo: ejemplo del bosque de Białowieża. Teledetección 14, 995 (2022).

ADS del artículo Google Scholar

Küçükdemirci, M., Landeschi, G., Ohlsson, M. y Dell'Unto, N. Investigación de antiguos sistemas de campos agrícolas en Suecia a partir de datos LIDAR aéreos mediante el uso de una red neuronal convolucional. Prospección arqueológica 30, 209–219 (2023).

Artículo de Google Scholar

Kazimi, B., Thiemann, F. y Sester, M. Segmentación de instancias de objetos en modelos digitales del terreno. en Análisis informático de imágenes y patrones (eds. Vento, M. y Percannella, G.) 488–495, https://doi.org/10.1007/978-3-030-29891-3_43 (Springer International Publishing, 2019) .

Simidjievski, N. y col. Descubre los misterios de los mayas: ECML PKDD 2021 - Discovery Challenge. (2021).

Descubre los misterios de los mayas. Contribuciones seleccionadas del taller del desafío de aprendizaje automático y del desafío de descubrimiento, ECML PKDD 2021 (Instituto Jožef Stefan, 2022).

Dunning, NP y Beach, T. Granjas y bosques: perspectivas espaciales y temporales de los paisajes mayas antiguos. en Paisajes y sociedades: casos seleccionados (eds. Martini, IP y Chesworth, W.) 369–389, https://doi.org/10.1007/978-90-481-9413-1_23 (Springer Países Bajos, 2011).

Playa, T. et al. Estabilidad e inestabilidad en suelos de laderas tropicales de las Tierras Bajas Mayas. Geomorfología 305, 185–208 (2018).

ADS del artículo Google Scholar

Šprajc, I. Introducción. in Exploraciones arqueológicas en Chactún, Campeche, México (ed. Šprajc, I.) 1–3 (Založba ZRC, 2015).

Šprajc, I., Flores Esquivel, A. & Marsetič, A. Descripción del sitio. in Exploraciones arqueológicas en Chactún, Campeche, México (ed. Šprajc, I.) 5–24 (Založba ZRC, 2015).

Šprajc, I. et al. Chactún, Tamchén y Lagunita: primeras incursiones arqueológicas a una región ignota. Arqueología Mexicana 24, 20–25 (2015).

Google Académico

Reconocimiento Arqueológico en el Oriente de Campeche, México: Chactun, Tamchen y Lagunita. (Universidad de Tulane, 2021).

Fernández-Díaz, JC, Carter, WE, Shrestha, RL y Glennie, CL Ahora lo ve... Ahora no: comprensión de la recopilación LiDAR de cartografía aérea y la generación de productos de datos para la investigación arqueológica en Mesoamérica. Sensores remotos 6, 9951–10001 (2014).

ADS del artículo Google Scholar

Fernández-Díaz, JC et al. Evaluación de capacidad y métricas de rendimiento para el Lidar de mapeo multiespectral Titan. Sensores remotos 8, 936 (2016).

ADS del artículo Google Scholar

Axelsson, P. Generación DEM a partir de datos de escáner láser utilizando modelos TIN adaptativos. en Archivos Internacionales de Fotogrametría, Teledetección y Ciencias de la Información Espacial - ISPRS Archives vol. 33, 110–117 (Sociedad Internacional de Fotogrametría y Teledetección, 2000).

Kokalj, Ž. & Oštir, K. Visualización y procesamiento de datos Lidar. en La Enciclopedia de Ciencias Arqueológicas 1–6, https://doi.org/10.1002/9781119188230.saseas0347 (John Wiley & Sons, Ltd, 2018).

Khosravipour, A., Skidmore, AK & Isenburg, M. Generación de modelos de superficie digitales sin picos utilizando nubes de puntos sin procesar LiDAR: un nuevo enfoque para aplicaciones forestales. Revista Internacional de Geoinformación y Observación Aplicada de la Tierra 52, 104–114 (2016).

ADS del artículo Google Scholar

Datos modificados de Copernicus Sentinel (2017-2020). Centro Sentinel https://apps.sentinel-hub.com/eo-browser (2023).

Centro de rendimiento de la misión Sentinel-1. S-1 Informe de desempeño anual para 2022. 117, https://sentinel.esa.int/documents/247904/4889382/DI-MPC-APR-0588-1-2-track-Annual+Performance+Report+2022.pdf /a683c9d2-06c2-9143-b456-4a9c8e30e449?t=1678771841042 (2023).

Aleksándrov, M. et al. Detector de nubes de Sentinel Hub para imágenes de Sentinel-2. (2020).

Equipo del Laboratorio de soporte experto de Sentinel-2 MSI. Informe de rendimiento anual de Sentinel-2 - Año 2022. 132, https://sentinels.copernicus.eu/documents/247904/4893455/OMPC.CS.APR.001+-+i1r0+-+S2+MSI+Annual+Performance+Report +2022.pdf (2023).

Kokalj, Ž. et al. Datos de teledetección listos para el aprendizaje automático para la arqueología maya: máscaras, datos ALS, Sentinel-1, Sentinel-2. figshare https://doi.org/10.6084/m9.figshare.22202395 (2023).

Agencia Espacial Europea. Funciones de respuesta espectral Sentinel-2 (S2-SRF). 5, https://sentinels.copernicus.eu/documents/247904/685211/S2-SRF_COPE-GSEG-EOPG-TN-15-0007_3.1.xlsx (2022).

Descargar referencias

Se obtuvieron todos los permisos necesarios para el estudio descrito, que cumplió con todas las regulaciones pertinentes. La investigación fue autorizada por el Instituto Nacional de Antropología e Historia (INAH), México (Consejo de Arqueología permite 401.1 S.3-2017/117, del 30 de enero de 2017, y 401.1 S.3-2018/132, del 30 de enero de 2017). , 2018), y aprobado por la Reserva de la Biosfera de Calakmul (permisos D-RBC-029/2017, del 17 de marzo de 2017, y D-RBC-039/2018, del 22 de marzo de 2018). La investigación fue financiada por la Agencia Eslovena de Investigación a través del Proyecto Regional Chactún (J6-7085; 2016-18) y los programas de investigación Estudios Antropológicos y Espaciales (P6-0079; 2015-21), Observación de la Tierra y Geoinformática (P2-0406; 2019). -24) y Tecnologías del Conocimiento (P2-0103; 2022-27), y por el proyecto de la Agencia Espacial Europea Artificial Intelligence Toolbox for Earth Observation (AiTLAS 2020-21). El trabajo de campo fue cofinanciado por la KJJ Charitable Foundation, presidida por Ken y Julie Jones (EE.UU.), y apoyado adicionalmente por Hotel Río Bec Dreams (México), Ars longa, Adria Kombi, Abanka, Zavarovalnica Triglav, Rokus Klett, Parka Group, GKTI, BSL, Klemen Fedran, Martin Hobel y Aleš Obreza (Eslovenia).

Centro de Investigación de la Academia Eslovena de Ciencias y Artes (ZRC SAZU), Novi trg 2, 1000, Ljubljana, Eslovenia

Žiga Kokalj, Ivan Šprajc, Jasmina Štajdohar, Andrej Draksler y Maja Somrak

Tecnologías de la información y las comunicaciones, Escuela Internacional de Postgrado Jožef Stefan, Jamova cesta 39, 1000, Ljubljana, Eslovenia

Sašo Džeroski y Maja Somrak

Instituto Jožef Stefan, Jamova cesta 39, 1000, Liubliana, Eslovenia

Sašo Džeroski

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Ž.K. concibió y diseñó la investigación, proporcionó la especificación de datos ALS necesarios para la encuesta y procesó los datos ALS recopilados para crear modelos de elevación digitales, realizó la validación técnica, analizó los datos satelitales y diseñó las figuras. ES. concibió y diseñó los estudios de campo, realizó la validación técnica en el campo y, como principal experto arqueológico en la cultura y los asentamientos mayas, brindó experiencia y orientación invaluables sobre la anotación de estructuras hechas por el hombre. J.Š. fue responsable del proceso de etiquetado manual y anotó más de 12.000 estructuras. MS generó visualizaciones de ALS, creó máscaras binarias correspondientes a partir de anotaciones de polígonos, realizó labrado, anonimizó los datos y dividió el conjunto de datos. AD procesó la serie temporal Sentinel. SD asesoró sobre la preparación del conjunto de datos. Todos los autores participaron en la redacción y edición del texto. Todos los autores leyeron y aceptaron la versión publicada del manuscrito.

Correspondencia a Žiga Kokalj.

Los autores declaran no tener ningún conflicto de intereses. Los financiadores no tuvieron ningún papel en el diseño del estudio, en la recopilación, análisis o interpretación de los datos, en la redacción del manuscrito o en la decisión de publicar los resultados.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Kokalj, Ž., Džeroski, S., Šprajc, I. et al. Datos de teledetección listos para el aprendizaje automático para la arqueología maya. Datos de ciencia 10, 558 (2023). https://doi.org/10.1038/s41597-023-02455-x

Descargar cita

Recibido: 08 de marzo de 2023

Aceptado: 08 de agosto de 2023

Publicado: 23 de agosto de 2023

DOI: https://doi.org/10.1038/s41597-023-02455-x

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt