Una visión mas nítida de la Vía Láctea con Gaia y el aprendizaje automático         

Por: Janine Fohlmeister, Instituto Leibniz de Astrofísica de Potsdam.

10 de octubre de 2024

 

Mapa a gran escala (330.000 años luz de longitud de lado) de la densidad de los 217 millones de estrellas de la muestra Gaia DR3 XP en coordenadas cartesianas galactocéntricas. Crédito de la imagen: F. Anders, Universitat de Barcelona.

 

Un grupo de científicos liderado por el Instituto Leibniz de Astrofísica de Potsdam (AIP) y el Instituto de Ciencias del Cosmos de la Universidad de Barcelona (ICCUB) han utilizado un novedoso modelo de aprendizaje automático para procesar datos de 217 millones de estrellas observadas por la misión Gaia de una manera extremadamente eficiente. Los resultados son competitivos con los métodos tradicionales utilizados para estimar los parámetros estelares.

 

Este nuevo enfoque abre oportunidades interesantes para mapear características como la extinción interestelar y la metalicidad en toda la Vía Láctea, ayudando a comprender las poblaciones estelares y la estructura de nuestra galaxia. Con la tercera publicación de datos de la misión espacial Gaia de la Agencia Espacial Europea, los astrónomos obtuvieron acceso a mediciones mejoradas de 1.800 millones de estrellas, lo que proporciona una gran cantidad de datos para investigar la Vía Láctea.

 

Sin embargo, analizar un conjunto de datos tan grande de manera eficiente presenta desafíos. En el estudio, los investigadores exploraron el uso del aprendizaje automático para estimar propiedades estelares clave utilizando los datos espectrofotométricos de Gaia. El modelo se entrenó con datos de alta calidad de 8 millones de estrellas y logró predicciones confiables con pequeñas incertidumbres.

 

El modelo se entrena con datos espectroscópicos de alta calidad de estudios estelares más pequeños y luego aplica este aprendizaje a la tercera publicación de datos de Gaia (DR3), extrayendo parámetros estelares clave utilizando solo datos fotométricos y astrométricos, así como los espectros XP de baja resolución de Gaia.

 

La técnica subyacente, llamada árboles potenciados por gradientes extremos, permite estimar propiedades estelares precisas, como la temperatura, la composición química y la oscuridad del polvo interestelar, con una eficiencia sin precedentes. El modelo de aprendizaje automático desarrollado, SHBoost, completa sus tareas, incluido el entrenamiento y la predicción del modelo, en cuatro horas en una sola GPU, un proceso que antes requería dos semanas y 3000 procesadores de alto rendimiento”, dice Arman Khalatyan, primer autor del estudio.

 

La alta calidad de los resultados reduce la necesidad de realizar observaciones espectroscópicas que consumen muchos recursos cuando se buscan buenos candidatos para estudios posteriores, como estrellas raras pobres en metales o súper ricas en metales, cruciales para comprender las primeras fases de la formación de la Vía Láctea”, dice Cristina Chiappini, investigadora del AIP. El equipo también utilizó el modelo para mapear estrellas jóvenes, masivas y calientes en toda la galaxia, destacando regiones lejanas y poco estudiadas en las que se están formando estrellas.

 

Los datos también revelan que existen varios “vacíos estelares” en nuestra Vía Láctea, es decir, áreas que albergan muy pocas estrellas jóvenes. Además, los datos demuestran dónde la distribución tridimensional del polvo interestelar aún está mal resuelta. A medida que Gaia continúa recopilando datos, la capacidad de los modelos de aprendizaje automático para manejar los vastos conjuntos de datos de manera rápida y sostenible los convierte en una herramienta esencial para la investigación astronómica futura.

 

Fuente:

        https://phys.org/news/2024-10-sharper-view-milky-gaia-machine.html