Un sistema altamente flessibile interpreta automaticamente diverse tipologie di dati sperimentali e li archivia in un formato ottimizzato per l'informatica dei materiali.

La ricerca sui materiali genera enormi quantità di dati, ma le informazioni sono spesso registrate in formati proprietari dei singoli produttori e la terminologia manca di uniformità. Questo rende difficile aggregare, confrontare e riutilizzare i dati. Tradizionalmente, i ricercatori hanno dovuto dedicare un tempo considerevole ad attività ripetitive come la conversione dei formati, l'assegnazione dei metadati e l'estrazione delle caratteristiche. Questi passaggi aggiuntivi scoraggiano la condivisione dei dati, ostacolando così il progresso della ricerca basata sui dati.
Il problema si aggrava ulteriormente con la crescente dipendenza del settore in questione dalla scoperta di materiali guidata dall'intelligenza artificiale, che richiede dataset di alta qualità.
Per affrontare questa sfida, i ricercatori del National Institute for Materials Science (NIMS, ente di ricerca scientifica giapponese) hanno sviluppato Research Data Express (RDE), un sistema di gestione dati estremamente flessibile a supporto degli scienziati dei materiali. Methods, RDE (pubblicato sulla rivista Science and Technology of Advanced Materials) interpreta automaticamente i dati sperimentali dai file grezzi e dalle misurazioni inserite manualmente, ristrutturandoli e archiviandoli in un formato ad alta leggibilità.
"RDE riduce significativamente il carico delle attività routinarie di elaborazione dati per i ricercatori e migliora la reperibilità, l'interoperabilità e la riutilizzabilità dei dati (i principi FAIR), oltre alla tracciabilità", spiega il dott. Jun Fujima, autore corrispondente e ricercatore presso la divisione Materials Data Platform del NIMS. "Ci auguriamo che questo favorisca una ricerca sui materiali collaborativa e basata sui dati."
A differenza di molti sistemi analoghi che "definiscono" il formato dei dati, l'innovazione centrale di RDE, il "Dataset Template", definisce e coordina il modo in cui i dati provenienti da diversi tipi di esperimenti devono essere elaborati. Ad esempio, se un ricercatore carica fogli di calcolo con misurazioni a raggi X provenienti da fonti diverse, il Dataset Template può essere configurato per interpretarli. Il sistema esegue quindi automaticamente analisi avanzate e crea visualizzazioni per fornire una panoramica immediata. È possibile preparare template multipli per diversi temi di ricerca sui materiali, garantendo la massima flessibilità nella gestione dei dati. Se necessario, i singoli ricercatori possono anche creare facilmente template personalizzati. Numerosi template sono già stati preparati e condivisi tra gli utenti.
"L'approccio unico di RDE consente ai ricercatori di definire liberamente strutture dati adattate ai loro strumenti, permettendo al contempo al sistema di eseguire automaticamente strutturazione massiva dei dati ed estrazione dei metadati", afferma Fujima.
Dal suo lancio nel gennaio 2023, RDE è stato ampiamente adottato dalla comunità di ricerca sui materiali giapponese, dimostrando la sua scalabilità. Ad oggi conta oltre 5.000 utenti, con più di 1.900 Dataset Template implementati per vari metodi sperimentali, oltre 16.000 dataset creati e più di tre milioni di file di dati accumulati. Il sistema funge da infrastruttura dati per importanti iniziative nazionali, tra cui la Materials Research DX Platform promossa dal Ministero dell'Istruzione, della Cultura, dello Sport, della Scienza e della Tecnologia giapponese. Il team del NIMS ha rilasciato un software open-source (RDEToolKit) per incoraggiare l'utilizzo del sistema all'interno della comunità di ricerca.
Fonte:
https://doi.org/10.1080/27660400.2025.2597702
Science and Technology of Advanced Materials: Methods (STAM-M)
STAM Methods è una rivista open access affiliata a Science and Technology of Advanced Materials (STAM), dedicata ai metodi e agli strumenti emergenti che migliorano e accelerano lo sviluppo dei materiali, quali metodologie sperimentali, apparecchiature, strumentazione, modellizzazione, acquisizione massiva di dati, informatica dei materiali e dei processi, database e programmazione.