L’Uni ha reso noto il recepimento in italiano delle quattro parti della UNI CEI EN ISO/IEC 5259 sulla qualità dei dati per l’intelligenza artificiale.
La norma riguarda la qualità dei dati per le analytics e per l’apprendimento automatico (conosciuto anche come machine learning) e fornisce gli strumenti, i modelli e le linee guida per garantire che i dati usati nei sistemi di intelligenza artificiale siano affidabili, trasparenti e appropriati al loro scopo.
La prima parte della norma, “Panoramica, terminologia ed esempi”, definisce i concetti fondamentali, la terminologia standard e offre anche degli esempi a supporto della comprensione delle successive parti. Questa prima parte della norma – afferma l’Uni – si rivolge non solo alle organizzazioni (aziende, enti pubblici, laboratori, startup) che utilizzano dati per le analytics o per l’apprendimento automatico, ma è utile anche ai policy makers, a chi progetta regolamenti oppure sistemi di artificialemiglioramento.
L’utenza a cui si rivolge la seconda parte della UNI CEI EN ISO/IEC 5259 è di natura più tecnica: data engineers o data scientist, ma anche chi si occupa della qualità dei dati, chi segue attività di auditing, reportistica o benchmarking. Può essere di supporto anche per chi fornisce i dati o per le aziende che erogano servizi AI o analitici.
La UNI CEI EN ISO/IEC 5259-3 terza parte – spiega inoltre l’Uni – stabilisce i requisiti e le linee guida per la gestione della qualità dei dati. Nello specifico, si occupa dell’intero ciclo di vita dei dati usati per le analytics e per il machine learning, aiutando le organizzazioni a strutturare un sistema di gestione della qualità del dato, conosciuto anche come Data Quality Management System, che sia flessibile, verificabile e allineato ai propri obiettivi.
Grazie a questo standard la qualità dei dati può diventare parte integrante della governance e della cultura aziendale. Vista la natura più specifica, questa parte si rivolge a chi gestisce i servizi IT e i dati, ma anche alle persone che monitorano le performance delle organizzazioni (auditing), chi si occupa di data governance, agli enti regolatori e in tutte quei settori regolamentati dove la responsabilità e la trasparenza del trattamento sono particolarmente critiche (salute, pubblica amministrazione, ecc.).
Infine, la quarta parte, denominata “Quadro di riferimento per il processo di qualità dei dati”, propone un framework di processo per la gestione operativa della qualità dei dati. Copre anche le attività di data labeling, di valutazione e di gestione del ciclo di vita dei dati e si può applicare a diverse tipologie di machine learning: supervisionato, non supervisionato, semi-supervisionato, reinforcement learning o apprendimento per rinforzo.
Questo standard fornisce gli strumenti per mitigare i rischi dell’apprendimento, fornendo buone pratiche da implementare. Si rivolge a chi gestisce la pipeline del machine learning e a tutta la filiera dei dati (validazione, etichettatura, ecc.), ma anche a chi si occupa di ricerca e a tutte le organizzazioni che vogliono garantire che i loro processi di sviluppo AI siano robusti, responsabili e verificabili.
In sintesi, la serie UNI CEI EN ISO/IEC 5259 – conclude l’Uni – si rivolge a chi vuole adottare un approccio responsabile e sistematico alla qualità dei dati negli ambiti dell’intelligenza artificiale e degli analytics.
Ogni sua parte identifica e tratta un aspetto in particolare:
– nella prima parte si identificano le basi con le terminologia ed esempi;
– nella seconda invece si parla di misure concrete per la misurazione;
– nella terza parte viene trattata la gestione della qualità dei dati;
– nella quarta ed ultima parte si entra nel dettaglio dei processi operativi.


