Estrazione dati da specifiche tecniche con l’AI

Come estrarre dati da specifiche tecniche con l’AI

I documenti di specifica sono strumenti fondamentali per definire in modo dettagliato i requisiti, le caratteristiche e i criteri tecnici che un prodotto o un processo devono soddisfare. Vi rientrano le specifiche tecniche di prodotto, le specifiche di test o di processo. Questi documenti garantiscono uniformità, conformità agli standard e comunicazione chiara tra progettisti, produttori, fornitori e clienti. La loro analisi rappresenta una sfida complessa per molte aziende, in particolare manifatturiere ed appartenenti a filiere lunghe.

Questi documenti, spesso estesi e dettagliati, contengono una grande quantità di informazioni critiche, tra cui normative, requisiti funzionali, parametri tecnici, che i fornitori devono mappare e rispettare per la corretta soddisfazione dei clienti. La loro gestione viene comunemente affidata a team di tecnici, a cui viene chiesto di individuare ed estrapolare le informazioni critiche, e di sintetizzarle in formati standard per l’inoltro ai team di progettazione. Questo approccio ‘manuale’ presenta non poche criticità: la mole di dati è difficile da processare, i tempi a disposizione per l’analisi sono scarsi ed il rischio di errori o omissioni è elevato. Questo crea una necessità urgente di soluzioni tecnologiche che possano supportare il processo.

Una gestione inefficace delle specifiche può causare conseguenze significative, tra cui ritardi decisionali, aumento dei costi operativi, non conformità normative ed errori progettuali. Una scorretta identificazione delle normative applicabili espone l’azienda a rischi legali, e requisiti non individuati o mal interpretati possono generare errori di progettazione.

L’adozione di soluzioni basate sull’intelligenza artificiale (AI) e sull’elaborazione del linguaggio naturale (NLP) promette di superare molte di queste limitazioni, supportare nell’estrazione dei dati e migliorare i processi di analisi.

Tecnologie di Natural Language Processing per l’analisi dei dati tecnici

L’elaborazione del linguaggio naturale (NLP) rappresenta un insieme di tecnologie progettate per comprendere ed analizzare il linguaggio naturale. Tra i principali strumenti e tecniche NLP per l’analisi automatica delle specifiche rientrano gli OCR (Optical Character Recognition, ne è un esempio Tesseract di Google), che consentono di digitalizzare documenti cartacei o immagini, trasformandoli in testo modificabile.

Sono indispensabili strumenti per l’applicazione di tecniche NER (Named Entity Recognition) che identificano automaticamente entità rilevanti come materiali, standard (es. ISO), requisiti tecnici e normative; così come gli strumenti per l’analisi delle tabelle, fondamentali per tirare fuori i parametri chiave dagli innumerevoli fogli dati allegati alla documentazione di specifica. Pure gli LLM (Large Language Models) come GPT-4o di OpenAI trovano applicazione in questo dominio, eseguendo analisi semantiche complesse, rispondendo a domande sui documenti, o verificando coerenza e conformità rispetto a standard predefiniti.

Integrando tra loro queste tecnologie è possibile trasformare documenti complessi in dati strutturati e facilmente accessibili.

Scopri come i nostri software basati su Intelligenza Artificiale possono aiutarti nella Ricerca Brevettuale.

Use Case: Estrazione e valutazione di requisiti in ambito ferroviario

I documenti di specifica assumono differenti livelli di complessità e criticità. Nel settore ferroviario, ad esempio, rappresentano documenti fondamentali per regolamentare la progettazione, la costruzione e la manutenzione dei sistemi e la loro analisi richiede il coinvolgimento oneroso di tecnici esperti.

Un caso in cui l’applicazione dell’NLP ha evidenziato particolari vantaggi è relativo ad un progetto condotto da Erre Quadro con una importante multinazionale del settore. Qui l’analisi di specifiche tecniche di oltre 2.000 pagine avveniva coinvolgendo mediamente 4 tecnici, a tempo pieno, per un periodo minimo di 5 giorni. La complessità del linguaggio tecnico, unita alla complessa organizzazione delle informazioni all’interno dei documenti, rendevano il processo inefficiente e soggetto a frequenti ritardi, evidenziando l’urgenza di una soluzione automatizzata. Il progetto condotto da Erre Quadro mirava a ridurre i tempi necessari all’estrazione dei requisiti di sistema, incrementare l’affidabilità dei risultati ed anticipare l’identificazione dei requisiti maggiormente ambigui e meno chiari.

Per affrontare queste sfide, il team Erre Quadro ha sviluppato un software basato su algoritmi di Machine Learning, in grado di estrarre i requisiti e di stimarne il livello di ambiguità. Tale software è composto da un modulo adibito al pre-processamento del documento e da un modulo di NLP, a sua volta suddiviso in un sistema di tokenizzazione e POS-tagging, un workflow di Requirements Recognition che applica una catena di  OCR, LLM e classificatori ML, ed un sistema di valutazione formale dei requisiti estratti. Per quest’ultimo scopo è stata creata una base di conoscenza fondata su elementi tecnici quali le unità di misura, le funzioni, le proprietà fisiche, e le norme, che ha consentito di valutare il contenuto e la qualità formale dei requisiti, assegnando score basati su criteri di chiarezza e completezza.

I risultati ottenuti

Il progetto è stato valutato su un corpus di oltre 2.000 pagine derivanti da documenti di specifica tecnica, da cui il software è stato in grado di estrarre oltre 6.200 requisiti tecnici.  Da questi, il sistema ha rintracciato più di 3.000 unità di misura specifiche e 543 riferimenti normativi, da cui è nato un elenco di oltre 50 sigle normative non precedentemente note al Cliente. Da valutazioni a campione, eseguite su più gruppi casuali di 100 requisiti (50 con riferimenti a norme e 50 senza), è stato determinato che il sistema garantisse l’84% di corrispondenza con le attribuzioni ‘manuali’ degli esperti, confermando così l’affidabilità del processo, il quale, posizionandosi a supporto dei tecnici, promette di ridurre di oltre il 90% il tempo di analisi di un intero capitolato.

Conclusioni: Verso un’analisi più efficace delle specifiche tecniche

L’introduzione di soluzioni basate sull’AI  sull’NLP rappresenta una svolta per le aziende che necessitano di analizzare documenti ingegneristici complessi come le specifiche tecniche. L’analisi automatizzata dei documenti non solo riduce significativamente i tempi e i costi, ma migliora anche l’accuratezza e la qualità dei risultati, standardizzando i processi e rendendo i dati maggiormente accessibili. Con l’evoluzione delle tecnologie, l’integrazione di questi strumenti nei flussi di lavoro aziendali potrà ottimizzare ulteriormente la gestione delle informazioni tecniche, offrendo alle imprese un vantaggio competitivo duraturo. L’AI si configura quindi come un alleato imprescindibile per chi opera in settori ad alta intensità di dati, trasformando le sfide dell’analisi documentale in opportunità di crescita e innovazione.

Richiedi una demo dei nostri tools AI.

Vuoi provare i nostri prodotti?

Richiedi una demo gratuita compilando il form.