
Nell’universo dei brevetti, le immagini non sono semplici illustrazioni di accompagnamento: esse costituiscono una parte integrante del documento, e spesso racchiudono informazioni cruciali, sebbene comunicate in modi più sottili. A differenza delle fotografie o delle rappresentazioni realistiche, i disegni brevettuali, di solito rappresentati sotto forma di wireframe o schizzi stilizzati, servono uno scopo funzionale e tecnico. Questi disegni non si limitano a visualizzare un’invenzione, ma incorporano dettagli che supportano l’interpretazione tecnica del testo del brevetto.
Le immagini nei brevetti, spesso semplici e stilizzate, sono distanti dalle foto reali per una buona ragione: rappresentano una forma di “codifica” che serve a rendere il contenuto tecnico dell’invenzione più chiaro, ma allo stesso tempo meno accessibile agli occhi non esperti. In effetti, un brevetto non è semplicemente un disegno tecnico o meccanico, e le sue figure non seguono rigorosamente standard CAD o tecnici. Invece, usano un proprio linguaggio visuale per rappresentare componenti e funzionalità dell’invenzione. Come il testo di un brevetto è scritto in un gergo per addetti ai lavori, detto legalese, così le immagini, che seguono un “dialetto” tutto loro che raramente si trova usato in altri documenti tecnici (manuali, specifiche ecc..).
Proprio per questo, strumenti innovativi come TagMyPic di Erre Quadro emergono come soluzioni fondamentali per navigare tra testo e immagini nei brevetti. Questo strumento, grazie a tecnologie di analisi delle immagini e del testo integrate tra loro, collega rapidamente testo e immagini del brevetto, consentendo una maggiore efficienza sia nelle fasi di analisi che nella stesura del documento brevettuale. Le funzionalità di TagMyPic non si limitano alla semplice annotazione dell’immagine. La funzionalità di navigazione consente all’analista di spostarsi rapidamente tra il testo descrittivo e le immagini associate, facilitando la comprensione e l’interpretazione del brevetto. La possibilità di passare dalle figure ai testi che le descrivono, dai componenti alle funzioni svolte e alle loro interfacce rende la navigazione un’esperienza realmente multimodale che aumenta l’efficienza, ma sperabilmente anche l’efficacia dell’esplorazione.
La funzione “Image Enhancement” permette di arricchire l’immagine con annotazioni personalizzate inserite dall’utente, creando un collegamento diretto tra testo e immagine e aumentando il livello di dettaglio e personalizzazione della rappresentazione visiva. Questo strumento permetta un’interazione diretta fra la progettazione o la ricerca e sviluppo e gli esperti di proprietà intellettuale in un dialogo reso possibile da strumenti di traduzione dei rispettivi dialetti (o lingue).
Ancora più avanzata è la funzione “Problem-Solution” che offre una visualizzazione immediata dei problemi tecnici risolti dall’invenzione, insieme alle soluzioni proposte, rendendo più chiaro l’impatto tecnico dell’invenzione stessa. Il tutto, relazionato con le immagini, potrebbe far pensare agli esperti di Engineering Design ad un proto Axiomatic Design!
Scopri come i nostri software basati su Intelligenza Artificiale possono aiutarti nella Ricerca Brevettuale.
La Fusione tra Testo e Immagini: Un Passo Oltre
Nonostante le tecnologie multimodali stiano guadagnando sempre più terreno, rimangono aperti due scenari:
i sistemi multimodali (come CLIP) sono addestrati su immagini tratte dal web e quindi a colori o in bianco e nero e soffrono enormemente nella “digestione” dei wireframe (rappresentazione schematica, spesso tridimensionale, in cui solo le linee principali e i contorni sono mostrati per definirne la struttura)
esiste ancora una distanza significativa tra come l’essere umano integra informazioni da testo e immagini in maniera “seamless” e come lo fanno le macchine. Infatti, nella comprensione umana, testo e immagini si fondono intuitivamente, creando un’unica rappresentazione mentale. Al contrario, le macchine trattano ancora testo e immagini come due mondi separati, che successivamente vengono combinati con tecniche sofisticate, come quelle multimodali, per ottenere un’interpretazione unificata.
C’è anche un’altra faccia delle immagini nei brevetti: in alcuni casi, queste vengono utilizzate per “nascondere” il vero contenuto dell’invenzione, rendendolo meno immediatamente interpretabile e più difficile da cercare da parte di chi cerca brevetti concorrenti. Proprio per questo motivo, Erre Quadro ha sviluppato una serie di strategie e tecniche in grado di svelare la struttura e le funzioni nascoste dietro i disegni brevettuali. Questo approccio consente di eseguire query funzionali e strutturali direttamente sulle immagini, aumentando l’efficacia nella ricerca e nell’analisi dei brevetti.
L’integrazione tra testo e immagine nei brevetti rappresenta ad oggi una sfida per migliorare l’analisi e la comprensione di un documento tecnico complesso. Strumenti come TagMyPic stanno spingendo in avanti i confini di ciò che è possibile in termini di navigazione e annotazione dei brevetti, offrendo agli analisti e agli attorney una capacità senza precedenti di decodificare e valorizzare l’informazione brevettuale.
Se hai un caso d’uso che vuoi testare o un’applicazione innovativa e sfidante, è il momento perfetto per esplorare le nuove frontiere dell’analisi brevettuale.
Richiedi una demo dei nostri tools AI.