Estrai testo e dati da immagini e documenti, trasforma contenuti non strutturati in dati strutturati pronti per l'uso aziendale e accedi a insight preziosi.
Integra le funzionalità OCR nelle tue applicazioni tramite API.
I nuovi clienti ricevono 300 $ di crediti gratuiti al momento della registrazione da usare sulle soluzioni OCR per il riepilogo di documenti.
Panoramica
Google Cloud offre due tipi di OCR: OCR per i documenti e OCR per immagini e video.
Sebbene condividano la stessa tecnologia di base, Document AI è una piattaforma di comprensione dei documenti ottimizzata per l'elaborazione. Il suo Custom Extractor si basa su GenAI , in grado di elaborare documenti generici e specifici del dominio con maggiore accuratezza e in modo più rapido, senza la necessità di scegliere un processore specializzato.
Cloud Vision viene comunemente utilizzato per rilevare testo, scrittura a mano libera e una vasta gamma di oggetti da immagini e video.
Google Cloud supporta la tecnologia OCR con l'AI migliore del settore. Va ben oltre il riconoscimento di testo tradizionale, in quanto comprende, organizza e arricchisce i dati, generando infine insight pronti per l'uso aziendale.
Offre la flessibilità di utilizzare gli strumenti OCR come suite unificata per una maggiore efficienza (ad es.Document AI) o semplicemente di chiamare le API pertinenti direttamente nella console Google Cloud per integrare le funzionalità di OCR nelle tue applicazioni.
Tutte le soluzioni OCR menzionate sopra ti permettono di accedere a modelli di machine learning preaddestrati di cui puoi eseguire il deployment immediatamente tramite un'API o di cui puoi ottimizzare l'addestramento per migliorare l'accuratezza in base alle tue esigenze specifiche.
Puoi anche addestrare i tuoi modelli personalizzati con AutoML, senza bisogno di competenze nel machine learning.
Consulta la documentazione di AutoML per la creazione di modelli di machine learning personalizzati.
Se vuoi analizzare un documento o creare una pipeline di elaborazione automatica dei documenti, utilizza Document AI - Si occupa dell'intero flusso di lavoro in un'unica posizione, dalla comprensione dei documenti alla ricerca, all'archiviazione, all'organizzazione e alla gestione dei documenti insieme ai dati estratti.
Se vuoi analizzare ed elaborare le immagini, usa Cloud Vision insieme ad altri prodotti Google Cloud per ottenere risultati ottimali. Per informazioni dettagliate e per le guide rapide, consulta la sezione Utilizzi comuni.
Entrambe le API si possono provare gratuitamente con un account Google Cloud.
Confronta le offerte di OCR
Offerta OCR | Ideale per | Funzionalità principali | |
---|---|---|---|
| Casi d'uso generici per l'estrazione del testo che richiedono bassa latenza e capacità elevata. | Funzionalità predefinite come etichettatura delle immagini, rilevamento di volti e punti di riferimento, OCR, ricerca sicura. | |
Enterprise Document OCR | Digitalizza il testo dei documenti (PDF, documenti scansionati come immagini o file Microsoft DocX). | Estrai testo in oltre 200 lingue e 50 lingue scritte a mano. Componenti aggiuntivi per il riconoscimento di formule matematiche, stili e così via. | |
| Document AI Workbench | Estrarre, classificare e suddividere qualsiasi documento con l'IA generativa (modelli di base) | Custom Extractor: utilizza modelli di base per creare rapidamente parser senza etichettare o addestrare i dati in modo esaustivo. Classificatore personalizzato e divisione documenti per un'elaborazione efficiente. |
| Modelli preaddestrati | Estrazione di testo e campi da documenti specifici del dominio. | Estrazione e digitalizzazione del testo su una vasta gamma di documenti relativi all'approvvigionamento, ai mutui,documenti di identità e documenti contrattuali. |
Casi d'uso generici per l'estrazione del testo che richiedono bassa latenza e capacità elevata.
Funzionalità predefinite come etichettatura delle immagini, rilevamento di volti e punti di riferimento, OCR, ricerca sicura.
Enterprise Document OCR
Digitalizza il testo dei documenti (PDF, documenti scansionati come immagini o file Microsoft DocX).
Estrai testo in oltre 200 lingue e 50 lingue scritte a mano.
Componenti aggiuntivi per il riconoscimento di formule matematiche, stili e così via.
Document AI Workbench
Estrarre, classificare e suddividere qualsiasi documento con l'IA generativa (modelli di base)
Custom Extractor: utilizza modelli di base per creare rapidamente parser senza etichettare o addestrare i dati in modo esaustivo.
Classificatore personalizzato e divisione documenti per un'elaborazione efficiente.
Modelli preaddestrati
Estrazione di testo e campi da documenti specifici del dominio.
Estrazione e digitalizzazione del testo su una vasta gamma di documenti relativi all'approvvigionamento, ai mutui,documenti di identità e documenti contrattuali.
Come funziona
Per comprendere ed elaborare i documenti, utilizza Document AI.
Per le immagini, ti consigliamo di utilizzare Cloud Vision.
Entrambe offrono l'accesso a modelli di machine learning preaddestrati di cui è possibile eseguire il deployment tramite API o ottimizzare l'addestramento. Puoi anche addestrare i tuoi modelli personalizzati da zero con AutoML, senza bisogno di competenze nel machine learning.
Le prime 1000 unità al mese sono gratuite quando utilizzi Cloud Vision o Document OCR: prova con una semplice chiamata API.
Demo
Prova l'API Document AI con un semplice trascinamento.
Utilizzi comuni
Basato su un modello di base, Document AI Custom Extractor estrae testo e dati dai documenti, generici e specifici per il dominio, più velocemente e con maggiore accuratezza. Facile ottimizzazione con soli 5-10 documenti per prestazioni ancora migliori.
Se vuoi addestrare un modello personalizzato, etichetta automaticamente i set di dati con il modello di base per velocizzare i tempi di produzione.
Oppure puoi scegliere di utilizzare processori specializzati preaddestrati: consulta l'elenco completo dei processori.
Basato su un modello di base, Document AI Custom Extractor estrae testo e dati dai documenti, generici e specifici per il dominio, più velocemente e con maggiore accuratezza. Facile ottimizzazione con soli 5-10 documenti per prestazioni ancora migliori.
Se vuoi addestrare un modello personalizzato, etichetta automaticamente i set di dati con il modello di base per velocizzare i tempi di produzione.
Oppure puoi scegliere di utilizzare processori specializzati preaddestrati: consulta l'elenco completo dei processori.
Basato su GenAI, Document AI offre un'elevata accuratezza nell'estrazione dei dati da documenti con layout e qualità diversi. Puoi collegarlo a Cloud Storage in modo che i tuoi documenti non strutturati siano conformi a livello aziendale. BigQuery aiuta a elaborare e analizzare in batch i dati estratti come preferisci. Con Looker puoi creare facilmente visualizzazioni basate sulle tue tabelle BigQuery. Vertex AI Search consente di eseguire query sui documenti e cercarli in Cloud Storage, in modo conversazionale o tradizionale.
La configurazione dell'intera pipeline come visto richiede 60-90 minuti, mentre la parte di Document AI richiede 10 minuti.
Basato su GenAI, Document AI offre un'elevata accuratezza nell'estrazione dei dati da documenti con layout e qualità diversi. Puoi collegarlo a Cloud Storage in modo che i tuoi documenti non strutturati siano conformi a livello aziendale. BigQuery aiuta a elaborare e analizzare in batch i dati estratti come preferisci. Con Looker puoi creare facilmente visualizzazioni basate sulle tue tabelle BigQuery. Vertex AI Search consente di eseguire query sui documenti e cercarli in Cloud Storage, in modo conversazionale o tradizionale.
La configurazione dell'intera pipeline come visto richiede 60-90 minuti, mentre la parte di Document AI richiede 10 minuti.
Il tagging delle immagini è noto anche come etichettatura delle immagini.
L'API Cloud Vision può identificare ed etichettare oggetti generici, punti di riferimento, località, loghi, attività, specie animali, prodotti e altro ancora all'interno di un'immagine. Una volta che le immagini vengono taggate con le etichette rilevate, la ricerca, l'elaborazione e la gestione delle immagini diventano automatizzate e più facili.
Se hai bisogno di etichette personalizzate mirate, utilizza Cloud AutoML per addestrare un modello di machine learning personalizzato.
Per utilizzare le tecnologie Google OCR on-premise, utilizza OCR On-Prem, disponibile su Cloud Marketplace.
Per eseguire una pipeline di elaborazione delle immagini di base che rileva le etichette come mostrato a destra, il costo mensile sarà di 27,36 $.
Puoi verificare le ipotesi di utilizzo effettuate per arrivare a questo numero nel Calcolatore prezzi.
Le prime 1000 unità al mese sono gratuite.
Il tagging delle immagini è noto anche come etichettatura delle immagini.
L'API Cloud Vision può identificare ed etichettare oggetti generici, punti di riferimento, località, loghi, attività, specie animali, prodotti e altro ancora all'interno di un'immagine. Una volta che le immagini vengono taggate con le etichette rilevate, la ricerca, l'elaborazione e la gestione delle immagini diventano automatizzate e più facili.
Se hai bisogno di etichette personalizzate mirate, utilizza Cloud AutoML per addestrare un modello di machine learning personalizzato.
Per utilizzare le tecnologie Google OCR on-premise, utilizza OCR On-Prem, disponibile su Cloud Marketplace.
Per eseguire una pipeline di elaborazione delle immagini di base che rileva le etichette come mostrato a destra, il costo mensile sarà di 27,36 $.
Puoi verificare le ipotesi di utilizzo effettuate per arrivare a questo numero nel Calcolatore prezzi.
Le prime 1000 unità al mese sono gratuite.
Tramite l'API Cloud Vision, puoi rilevare ed estrarre testo e scrittura a mano libera da qualsiasi immagine in lingue diverse. Inoltre è disponibile il supporto di più regioni per il quale è possibile specificare l'archiviazione dei dati a livello di continente e l'elaborazione OCR.
Puoi scegliere di ottenere risultati immediati per un numero ridotto di immagini (fino a 16 per richiesta) o di elaborare in batch un numero maggiore di immagini (fino a 2000 per richiesta) in modo asincrono per ottenere un risultato in un secondo momento.
Per eseguire una pipeline di elaborazione di base che estrae il testo dalle immagini come mostrato a destra, il costo mensile è di 27,36 $.
Puoi verificare le ipotesi di utilizzo effettuate per arrivare a questo numero nel Calcolatore prezzi.
Le prime 1000 unità al mese sono gratuite.
Tramite l'API Cloud Vision, puoi rilevare ed estrarre testo e scrittura a mano libera da qualsiasi immagine in lingue diverse. Inoltre è disponibile il supporto di più regioni per il quale è possibile specificare l'archiviazione dei dati a livello di continente e l'elaborazione OCR.
Puoi scegliere di ottenere risultati immediati per un numero ridotto di immagini (fino a 16 per richiesta) o di elaborare in batch un numero maggiore di immagini (fino a 2000 per richiesta) in modo asincrono per ottenere un risultato in un secondo momento.
Per eseguire una pipeline di elaborazione di base che estrae il testo dalle immagini come mostrato a destra, il costo mensile è di 27,36 $.
Puoi verificare le ipotesi di utilizzo effettuate per arrivare a questo numero nel Calcolatore prezzi.
Le prime 1000 unità al mese sono gratuite.
Prezzi
Quanto costa il mio caso d'uso? | Comprendi il costo mensile per la risoluzione di un caso d'uso, tenendo traccia dei prodotti che ti servono e formulando le principali ipotesi sull'utilizzo. | ||
---|---|---|---|
Caso d'uso | Prodotti utilizzati | Ipotesi di utilizzo | Costo mensile stimato ($) |
Tagging, elaborazione e ricerca delle immagini | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 15.000 chiamate API di rilevamento etichette Cloud Vision al mese 2. 100 GiB di spazio di archiviazione al mese 3. Una CPU da 1,25 GiB 4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub | 27,36 $ |
Estrazione di testi e insight dai documenti | Document AI Cloud Storage BigQuery Cloud Functions | 1. 1000 chiamate API di analizzatore sintattico di moduli Document AI al mese 2. 100 GiB di spazio di archiviazione al mese 3. 1 TiB di query al mese 4. RAM: 512 MB, CPU: 800 MHz | 71,87 $ |
Estrai testo dalle immagini | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 15.000 chiamate API di OCR Cloud Vision al mese 2. 100 GiB di spazio di archiviazione al mese 3. Una CPU da 1,25 GiB 4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub | 27,36 $ |
Visualizza i dettagli completi dei prezzi delle unità per Document AI, API Vision e AutoML.
Quanto costa il mio caso d'uso?
Comprendi il costo mensile per la risoluzione di un caso d'uso, tenendo traccia dei prodotti che ti servono e formulando le principali ipotesi sull'utilizzo.
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 15.000 chiamate API di rilevamento etichette Cloud Vision al mese
2. 100 GiB di spazio di archiviazione al mese
3. Una CPU da 1,25 GiB
4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub
27,36 $
Document AI
Cloud Storage
BigQuery
Cloud Functions
1. 1000 chiamate API di analizzatore sintattico di moduli Document AI al mese
2. 100 GiB di spazio di archiviazione al mese
3. 1 TiB di query al mese
4. RAM: 512 MB, CPU: 800 MHz
71,87 $
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 15.000 chiamate API di OCR Cloud Vision al mese
2. 100 GiB di spazio di archiviazione al mese
3. Una CPU da 1,25 GiB
4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub
27,36 $
Visualizza i dettagli completi dei prezzi delle unità per Document AI, API Vision e AutoML.