Ekstrak teks dan data dari gambar dan dokumen, ubah konten tidak terstruktur menjadi data terstruktur yang siap untuk penggunaan bisnis, serta dapatkan insight berharga.
Integrasikan fungsionalitas OCR ke dalam aplikasi Anda melalui API.
Pelanggan baru mendapatkan kredit gratis senilai $300 saat mendaftar untuk digunakan pada solusi OCR peringkasan dokumen.
Ringkasan
Google Cloud menawarkan dua jenis OCR: OCR untuk dokumen dan OCR untuk gambar dan video.
Meskipun mereka menggunakan teknologi dasar yang sama, Document AI adalah platform pemahaman dokumen yang dioptimalkan untuk pemrosesan dokumen. Ekstraktor Kustomnya didukung oleh GenAI yang memproses dokumen umum dan khusus domain dengan akurasi yang lebih tinggi dan lebih cepat, tanpa perlu memilih pemroses khusus.
Cloud Vision, biasanya digunakan untuk mendeteksi teks, tulisan tangan, dan berbagai objek dari gambar dan video.
Google Cloud mendukung OCR dengan AI terbaik di kelasnya. Alih-alih sekadar mengenali teks, teknologi ini memahami, mengatur, dan memperkaya data sehingga menghasilkan insight yang siap untuk penggunaan bisnis.
Anda memiliki fleksibilitas untuk memilih antara menggunakan alat-alat OCR sebagai suite terpadu untuk memperoleh efisiensi yang disederhanakan (misalnya Document AI), atau memanggil API relevan yang tersedia langsung di konsol Google Cloud untuk mengintegrasikan fungsionalitas OCR ke dalam aplikasi Anda.
Semua solusi OCR yang disebutkan di atas memberi Anda akses ke model ML terlatih yang dapat langsung di-deploy melalui API atau di-uptrain untuk meningkatkan akurasinya demi kebutuhan spesifik Anda.
Anda juga dapat melatih model kustom dengan AutoML, tanpa perlu keahlian machine learning.
Baca dokumentasi AutoML tentang cara membangun model ML kustom.
Jika Anda ingin menganalisis dokumen atau membangun pipeline pemrosesan dokumen otomatis, gunakan Document AI. Solusi ini menangani seluruh alur kerja, mulai dari memahami dokumen hingga menelusuri, menyimpan, menata, dan mengelola dokumen bersama dengan data yang telah diekstrak, semuanya di satu tempat.
Jika Anda ingin menganalisis dan memproses gambar, gunakan Cloud Vision bersama produk Google Cloud lainnya untuk mendapatkan hasil terbaik. Lihat bagian Penggunaan Umum untuk membaca detail dan panduan memulainya.
Kedua API di atas dapat dicoba secara gratis dengan akun Google Cloud.
Membandingkan penawaran OCR
Penawaran OCR | Paling cocok untuk | Fitur utama | |
---|---|---|---|
| Kasus penggunaan ekstraksi teks umum yang memerlukan latensi rendah dan kapasitas tinggi. | Fitur bawaan seperti pelabelan gambar, deteksi wajah & tempat terkenal, OCR, penelusuran aman. | |
Enterprise Document OCR | Mendigitalkan teks dari dokumen (PDF, dokumen yang dipindai sebagai gambar, atau file Microsoft DocX). | Mengekstrak teks dalam 200+ bahasa dan 50 bahasa tulis tangan. Add-on untuk mengenali formula matematika, gaya, dll. | |
| Workbench Document AI | Mengekstrak, mengklasifikasikan, dan memisahkan dokumen apa pun dengan AI generatif (model dasar) | Pengekstrak Kustom: menggunakan model dasar untuk membuat parser dengan cepat tanpa pelatihan atau pelabelan data yang ekstensif. Pengklasifikasi kustom dan pemisah dokumen untuk pemrosesan yang efisien. |
| Model terlatih | Ekstraksi teks dan kolom dari dokumen khusus domain. |
Kasus penggunaan ekstraksi teks umum yang memerlukan latensi rendah dan kapasitas tinggi.
Fitur bawaan seperti pelabelan gambar, deteksi wajah & tempat terkenal, OCR, penelusuran aman.
Enterprise Document OCR
Mendigitalkan teks dari dokumen (PDF, dokumen yang dipindai sebagai gambar, atau file Microsoft DocX).
Mengekstrak teks dalam 200+ bahasa dan 50 bahasa tulis tangan.
Add-on untuk mengenali formula matematika, gaya, dll.
Workbench Document AI
Mengekstrak, mengklasifikasikan, dan memisahkan dokumen apa pun dengan AI generatif (model dasar)
Pengekstrak Kustom: menggunakan model dasar untuk membuat parser dengan cepat tanpa pelatihan atau pelabelan data yang ekstensif.
Pengklasifikasi kustom dan pemisah dokumen untuk pemrosesan yang efisien.
Cara Kerjanya
Untuk memahami dan memproses dokumen, gunakan Document AI.
Untuk gambar, kami merekomendasikan Cloud Vision.
Keduanya memberi Anda akses ke model ML terlatih yang dapat di-deploy apa adanya melalui API atau di-uptrain. Anda juga dapat melatih model kustom dari awal dengan AutoML, tanpa perlu keahlian ML.
Gratis 1.000 unit pertama setiap bulan bagi pengguna Cloud Vision atau Document OCR. Cobalah dengan panggilan API sederhana.
Demo
Coba Document AI API cukup dengan menarik lalu melepas.
Penggunaan Umum
Dengan dukungan model dasar, Document AI Custom Extractor dapat mengekstrak teks dan data dari dokumen, generik dan khusus domain, secara lebih cepat dan dengan akurasi yang lebih tinggi. Sesuaikan dengan mudah hanya dengan 5-10 dokumen untuk mendapatkan performa yang lebih baik.
Jika Anda ingin melatih model sendiri, beri label otomatis pada set data dengan model dasar untuk mempercepat waktu produksi.
Anda juga dapat memilih untuk menggunakan pemroses khusus terlatih - lihat daftar lengkap pemroses.
Dengan dukungan model dasar, Document AI Custom Extractor dapat mengekstrak teks dan data dari dokumen, generik dan khusus domain, secara lebih cepat dan dengan akurasi yang lebih tinggi. Sesuaikan dengan mudah hanya dengan 5-10 dokumen untuk mendapatkan performa yang lebih baik.
Jika Anda ingin melatih model sendiri, beri label otomatis pada set data dengan model dasar untuk mempercepat waktu produksi.
Anda juga dapat memilih untuk menggunakan pemroses khusus terlatih - lihat daftar lengkap pemroses.
Dengan dukungan AI Generatif, Document AI memberikan akurasi tinggi dalam mengekstrak data dari dokumen dengan berbagai tata letak dan kualitas. Anda dapat menghubungkannya dengan Cloud Storage agar dokumen tidak terstruktur mematuhi persyaratan tingkat perusahaan. BigQuery membantu memproses batch dan menganalisis data yang diekstrak dengan cara apa pun yang Anda inginkan. Dengan Looker, Anda dapat dengan mudah membuat visualisasi berdasarkan tabel BigQuery. Vertex AI Search memungkinkan Anda membuat kueri dan menelusuri dokumen di Cloud Storage, baik secara percakapan maupun tradisional.
Diperlukan waktu 60-90 menit untuk menyiapkan seluruh pipeline seperti yang terlihat, sedangkan bagian Document AI memerlukan waktu 10 menit.
Dengan dukungan AI Generatif, Document AI memberikan akurasi tinggi dalam mengekstrak data dari dokumen dengan berbagai tata letak dan kualitas. Anda dapat menghubungkannya dengan Cloud Storage agar dokumen tidak terstruktur mematuhi persyaratan tingkat perusahaan. BigQuery membantu memproses batch dan menganalisis data yang diekstrak dengan cara apa pun yang Anda inginkan. Dengan Looker, Anda dapat dengan mudah membuat visualisasi berdasarkan tabel BigQuery. Vertex AI Search memungkinkan Anda membuat kueri dan menelusuri dokumen di Cloud Storage, baik secara percakapan maupun tradisional.
Diperlukan waktu 60-90 menit untuk menyiapkan seluruh pipeline seperti yang terlihat, sedangkan bagian Document AI memerlukan waktu 10 menit.
Pemberian tag pada gambar disebut juga pelabelan gambar.
Cloud Vision API dapat mengidentifikasi dan melabeli objek umum, tempat terkenal, lokasi, logo, aktivitas, spesies hewan, produk, dan sebagainya yang ada dalam gambar. Setelah gambar diberi tag dengan label yang terdeteksi, penelusuran, pemrosesan, dan pengelolaan gambar akan diotomatiskan dan menjadi lebih mudah.
Jika Anda memerlukan label khusus yang tertarget, gunakan Cloud AutoML untuk melatih model ML kustom.
Untuk menggunakan teknologi OCR Google di lingkungan lokal, gunakan OCR On-Prem yang tersedia di Cloud Marketplace.
Untuk menjalankan pipeline pemrosesan gambar dasar yang mendeteksi label seperti ditunjukkan di sebelah kanan, biaya bulanan Anda adalah $27,36.
Anda dapat memeriksa asumsi penggunaan yang dibuat untuk memperoleh angka ini di kalkulator harga.
Gratis 1.000 unit pertama setiap bulan.
Pemberian tag pada gambar disebut juga pelabelan gambar.
Cloud Vision API dapat mengidentifikasi dan melabeli objek umum, tempat terkenal, lokasi, logo, aktivitas, spesies hewan, produk, dan sebagainya yang ada dalam gambar. Setelah gambar diberi tag dengan label yang terdeteksi, penelusuran, pemrosesan, dan pengelolaan gambar akan diotomatiskan dan menjadi lebih mudah.
Jika Anda memerlukan label khusus yang tertarget, gunakan Cloud AutoML untuk melatih model ML kustom.
Untuk menggunakan teknologi OCR Google di lingkungan lokal, gunakan OCR On-Prem yang tersedia di Cloud Marketplace.
Untuk menjalankan pipeline pemrosesan gambar dasar yang mendeteksi label seperti ditunjukkan di sebelah kanan, biaya bulanan Anda adalah $27,36.
Anda dapat memeriksa asumsi penggunaan yang dibuat untuk memperoleh angka ini di kalkulator harga.
Gratis 1.000 unit pertama setiap bulan.
Melalui Cloud Vision API, Anda dapat mendeteksi serta mengekstrak teks dan tulisan tangan dari gambar apa pun dalam bermacam bahasa. Produk ini juga memiliki dukungan multi-region sehingga Anda dapat menentukan pemrosesan OCR dan penyimpanan data di tingkat benua.
Anda dapat memilih antara memperoleh hasil segera untuk sejumlah kecil gambar (hingga 16 gambar per permintaan) dan memperoleh hasil belakangan dengan melakukan batch processing terhadap sejumlah besar gambar (hingga 2.000 gambar per permintaan) secara asinkron.
Untuk menjalankan pipeline pemrosesan dasar yang mengekstrak teks dari gambar seperti ditunjukkan di sebelah kanan, biaya bulanan Anda adalah $27,36.
Anda dapat memeriksa asumsi penggunaan yang dibuat untuk memperoleh angka ini di kalkulator harga.
Gratis 1.000 unit pertama setiap bulan.
Melalui Cloud Vision API, Anda dapat mendeteksi serta mengekstrak teks dan tulisan tangan dari gambar apa pun dalam bermacam bahasa. Produk ini juga memiliki dukungan multi-region sehingga Anda dapat menentukan pemrosesan OCR dan penyimpanan data di tingkat benua.
Anda dapat memilih antara memperoleh hasil segera untuk sejumlah kecil gambar (hingga 16 gambar per permintaan) dan memperoleh hasil belakangan dengan melakukan batch processing terhadap sejumlah besar gambar (hingga 2.000 gambar per permintaan) secara asinkron.
Untuk menjalankan pipeline pemrosesan dasar yang mengekstrak teks dari gambar seperti ditunjukkan di sebelah kanan, biaya bulanan Anda adalah $27,36.
Anda dapat memeriksa asumsi penggunaan yang dibuat untuk memperoleh angka ini di kalkulator harga.
Gratis 1.000 unit pertama setiap bulan.
Harga
Berapa biaya untuk kasus penggunaan saya? | Pahami biaya bulanan Anda untuk menyelesaikan sebuah kasus penggunaan, beserta produk yang diperlukan dan asumsi penggunaan utama. | ||
---|---|---|---|
Kasus penggunaan | Produk yang digunakan | Asumsi penggunaan | Estimasi biaya bulanan (USD) |
Pemrosesan, penelusuran, dan pemberian tag pada gambar | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 15.000 panggilan API deteksi label Cloud Vision setiap bulan 2. 100 GiB penyimpanan bulanan 3. Satu CPU 1,25 GiB 4. Empat GiB dipublikasikan setiap hari melalui Pub/Sub | $27,36 |
Mengekstrak teks dan insight dari dokumen | Document AI Cloud Storage BigQuery Cloud Functions | 1. 1.000 panggilan API form parser Document AI setiap bulan 2. 100 GiB penyimpanan bulanan 3. 1 TiB kueri bulanan 4. RAM: 512 MB, CPU: 800 MHz | $71,87 |
Mengekstrak teks dari gambar | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 15.000 panggilan API OCR Cloud Vision setiap bulan 2. 100 GiB penyimpanan bulanan 3. Satu CPU 1,25 GiB 4. Empat GiB dipublikasikan setiap hari melalui Pub/Sub | $27,36 |
Lihat detail lengkap penghitungan harga unit untuk Document AI, Vision API, dan AutoML.
Berapa biaya untuk kasus penggunaan saya?
Pahami biaya bulanan Anda untuk menyelesaikan sebuah kasus penggunaan, beserta produk yang diperlukan dan asumsi penggunaan utama.
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 15.000 panggilan API deteksi label Cloud Vision setiap bulan
2. 100 GiB penyimpanan bulanan
3. Satu CPU 1,25 GiB
4. Empat GiB dipublikasikan setiap hari melalui Pub/Sub
$27,36
Document AI
Cloud Storage
BigQuery
Cloud Functions
1. 1.000 panggilan API form parser Document AI setiap bulan
2. 100 GiB penyimpanan bulanan
3. 1 TiB kueri bulanan
4. RAM: 512 MB, CPU: 800 MHz
$71,87
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 15.000 panggilan API OCR Cloud Vision setiap bulan
2. 100 GiB penyimpanan bulanan
3. Satu CPU 1,25 GiB
4. Empat GiB dipublikasikan setiap hari melalui Pub/Sub
$27,36
Lihat detail lengkap penghitungan harga unit untuk Document AI, Vision API, dan AutoML.