Kanggo ngakses teks sing diekstrak saka gambar nggunakake Google Vision API, sampeyan bisa ngetutake sawetara langkah sing kalebu nggunakake kemampuan Optical Character Recognition (OCR) API. Teknologi OCR ing Google Vision API mbisakake deteksi lan ekstraksi teks saka gambar, kalebu tulisan tangan. Fungsi iki utamané migunani ing aplikasi sing mbutuhake analisis lan pangerten informasi teks sing ana ing data visual.
Kaping pisanan, sampeyan kudu nyiyapake lingkungan sing dibutuhake kanggo nggarap Google Vision API. Iki kalebu nggawe proyek ing Google Cloud Console, mbisakake Vision API, lan entuk kredensial otentikasi sing dibutuhake kayata kunci API utawa kunci akun layanan.
Sawise lingkungan wis disetel, sampeyan bisa nggunakake metode `asyncBatchAnnotateFiles` API Vision kanggo nindakake OCR ing file gambar. Cara iki ngidini sampeyan ngirim dhaptar file gambar kanggo diproses lan nampa asil kanthi ora sinkron. Utawa, sampeyan bisa nggunakake metode `asyncBatchAnnotateImages` kanggo ngolah dhaptar gambar kanthi langsung.
Kanggo ngekstrak teks saka gambar, sampeyan kudu nggawe conto obyek `AnnotateImageRequest` lan nemtokake fitur sing dikarepake. Ing kasus iki, sampeyan bakal nyetel fitur `TEXT_DETECTION` kanggo nuduhake yen sampeyan pengin ngekstrak teks saka gambar. Sampeyan uga bisa nemtokake paramèter tambahan kayata pitunjuk basa kanggo nambah akurasi OCR.
Sabanjure, sampeyan kudu ngodhe file gambar menyang string sing dienkode base64 lan nggawe conto obyek `Gambar` nggunakake data gambar sing dienkode. Objek `Gambar` iki kudu ditambahake menyang obyek `AnnotateImageRequest` sing digawe sadurunge.
Sawise nyiyapake panjalukan, sampeyan bisa ngirim menyang Vision API nggunakake metode `batchAnnotateImages` utawa `batchAnnotateFiles`, gumantung saka pendekatan sing sampeyan pilih. API bakal ngolah gambar lan ngasilake respon sing ngemot teks sing diekstrak.
Kanggo ngakses teks sing diekstrak saka respon, sampeyan bisa ngulang ing lapangan `textAnnotations` saka obyek `AnnotateImageResponse`. Kolom iki ngemot dhaptar obyek `EntityAnnotation`, saben makili unsur teks sing dideteksi ing gambar. Kolom `deskripsi` saben obyek `EntityAnnotation` ngemot teks sing diekstrak.
Iki minangka conto potongan kode ing Python sing nuduhake carane ngakses teks sing diekstrak saka gambar nggunakake Google Vision API:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
Ing conto iki, fungsi `extract_text_from_image` njupuk path menyang file gambar minangka input lan nggunakake perpustakaan klien Google Cloud Vision kanggo ngirim panjalukan kanggo Vision API. Teks sing diekstrak banjur dicithak.
Kanggo ngakses teks sing diekstrak saka gambar nggunakake API Google Vision, sampeyan kudu nyiyapake lingkungan, nggawe obyek `AnnotateImageRequest` kanthi fitur sing dikarepake, encode file gambar, ngirim panjalukan menyang API, lan njupuk teks sing diekstrak. saka respon. Kapabilitas OCR saka Vision API mbisakake deteksi lan ekstraksi teks saka gambar, kalebu tulisan tangan.
Pitakonan lan jawaban anyar liyane babagan Ndeteksi lan ngekstrak teks saka tulisan tangan:
- Watesan apa sing bisa kedadeyan nalika ngekstrak teks saka dokumen rumit nggunakake API Google Vision?
- Apa pentinge tingkat kapercayan ing interpretasi teks Google Vision API?
- Kepiye Google Vision API bisa ngenali lan ngekstrak teks kanthi akurat saka cathetan tulisan tangan?
- Apa tantangan kanggo ndeteksi lan ngekstrak teks saka gambar tulisan tangan?
- Apa Google Vision bisa ngenali tulisan tangan?
Pitakon lan jawaban liyane:
- Lapangan: Kacerdhasan gawéyan
- program: API Visi Google EITC/AI/GVAPI (pindhah menyang program sertifikasi)
- Pawulangan: Pangerten teks ing data visual (pindhah menyang pelajaran sing gegandhengan)
- Topik: Ndeteksi lan ngekstrak teks saka tulisan tangan (pindhah menyang topik sing gegandhengan)
- Review ujian