Διαφήμιση
( 0 ψήφοι )

Google Docs OCR

Η Google εμπλουτίζει τη δυνατότητα αναγνώρισης κειμένου, που εισήγαγε τον περασμένο Ιούνιο, προσθέτοντας 29 γλώσσες, μεταξύ των οποίων και η ελληνική.

Ο χρήστης μπορεί να ανεβάζει στα Google Docs εικόνες ή αρχεία PDF, που παράγονται από σαρωτή ή φωτογραφική μηχανή. Το λογισμικό Optical Character Recognition (οπτική αναγνώριση χαρακτήρων - OCR) αναλαμβάνει να μετατρέψει την εικόνα σε επεξεργάσιμο κείμενο, διατηρώντας κάποια στοιχεία από την αρχική του μορφοποίηση.

Η Google διατείνεται ότι προέβη σε αυτή την κίνηση εξαιτίας της ένθερμης υποστήριξης της υπηρεσίας αναγνώρισης κειμένου, που δέχθηκε από τους χρήστες και κυρίως λόγω των αιτημάτων τους για την προσθήκη υποστήριξης περισσότερων γλωσσών. Πλέον η υπηρεσία υποστηρίζει συνολικά 34 γλώσσες, συμπεριλαμβανομένων των Ελληνικών, των Ρώσικων και της απλοποιημένης Κινεζικής γλώσσας.

Επίσης ο αλγόριθμός αναγνώρισης παρουσιάζεται βελτιωμένος για τις γλώσσες που υποστηρίζονταν εξ αρχής (Αγγλικά, Ιταλικά, Γαλλικά, Γερμανικά, Ισπανικά), ενώ βελτίωση έχει γίνει στη διατήρηση στοιχείων μορφοποίησης όπως η διάταξη και η γραμματοσειρά.

Η υπηρεσία λειτουργεί με απλό τρόπο, ανεβάζοντας εικόνες (*.jpg, *.png, *.gif) ή αρχεία PDF στην υπηρεσία Google Docs, δηλώνοντας τη γλώσσα του κειμένου που υπάρχει στο αρχείο και πατώντας το κουμπί "Start upload". Η ποιότητα του αποτελέσματος είναι τόσο καλύτερη, όσο πιο ευκρινής είναι η εικόνα που ανεβάζει ο χρήστης στο Google Docs. Το μέγεθος των αρχείων που ανεβάζει ο χρήστης για την επεξεργασία με το λογισμικό αναγνώρισης χαρακτήρων, μπορεί να είναι μέχρι 2 MByte, ενώ το OCR επεξεργάζεται μόνο τις πρώτες 10 σελίδες αρχείων PDF.

 

02/03/2011 - ipo / adslgr.com με πηγή από googledocs.blogspot.com

δημοψήφισμα

Νέα επικαιρότητας: Ποιότητα ή ποσότητα;