Εφαρμογές Android που πρέπει να απεγκαταστήσετε άμεσα
infosec

Εφαρμογές Android που πρέπει να απεγκαταστήσετε άμεσα

Το Google Play Store, δυστυχώς φιλοξενεί πολλές εφαρμογές adware και clickfraud για συσκευές Android. Μια πρόσφατη έρευνα έριξε φως σε...
Read More
infosec

Τι νέο υπάρχει στην ενημέρωση KB4471332 των Windows 10 1809

Η Microsoft διαθέτει μία ακόμα ενημέρωση για τα Windows 10 1809 (Οκτωβρίου 2018) και αυτή είναι η δεύτερη ενημέρωση που...
Read More
infosec

Hacker εισέβαλε στο DNS του Linux.org!

Hacker κατάφερε να εισβάλλει στο DNS του Linux.org και να κατευθύνει το domain σε άλλο server με αποτέλεσμα να εμφανίζεται...
Read More
infosec

Το Google Plus τερματίζεται νωρίτερα, μετά από νέο σφάλμα που εκθέτει δεδομένα χρηστών

Εβδομάδες μετά την ανακοίνωσή της ότι θα τερματίσει τη λειτουργία του Google Plus, η Google λέει ότι θα επιταχύνει αρκετά...
Read More
infosec

Google+: Νέο data bug επηρέασε 52,5 εκατομμύρια χρήστες!

Το Google+, η social media πλατφόρμα της Google, υπέστη τη δεύτερη παραβίαση δεδομένων μέσα σε τρεις μήνες και ως αποτέλεσμα θα καταργηθεί πλήρως...
Read More
Latest Posts

Dropbox: Text recognition για ευκολότερη εύρεση αρχείων PDF

Δεν υπάρχει τίποτα χειρότερο από το να πρέπει να ψάξει κάνεις μια συγκεκριμένη φράση μέσα σε αρχεία PDF που έχουν “scan-αριστεί” σαν εικόνες. Τώρα όμως το Dropbox έρχεται να λύσει αυτό το πρόβλημα εισάγοντας στην cloud hosting υπηρεσία της ένα νέο αυτοματοποιημένο image recognition tool, που θα αναλύει αυτόματα τα κείμενα που υπάρχουν σε φωτογραφίες και PDF, και θα τα προσθέτει σαν αποτελέσματα στις αναζητήσεις των χρηστών. Σύμφωνα με το Dropbox, αυτή την στιγμή υπάρχουν περισσότερα από 20 δισεκατομμύρια PDF και φωτογραφιών.

dropbox text recognition pdf

Για να βρει την συγκεκριμένη έκφραση που θα ψάχνει ο χρήστης, το μόνο που θα έχει να κάνει θα είναι να την εισάγει στην μηχανή αναζήτησης αρχείων του Dropbox, όπως ακριβώς θα έκανε και σε οποιοδήποτε search engine. Έτσι το Dropbox θα φέρνει σαν αποτέλεσμα όλα τα PDF αρχεία που περιέχουν την συγκεκριμένη λέξη ή φράση. Η εταιρεία δήλωσε ότι αυτό το project είναι το πιο απαιτητικό εγχείρημα που έχει προσπαθήσει να υλοποιήσει μέχρι σήμερα το machine learning τμήμα της.

Τα προβλήματα που συνάντησαν ήταν αρκετά. Ένα από αυτά είναι ότι PDF αρχεία με πολλές σελίδες, αποσπούσαν πολλούς υπολογιστικούς πόρους του συστήματος για πολύ ώρα. Έτσι η ομάδα αποφάσισε να θέσει μια ρύθμιση, που το index του κάθε PDF εκτελείται μόνο για τις 10 πρώτες σελίδες του αρχείου.

Το αυτόματο image recognition θα μπορεί να αναγνωρίσει μόνο την αγγλική γλώσσα, από αρχεία τύπου JPEG, GIF, PNG, TIFF και PDF, που έχουν ανεβεί στο cloud storage του Dropbox. Η νέα υπηρεσία αναμένεται να κυκλοφορήσει σύντομα για τα εταιρικά πακέτα, αλλά δεν είναι γνωστό το ποτέ θα εφαρμοστεί στους απλούς χρήστες. Τέλος η indexing διαδικασία θα γίνει και σε παλιά αρχεία που έχουν ανεβεί στην υπηρεσία πριν την κυκλοφορία του νέου χαρακτηριστικού.

Έχετε άποψη; Αφήστε το σχόλιό σας.

Ο συντάκτης σας επιτρέπει να αντιγράψετε το κείμενό του, μόνο εφόσον αναφέρετε την πηγή (SecNews.gr), σαν ηλεκτρονική διεύθυνση (Live URL) του άρθρου.
Updated on by

Reader Interactions

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *