Το Megabreach των 773 εκατομμυρίων Passwords ξεκίνησε χρόνια πριν
infosec

Το Megabreach των 773 εκατομμυρίων Passwords ξεκίνησε χρόνια πριν

Πρόσφατα κυκλοφόρησε η είδηση, ότι σχεδόν 773 εκατομμύρια διευθύνσεις ηλεκτρονικού ταχυδρομείου και 21 εκατομμύρια passwords δημοσιεύθηκαν σε ένα φόρουμ hacking....
Read More
infosec

Instagram influencers ανακτούν τα accounts με τη βοήθεια hackers

Οι Instagram influencers που έχουν δει τους λογαριασμούς τους να χακάρονται και τις προσωπικές τους πληροφορίες να εκτίθενται, λένε ότι...
Read More
infosec

Windows 10: Πώς να διορθώσετε το browsing σφάλμα στο Microsoft Edge

Η τελευταία αναβάθμιση που κυκλοφόρησε από τη Microsoft για τα Windows 10 έφερε ένα πρόβλημα, το οποίο παρατηρείται όταν επιχειρεί...
Read More
infosec

Google Play: Κρυβόταν malware με τη χρήση των αισθητήρων κίνησης

Στην αγορά του Google Play υπάρχουν πολλές κακόβουλες εφαρμογές που δοκιμάζουν κόλπα για να αποφευχθεί η ανίχνευση τους. Για την...
Read More
infosec

Bug του Twitter δημοσίευε τα προσωπικά tweets των χρηστών για 5 χρόνια

Οι χρήστες του Twitter, οι οποίοι χρησιμοποιούν το δημοφιλές κοινωνικό δίκτυο από τις Android συσκευές τους, θα πρέπει να ελέγξουν...
Read More
Latest Posts

Φωτογραφίες παλαιών βιβλίων διαθέσιμες στο Flickr

Εκατομμύρια αρχεία περνούν από το Internet Archive στα Commons του Flickr

Flickr8

Οι αναξιοποίητες φωτογραφίες 600 εκατομμυρίων σελίδων από παλαιά βιβλία που έχει ψηφιοποιήσει ο μη κερδοσκοπικός οργανισμός Internet Archive ανεβαίνουν σταδιακά στο FIickr, με την συμβολή του ακαδημαϊκού Kalev Leetaru. Υπολογίζεται ότι το σάιτ φιλοξενίας φωτογραφιών της Yahoo θα πλημμυρίσει από 12 εκατομμύρια ιστορικές φωτογραφίες από το 1500 έως το 1922 που έχουν περάσει στο public domain και θεωρούνται κοινό κτήμα, χωρίς περιορισμούς στην χρήση τους.

Οι φωτογραφίες προέρχονται από βιβλία δημόσιων βιβλιοθηκών τα οποία επί χρόνια ψηφιοποιούνται από το Internet Archive, εντούτοις καταλήγουν σε μορφή αρχείου PDF ή απλού κειμένου χωρίς δυνατότητα αναζήτησης των φωτογραφιών.

Το λογισμικό του Kalev Leetaru σε αντίθεση με το λογισμικό οπτικής αναγνώρισης χαρακτήρων δεν παρακάμπτει τις φωτογραφίες. Αξιοποιεί μάλιστα την αδυναμία του OCR, υποθέτοντας πως ότι παρακάμπτει είναι φωτογραφία και το αποθηκεύει σε μορφή αρχείου εικόνας Jpeg. Επιπλέον, επιχειρεί να συνοδεύσει τα αρχεία εικόνας με επεξηγηματικό κείμενο υπό μορφή λεζάντας, επιλέγοντας το κείμενο που διάβασε το OCR πριν και μετά την φωτογραφία της σκαναρισμένης σελίδας.

Η οικουμενικότητα του Διαδικτύου

Φιλοδοξία του καθηγητή Leetaru είναι να αξιοποιηθούν οι φωτογραφίες αυτές –2,6 εκατομμύρια από τις οποίες έχουν ήδη «ανέβει» στο FIickr– από τους συντάκτες της Wikipedia για να εμπλουτίσουν το περιεχόμενό της, ιδιαίτερα όταν το λήμμα αφορά σε ιστορικά γεγονότα. Eμφανίζεται δε πρόθυμος να διαθέσει τον κώδικά του  σε βιβλιοθήκες ανά τον κόσμο για να εξάγουν και τις φωτογραφίες από τα βιβλία που επιχειρούν να μετατρέψουν σε ψηφιακή μορφή, μεταφέρει το BBC.

Πάντως, οι χρήστες του FIickr παραπονιούνται ότι από τον Ιούλιο οπότε το Internet Archive έγινε μέλος της υπηρεσίας, οι φωτογραφίες του πλημμύρισαν το σάιτ και εμφανίζονται πολύ συχνά στα αποτελέσματα χωρίς δυνατότητα εξαίρεσης χρήστη.

Πηγή: tovima.gr

Έχετε άποψη; Αφήστε το σχόλιό σας.

Ο συντάκτης σας επιτρέπει να αντιγράψετε το κείμενό του, μόνο εφόσον αναφέρετε την πηγή (SecNews.gr), σαν ηλεκτρονική διεύθυνση (Live URL) του άρθρου.
Updated on by

Reader Interactions

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *