Prosty skan – OCR dla każdego

Jak za pomocą aparatu i Google Docs skanować teksty.

[more]

Właśnie skończyłem książkę „Subject to change” napisaną przez ludzi z Adaptive Path. Polecam. Zachęciła mnie do dalszej eksploracji.

By zyskać prosty dostęp do bibliografii przetestowałem możliwość jaką od niedawna daje Google Docs. Gdy wrzucasz pdf lub obrazek ze zdjęciem tekstu możesz wyekstraktować z niego tekst. Oto fragment pliku, który wrzuciłem do docsów.

To zwykłe zdjęcie zrobione aparatem Finepix F30 przekonwertowane na czarnobiały jpg. Choć nie wygląda czytelnie, Google świetnie sobie z nim poradziło. Wyczytało:


Brand, Stewart. H ou/ Buildings Learn: What Happens After The-y’fe Built. New York: Penguin, 1995.
Gladwell, The Tipping Point. Boston: Little Brown and company, 2002
Levy, Steven. I nsanely Great: The Life and Times of Macintosh, the Computer That Changed Everything. New York: Penguin, 2000.


Nie poradziło sobie tylko z zagiętym Berkunem. Nieźle.