Sahanya

Texte mit Captcha digitalisieren

Die beste OCR-Software versagt bei schwer leserlichen Texten. Um deren Digitalisierung trotzdem zu realisieren hilft u. a. die Software reCAPTCHA. Durch diese helfen “Benutzer” von einem sogenannten Captcha (meist unwissentlich) mit das Intenet Archiv (hier werden Bücher digitalisiert, deren Urheberschutz erloschen ist) und alte Ausgaben der New York Times zu digitalisieren.

Damit das funktioniert müssen Website-Betreiber das reCAPTCHA auf ihrer Seite integrieren. Zur Zeit sind dies ca. 450.000 – mit dabei z. B. auch Facebook. Dabei werden unleserliche Wörter in Form eines Captchas gleichzeitig an mehrere Seiten gesendet, so dass lt. der Betreiber eine Treffsicherheit von über 96% erzielt wird, denn im Gegensatz zu einem “richtigen” Captcha ist die “Lösung” vorher ja nicht bekannt.

Für WordPress gibt es sogar ein Plugin um reCAPTCHA zu nutzen.

Via Zeit Online

 — 

Der Beitrag "Texte mit Captcha digitalisieren" wurde von Sahanya am 14. August 2008 um 22:18 verfasst und unter folgenden Kategorien einsortiert: literarisch.

Kommentieren:

Kommentarlinks könnten nofollow frei sein.

Newsfeed abonnieren

Newsfeed abonnieren Abonniere den Newsfeed um immer auf dem Laufenden zu bleiben.

Lilypie Dritter Ticker

Lilypie Erster Geburtstag Ticker

Twitpic

Kategorien

Lesestoff

Frank Schätzing: Limit

Werbung

Weitere Projekte

Eigenwerbung

WordPress - Das Praxisbuch: WordPress von A bis Z beherrschen-Themen anwenden und bearbeiten- inkl, CD-ROM mit WordPress 2.9, Plugins, Themes, Beispielmaterialien

Werkzeuge fürs Web – Nützliche Werkzeuge für Webdesigner, Webentwickler, Blogger und Online-Redakteure

WeWordPress: Das Einsteigerseminar, 2. Aufl.

Workshop bei akademie.de

Artikel bei akademie.de

Links

Im Web

XING

Thordis Bonfranchi-Simovics Facebook-Profil

@FrauBluemel ne, da lache ich nicht, da läuft mir das Wasser im Mund zusammen, habe aber nur Melone da, das ist irgendwie nicht das gleiche

Blip

formspring.me