Newsflash

ABBYY heeft besloten de prijzen voor FineReader Europees gelijk te trekken.

Voor ons heeft dat het voordeel dat we een prijsreductie kunnen aankondigen!

FineReader Professional kost vanaf nu 149,- inclusief BTW.

Download de test versie van deze site.

 
FineReader XIX voor Fraktur

Het eerste Omnifont OCR programma voor Fraktur en Oud Europese Geschriften.
ABBYY FineReader XIX is een speciale versie van de bekroonde FineReader software voor het herkennen van “fraktur” of "black letter” teksten uit de periode van 1800 tot 1938.
Het is ontworpen om scans van oude documenten, boeken of papieren om te zetten in teksten, met als doel het digitaal archiveren en publiceren van deze teksten.

De Uitdaging: Oude Teksten Verwerken
Tot voor kort maakten de gelimiteerde technologie en de unieke eigenschappen van de in vele variaties van ouderwetse lettertypes geschreven teksten het moeilijk om het proces van het digitaliseren van deze informatie op de computer te automatiseren. Geraffineerde OCR woordenboeken en taalmodellen die gebruikt werden voor het analyseren en controleren van teksten die in die periode geschreven waren, waren er niet. Systemen die in staat waren deze oude teksten te lezen vereisten vele uren van systematische training om lettertypes en figuren die niet meer gebruikt werden in het hedendaagse afdrukken te herkennen.

“Black letter” lettertypes, ook bekend als “Gebrochene Schriften”, of gebroken schriften, verschenen het eerst op in de 12e eeuw, en evolueerden door de jaren heen tot een bron van gevarieerde afgeleide woorden en lettertypes. De lettersoort Fraktur, dominant in Duitsland, werd gecreëerd in naam van de Duitse Keizer Maximilian en werd spoedig populair in vele delen van Europa. De gemeenschappelijke kenmerken en de eigenaardigheden van het type omvatten de verlengde s en “ligaturen”, samengesmolten letters voor bepaalde lettercombinaties. De frequentie van zijn toepassing maakt het begrijpen van Fraktur essentieel voor het bestuderen van tekst en het ontwikkelen van herkenningstechnologieën voor de periode tussen 1800 en 1938.

De Oplossing: De Eerste Omnifont OCR voor Fraktur.
ABBYY FineReader XIX is eerste omnifont OCR voor Fraktur, die gebruikers een oplossing voor het uitlezen geeft en oude documenten omzet met minimale training en woordenboek-gebruik mogelijk maakt.

Dit wordt bereikt door uiterst intelligente technologie met een specifieke taalkundige studie te combineren:
De OCR systemen werken door een tekstbeeld te analyseren en een hypothese te maken welk letter of woord het beeld vertegenwoordigt. De hypothesen worden in context geanalyseerd en geverifieerd door middel van verfijnde OCR woordenboeken die uit de Language Models (LMs) worden samengesteld. De Language Models (LMs) zijn computerbestanden die de woordenschat van een taal beschrijven. Het probleem is dat de moderne OCR systemen geen LMs voor oudere tekstfonts en oudere tekstspellingen hebben. De oplossing voor Fraktur tekstherkenning werd bereikt door de ontwikkeling van OCR woordenboeken specifiek voor deze tijdspanne. De speciale taalmodellen werden gecreëerd voor vijf Europese talen.

De Fraktur taalmodellen werden gecreëerd met behulp van ABBYY partner, ATAPY Software. Voor dit ontwikkelingsproces, werden 10 verschillende woordenboeken en meer dan 105 boeken, die tussen 1808 en 1930 werden gepubliceerd, geanalyseerd. De taalkundigen herzagen woordvoorraad, identificeerden woorden die door de evolutie van de talen geleidelijk werden geëlimineerd en de correcte paradigmataken voor het synchroniseren van de taalmodellen met het aangewezen grammaticagebruik voor de tijdspanne. Meer dan 500.000 verschillende woorden werden handmatig vergeleken met bestaande FineReader- woordenboeken.

De grammaticale paradigma's en de woordevoluties werden herzien om 159 historische grammaticaparadigma's toe te voegen die van de eigentijdse taalmodellen misten. Modellen van de taal werden vervolgens gecompileerd en getest op een controlegroep van documenten die oude tekst kenmerken testen.

Om Fraktur stijlfonts te herkennen, creëerden de ontwikkelingsteams van ABBYY speciale classificatoren, of alfabetten, geschikt om de Fraktur symbolen te herkennen. Als deel van deze inspanning, verzamelden de ontwikkelteams van ABBYY een basis van het symboolbeeld met een gemiddelde van 2500 symboolsteekproeven voor elk symbool, een nieuw alfabetpatroon, en verzamelden en voerden een basistekst in van de steekproeftest die 31000 pagina's uit verschillende bronnen vertegenwoordigd. Door de steekproeftekst te gebruiken, was de herkenningsmotor "verfijnd" om met de subtiele eigenschappen van het alfabet Fraktur (zoals de ligaturen, of verbonden letters) te werken. Het nieuwe alfabet werd toen toegevoegd aan het systeem FineReader en de interface en werd uitgebreid getest.


 
Fraktur


Gecreeerd in samenwerking met belangrijke archiverende instellingen
ABBYY FineReader XIX werd ook ontwikkeld met de behoeften van universiteiten en onderzoekscentra in het achterhoofd. Het product werd ontwikkeld door een samenwerking met het wereldwijde METAe- Project. METAe is een consortium van bibliotheken en digitaliseringsbedrijven in heel Europa, die samenwerken om tot de METAe Motor te leiden. Dit is een softwarepakket dat specifiek is ontworpen voor het organiseren van de werkstroom van het archiveren en de omzetting van historische materialen zoals boeken, dagboeken, tijdschriften en kranten. ABBYY FineReader XIX zal een zeer belangrijke component verstrekken om wat van Europa’s uiterst belangrijke historische documenten te archiveren. De partners in het METAe- project zijn: Univeristeit van Innsbruck (Oostenrijk), Universiteit van Florence (Italië), Bibliotéque Nationale de France, de Nationale Bibliotheek van Noorwegen, de Freiedrich-Ebert-Stichting (Duitsland), CCS Compacte Computer Systeme (Duitsland), en Cornell Library University (de VS)

 

Specificaties
Systeem vereisten:

 - PC met Intel® Pentium®/Celeron®/ Xeon™, AMD K6/Athlon™ / Duron™ of compatibele bewerker met een minimum van 200 MHz

- Microsoft Windows 2003, Windows XP, Windows 2000, Windows NT 4,0 (SP6 of recenter), Windows Me/98 (aan het werk met gelokaliseerde interface, wordt de overeenkomstige taalsteun vereist)

- 64 MB van de RAM voor Windows 2003/XP/2000/NT4.0; 3,2 Mb van de RAM voor Windows Me/98.

- Microsoft® Internet Explorer 4,0 of hoger (Microsoft® Internet Explorer 5,01 is inbegrepen in het leveringspakket)multiverwerkersysteem

- 230 MB hard-disk ruimte voor typische installatie

- 100% Twain-compatibele scanner, digitale camera, of faxmodem

- Video kaart en monitor (min. resolutie 800x600)

- Toetsenbord, muis of ander inputmechanisme

 

De ondersteunde Input/Beeldtypes

 

-         BMP: zwart/wit, grijs, kleur

-         PCX, DCX: zwart/wit, grijs, kleur

-         JPEG: grijs, kleur

-         JPEG 2000, deel 1: grijs, kleur

-         PNG: zwart/wit, grijs, kleur

-         TIFF: zwart/wit, grijs, kleur, multi-image. (Unpacked, CCITT Group 3, CCITT Group 3 FAX(2D), CCITT Group4, PackBits, JPEG, ZIP)

-         PDF.

 

Document bewaar formaten:    

  • Microsoft®Word XP, 2000, 97, 95
  • RTF
  • TXT
  • Unicode Text
  • Microsoft®Excel XP, 2000, 97, 95
  • HTML 3.2/4.0
  • Unicode HTML 3.2/4.0
  • DBF
  • CSV
  • PDF 3.0/4.0

 

 

 
Copyright 2010 EasyData B.V..