Firma IBM zamierza pomóc w digitalizacji bogatego zbioru historycznych dokumentów starego kontynentu. Dzięki temu naukowcy i inne osoby będą mogły przeglądać europejskie dokumenty za pośrednictwem Internetu.
W ramach projektu "Improving Access to Text" czyli poprawy dostępu do tekstów, do IBM dołączy kilkanaście bibliotek, uczelni i firm.
Główny program obejmuje odczytanie i zdigitalizowanie tekstów, które w wielu miejscach już wyblakły, a w wielu stosowane były nieużywane dzisiaj czcionki. Z tego właśnie powodu, tradycyjne systemy rozpoznawania tekstów OCR są bardzo powolne. W tym momencie muszą zostać wprowadzone nowe, rozproszone technologie. Według informacji IBM, ich system jest skuteczniejszy o od 25 do 50% od konkurentów. Ponadto system ten jest w stanie uczyć się na własnych błędach. Dodatkowo IBM korzystać będzie z ogromnej rzeszy pomocników online.
Wolontariusze będą teksty te następnie przeglądać po skanowaniu w celu sprawdzenia ich dokładności. Będą oni sprawdzać poprawność odczytania i w razie czego szybko poprawiać błędy.
Źródło: compulenta |