Blog-Layout

Schopenhauer digital - Crowdsourcing-basierte Transkriptionsplattform

5. Dezember 2022 | Gastbeitrag

Von Agnes Brauer und Michelle Kamolz

Die Frankfurter Universitätsbibliothek Johann Christian Senckenberg (UB JCS) digitalisiert seit etwa 25 Jahren ihren Altbestand und präsentiert diesen in den Digitalen Sammlungen. Mittlerweile haben sich etwa 8 Millionen digitalisierte Seiten angesammelt. Um die Zugänglichkeit und Nutzbarkeit der Digitalisate zu optimieren, werden Drucke einer automatischen Texterkennung (Optical Character Recognition - OCR) unterzogen. Die damit hinterlegten Texte erlauben die Volltextsuche und damit zielgerichtete und intensive Recherchen. Das Verfahren, das bei Drucken schon seit vielen Jahren zuverlässig funktioniert, lässt sich noch nicht adäquat auf handschriftliche Materialien übertragen. Zwar existieren mittlerweile äußerst leistungsfähige Tools, die sehr gute Ergebnisse bei der automatischen Texterkennung von Handschriften (Handwritten Text Recognition - HTR) leisten. Ohne intensive Vor- und Nacharbeiten, für die die Bibliothek nicht im benötigten Umfang Ressourcen zur Verfügung stehen hat, sind die Resultate jedoch (noch) nicht zufriedenstellend. Um diese schiere Masse an Autographen im Bestand dennoch mit guten Volltexten versehen zu können, aktiviert die UB JCS mittels Crowdsourcing eine engagierte Community, die dabei hilft, Transkriptionen zu erzeugen, indem sie die Handschriften der Digitalisate in ein maschinenlesbares Format überträgt. Das Vorgehen, freiwillige Personen in die Bewältigung von Aufgaben einzubeziehen (auch unter der Bezeichnung „Citizen Science“ bekannt), zielt darauf ab, eine Gruppe von Individuen zu akquirieren, die sich aus intrinsischer Motivation als freiwillige Crowdworker zur Verfügung stellen und gemeinsam das Projekt des Cowdsourcers (in diesem Falle die UB JCS mit Unterstützung der Schopenhauer-Gesellschaft) realisieren. Für die Pilotierungsphase wird der im Schopenhauer-Archiv bewahrte, und mittlerweile vollständig digitalisierte Nachlass Arthur Schopenhauers herangezogen. Das Archivzentrum der UB beherbergt diesen sich über 25 Meter erstreckenden Bestand, der eine große Anzahl an heterogenen Materialien enthält. So lassen sich unter der Signatur Na 50 nicht nur Briefe von und an Arthur Schopenhauer, seine persönlichen Dokumente wie die seiner Familienmitglieder, Manuskripte, Tagebücher, Reiseberichte und Fotografien finden, sondern auch die mehrere Hundert Bände umfassende Privatbibliothek, sowie persönliche Gebrauchsgegenstände und eine Porträtsammlung. Im Rahmen des Transkriptionsprojekts können interessierte Freiwillige aus über 1000 handschriftlichen Dokumenten wählen und in einem dafür vorgesehenen Editor Übertragungen der handschriftlichen Seiten vornehmen.

Abbildung: Transkriptionsumgebung der Digitalen Sammlungen der UB

 

Die Übertragung erfolgt in der vereinfachten Auszeichnungssprache Markdown. Dieses in vielen Bereichen etablierte Format hat den Vorteil, einerseits für menschliche Betrachter*innen (noch) gut lesbar zu sein, andererseits aber auch computergestützt verarbeitet werden zu können. Ein Editor mit Buttons für die gängigsten Formatierungen unterstützt die Transkriptor*innen, sodass Kenntnisse des zugrunde liegenden Markups nicht erforderlich sind. In einem redaktionellen Workflow werden die eingereichten Transkriptionen geprüft und freigegeben. Die Redaktion, die neben Mitarbeiter*innen der UB JCS vor allem aus einer Gruppe von internationalen Schopenhauer-Forschern besteht, prüft, ob der erstellte Text den geforderten Qualitätsansprüchen entspricht, korrigiert ggf. und gibt die Transkription frei. Sollte der Text sehr fehlerhaft sein, wird er an die Transkriptor*innen zur weiteren Bearbeitung zurückgegeben. Mit der Freigabe ist der erzeugte Text frei verfügbar. Damit ist nicht nur eine Volltextsuche über die digitalisierten Dokumente möglich: Sukzessive werden die veröffentlichten Transkriptionen semi-automatisiert in das Format TEI/XML, einem Defacto-Standard für die digitale Aufbereitung und Archivierung von Textdaten in den Geisteswissenschaften, überführt und im gerade im Aufbau befindlichen Forschungsdatenrepositorium der Goethe-Universität gesichert. Auf diese Art und Weise werden der Forschung qualitativ hochwertige Daten für vielfältige Nutzungsszenarien zur Verfügung gestellt und langfristig vorgehalten. |


Weitere Informationen und Möglichkeit zur Registrierung und Partizipation: https://sammlungen.ub.uni-frankfurt.de/schopenhauer/transcript


Die Autorinnen:

Agnes Brauer und Michelle Kamolz sind Mitarbeiterinnen im Bereich "Bestandserhaltung und Digitalisierung" der Universitätsbibliothek Johann Christian Senckenberg der Goethe Universität Frankfurt am Main.

19. August 2024
Martin Morgenstern versammelt seine Aufsätze über Schopenhauer in einem neuen Band.
8. Juli 2024
Wie wird Schopenhauer in Brasilien rezipiert? Ein Gespräch zwischen Maria Cacciola und William Massei Jr.
6. Mai 2024
Laura Langone stellt ihr neues Buch "Schopenhauer’s Buddhism: A Historical-Philosophical Inquiry" vor.
25. März 2024
David Bather Woods und Timothy Stoll legen einen umfassenden Sammelband zur Philosophie Schopenhauers vor.
von Matthias Koßler 12. Februar 2024
Die Philosophin Natalie Duţescu spricht über ihren Weg zu Schopenhauer und seine Aktualität.
22. Januar 2024
Barbara Neymeyr legt einen umfassenden Kommentar zu Nietzsches "Schopenhauer als Erzieher" vor.
27. Dezember 2023
Jan Kerkmann stellt seine neu erschienene Habilitationsschrift zum Idealismus bei Berkeley, Kant und Schopenhauer vor.
24. November 2023
Tom Bildstein und Raphael Gebrecht im Gespräch über Kant und Schopenhauer.
6. November 2023
Oliver Brown about the workshop "Mythos and Logos" in Sinaia.
Weitere Beiträge
Share by: