TLA Textkorpus
Einführung
Das Textkorpus ist einer der beiden Kernbestandteile des Thesaurus Linguae Aegyptiae (TLA), der andere sind die Lemmalisten. Das Korpus enthält eine ständig wachsende Anzahl altägyptischer Texte, die in hieroglyphisch-hieratischer oder demotischer Schrift verfasst sind und derzeit von ca. 3.000 v.Chr. bis ca. 300 n.Chr. reichen. (Koptische Texte werden später im Projekt hinzugefügt.)
Die altägyptische Textwelt war kulturell und historisch gesehen recht bemerkenswert. Botschaften von unterschiedlicher Länge und Komplexität wurden auf verschiedenste Objekte aus den unterschiedlichsten Lebensbereichen geschrieben. Es gibt Texte auf tragbaren Gegenständen wie Papyrus, Ostraka (d.h. Steinplättchen oder Tonscherben) und (kompletten) Gefäßen sowie Texte auf unbeweglichen Gegenständen wie den Wänden von Tempeln und Gräbern, Obelisken, Statuen usw. Diese verschiedenen Arten von Textträgern, ihre materiellen, formalen und funktionalen Merkmale, tragen zu einer zusätzlichen Bedeutung bei, die diejenige der geschriebenen Texte konnotiert.
Angesichts dieser engen Wechselbeziehung und semantischen Interaktion zwischen geschriebenen Texten und ihren Textträgern muss ein besseres Verständnis der altägyptischen Weltanschauung anhand von Texten sowohl die textlichen als auch die materiellen Merkmale von Textobjekten systematisch in Betracht ziehen. Aus diesem Grund sind alle Texte im Textkorpus mit einer Vielzahl von Metadaten versehen, die sich sowohl auf die Texte selbst als auch auf ihre Textträger beziehen. Es war immer ein Ziel des Akademienprojekts, ein mehr oder weniger ausgewogenes, vielfältiges Korpus zu entwickeln, d.h. eine repräsentative Bandbreite an textlicher und chronologischer Variation im Korpus abzudecken. Derzeit umfasst das Textkorpus etwa 1,58 Mill. Lemma-Instanzen (Hieroglyphen/Hieratisch: 1.247 Tsd., Demotisch: 330 Tsd.).
Außerdem werden die Texte im TLA nicht primär als abstrakte Texte (z.B. Sinuhe), sondern als (semantisch kohärente) Textkette auf einem konkreten Textträger (z.B. Papyrus Berlin ÄM P 3022) konzeptualisiert.
Details
Jeder geschriebene Text und Satz sowie jedes Textobjekt (Textträger) im Korpus hat seine eigene eindeutige, stabile ID-Nummer, z.B. „MORHQGR3SNBI3KHAF6YOW5WLL4‟. Die grundlegende Ebene eines Textes ist seine ägyptologische Transkription. Ein wachsender Teil des Subkorpus der hieroglyphisch-hieratischen Texte ist auch mit einer digitalen hieroglyphischen Transliteration im JSesh-spezifischen Manuel de Codage und, soweit möglich, in Unicode versehen (bei Sätzen noch nicht im TLA sichtbar). Alle Texte enthalten außerdem eine Übersetzung in eine moderne Wissenschaftssprache (meist Deutsch, teils Englisch oder Französisch, je nach den Sprachkenntnissen der Autor:innen). Texte können außerdem kommentierende Anmerkungen enthalten.
Text-Metadaten und Textobjekt-Metadaten
Texte und Textobjekte werden systematisch mit zusätzlichen Metadaten versehen, die nicht im Text oder Textobjekt selbst immanent sind. Um die Datenabfrage zu verbessern, werden mögliche Werte von Metadaten in kontrollierten Vokabularen (Thesauri) bearbeitet. Kategorien von Daten und Metadaten, die sich auf Texte und Textobjekte beziehen, sind in der folgenden Tabelle aufgeführt:
Textdaten und Metadaten | Textobjekt-Metadaten | |
---|---|---|
Ägyptologische Transkription | ||
(digitale) Hieroglyphentransliteration | ||
Übersetzung (Deutsch, Englisch oder Französisch) | ||
Schriftart (Hieroglyphisch, Hieratisch, Demotisch) | ||
Sprache (Phase) (Altägyptisch, Mittelägyptisch, usw.) | ||
Datierung des Textzeugen | Datierung der Textproduktion | |
Textkategorie/Typ | Art des Textobjekts | |
Komponente | ||
Akteur einer sozialen Handlung | ||
Material | ||
Abmessungen | ||
Erhaltungszustand | ||
Herstellungsart | ||
archäologischer Kontext | ||
kultureller Kontext | ||
Fundort | ||
aktueller Standort | ||
bibliographische Referenzen | bibliographische Referenzen |
„Texte‟ und „Subtexte‟ im TLA
Ein ‚Text‛ im weiteren Sinne, wie er im TLA konzeptualisiert wird, ist eine Einheit, die durch deutlich markierte Textbegrenzer (Anfang und Ende) als unabhängige Texteinheit gekennzeichnet ist. Ein einzelner Text kann entweder nur aus Schrift bestehen oder eine multimodale Komposition aus Schrift und Illustrationen sein. Ein Beispiel für multimodale Texte sind Opferszenen an den Wänden ägyptischer Tempel, die den König gegenüber einer Gottheit zeigen, wobei beide miteinander interagieren. Inschriften, kurze Phrasen oder Sätze, identifizieren die dargestellten Personen oder bieten Informationen über ihre Interaktionen. Solche kurzen Texteinheiten sind zwar formal eigenständige Einheiten, sind aber Teil der größeren Einheit der Szene und werden daher nicht als unabhängige „Texte‟, sondern als abhängige „Subtexte‟ im TLA konzipiert. Ein Merkmal von Subtexten im Vergleich zu Texten im TLA ist, dass eine feste Lesereihenfolge von Subtexten normalerweise nicht eindeutig ermittelt werden kann. Ein weiteres Merkmal ist, dass es bei der Interpretation von Subtexten notwendig ist, parallele Subtexte zu berücksichtigen, z.B. eine Szene als Ganzes.
Allgemeine Grundsätze der Textbearbeitung im TLA
Wie erwähnt, werden ägyptische Texte im TLA in erster Linie als Zeichenketten in ägyptologischer Transkription konzeptualisiert. Die Zählung der Zeilen/Kolumnen folgt im Allgemeinen der Originalquelle (Tag „lc‟, für ‚line[/column] count'). Zusätzlich kann auf übliche Zeilenzählungen in Standardpublikationen von (abstrakten) Texten Bezug genommen werden (Tag „para"). Texte werden in Einheiten von einfachen oder komplexen Sätzen unterteilt. Jeder Satz hat eine eindeutige, stabile ID-Nummer, mit der er zitiert werden kann und sollte, z.B. „TLA Satz IBUBd1NUc4LHaUPIlW0V9mCZyNQ‟.
Jede Wort-Instanz (ggf. auch eine Folge von Wörtern) ist lemmatisiert, d.h. sie ist mit einem Eintrag ('Lemma') in einer der Lemmalisten des TLA verknüpft. Darüber hinaus sind die Lemma-Instanzen in vielen Texten auch mit grammatischen Codes annotiert. Diese kodieren morphologische Flexion, hauptsächlich Flexion, die sichtbar in der Schrift markiert ist (z.B. Genus, Numerus der Substantive), aber manchmal auch Flexion, die in der rein konsonantischen Schrift nicht repräsentiert ist, aber kontextuell aus dem textlichen Zusammenhang rekonstruiert werden kann (z.B. Genus verbi eines unmarkierten sḏm(=f), Numerus eines relativen sḏm.t.n(=f)). Um die grammatische Annotation bis zu einem gewissen Grad unabhängig von immer wieder diskutierten theoretischen Prämissen zu halten, beschränkt sich die Markierung von Tempus/Aspekt/Modus (TAM)-Merkmalen von flektierten Verben strikt auf die sichtbare Flexion, d.h. auf morphologische Merkmale, die in der geschriebenen Form repräsentiert sind. Zum Beispiel wird ein morphologisch unmarkiertes nḥm(=f) einfach als Instanz einer (aktiven oder passiven) „Suffixkonjugations"-Form ohne TAM-Spezifikation annotiert. Die Lemma-Instanzen eines immer größer werdenden Anteils der Texte werden auch in ihrer ursprünglichen hieroglyphischen Schreibweise (oder, im Falle des Hieratischen, in einer hieroglyphischen Transliteration) angegeben. Die Autor:innen werden außerdem ermutigt, eine bestimmte Bedeutung eines Lemmas im Kontext anzugeben, indem sie entweder eine Bedeutung aus einer Reihe von Übersetzungen aus der Lemmaliste auswählen oder selbst eine andere spezifische Bedeutung eingeben. Zusätzlich zu diesen Standard-Annotationen können die Eingebenden weitere Annotationen hinzufügen, wie z.B. andere semantische Merkmale (z.B. Art des Sprechakts), Layout-Merkmale (z.B. Rubra, Verspunkte, geteilte Spalten, Listen), semantische Merkmale (z.B. metaphorische Domänen), usw.
Der Inhalt des Textkorpus
Eine komplette Übersicht über den Textobjekt-Baum des TLA finden Sie hier [PDF, 1.200 Seiten mit Links].
Im Folgenden finden sie eine händisch erstellte, nach Textdatierungen unterteilte Aufstellung. Teilkorpora mit digitaler Hieroglyphen-Transliteration sind mit [H] gekennzeichnet, solche mit grammatischer Annotation mit [G].
-
Texte aus der frühdynastischen Periode
- Königliche und nicht-königliche Texte [H; G] (M. Rathenow, J. Schneider, G. Sperveslage)
-
Texte aus dem Alten Reich
- Archivalische Texte [G] (S. Grunert, I. Hafemann, S. Seidlmayer)
- Historisch-biographische Texte [teilweise H; G] (A. Burkhardt, R. Díaz Hernández, S. Grunert, J. Stauder-Porchet)
- Briefe [G] (I. Hafemann)
- Briefe an die Toten [G] (I. Hafemann)
- Erweitert v19: Nicht-königliche Gräber [teilweise H; G] (A. Burkhardt, S. Grunert, E. Windus-Staginsky)
- Neu v19: Qubbet el-Hawa [G] (R. Díaz Hernández)
- Felsinschriften [G] (I. Hafemann, G. Sperveslage)
- Pyramidentexte [teilweise H; G] (D. Topmann)
- Votivinschriften [G] (S.J. Seidlmayer)
-
Texte aus der Ersten Zwischenzeit
- Briefe [G] (I. Hafemann)
- Briefe an die Toten [G] (I. Hafemann)
- Pyramidentexte [teilweise H; G] (D. Topmann)
-
Texte aus dem Mittleren Reich
- Würfelhocker [H] (R. Díaz Hernández)
- Historisch-biografische Texte [teilweise H; G] (M. Brose, P. Dils, R. Landgráfová, L. Popko, A. Schütze)
- Neu v19: Heqaib-Heiligtum [G] (I. Hafemann)
- Briefe [G] (I. Hafemann)
- Literarische Texte [teilweise H; G] (P. Dils, R. Enmarch, F. Feder, H. Felber, V. Lepper, L. Popko)
- Magische Texte [H; G] (A. Blöbaum, P. Dils, L. Popko, K. Stegbauer)
- Medizinische Texte [H; G] (P. Dils, I. Köhler, L. Popko, G. Sperveslage)
- Private Stelen [H; G] (S. Beck)
- Religiöse Texte: Hymnen [H; G] (P. Dils, A. Schütze)
-
Texte aus der Zweiten Zwischenzeit
- Briefe [G] (I. Hafemann)
- Historisch-biografische Texte von königlichen und nicht-königlichen Personen [teilweise H; G] (M. Brose, P. Dils, R. Landgráfová, L. Popko, A. Schütze)
- Literarische Texte [H; G] (P. Dils, L. Popko)
- Private Stelen [H; G] (S. Beck)
-
Texte aus dem Neuen Reich
- Neu v19: Archive: Ostraka des Senenmut [G] (A. Burkhardt & G. Sperveslage)
- Verwaltungstexte aus Deir el-Medine [H; G] (M. Goecke-Bauer; M. Landrino)
- Würfelhocker [H] (R. Díaz Hernández)
- Totenbuch [teilweise H] (B. Backes, J. Iskander)
- Briefe [teilweise H; G] (I. Hafemann)
- Literarische Texte [H; G] (M. Brose, P. Dils, F. Feder, H. Felber, L. Popko)
- Erweitert v19: Magische Texte [H; G] (A. Blöbaum, M. Brose, P. Dils, L. Popko, K. Stegbauer)
- Medizinische Texte [H; G] (A. Blöbaum, B. Böhm, M. Brose, C. Di Biase-Dyson, P. Dils, A. Herzberg, I. Köhler, L. Popko)
- Neu v19: Unterweltsbücher [teils H; G] (E. Freier, D. Topmann, D.A. Werning)
- Private religiöse Texte [H; G] (K. Dietze)
- Private Stelen [H; G] (S. Beck)
- Stundenritual [H; G] (E. Graefe)
- Erweitert v19: Historisch-biografische Texte der 18. Dynastie [teilweise H; G] (M. Brose, J. Iskander)
- Biographische Texte aus der Ramessidenzeit [H; G] (P. Dils, E. Frood)
- Neu v19: Graffiti und Dipinti [teils H; G] (H. Navratilova)
- Königliche historische und rhetorische Texte aus der Ramessidenzeit [teilweise H; G] (S. Grallert, I. Hafemann, L. Popko)
- Erweitert v19: Texte aus der Amarna-Zeit [teilweise H; G] (D. Ceballos Contreras, I. Hafemann, A. Hornung, G. Sperveslage)
- TT 192, Grab des Cheruef [H; G] (A. Singer)
-
Texte aus der Dritten Zwischenzeit
- Totenbuch [teilweise H] (B. Backes, A. Wüthrich)
- Historisch-biographische Texte [H; G] (R. Díaz Hernández, S. Grallert, G. Sperveslage)
- Briefe [H; G] (I. Hafemann)
- Literarische Texte [H; G] (P. Dils, L. Popko)
- Erweitert v19: Magische Texte [H; G] (A. Blöbaum, M. Brose, P. Dils, L. Popko, K. Stegbauer)
- Stundenritual [H; G] (E. Graefe)
- Texte auf nicht-königlichen Särgen [H; G] (J. Schneider)
-
Texte aus der Spätzeit
- Administrative Texte (G. Vittmann)
- Literarische Texte [teilweise H; G] (P. Dils, L. Popko)
- Medizinische Texte [H; G] (A. Blöbaum, B. Böhm, M. Brose, P. Dils, F. Feder, L. Popko, K. Stegbauer)
- Erweitert v19: Magische Texte [H; G] (A. Blöbaum, B. Böhm, M. Brose, P. Dils, L. Popko, J.-F. Quack, K. Stegbauer)
-
Historisch-biographische Texte
- Erweitert v19: 25.-26. Dynastie [H; G] (A. Blöbaum, R. Díaz Hernández, S. Grallert, J. Schneider, G. Sperveslage)
- 27.-29. Dynastie [H; G] (R. Díaz Hernández, S. Grallert)
- 30. Dynastie [H; G] (S. Grallert)
- Private Stelen (G. Vittmann)
- Stundenritual [H; G] (P. Dils, E. Graefe, K. Griffin)
- Felsinschriften (G. Vittmann)
- Tempelinschriften [H; G] (S. Blaschta)
- Erweitert v19: Texte aus nicht-königlichen Gräbern und auf Särgen und Sarkophagen [teilweise H; teilweise G] (A. Burkhardt, D. Topmann, G. Vittmann, M. Wagner, D.A. Werning)
- Texte aus Tempelbibliotheken [H; G] (F. Feder)
- Totenbuch [H] (A. Wüthrich)
- Theologische und religiöse Texte (varia) [H; G] (N. Hartmann, D.A. Werning)
-
Texte aus der griechisch-römischen Zeit
- Erweitert v19: Administrative Texte (G. Vittmann)
- Totenbuch [H] (B. Backes, A. Wüthrich)
- Rechtliche Texte (G. Vittmann)
- Literarische Texte (G. Vittmann)
- Mathematische Texte (G. Vittmann)
- Erweitert v19: Magische Texte [teilweise H; teilweise G] (A. Blöbaum, B. Böhm, M. Brose, P. Dils, A.-K. Gill, A. Pries, L. Popko, K. Stegbauer, G. Vittmann)
- Medizinische Texte [teilweise H; teilweise G] (A. Blöbaum, B. Böhm, M. Brose, P. Dils, I. Köhler, L. Popko, G. Vittmann)
- Begräbnisliturgien [teilweise H; G] (F. Feder, S. Töpfer)
- Historisch-biographische Texte [H; G] (R. Birk, D. Schäfer, J. Schneider, G. Sperveslage, G. Vittmann)
- Erweitert v19: Objektaufschriften (G. Vittmann)
- Private Stelen [teilweise H; teilweise G] (S. Beck, G. Vittmann)
- Religiöse Texte (M. Moser, M. Stadler, G. Vittmann)
- Felsinschriften (G. Vittmann)
- Königliche Texte [H; G] (R. Birk, D. Schäfer, J. Schneider, G. Sperveslage, G. Vittmann)
- Wissenschaftliche Texte (G. Vittmann)
-
Tempelinschriften
- Assuan, Bigge, Dakka, Deir el-Bahari, Deir el-Medine, Dendur, Opet [teilweise H; teilweise G] (P. Dils, M. Elebaut, A. Paulet, R. Preys)
- Erweitert v19: Dendera [teilweise H; teilweise G] (St. Baumann, P. Dils, A. Pries, A. Rickert, J. Tattko)
- Edfu (Stundenritual) [H, G] (E. Graefe)
- Esna (D. von Recklinghausen)
- Texte auf Särgen und Sarkophagen (G. Vittmann)
- Texte aus Tempelbibliotheken [H; G] (F. Feder)
Liste von TLA-Autor:innen
Eine komplette Liste der Autor:innen finden Sie hier.
Geschichte des hieroglyphisch-hieratischen Textkorpus
Das digitale Textkorpus des TLA wurde im Rahmen des Vorgängerprojekts „Altägyptisches Wörterbuch‟ (AAeW, 1992–2012) an der Berlin-Brandenburgischen Akademie der Wissenschaften initiiert (gefördert durch das Akademienprogramm der Union der deutschen Akademien der Wissenschaften). Die Idee war, im Zeitalter der korpusbasierten computergestützten Lexikographie einen digitalen Nachfolger von A. Ermans & H. Grapows Wörterbuch der aegyptischen Sprache (1926–1931; 1950, 1963) zu schaffen, insbesondere einschließlich der Belegstellen-Bände (1935–1953): (a) ein lemmatisiertes, ausgewogenes digitales Korpus ägyptischer Texte in hieroglyphischer, hieratischer und demotischer Schrift, das (b) ein korpusbasiertes ‚Wörterbuch‛ der altägyptischen Sprache aufbaut.
Um die Lemmaliste weiter zu vervollständigen, wurden auf der Grundlage einer Reihe von Kriterien zusätzliche Texte ausgewählt, die in den TLA aufgenommen werden sollten. Texte, die nicht für das ursprüngliche Wörterbuch-Projekt verwendet worden waren, und Texte, die nach Abschluss des Projekts veröffentlicht oder neu bearbeitet worden waren, wurden bei der Aufnahme bevorzugt. Neuägyptische Texte, die im Rahmen des Projet Ramsès (Liège) kodiert werden sollten, wurden dagegen hinten angestellt. Mit der Vergrößerung des Projektteams und der zunehmenden Unterstützung durch kooperierende Projekte und einzelne Forscher:innen entwickelt sich ein breiteres, ausgewogeneres und vielfältigeres Korpus.
Zukunftsaussichten
Koptisches Textkorpus
Koptisch, die letzte Phase der altägyptischen Sprache, ist noch nicht im TLA-Textkorpus vertreten. Sobald die koptische Lemmaliste im TLA implementiert ist, wird ein Beispielkorpus mit Texten aus allen koptischen Dialekten importiert werden. Dieses wird aus den lemmatisierten digitalen Textdaten stammen, die von Wolf-Peter Funk über viele Jahrzehnte hinweg erstellt wurden. Diese Altdaten wurden von Katrin John (Kooperationsprojekt „Database and Dictionary of Greek Loanwords in Coptic‟, FU Berlin) in ein modernes Kodierungsformat, d.h. Unicode, konvertiert und werden nun für die Einbindung in den TLA aufbereitet.
Sargtexte
In Zusammenarbeit mit Wolfgang Schenkel bereitet das Projekt die Transformation seiner Coffin Text Urtext-Daten (CTURTEXT) vor, damit die Sargtexte in den TLA aufgenommen werden können.