Quantitative Ansätze zur Untersuchung des frühneuzeitlichen Dramas

Luca Giovannini

Universität Potsdam  Universität Padua

X. DHd-Tagung: Quo vadis, DH?

Passau, 18. Februar 2024

Überblick

  1. Forschungsfrage
  2. Vorgehensweise
  3. Korpus
  4. Methodologie
  5. Experimente
  6. Diskussion

Folien: plu.sh/dhd24

1. Forschungsfrage

Eine literaturwissenschaftliche Frage:

Wie hat sich die Struktur des europäischen Dramas im Lauf der frühen Neuzeit entwickelt?

Forschungslücke

 Laut Küpper (2018): fehlende komparatistische Perspektive auf den Entwicklungsprozess der dramatischen Gattung

Ausgangspunkt

Franco Moretti, "Modern European Literature: A Geographical Sketch" (1994)

Kernbegriff aus der Biologie: Allopatrische Artbildung

(Entstehung neuer Tierarten durch die Bewegung in neuen geografischen Räumen)

Entstehung neuer Literaturformen durch die politische und geografische Verteilung Europas

Während der Frühneuzeit "the stable, common features of European drama are replaced by a rapid succession of major formaI mutations.

 

By the mid seventeenth century, the tragedy of western Europe has branched out in three or four separate versions, where everything has changed: the relationship between word and action, the number of characters, stylistic register, temporal span, plot conventions, spatial movements, verse forms."

(Moretti 2013: 11)

Morettis Sicht auf die Entwicklung der europäischen Tragödie

          1400                    1500                      1600                    1700                    1800

Einheitliches Modell von europäischer Tragödie

(Einfluss von Seneca und mittelalterlichen Theater)

Nationale Varianten

von Drama

... visualisiert

Was ist hier geschehen?

Fragestellungen / Forschungsziele

  • Wie lässt sich diese Theorie über eine "Verzweigung" der europäischen Tragödie im Lauf des 17. Jahrhunderts empirisch überprüfen?

  • Betrifft ein ähnliches Phänomen auch andere dramatische Gattungen der Zeit (v. a. die Komödie)?

  • Inwiefern lässt sich dieser Entwicklungsprozess durch die Methode der computational literary studies (CLS) erforschen?

  1. Aufbau eines Korpus von frühneuzeitlichen Dramen ✔️
  2. Enkodierung und Integrierung in die DraCor-Plattform  ✔️
  3. Berechnung und Vergleich verschiedener Textmetriken✔️
  4. Reihe von Experimenten zur dramatischen Evolution  
  5. Literaturwissenschaftliche Auswertung der Ergebnisse 🔜

2. Vorgehensweise

3. Korpus

  • Bestand: 150 Dramen

  • Zeitraum: 150 Jahre (1561-1710) - die Texte verteilen sich gleichmäßig darüber

  • Sprachen: 🇫🇷 🇮🇹 🇩🇪 🇪🇸 🇬🇧

  • Vorschau des Korpus

Geburtsorte der Autor:innen im Korpus (durch Wikidata,  unvollständig)

Übersicht

Textauswahl und -enkodierung

  1. Anpassung von Texten, die schon in XML oder in anderen elektronischen Formaten verfügbar sind
  2. Eigene Enkodierung von Texten, die nur als Scans verfügbar sind (OCR + ezdrama-Tool)

 

Pipeline:

vgl. Giovannini et al. 2023

  • DraCor (Drama Corpora) ist eine Open-Access-Plattform für Forschung zum europäischen Drama.

  • Derzeit: 17 „programmierbare Korpora“ in 12 verschiedenen Sprachen; mehr als 3000 Texte im XML-TEI-Format.

  • Anwendungen und Werkzeuge für die CLS durch die API (z. B. Berechnung von Netzwerkmetriken und Sprecherverteilung, SPARQL-Suchen auf Linked Open Data usw.)

Homepage: dracor.org

Paper: Fischer et al. 2019

Tour: bit.ly/einfdrac

Integration des Korpus im DraCor-Projekt

Dockerisierung

  • Erstellung einer lokal gehosteten Version der DraCor-Plattform, auf der das eigene Korpus hochgeladen werden kann
  • Dadurch können alle DraCor-Tools auf eigene Texte angewendet werden
  • Dazu: Reproduzierbarkeit der Ergebnisse
  • Vgl. Börner et al. 2023

EmDraCor

v1.0

4. Methodologie

  • Im Umfeld der Stanford Literary Lab entwickelten Konzept (vg. Allison et al. 2011)
  • Die Morphologie eines Werkes (Propp) durch die Messung einzelner textueller Elemente untersuchen
    • Auseinandernehmen einer ästhetischen Form bis zu ihren grundlegenden Elementen
    • Computationelle/quantitative Analyse dieser Komponenten

Quantitativer Formalismus

Woraus besteht ein Drama?

Die "elementare Bausteinen" der Gattung Drama (nach Kretz 2012: 105)

DIALOG

dialogue

(Hauptraum der Informationsvergabe)

der dialogische Charakter ist die "erste äußere Grundlage" eines Dramas (A. W. Schlegel)

FIGUR

character

 

"nicht eine physische Entität, sondern eine literarische Konstruktion" (Pfister)

HANDLUNG

plot

 

"eine Verknüpfung von Begebenheiten" (Lessing)  Fabel (Pfister), sjužet (Formalisten)

Wie kann man diese "elementare Bausteinen" quantifizieren bzw. den Begriff von "Drama" operationalisieren?

Grundansatz:

Netzwerkanalyse

"In der Netzwerkanalyse werden zuvor bestimmte Größen (z. B. Figuren, Autoren, Orte) in ihrer Beziehung zueinander als Netzwerk aus Knotenpunkten (oder Ecken) und Verbindungslinien (auch Kanten, Relationen) untersucht."

(Schumacher 2018, leicht ver.)

Literaturwissenschaftliche Netzwerkanalyse (LiNA)

  • LiNA ermöglicht quantitative Untersuchung von Handlung durch die Herstellung von Charakternetzwerken (vgl. Trilcke 2013, Labatut und Bost 2020)

 

  • "We are not analyzing the actual text of the play, but a strict formalization of it". (Fischer und Skorinkin 2021: 522)
  • Sprachunabhängig

 

  • Strukturorientiert

 

  • Geeignet für massive Textvisualisierung und -analyse (Beispiel)

LiNA für eine komparative Studie des frühneuzeitlichen Dramas

LiNA über die DraCor-Plattform

LiNA ist nicht genug...

  • Netzwerkbasierte Repräsentationen eines Textes sind nützlich, aber limitiert

 

  • Man muss so viel Komponenten eines Dramas wie möglich erfassen, um eine zufriedenstellende Abbildung seiner Struktur zu bieten

Vorbild:

Boris Yarkho (1889-1942)

 

Mitglied der Moskauer Formalistengruppe

 

“a very early forerunner of contemporary research practice in the Digital Humanities”

(Fischer, Akimova, und Orekhov, 2019: 7)

Yarkhos Werke zum Drama

  • "Die Komödien und Tragödien von Corneille. Eine Studie zur Gattungstheorie" (1920-30?)
  • "Sprachverteilung in Fünf-Akt-Tragödien. Eine Frage des Neoklassizismus und der Romantik" (1920-30?)
  • In seinem Hauptwerk Methodik für das genaue Studium der Literatur (2006) enthalten

 

 

 

Berechnung und Betrachtung mehrerer formeller Eigenschaften als Grundlage für die Textanalyse

Operationalisierung

des Begriffes von Drama

Type Features
Network Size; Average clustering coefficient; Density; Average path length; Average degree; Diameter; Maximum degree; Number of edges; Number of connected components; Ratio, average degree to maximum degree; Ratio, maximum degree to number of characters; Weighted degree distribution; Protagonism; Mediateness
Cast and speech Average characters per scene; Average length of character speech; Speech intensity; Gendered speakers; Collective speakers
Size Number of acts; Number of Segments; Word count, whole text; Word count, spoken text; Word count, stage directions; Number of prose lines; Number of verse lines
Plot All-in index; Final scene size; Drama change rate

Kernmethode: Vektorisierung

1. Extraktion/Berechnung einer breiten Palette von Textstatistiken durch die DraCor-API und ad hoc Python-Skripten

2. Verwendung dieser Statistiken zum Aufbau von Vektoren, die die formellen Eigenschaften der Stücke zusammenfassen

num_speakers num_speakers_
groups
density (SNA) avg_degree (SNA) word_count_sp
Musterstück_1 10 2 0.5714 3 16792
Musterstück_2 26 6 0.3422 2 40098

Musterstück_1 = {10, 2, 0.5714, 3, 16792}

Musterstück_2 = {26, 6, 0.3422, 2, 40098}

play embeddings

5. Experimente

  1. Dramen als Punkte in einem Koordinatensystem repräsentieren (durch Dimensionsreduktion, z.B. PCA)
  2. Distanzen berechnen (Euklidisch, Kosinus, usw.)
  3. Cluster identifizieren, die strukturellen Ähnlichkeiten entsprechen sollen

Anwendungsfall der Vektoren

Wenn sich im Verlauf des 17. Jahrhunderts tatsächlich eine fortschreitende formale Differenzierung der Gattung Drama ergab, sollten die Vektoren eine solche Konstellation abbilden:

1561 (Homogeneität)                              1710 (Differentiation)

🇫🇷

🇬🇧

🇪🇸

🇮🇹

🇩🇪

Vorläufige Ergebnisse

  • Es gab tatsächlich eine Zunahme der formalen Vielfalt im Korpus...

  • ... aber keine deutliche Aufteilung auf nationaler Ebene (vgl. Theorie des kulturellen Netzwerks von Küpper / Clubbs theatergrams)

  • Es ist jedoch möglich, quantitative Profile nationaler Theaterliteraturen auf der Grundlage strukturellen Eigenschaften zu erstellen (work-in-progress)

Nachfolge der Evolution einzelner Metriken

Messung der prozentualen Veränderung von Metriken aller Arten über die Korpora

 

Metriktypen: 

Netzwerk

Charaktere

Ausmaß

Handlung

6. Diskussion

  • Kriterien der Korpuszusammenstellung im Hinblick auf das Untersuchungsziel?

 

  • Ausgestaltung und Vergleich der Vektoren?
    • Optionen zur Verkürzung der Vektoren (Featurreduktion)?
    • Auswahl der geeigneten Distanzmaße?

 

  • Bedarf/Nichtbedarf eines Referenzkorpus?
    • Replikationsexperiment mit breiteren DraCor-Korpora (🇫🇷 🇬🇧) schon geplant

Input der Begutachter:innen

Vielen Dank für Ihre Aufmerksamkeit!

📧 giovannini@uni-potsdam.de

plu.sh/dhd2024

Danke an: Henny Sluyter-Gäthje, Daniil Skorinkin

Literatur

Literatur

"Morphological variety needs a broader space than the nation; with more cultural 'niches' for mutations to take root, and later contribute to literary evolution. [...] Discontinuous, fractured, the European space functions as a sort of archipelago of (national) sub-spaces, each of them specializing in one formaI variation" (Moretti 2013: 11-12)