{"id":2128,"date":"2013-08-19T20:09:17","date_gmt":"2013-08-19T18:09:17","guid":{"rendered":"http:\/\/dhd-blog.org\/?p=2128"},"modified":"2013-08-19T20:09:17","modified_gmt":"2013-08-19T18:09:17","slug":"kleiner-versuch-uber-romangattungen","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=2128","title":{"rendered":"Kleiner Versuch \u00fcber Romangattungen"},"content":{"rendered":"<p>Ich arbeite an der Erstellung eines Romankorpus, das l\u00e4ngere, deutschsprachige Erz\u00e4hltexte von 1500 bis 1930 versammelt. Das Kernkorpus umfasst ca. 450 Romane, gr\u00f6\u00dftenteils deutschsprachige Originalromane, aber rd. 1\/8 sind \u00dcbersetzungen, vor allem aus dem Englischen, Franz\u00f6sischen und Russischen. Hinzu kommt ein gr\u00f6\u00dferes Korpus von zur Zeit rd. 1500 Texten (diese Zahl ist wirklich nur eine Sch\u00e4tzung, da die Texte noch zu sichten sind). Das Kernkorpus soll mit relativ ausf\u00fchrlichen Metadaten, etwa Druckort, Verlag, Originalsprache, Erz\u00e4hlform, Epoche und eben auch zur Gattung versehen werden. Die meisten dieser Angaben sind unproblematisch, Erz\u00e4hlform und Gattung sind es nicht. Schon die Kategorisierung eines l\u00e4ngeren Prosatextes als Roman erweist sich als als andere als trivial, aber darum soll er hier nicht gehen. Sondern hier handelt es sich um die Frage nach Formen der Roman, nach den Gattungen der Gattung Roman.<\/p>\n<p>Ein erster L\u00f6sungsversuch sah so aus: Da ich vermeiden wollte, dass die Gattungszuschreibungen ad hoc von mir vergeben werden, habe ich eine Hilfskraft beauftragt, aus einer Liste von Roman-Nachschlagewerken und Literaturgeschichten die Zuschreibungen herauszusuchen und ohne Vereinheitlichung zu notieren. Das Ergebnis war recht interessant (besten Dank Herr Weimer!). Da gab es Eintr\u00e4ge wie \u201eBriefroman::K\u00fcnstler- und Liebesroman in Briefform::monologischer Briefroman\u201c (die Doppelpunkte trennen verschiedene Zuschreibungen) oder \u201eEntwicklungsroman mit autobiographischen Z\u00fcgen::Schelmenhafter Zeit- und Entwicklungsroman::Entwicklungs- und Zeitroman::Schelmenroman\u201c oder \u201eFamilienroman::moralisch-didaktischer Roman::Ich-Erz\u00e4hlung::Briefroman::aufkl\u00e4rerisch-b\u00fcrgerlicher Roman\u201c. Man kann dahinter ohne Probleme den Werther, den Simplizismus oder die Schwedische Gr\u00e4fin erkennen.<\/p>\n<p>Allerdings ist ein Begriff wie &#8218;monologischer Briefroman&#8216; wohl keine Gattungsbezeichnung, vielmehr wird die Gattungsbezeichnung &#8218;Briefroman&#8216; gemeinsam mit dem deskriptiven &#8218;monologisch&#8216; zur Beschreibung verwendet. Viele der Begriffe scheinen eng verwandt zu sein, z.B. \u201eZeitroman::Gegenwartsroman::Gesellschaftsroman\u201c. Dann finden sich Begriffe wie \u201eGro\u00dfroman\u201c oder \u201eAltersroman\u201c, die \u00fcberhaupt keine Gattungsbegriffe im herk\u00f6mmlichen Sinne sind, sondern lediglich klassifizieren und dabei manchmal auch bewerten. Leider zeigte sich au\u00dferdem, dass nur rd. 250 der Texte auf diese Weise beschrieben werden konnten; f\u00fcr die anderen 150 fanden sich in den Darstellungen keine Gattungsbezeichnungen.<\/p>\n<p>Der n\u00e4chste Schritt war die Vereinheitlichung der so zusammengetragenen Begriffe. Um f\u00fcr eine quantitative Auswertung brauchbar zu sein, geht es weniger um eine individualisierte Beschreibung des Einzelwerks, sondern um die Zuschreibung zu allgemeineren Kategorien, die es dann erlauben zu pr\u00fcfen, ob man mit dieser Gruppe regelhaft Textmerkmale verbinden kann. F\u00fcr diese Vereinheitlichung, aber auch f\u00fcr die Frage nach der Klassifizierung der \u00fcbrigen 150 Texte w\u00e4re es n\u00fctzlich auf eine existierende Systematik von Gattungsbegriffen zur\u00fcckgreifen zu k\u00f6nnen. Die literaturwissenschaftliche Forschung scheint diese Frage bislang nicht systematisch verfolgt zu haben.<\/p>\n<p>Eine erste Ann\u00e4herung k\u00f6nnte \u00fcber die Verwendung des Begriffs Roman in Zusammensetzungen geschehen. Daf\u00fcr w\u00e4re eine Liste aller Komposita mit dem Wort &#8218;Roman&#8216; ein guter Anfang. Die gr\u00f6\u00dfte Menge an zug\u00e4nglichen Sprachdaten bietet zur Zeit Google mit den Quellen f\u00fcr die N-Gramm-Suche. F\u00fcr die Romankomposita habe ich die <a href=\"http:\/\/storage.googleapis.com\/books\/ngrams\/books\/datasetsv2.html\">1-gram<\/a>s verwendet (Version 20120701). Die Daten liegen in dieser Form vor: \u201eQuasselbude_NOUN 1956 11 10\u201c, wobei die Angabe der Wortklasse, die erst in der <a title=\"Lin et.al. 2012\" href=\"http:\/\/aclweb.org\/anthology-new\/P\/P12\/P12-3029.pdf\" target=\"_blank\">zweiten Version des Korpus <\/a>hinzugekommen ist, nur teilweise vorliegt. Die erste Zahl bezeichnet das Jahr, die zweite die Anzahl der Vorkommen des Wortes und die dritte die Anzahl der B\u00e4nde, in denen das Wort vorkommt.<\/p>\n<p>Nach der Extraktion der Komposita, der Vereinfachung des Materials auf den Nominativ und einer manuellen Sichtung ergab dies eine Liste mit rd. 424 Eintr\u00e4gen vom \u201eAlltagsroman\u201c \u00fcber den \u201eHaremsroman\u201c und den \u201eNichtroman\u201c bis zum \u201eZigeunerroman\u201c. Zu jedem Begriff gibt es au\u00dferdem eine Frequenzangabe (H\u00e4ufigkeit im ganzen Korpus). Die Zahl 424 ist cum grano salis zu nehmen, da man einige Eintr\u00e4ge zusammenfassen konnte, z.B. \u201eDebutroman\u201c und \u201eDeb\u00fctroman\u201c oder \u201eDesillusionierungsroman\u201c und \u201eDesillusionsroman\u201c oder sogar \u201eGegenwartroman\u201c und \u201eGegenwartsroman\u201c.<\/p>\n<p>Diese Liste ergibt keine Liste der Gattungsbezeichnungen und trotz ihrer L\u00e4nge schon gar nicht eine vollst\u00e4ndige. Einige der Begriffe sind keine Gattungsbezeichnungen, wenn man darunter \u201edie als ge- und bewu\u00dfte Normen die Produktion und Rezeption von Texten bestimmenden &#8218;historischen Textgruppen&#8217;\u201c versteht (Klaus Hempfer: \u201eGattung\u201c in: Klaus Weimar (Hg.): Reallexikon der deutschen Literaturwissenschaft Bd. 1, de Gruyter 1997, S. 651 ), sondern haben eine andere Funktion, z.B. \u201eDeb\u00fctroman\u201c,\u201cEmigrationsroman\u201c,\u201cHauptroman\u201c oder \u201eLieblingsroman\u201c. Einige beziehen sich au\u00dferdem auf einen einzigen Text (z.B. \u201eRosenroman\u201c oder \u201eJosephsroman\u201c). Die Liste enth\u00e4lt also Begriffe, die keine Gattungsnamen sind und andererseits gibt es noch mehr Bezeichnungen f\u00fcr Gattungen, die aber nicht als Kompositum aufgebaut sind, n\u00e4mlich in der Verbindung von ADJ + NOUN, also z.B. \u201esozialer Roman\u201c, \u201epsychologischer Roman\u201c, \u201ephilosophischer Roman\u201c usw. Diese sind in der ersten Fassung der Liste nicht enthalten.<\/p>\n<p>Mit wenig Aufwand kann man aus den Daten, die ja die Verwendungsh\u00e4ufigkeit der Begriffe enthalten, ein Wordle erstellen, indem man einen Text generiert, der die Begriffe anteilig zu ihrer absoluten H\u00e4ufigkeit enth\u00e4lt. Das Ergebnis sieht so aus:<\/p>\n<p><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2013\/08\/romangattungen1.png\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-2129\" alt=\"romangattungen1\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2013\/08\/romangattungen1.png\" width=\"1852\" height=\"932\" \/><\/a><\/p>\n<p>Leider ist &#8218;Kriminalroman&#8216; so dominant, dass die anderen Begriffe sehr schnell in unlesbarer Kleinschreibung verschwinden. Wenn wir ihn aus dem Bild entfernen, ergibt sich diese informationsreichere \u00dcbersicht:<\/p>\n<p><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2013\/08\/romangattungen2.png\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-2130\" alt=\"romangattungen2\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2013\/08\/romangattungen2.png\" width=\"1836\" height=\"1001\" \/><\/a><\/p>\n<p>Das ist h\u00fcbsch. Und es ist ein erster Schritt auf dem Weg eines \u00dcberblicks \u00fcber die Gattungsbegriffe f\u00fcr den Roman. Aber nat\u00fcrlich hat es nur einen eingeschr\u00e4nkten analytischen Wert. Die Ursachen f\u00fcr die hohe Frequenz eines Worts k\u00f6nnen sehr unterschiedlich sein. Die gro\u00dfe H\u00e4ufigkeit des &#8218;Kriminalromans&#8216; etwa ergibt sich daraus, dass dies eine eingef\u00fchrte paratextuelle Bezeichnung ist, die sich im Text findet (Meinem Wissensstand nach sind Titel und Untertitel Teil des Korpus). Der &#8218;Bildungsroman&#8216; dagegen ist ein Begriff der Beschreibungssprache. Interessant sind Begriffe wie &#8218;Zeitroman&#8216;, die sich am Anfang des 20. Jahrhunderts in einer ganzen Reihe von Romantiteln finden, w\u00e4hrend er gegen Ende des Jahrhunderts h\u00e4ufiger in Texten \u00fcber Romane zu finden ist.<\/p>\n<p>Anders ausgedr\u00fcckt: Die Analyse hat einen ersten Eindruck von der H\u00e4ufigkeitsverteilung von Gattungsbegriffen ergeben, aber wir k\u00f6nnen nicht beurteilen, ob es sich hierbei um Begriffe der Objekt- oder Metasprache handelt. Das Problem k\u00f6nnte man m\u00f6glicherweise l\u00f6sen, wenn man in einem gro\u00dfen Bibliothekskatalog die Untertitel von Romanen systematisch unter der Perspektive auswertet, welche der hier aufgef\u00fchrten Kategorien vorkommen. Das w\u00fcrde dann ihre Verwendung in der Objektsprache belegen. Au\u00dferdem k\u00f6nnte man, ausgehend von den Publikationsdaten der Romane \u00fcberpr\u00fcfen, ob ungef\u00e4hr gleichzeitig die entsprechenden Begriffe gel\u00e4ufig sind, also Romanmetadaten und Ngramm-Daten abgleichen.<\/p>\n<p>Ein weiteres Problem entsteht durch die Heterogenit\u00e4t der Gattungsbegriffe. Selbst wenn man die Begriffe aussondert, die offensichtlich keine Gattungen bezeichnen, bleibt eine F\u00fclle von Begriffen \u00fcbrig, die sich auf sehr unterschiedliche Aspekte beziehen, z.B. der inhaltsbezogene Begriff Abenteuerroman und der referenzbezogene Begriff Schl\u00fcsselroman. In dieser Form sind sie nur eingeschr\u00e4nkt tauglich f\u00fcr die Korrelierung mit den Ergebnissen von Clustering aufgrund von Textmerkmalen. Dieses Problem k\u00f6nnte durch eine genauere Analyse der Gattungsbegriffe gel\u00f6st oder zumindest mal aufger\u00e4umt werden. Und wenn wir schon bei Zukunftspl\u00e4nen sind: Die historische Information, wann welche Gattungsbegriffe h\u00e4ufiger zu finden sind, k\u00f6nnte man auch noch auswerten, aber das ist nicht ganz einfach zu visualisieren. So etwas ist noch zu un\u00fcbersichtlich:<\/p>\n<p><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2013\/08\/romangattungen3.png\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-2131\" alt=\"romangattungen3\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2013\/08\/romangattungen3.png\" width=\"1686\" height=\"547\" \/><\/a><\/p>\n<p>(<a href=\"http:\/\/books.google.com\/ngrams\/graph?content=Bildungsroman,Zeitroman,Entwicklungsroman,Gesellschaftsroman,Staatsroman&amp;year_start=1900&amp;year_end=2008&amp;corpus=20&amp;smoothing=0&amp;share=\">Link<\/a>)<\/p>\n<p>Insgesamt also noch ein weiter Weg zu einem brauchbaren Beschreibungssystem von Romangattungen, aber die Frequenzangaben helfen wohl bereits bei der Vereinfachung der vorliegenden Begriffe. Nun m\u00fcssten noch die 150 anderen Texte zugeordnet werden. Hat jemand <em>Evremont<\/em> von Sophie Bernhardi gelesen und h\u00e4tte einen Vorschlag zur Gattungszuordnung? Oder Bruno Willes <em>Glasberg<\/em>. Henriette von Paalzows <em>Ste. Roche<\/em>?<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ich arbeite an der Erstellung eines Romankorpus, das l\u00e4ngere, deutschsprachige Erz\u00e4hltexte von 1500 bis 1930 versammelt. Das Kernkorpus umfasst ca. 450 Romane, gr\u00f6\u00dftenteils deutschsprachige Originalromane, aber rd. 1\/8 sind \u00dcbersetzungen, vor allem aus dem Englischen, Franz\u00f6sischen und Russischen. Hinzu kommt ein gr\u00f6\u00dferes Korpus von zur Zeit rd. 1500 Texten (diese Zahl ist wirklich nur eine [&hellip;]<\/p>\n","protected":false},"author":68,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,11,23,10],"tags":[],"class_list":["post-2128","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-forschung","category-forschung-methode","category-reflektion"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/2128","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/68"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2128"}],"version-history":[{"count":6,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/2128\/revisions"}],"predecessor-version":[{"id":2137,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/2128\/revisions\/2137"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2128"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2128"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2128"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}