Da hab ich mich doch von diesem Hartmut da verleiten lassen, bei der Dichtungs&Denkungs-Analyse dieser FAZ mitzumachen, um herauszufinden, wie welche große Dichter&Denker-Queen ich denn nun eigentlich so wirke, wenn ich was schriftlich für die Nachwelt hinterlasse, habe also mal das da in den FAZinierenden Apparat getypet:
Ich dachte darüber nach, ließ es dann aber bleiben. Nach einer Weile überlegte ich erneut, entschied mich aber wieder, es nicht zu tun sei besser. Andererseits, so gesehen, mußte es vielleicht doch getan werden. Auch nach scheinbarer Erwägung aller Umstände blieb zunächst ein gewisser Zweifel daran, daß es nicht zu tun auf alle Fälle vorzuziehen sei, den ich bald unterdrückte. Eine Stunde trügerischer Gewißheit verstrich, bis mir aufs Neue die Frage zu schaffen machte, ob nicht aller Überzeugung zum Trotz sehr viel daran liege, daß es doch getan werde. Die Frage plagte mich, und nach etwa einer Stunde ergab ich mich. Aller Zweifel hatte sich zerstreut, und ich erhob mich vom Liegestuhl, um es nun doch endlich hinter mich zu bringen.
Und was behaupten die Genderbender von der FAZ mir dreist ins Gesicht? Johann Wolfgang von Goethe. Goehte? Das klingt doch nicht wie Goethe. Außerdem handelt der Text offenkundig von einem Mann, der kacken muß, und wäre Goethe also vom Sujet her meistens zu banal gewesen.
Die Überschrift ist übrigens der Name der Johann-Wolfgang-Goethe-Gedächtnis-Datei, in der ich das Werk gespeichert habe. Fand ich als Titel irgendwie passend.
10 Kommentare
Die FAZ verrät es zwar nicht, aber ich vermute stark, dass sich ihre „absolut sichere und unbestechliche Messmethode“ auf eine Standardtechnik der Authorship Identification mit Hilfe maschineller Lernverfahren stützt. Solche Techniken funktionieren gut, wenn man einen Text einem von mehreren in Frage kommenden Verfasserinnen zuordnen muss (und weiß, dass die Verfasserin ihren Schreibstil nicht absichtlich verstellt hat) [1].
Aus einem solchen Modell Aussagen der Form „Sie schreiben wie X“ abzuleiten, ist m.E. Humbug. Stilistische Ähnlichkeit zwischen Texten und Autoren ist ein Merkmal, das dem menschlichen Urteil unterliegt, und ich vermute wiederum stark, dass hier noch andere Merkmale eine Rolle spielen, als für automatische Authorship Identification ausreichend sind, nämlich so banale Merkmale wie Buchstaben- und Satzzeichenhäufigkeiten sowie Satz- und Wortlängen.
Ein weiteres Problem ist, dass der FAZ-Stilmatchdienst ein reiner Klassifikator ist und das, was sich da stilistische Ähnlichkeit schimpft, in keinster Weise quantifiziert. Der Begleittext verspricht zwar die Erkenntnis, „ob Sie Stil haben und wenn ja: welchen“, aber so weit ich erkennen kann, kann von „ob“ gerade keine Rede sein: Es kommt immer einer der eingespeicherten großen Namen zurück und nie eine Meldung wie „Ihr Stil ähnelt keinem der uns bekannten Autoren signifikant.“ Auch daher ist es kein Wunder, dass die Ergebnisse beliebig wenig nachvollziehbar werden können: Das System wählt einfach die Autorin, deren Merkmalsvektor von allen noch gerade am nächsten an dem der Textprobe ist.
Zusammenfassend: Was für ein kompletter Bogus und was für ein unsägliches falsches Gefasel im Begleittext.
[1] Interessantes Paper: https://har2009.org/program/attachments/43_brennan_greenstadt_stylometry.pdf
Den Begleittext habe ich mir gar nicht erst gegeben...
Danke für die Ausführungen!
... ein astreiner thomas bernhard, wenn sie (statt der FAZ) MICH fragen, im insistatorisch hesitatorischen wie im repetitorischen 😉 ...
Da steht auch unten geschrieben, dass das auf ""I write like" von Coding Robots" basiert.
Also geheim gehalten wird da nichts.
Danke! Das hatte ich übersehen. Unter http://www.codingrobots.com/blog/2010/07/09/i-write-like/#comment-3337 findet man denn folgende Info:
Ich sehe meine Vermutung bestätigt.
Danke, frau k.
Ein Grund mehr, endlich mal was von diesem ominösen Herrn Bernhard zu lesen, was ich (Schande) bisher noch nicht getan habe.
@ke: Echt valide ist das Verfahren natürlich nicht. Aber bei der Analyse des Schreibstills muss man eben abstriche machen.
Davids Beispiel ist da ganz gut: Goethe würde vielleicht nie über so banales schreiben, aber man kann in seinem "Still" darüber schreiben.
Wenn man sich nur auf die Form bezieht, kann man nicht jede Frage nach der Autorenschaft eines Textes klären.
Wenn aber jemand im Stille von Aristoteles in einem alten Buch schon die Grundlagen der newtenschen Mechanik ausformuliert, wäre das eine Wissenschaftshistorische Senation, trotzdem. Hier muss man immer abwägen. Fällt das alte Buch z. B. weg, dann ist Zweifel angebracht.
Edit: Bzw., fällt das ALTER des Buches weg.
Wenn ich dich richtig verstehe, hältst du mir entgegen, dass Authorship Identification mit dem verwendeten Verfahren durchaus seine Berechtigung hat. Dazu: Ja, das sage ich doch. Nur behaupte ich, dass das entgegen der Behauptung der FAZ wenig bis nichts mit Stil zu tun hat.
"Goethe würde vielleicht nie über so banales schreiben"
Da wäre ich vorsichtig; der Text handelt offenkundig von einem Mann, der im Begriff ist, eine kleine Nähterin zu knallen. Dieses Sujet kennt man von Goethe, wenn auch im Detail anders ausgestaltet.