Im Spotlight von außen: Verliebt in einen Losentscheid
Immer wieder kommt es vor, dass das Debattieren in der Öffentlichkeit auftaucht – und nicht unbedingt breite Wellen im VDCH-Land schlägt oder danach schnell wieder in Vergessenheit gerät. Sven Jentzsch stellt in unserem heutigen Mittwochs-Feature einen solchen Moment vor – und erzählt, wie er sich in einen Losentscheid verliebt hat.
Prolog
Der Ursprung dieser Reihe liegt zwei bis drei Jahre zurück. Meiner trüben Erinnerung nach war es so: Ich wollte auf YouTube nochmal Videos zu „AlphaGo“ anschauen, einer Künstlichen Intelligenz, die erstmals Menschen im legendären japanischen Brettspiel Go schlagen konnte– plötzlich tauchte in den Empfehlungen ein anderes Video auf: Project Debater (Link). Ob es wirklich genauso ablief, weiß ich ehrlich gesprochen nicht mehr genau. Aber das Ergebnis war jedenfalls: Ich stieß plötzlich und unvermittelt auf ein Video über eine KI, die debattieren kann. Falls ihr überrascht seid, ihr habt richtig gelesen: eine KI, die debattieren kann.
Wenn das neu für euch ist, geht es euch exakt wie mir damals. Meine erste Reaktion war: „Wow, warum wusste ich davon nichts?!“ Fairerweise muss man einwenden, dass ich nie sonderlich gut in Debattiertheorie-Gruppen oder der internationalen Szene vernetzt war, da hätte ich sicherlich etwas von „Project Debater“ mitbekommen. Aber trotzdem ist die Resonanz auf diese KI – wenn man sie mit den Schockwellen vergleicht, die „DeepBlue“ 1996/97 in der Schachwelt, und 2016 „AlphaGo“ in der Go-Welt warf – meines Erachtens in unserer Szene doch sehr gering geblieben.
Das halte ich aber wiederum für systematisch für einen weiteren Trend: Dafür, wie vergleichsweise selten unser Sport mal im überraschenden Fokus der Öffentlichkeit bzw. Außenwelt steht, finden die entsprechenden Gelegenheiten erstaunlich wenig Aufmerksamkeit in unserer (deutschsprachigen) Szene selbst. Metaphorisch und lyrisch könnte man sagen: Wir stehen im Scheinwerferlicht und merken es nicht. Das haben einige beispielsweise beklagt, als der Debattierfilm „Contra“ in die Kinos kam– und die erfolgreiche französische Vorlage für „Contra“, „Le Brio“ bzw. „Die brillante Mademoiselle Neïla“, ist uns bis heute weitgehend unbekannt.
Genau dafür soll die kleine, lose Reihe dienen, die Jan-Gunther und ich ins Leben rufen möchten: Wir wollen (und sei es mit großer zeitlicher Verzögerung) auf den Scheinwerferkegel von außen hinweisen. Sei es ein Scheinwerferkegel der Wissenschaft, der Kultur, der Politik oder Gesellschaft. Um es definitorisch noch etwas einzugrenzen: Es soll erstens um Gelegenheiten gehen, die direkt und nicht nur indirekt auf uns Bezug nehmen– also beispielsweise wissenschaftliche Arbeiten über den Debattiersport, nicht welche über Rhetorik oder Debatten allgemein. Es soll zweitens über besondere Momente gehen, die für uns nachhaltig relevant sind– also nicht über jedes Mal, wo wir in der Zeitung stehen oder interviewt werden, eher Ausnahmeereignisse, wie wenn Debattierer bei TV total eingeladen sind (Link).
Unser erstes Fundstück
Es läge jetzt nahe, mit „Project Debater“ diese Reihe zu eröffnen. Oder mit „Contra“; oder gar mit „TV total“. Aber „Project Debater“, vielleicht auch die anderen beiden, möchte ich mir – Achtung, Cliffhanger – für ein anderes Mal aufsparen. Heute soll es dafür „nur“ um einen kleinen, wissenschaftlichen Artikel gehen– der fundamental infrage stellt, was wir im Debattieren überhaupt machen (auch das ist natürlich ein Cliffhanger).
Zunächst einmal Ehre, wem Ehre gebührt: Ich verdanke diesen Fund Julius Klikar und Susanna Wirthgen aus Potsdam, die mich am Rande der DDM 2022 in Wien darauf aufmerksam gemacht und mir den entsprechenden Link im Anschluss zugesendet haben. Internationale Debattierende kennen den Artikel wahrscheinlich bereits auch. Um ihn korrekt zu zitieren: Schwardmann, Peter; Tripodi, Egon; van der Weele, Joël J.: „Self-Persuasion: Evidence from Field Experiments at International Debating Competitions“. In: American Economic Review 112(4), S. 1118-46 (online verfügbar unter: https://doi.org/10.1257/aer.20200372). (Anmerkung: Mir lag er mit meinem Tübinger Bibliotheks-Abonnement nur in Manuskript-Form vor; dadurch weichen meine Zitate ggf. vom originalen Artikel ab.)
Fangen wir mal mit der Einordnung an: Es handelt sich um einen Artikel von drei Wirtschaftswissenschaftlern in einem wirtschaftswissenschaftlichen Journal. Es geht aber um einen persuasiven Effekt, wie er wahrscheinlich vor allem in der Sozialpsychologie untersucht wird.
Den Effekt selbst kennen viele von uns aus dem Debattieren. Im OPD-Jubiläumsband 2021 hatte ich ihn an zwei Stellen wenig wissenschaftlich beschrieben: „So beobachte ich, dass ich mich bisweilen während der Debatte so sehr in meine Rolle steigere, dass ich mich in meine eigene Position verliebe und die Contrameinung gar nicht mehr nachvollziehen kann“ (S. 15); „Die Aufgabe der Teams, die eigene Position glaubhaft und entschlossen zu vertreten, führt nämlich bisweilen zu einem Effekt, den ich als die „Liebesfalle“ bezeichnen würde: Man steigert sich emotional so sehr in die eigene Seite hinein, dass man blind wird für die Gegenargumente. Die Liebesfalle führt dazu, dass man immer größere Auswirkungen (Impacts) aus den eigenen Argumenten herleiten möchte; dass man sich wider besseren Gewissens nicht mit der stärksten Version der Gegenseite auseinandersetzt“ (S. 149). Bei Schwardmann et. al. 2021 heißt es nicht „Liebensfalle“, sondern (zweifelsfrei wissenschaftlicher) „self-persuasion“. Die Autoren definieren diesen Effekt so: „Aufgefordert einen bestimmten Standpunkt zu verteidigen, ändern Personen ihre private Meinung insofern, dass sie diese mit den neuen Argumenten in Einklang bringen“ bzw. „[i]n […] Settings, in denen Versuchspersonen für eine randomisiert zugeteilte Seite eines Falls argumentieren, entwickeln sie selbstverstärkende Ansichten über die vorliegende Evidenz in einer Weise, dass ihre Kompromissbereitschaft eingeschränkt wird“ [m. Übers.] (S.1.).
Die Studie zusammengefasst
Der Artikel von Schardmann et. al. hat 28 Seiten; das Manuskript inklusive Literatur und Anhang sogar 71 Seiten. Meine Zusammenfassung davon ist also notwendigerweise eine Simplifizierung. Gleichzeitig weiß ich, dass einige von euch für lange Achte-Minute-Artikel keinen Nerv haben– in dem Fall überspringt die Beschreibung der Studie, nehmt einfach an, dass sie Selbstpersuasion nachweist und springt zum letzten Abschnitt nach unten, wo es um die Auswirkungen für unsere Szene geht. Für diejenigen, die dranbleiben möchten, hier aber die Studie komprimiert:
STUDIENDESIGN:
- Art: Feldstudie
- Forschungsfrage: Lässt sich der Effekt der Selbstpersuasion auch außerhalb des Labors nachweisen?
- Erhebungsorte: Munich Research Open 2019, Erasmus Rotterdam Open 2019 (beides Präsenz-Turniere), Amsterdam Open 2020, LSE Open 2021 (beides Online-Turniere). Die Forschungsgruppe trat als Großsponsor des jeweiligen Turniers auf und bekam dafür die Erlaubnis für die Erhebungen.
- Versuchspersonen: Untersucht wurden Redner auf den jeweiligen Turnieren; dazu gab es Zusatzmessungen auch mit Jurierenden– insgesamt füllten 473 Debattierer aus 58 Ländern 4854 Fragebögen zu 19 Motions aus. Als Anreiz wurden Geldpreise unter richtigen Antworten bei den Schätz-/Prognoseaufgaben (siehe „abhängige Variablen“) verlost.
- Unabhängige Variable: Die Zuteilung der Redner zur Pro- oder Contraseite.
- Abhängige Variablen: Gemessen wurde die Überzeugtheit von der eigenen Seite auf drei unterschiedliche Weisen: (a) die Einschätzung, ob eine die Pro-Seite der Debatte betreffende Faktenbehauptung wahr sei („factual beliefs“), (b) die Einschätzung, ob das Thema in den Tab-Statistiken reg- oder opp-lastig ausfallen würde („confidence in proposition“) und (c) die Entscheidung, ob man eher einer zur Pro- oder zur Contra-Seite passenden Hilfsorganisation Geld spenden würde (ob da wo die EA-Fraktion am Werke war? 😉 ) („revealed attitudes“).
- Erhebungszeitpunkte: (i) Zu Beginn des Turniers [gemessen wurde dort nur Variable a], (ii) nach der Vorbereitungszeit bzw. vor der Debatte, (iii) nach der Debatte bzw. vor der Ergebnisverkündung.
- Moderatorvariablen: Es wurden noch andere Messungen gemacht, auf die ich unter den Ergebnissen genauer eingehen werde.
ERGEBNISSE:
Im Kern fanden sich Ergebnisse in Übereinstimmung mit einem Effekt von Selbstpersuasion: Für Variablen a und b (sowie für c immerhin bei den Offline-Turnieren) ergab sich nach der Vorbereitungszeit und für alle drei Variablen a, b und c nach der Debatte ein statistisch signifikanter Unterschied zwischen Regierungs- und Oppositionsrednern. Beide Seiten wichen in die jeweilig andere Richtung von den Juroren als neutrale Instanz in der Mitte ab. Dieser Effekt existierte (zumindest für die dort gemessene Variable a) zu Beginn des Turniers noch nicht. Um die Autoren zu zitieren: „Wir finden starke Evidenz für Selbst-Persuasion vor Beginn der Debatte. Erstens glauben Debattierer wahrscheinlicher, dass ein Fakten-Statement wahr ist, wenn es ein Argument für ihre eigene Seite stützt. Zweitens werden Debattierer [nach der Vorbereitungszeit] sicherer über die relative Stärke ihrer Debattierposition […]. In unserer dritten Auswirkungsmessung, einer Geld-Allokationsaufgabe zwischen motionrelevanten Hilfsorganisationen, finden wir nur schwache Evidenz für Selbstpersuasion […]. [Es gibt] sehr ähnliche Selbstpersuasionseffekte nach und vor der Debatte, auch wenn wir kleinere Zu- oder Abnahmen nicht ausschließen können“ [m. Übers.] (S. 2 f.). Kurzgefasst: Es liegt also nahe, dass die Vorbereitungszeit mit zugeteilter Position (und ggf. die Debatte) die Redner ein bisschen überzeugter von der eigenen Seite machte. Nun ist ein statistisch signifikanter Effekt nicht automatisch groß. Zur Einordnung für eine der Variablen: Regierungsredner hatten nach der Vorbereitungszeit im Vergleich zu Oppositionsrednern eine im Schnitt um 7% höhere Einschätzung des Wahrheitsgehalts der (für die Pro-Seite sprechenden) Faktenbehauptungen; nach der Debatte lag die Differenz bei 5%.
Neben dieser Hauptmessung zur These wurden in der Feldstudie noch eine Reihe weitere Messungen angestellt:
- Untersuchung von möglichen Erklärungen: In der Literatur wird Selbstpersuasion einerseits damit erklärt, dass Biases dazu führen, dass einem mehr Argumente für die eigene Seite einfallen. Tatsächlich ergab die Erhebung, dass Debattierer vor der Debatte im Schnitt ein Argument bzw. ein halbes starkes Argument mehr für die eigene Seite als für die Gegenseite nennen konnten (Anmerkung: Das halte ich nach der Vorbereitungszeit ehrlich gesagt aber für kein großes Wunder). Eine weitere Erklärung ist, dass Selbstpersuasion den Vorteil bringe, Selbstzweifel und Nervosität auszuräumen. Passend dazu ließ sich immerhin eine marginal statistisch signifikante Korrelation zwischen der Überzeugtheit von der eigenen Seite und den Einzelrednerpunkten nachweisen.
- Vergleich zu politischer Polarisierung: Zur Einordnung des Effekts wurde verglichen, wie stark die Zuordnung zur Pro- oder Contra-Seite vs. wie stark die politische Präferenz des jeweiligen Debattierers die Outcome-Messungen (a, b, c) beeinflusste. Die politische Präferenz hatte nach der Vorbereitungszeit einen stärkeren Einfluss auf die Wahrnehmung einer Motion als lastig (b), aber einen kleineren und im letzteren Fall sogar statistisch insifnigikanten Effekt auf die Bewertung der Fakten-Statements (a) und die Charity-Aufgabe (c). Der Selbstpersuasionseffekt scheint also mit dem Effekt politischer Polarisierung vergleichbar zu sein.
- Moderatorvariablen: Ein weiterer Untersuchungsschwerpunkt lag darin, zu untersuchen, ob bestimmte Faktoren die Größe des Selbstpersuasionseffekts beeinflussen. Der Effekt schwankte sehr stark je nach Motion/Thema und fiel bei erfahrenen Rednern niedriger aus.
- Sonstiges: Am Rande kamen noch interessante weitere Dinge heraus. Erstens ist ein positiver Lerneffekt während der Debatten erkennbar: Die Gesamtzahl der Argumente, die man zur Motion nennen konnte, nahm im Lauf der Debatte um 20%, die zur Gegenseite um 25% zu. Ferner nahm der Einfluss politischer Polarisierung auf die Variablen a und c im Laufe der Debatte ab. Zweitens findet man in den Daten etwas über die Demographie internationaler, europäischer BPS-Turniere heraus: Der Durchschnittsdebattierer im Sample war 21,5 Jahre alt, hatte über zwei Jahre Debattiererfahrung und war politisch liberal-links eingestellt. Der Frauenanteil lag bei 34,8%. Nur 15% der Teilnehmer kamen im Schnitt aus dem jeweiligen Ausrichterland. Drittens ergaben alle drei Outcome-Messungen a, b und c selbst bei den Oppositionsrednern und Jurierenden eine leichte Regierungstendenz (was etwas der Empirie entgegenläuft, dass laut globalen Tabstatistiken Themen eher opp-lastig ausfallen bzw. die Eröffnende Opposition die stärkste Position sei). Entweder haben die Autoren recht, und auf diesen vier Turnieren waren die Themen für die Teilnehmer eher reg-lastig, oder es lag an den abhängigen Variablen– vielleicht waren z.B. die Pro-Faktenbehauptungen (a) einfach relativ plausibel.
DISKUSSION:
Feldstudien haben den Vorteil, oft näher an realen Umständen zu sein als Laborexperimente (bessere externere Validität), sie sind dafür aber anfälliger für Störfaktoren (schlechtere interne Validität). In diesem Fall würde ich es aber fast eher umgekehrt sehen: Dadurch, dass die Pro- und Contra-Seite zugelost werden, sollten sich beide Gruppen (das ist ja das clevere am Studiendesign) tatsächlich nur in diesem Faktor (Pro oder Contra) unterscheiden und in keinem anderen Bereich. Entsprechend sollte auch ausschließlich die Pro- oder Contralosung dafür verantwortlich sein, dass beide Gruppen unterschiedliche Outcomes hatten. Man kann einwenden, dass man bessere Operationalisierungen / Messmethoden hätte finden können als die drei Variablen. Man kann darüber hinaus bemängeln, dass den Versuchsteilnehmern das Studienziel relativ klar gewesen sein müsste, auch wenn die Autoren diesen Verzerrungseffekt getestet haben. Trotzdem halte ich die Studienergebnisse, dass ein gewisser Selbstpersuasionseffekt unter den Debattierern besteht, unterm Strich für realistisch. Die Frage ist meiner Meinung nach eher, wie gut diese Ergebnisse übertragbar sind: Die Studienteilnehmer hatten einen klaren Anreiz, von ihrer Seite überzeugt zu sein– sie wollten für diese Seite gewinnen, standen unter starken kompetitiven Druck. Man kann argumentieren, dass normale Menschen im politischen Diskurs einen ähnlich starken Grund haben, an ihrer Meinung festzuhalten– sonst müssten sie ihr Weltbild aufgeben und an ihrer sozialen Identität rütteln. Man kann aber auch argumentieren, dass sie in weniger kontroversen Fragen oder in zugeteilten Rollen kompromissbereiter sind als Debattierer. Analog stellt sich die Frage, wie nachhaltig der in der Studie gemessene Effekt ist. In der Sozialpsychologie ist bekannt, dass Einstellungsänderungen nicht zwingend zeitlich andauernd sind und nicht zwingend in Verhaltensänderungen resultieren. Die Autoren haben das bedacht und zumindest nachgewiesen, dass die Effekte bezüglich Variable a direkt nach dem Turnier weiterhin signifikant und auf 80% der vorherigen Pro-Contra-Differenz waren; eine langfristige Kontrolle ist dies aber noch nicht.
Zerstört Selbstpersuasion unsere Debattierideale?
Schwardmann et. al. schreiben übrigens nicht abwertend oder anklagend über das Debattieren; ihre Beschreibungen unseres Sports sind sogar sehr akkurat und bisweilen klingt sogar viel Anerkennung durch. Trotzdem – so sehr man auch (wie bei den meisten Studien) kritisch einhaken kann – ihre Ergebnisse fordern uns meiner Meinung nach trotzdem heraus. Sie werden zwar denjenigen von uns egal sein, die das Debattieren rein als Spaßbeschäftigung oder Wettkampfsport sehen; aber es ist problematisch für diejenigen (zu denen ich mich auch zähle), die das Debattieren ebenfalls als Form demokratisch-politischer Bildung sehen. Aus dieser Sicht heraus soll der Debattiersport unseren politischen Horizont erweitern und uns im Meinungsaustausch üben– aber wie lässt sich das damit vereinbaren, dass es einen Effekt gibt, automatisch von der eigenen zugelosten Seite stärker überzeugt zu sein als von der Gegenseite?
Ich würde sagen, wir haben einige Werkzeuge, um dagegen zu steuern:
- Das stärkste Gegenmittel ist bereits aktiv und ist ja auch das Zentrum der Studie: Das Los. Es verhindert zwar nicht die Selbstpersuasion, aber nutzt es für gute Zwecke. Kann ja sein, dass sich Debattierer in ihre Position verlieben– aber dann verlieben sie sich auch mal in eine Position, die ihrer tatsächlichen politischen Haltung zuwiderläuft, und hinterfragen sich so selbst. In diesem Sinne finde ich das schönste Ergebnis der Studie, dass der Einfluss politischer Polarisierung nach der Debatte geringer war als vorher.
- Die Stärke des positiven Loseffekts auf das Hinterfragen der eigenen politischen Haltung ist umso stärker, je häufiger man Positionen vertreten muss, die man normalerweise nicht vertreten würde. Das ist ein Appell für politisch diverse Themen, die nicht nur Subdiskurse eines politischen Spektrums spiegeln, sondern die Breite gesellschaftlicher Auseinandersetzung.
- Ein zweiter Ansatzpunkt ist der Austausch der Teams untereinander. Bereits jetzt sind sehr von sich selbst überzeugte Teams in BPS im Bestfall zu unnuanciert/extrem und in OPD zu arrogant/gemein– und werden entsprechend bestraft. Aber man könnte abwägende, stark auch auf die Gegenseite eingehende Teams noch mehr honorieren. „Jugend debattiert“ lässt in der Vorbereitungszeit noch offen, für welche Seite man in der Debatte reden wird, aber man könnte auch über weniger radikale Reformschritte, z.B. in Jurierleitfäden und -praxis, nachdenken.
- Ein dritter Ansatzpunkt ist die Zeit nach bzw. außerhalb der Debatte: Man könnte dem thematischen Austausch der Teilnehmenden zwischen den Runden oder vor und nach der Ergebnisverkündung noch größeren Stellenwert einräumen– in der Hoffnung, dass Teilnehmer einem stärkeren Reflexionsprozess ausgesetzt sind, wenn sie nicht mehr stark an die eigene Zulosung gekoppelt betrachten.
- An dieser Stelle profitiert das Debattieren wiederum auch von Diversität: Je mehr ich Personen mit unterschiedlicher politischer Einstellung und Lebenserfahrung auf Debattierveranstaltungen (freundschaftlich) begegne, desto größer könnte die Horizonterweiterung ausfallen.
Am Ende war der Cliffhanger also nur ein Bluff: Nein, das Debattieren wird in meinen Augen durch Schwardmann et. al. 2021 nicht in seinen Grundfesten erschüttert– aber ihre Feldstudie liefert sicherlich eine weitere gute Gelegenheit, über unseren Sport nachzudenken und an ihm arbeiten.
Vorschaubild: weatherbox auf freeimages.com
Sven Jentzsch debattiert seit 2015 und war in dieser Zeit als Redner, (Chef-)Juror, Mitglied der OPD-Regelkommission, Streitkultur- und VDCH-Präsident aktiv. Er promoviert in Allgemeiner Rhetorik in Tübingen.
Das Mittwochs-Feature: Mittwochs veröffentlicht die Achte Minute ab 10.00 Uhr oftmals ein Mittwochs-Feature, worin eine Idee, Debatte, Buch oder Person in den Mittelpunkt gestellt wird. Wenn du selbst eine Debatte anstoßen möchtest, melde dich mit deinem Themen-Vorschlag per Mail an team [at] achteminute [dot] de.
lok.