Attention Collective Mind III: KI-Assistenz für die Markus Lanz TV-Sendung am 30.04.2024

Kurzfassung: In diesem Blog-Beitrag wird der Attention Collective Mind Mechanismus auf eine reale Gruppenkommunikation angewendet. Es wird gezeigt, dass ein durch Reinforcement Learning trainierter RL-Agent einen TV-Moderator aktiv in einem hybriden Collective Intelligence Setting bei der Moderation einer TV-Sendung unterstützen kann. Ein dem Attention Modell ähnlicher Mechanismus wird für die Vermessung des Disruptiongrads von Redebeiträgen angewendet. Damit ist es möglich, die kreative Spannung in einer Kommunikation zu vermessen und deren Potential für die Ausbildung eines Collective Mind zu bewerten.

Dieser Bog-Beitrag ist mit Gemini Pro erstellt.

In den vorherigen beiden Blog-Beiträgen dieser Reihe habe ich einen Attention Mechanismus für die KI-Assistenz von soziale Systemen entwickelt. Ich konnte zeigen, dass ein Reinforcement Learning KI-Agent (RL-Agent) in der Lage ist, eine Projekt-Führungskraft bei der Führung seines Teams zu unterstützen: Der RL-Agent unterstützt die Führungskraft durch die Anzeige des individuellen Stresslevels und des Gruppen-Stresslevels und macht Vorschläge zur Teilnehmereinbindung um die Stresslevel zu senken.

In diesem Blog-Beitrag verwende ich den RL-Agenten, um eine reale Gruppe zu führen: Da es sehr schwierig ist, auf Daten eines realen Teams zuzugreifen, verwende ich die Kommunikation der Gruppe der Markus Lanz TV-Sendung vom 30.04.2024 [1]. Für diese TV-Sendung habe ich schon am 27.Juni 2024 eine Collective Mind Analyse im Blog-Beitrag ‚AI & M 4.0: Markus Lanz vom 30.04.2024…‘ veröffentlicht.

Die transkribierten Kommunikationsdaten zu dieser Sendung liegen vor, so dass es recht einfach ist, auf dieser Basis eine Attention Collective Mind Analyse durchzuführen. Der Ablauf ist wie folgt:

Schritt 1: Die transkribierten Daten werden einer LLM KI übergeben, in dem vorliegenden Fall, Gemini Pro. Gemini Pro erhält die Aufgabe, die Big-Five Persönlichkeiten und die Werte-Ausprägung zu drei Werten V1, V2 und V3 der Teilnehmer der TV-Sendung einzuschätzen:

[V1] Wahrheit & Logik (Sachlicher Erkenntnisgewinn)
[V2] Identität & Loyalität (Verteidigung der eigenen Ingroup)
[V3] Freiheit & Aufklärung (Tabubruch, liberale Werte)

Diese Werte wurden gewählt, weil es in der TV-Sendung um das Rollenverständnis der Muslime in Deutschland geht.

Die Big-Five Ergebnisse und die Werten V1 bis V3 werden pro Diskussionsteilnehmer aus der Gesamtheit der jeweiligen Redebeiträge ermittelt. Die mittels Gemini Pro erhaltenen Big-Five Werte weichen teilweise recht stark von den ChatGPT Big-Five Analyse aus dem Jahre 2024 ab. Die ChatGPT Big-Five Werte entsprechen sehr genau meinen persönlichen Einschätzungen. Ich habe überprüft inwieweit dieser Unterschied das Ergebnis (siehe weiter unten) beeinflusst: Die Big-Five Werte beeinflussen deutlich die Höhe der Stresspegel (Skala unten 0.1 bis 0.2), jedoch kaum deren Verlauf. 

Schritt 2: Big-Five und die Werte werden als statische Größen im Persönlichkeitsvektor der Gruppenteilnehmer eingetragen. Zusätzlich ist es nötig, im Persönlichkeitsvektor den emotionalen Zustand der Gesprächsteilnehmer zu erfassen. Mit Gemini Pro wird die sogenannte Valenz (positiv, neutral, negativ) und die damit verbundene Stimmung (Arousal) pro Redebeitrag erfasst. Diese Werte mit der Information auf welchen anderen Teilnehmer bzw. Redebeitrag ein Teilnehmer reagiert wird, werden in eine Tabelle eingetragen. 

Schritt 3: Mit Hilfe eines Transformer-Modells aus der Huggingface Bibliothek wird eine Textanalyse vorgenommen. Diese Analyse bettet die ungefähr 100 Redebeiträge in einen hochdimensionalen Vektorraum. Damit ist möglich, Textähnlichkeiten der Redebeiträge über Vektor-Ähnlichkeit zu vermessen. In Anlehnung an einen Artikel zur Vermessung des Disruptioncharakters von wissenschaftlichen Veröffentlichungen [2] habe ich einen Disruption-Score (D-Score) für Redebeiträge eingeführt: Dieser D-Score misst inwieweit sich nachfolgende Redebeiträge (nur noch) auf einen vorhergehenden Redebeitrag beziehen (für die verwendete Mathematik verweise ich auf den Anhang). 

Schritt 4: Der bisherige RL-Agent wird getestet, ob er in der Lage ist,  den Moderator aktiv und sinnvoll zu unterstützen. Die Tests ergeben, dass es notwendig ist, das RL-Agenten Modell für die Moderator-Situation zu erweitern: Der Redeanteil der Gesprächsteilnehmer wird durch eine Größe ‚Fatique‘ (Ermüdung) begrenzt. – Jeder Redebeitrag führt zu einer ‚Ermüdung‘. Indirekt wird damit auch die Ermüdung der Zuhörer bewertet.
Außerdem wird das Modell für den individuellen Stresspegel und den Stresspegel der gesamten Gruppe angepasst. – Für die entsprechende Mathematik verweise ich auf den Anhang. Der Anhang enthält nur die gegenüber dem vorherigen Blog-Beitrag geänderte Mathematik. – Die erfolgreiche Modellierung bedeutet in diesem Fall, dass die KI dem Moderator richtige Hinweise zur aktiven Steuerung des individuellen und gruppendynamischen Stresspegels gibt, in dem der RL-Agenten korrekte Empfehlungen zur Einbindungen bestimmter Gesprächsteilnehmer gibt: Der RL-Agenten entlastet den Moderator mental und gestaltet den Moderationsablauf mit.

Die erfolgreiche Modell-Ausgestaltung des RL-Agent hat den Nebeneffekt, dass die entscheidenden Modellgrößen selektiert werden und die wichtigen Mechanismen der Führung, hier der Moderation, abgebildet werden: Die ‚Beliebigkeit‘, was gute Führung ist, wird durch überprüfbare Modellgrößen ersetzt!

Schritt 5: Ergebnisse
Abbildung 1 zeigt den Stresslevel der TV-Diskussionsteilnehmer und den Disruptiongrad des jeweiligen Redebeitrages (Turn).

Abbildung 1: Diese Abbildung zeigt im oberen Teil den Stresspegel der fünf Teilnehmer aufgetragen über den Redebeiträgen (Turns). Im unteren Teil der Abbildung ist der D-Score (Disruptiongrad) des Turns enthalten. Am oberen Rand der Abbildung ist die Turn-Nr. als X-Achse verwendet, am unteren Rand wird die Sprecher-ID pro Turn als X-Achse angezeigt. Der Verlauf der Sprecher-ID stellt eine Signatur der Kommunikation dar: Sieht man vom Moderator (Lanz) ab, so zeigt der Sprecher 4 ( Mansour) den höchsten Anteil an Disruption. Der Sprecher 2 (Khorchide) wirkt als starker Konsolidierer. Sprecher 2 (Hübsch) wirkt fast immer als Antagonist, bringt aber kaum Disruption in die Debatte. Sprecher 3 (Kaymann) wirkt in der ersten Hälfte des TV-Gespräches konsolidieren, und hat bis auf eine kleine Disruption im zweiten Teil keine großen Einfluss auf die Diskussion. Berücksichtigt man, dass  Disruption und Konsolidierung Wegbereiter eines Collective Mind sind, so tragen Mansour und Korchide die Diskussion, auch wenn der Redeanteil von Mansour relativ klein ist. Dies entspricht den Sprechern 4 und 5 der Analyse vom Juni 2024. Die aktuelle Analyse hilft die vergangene Analyse der nahe beieinanderliegenden Collective Mind Beiträge besser zu unterscheiden.  

Abbildung 2: Diese Abbildung zeigt einen Ergebnis-Auszug der zusätzlichen Informationen pro Turn. Hier für die Turns 49 bis 51. Ich habe diesen Auszug beispielhaft gewählt, da hier der größte D-Score vorliegt. 

Im folgenden gebe ich eine detaillierte Aufschlüsselung dieses Ergebnis-Auszugs. Diese Zeilen zeigen sehr gut, wie ein kommunikativer ‚Game Changer‘ mathematisch aussieht.

Jeder Block repräsentiert einen Redebeitrag und ist in drei Ebenen unterteilt:

1. 🗣️ REALITÄT (Die Datenbasis)

Das ist die Eingabeebene. Das System registriert die Turn-Nummer ([49]), wer spricht (Mansour), an wen die Aussage gerichtet ist (zu Hübsch) und den Start des tatsächlichen Transkript-Textes.

2. 🧠 Die analytische Ebene (Emotion & Semantik)

Diese Ebene zeigt Parameter des gesprochenen Wortes:

  • Valenz: Misst die emotionale Schärfe von -1.0 (feindselig/Kritik) bis +1.0 (zustimmend/Lob).

  • D-Score: Der Disruptions-Wert. Er misst durch Vektorgeometrie, ob der Satz das inhaltliche Thema der Diskussion radikal verändert (positiver Wert) oder ob alte Argumente lediglich wiederholt werden (negativer Wert).

3. 🤖 KI-CO-PILOT (Die Systemsteuerung)

Dies ist das Steuerzentrum der Simulation:

  • Spg (Systemspannung): Die aufsummierte kognitive und emotionale Belastung (Stress) aller Personen im Raum. Über 2.0 wird es kritisch.

  • Empfehlung: Das neuronale Netz, der RL-Agent, berechnet im Hintergrund, wer als Nächstes sprechen sollte, um den inhaltlichen Ertrag zu maximieren und das System stabil zu halten.

  • System-Notizen: Wenn bestimmte Schwellenwerte gerissen werden, gibt das System Warnungen oder Erfolgsmeldungen aus (z. B. 💡 DISRUPTION ERFOLGREICH!).

Die Analyse: Was passiert in diesen drei Turns?

Dieser Auszug (Turns 49 bis 51) ist ein sehr gutes Beispiel für eine gelungene inhaltliche Intervention:

Turn 49: Der radikale Pivot von Mansour

Ahmad Mansour wehrt sich gegen eine Unterbrechung von Frau Hübsch. Die Valenz ist mit -0.50 stark negativ – es ist ein klarer verbaler Konflikt. Doch Mansour schlägt nicht einfach inhaltlich zurück, sondern lenkt das Thema auf eine völlig neue Ebene. Der NLP-Algorithmus schlägt massiv aus: Ein D-Score von +0.347 ist extrem hoch. Die KI erkennt sofort, dass der semantische Vektor der Diskussion gerade stark geändert wurde und meldet: „DISRUPTION ERFOLGREICH! Thema wurde neu gesetzt.“ Die Systemspannung (Spg) liegt hier bei leicht erhöhten 1.11. Die KI empfiehlt, das Wort an Prof. Khorchide (den harmonischsten Charakter) zu übergeben.

Turn 50: Die kühlende Moderation

Markus Lanz ergreift das Wort. Er erkennt den Themenwechsel („guten Übergang geliefert“) und fungiert als Moderator. Seine Valenz ist exakt 0.00 – völlig neutral und sachlich. Diese emotionale Kühle wirkt sofort: Die Systemspannung fällt schlagartig von 1.11 auf 0.85. Der D-Score ist mit +0.018 fast bei Null, was bedeutet: Lanz bricht Mansours neues Thema nicht ab, sondern lässt es zu. Die KI fordert weiterhin: Gebt das Wort an Khorchide!

Turn 51: Die inhaltliche Konsolidierung

Genau das passiert in der Realität: Prof. Khorchide übernimmt. Er greift Mansours neues Thema auf („Identitätssuche, Identitätsfindung in der Religion“). Die Valenz ist leicht negativ (-0.20), da er auf ein gesellschaftliches Problem hinweist.

Das Spannendste ist hier der D-Score von -0.080 (Konsolidierend). Ein negativer Wert ist hier absolut positiv zu werten! Es bedeutet, dass Khorchide keine neue Baustelle aufmacht, sondern den in Turn 49 neu gesetzten Themenanker akzeptiert und inhaltlich vertieft. Die neue Richtung der Diskussion ist damit erfolgreich etabliert und gefestigt.

Fazit dieser Sequenz: Die KI beweist hier datenbasiert, dass ein Streit (Turn 49) extrem produktiv sein kann, wenn er dazu genutzt wird, ein festgefahrenes Thema radikal zu wechseln. Und sie zeigt, wie gutes Zuhören und Aufgreifen durch nachfolgende Sprecher (Turns 50 & 51) das Stresslevel im Raum sofort senkt.

Zusammenfassung:

Ich beende hiermit (vorläufig) die Attention Collective Mind Blog-Reihe. Ich konnte zeigen, dass der Attention Mechanismus, der allen großen LLM KI-Systemen zugrunde liegt, auch erfolgreich auf die menschliche Kommunikation angewendet werden kann. Verwendet man ein Vektor-Persönlichkeitsmodell in das u.a. Big-Five, Werte und Emotionen (und ggf. der Projekttyp zur Beschreibung der Aufgabenstellung) eingehen, so lässt sich auf dieser Basis ein RL-Agent mittels Reinforcment Learning  trainieren. Dieser RL-Agent unterstützt in einem hybriden Collective Intelligence Setting eine Führungskraft bzw. einen Moderator bei der Wahrnehmung der Team- bzw. Gruppendynamik und gibt aktiv in Echtzeit Empfehlungen für die Führung.   

Anhang: Glossar und Formeln zum mathematischen Modell

Glossar: Die Vokabeln der KI-Simulation

Um die Dynamik einer Talkshow mathematisch zu berechnen, übersetzt die KI menschliches Verhalten in Datenpunkte. Hier sind die wichtigsten Begriffe aus der Psychologie und Datenwissenschaft einfach erklärt:

1. Die emotionale Ebene (Affective Computing)

Die KI bewertet jeden gesprochenen Satz nach zwei grundlegenden emotionalen Dimensionen:

  • Valenz (Valence): Beschreibt, ob eine Aussage positiv oder negativ ist. Negative Valenz (-1.0) bedeutet Angriff oder Kritik. Positive Valenz (+1.0) bedeutet Zustimmung oder Brückenbau.

  • Arousal (Erregungsniveau): Beschreibt die emotionale „Temperatur“. Hohes Arousal bedeutet, dass jemand passioniert oder hochgradig gestresst spricht. Ein negativer Satz, der geschrien wird (hohes Arousal), erzeugt mehr Systemstress als ein negativer Satz, der ruhig geäußert wird.

2. Die Gesprächsdynamik (Systemphysik)

  • Fatigue (Kognitive Erschöpfung): Wer lange spricht, verbraucht kognitive Energie. Wer zuhört, regeneriert sich leicht. Das System nutzt diesen Wert, um zu erkennen, wann ein Redner „leergesprochen“ ist.

  • Stresspegel (Individueller Stress): Ein Wert zwischen 0 und 1. Er steigt bei Angriffen und sinkt durch sachliche Klärung oder wenn man längere Zeit nicht attackiert wird (Abkühlungsphase).

  • Systemspannung (Kollektive Energie): Die Summe der individuellen Stresspegel aller Anwesenden. Steigt dieser Wert über eine kritische Grenze, steht die Diskussion kurz vor der Eskalation.

3. Die Persönlichkeit (Die „Big Five“)

Die Profile der Diskutanten basieren auf dem etablierten psychologischen OCEAN-Modell:

  • (O) Offenheit: Die Bereitschaft für neue, unkonventionelle Ideen.

  • (C) Gewissenhaftigkeit: Der Drang nach Struktur und Fakten.

  • (E) Extraversion: Das Bedürfnis, im Mittelpunkt zu stehen.

  • (A) Verträglichkeit (Agreeableness): Das Bedürfnis nach Harmonie und Konsens.

  • (N) Neurotizismus: Die Anfälligkeit für Stress bei Gegenwind.

4. Die linguistische Analyse (NLP & Disruption)

  • Text-Embeddings: KI-Modelle wandeln Sätze in mathematische Koordinaten (Vektoren) um. Sätze mit ähnlichem Inhalt liegen nah beieinander.

  • Kosinus-Ähnlichkeit: Eine Formel, die misst, ob zwei Personen inhaltlich über das Gleiche sprechen oder aneinander vorbei reden.

  • Disruption (D-Score): Das Maß für inhaltlichen Fortschritt. Ein negativer D-Score bedeutet, die Sprecher drehen sich im Kreis (Konsolidierung). Ein positiver D-Score bedeutet, ein Sprecher bringt einen radikalen „Game-Changer“ (Disruption / Topic Pivot).

Technischer Anhang: Mathematische Modellierung der Diskursdynamik

In diesem Anhang werden die Formeln erläutert, die zur Berechnung der Zustandsänderungen der Diskutanten und der inhaltlichen Struktur der Sendung verwendet wurden.

Die folgenden Funktionen sind Terme der geänderten Reward-Funktion:

1. Erschöpfungsmodell (Fatigue)

Die Erschöpfung eines Sprechers steigt durch den kognitiven Aufwand der Artikulation, während die Zuhörer eine leichte Regeneration erfahren.

     \begin{equation*} F_{i}^{(t)} = \begin{cases} \min(1.0, F_{i}^{(t-1)} + \Delta_{active}) & \text{wenn } i = \text{Sprecher} \\\\ \max(0.0, F_{i}^{(t-1)} - \Delta_{passive}) & \text{sonst} \end{cases} \end{equation*}

Erläuterung:

  • F_{i}^{(t)}: Erschöpfungsgrad des Teilnehmers i zum Zeitpunkt t.

  • \Delta_{active}: Zuwachsrate pro Redebeitrag (Modellwert: 0.45).

  • \Delta_{passive}: Regenerationsrate pro Turn des Zuhörens (Modellwert: 0.15).

2. Stress-Dynamik (Emotionale Physik)

Der Stresspegel reagiert auf die emotionale Ladung und die Konfrontation unter Berücksichtigung der Persönlichkeitsunterschiede.

A. Stress-Impact (Eskalation)

Bei negativer Valenz (V < 0) berechnet sich der Stresszuwachs der Zielperson (tg) wie folgt:

     \begin{equation*} \Delta S_{tg}^{(t)} = (A^{(t)} \cdot w_1) + (|B_{sp} - B_{tg}| \cdot |V^{(t)}| \cdot w_2) \end{equation*}

Erläuterung:

  • A^{(t)}: Das Arousal (Erregungsniveau) des Beitrags.

  • \|B_{sp} - B_{tg}\|: Die Euklidische Distanz zwischen den Big-Five-Profilen von Sprecher und Zielperson.

  • w_1, w_2: Gewichtungsfaktoren für emotionale Intensität und charakterliche Dissonanz.

Die Gewichtsfaktoren sind im Code auf folgende Werte gesetzt:

  • w_1 (Emotionale Intensität / Arousal): 0.2

  • w_2 (Charakterliche Dissonanz / Big-Five-Differenz): 0.1

Was bedeuten diese Werte für die Simulation?

Das System gewichtet die direkte, hörbare Erregung (Arousal) doppelt so stark wie den reinen Charakterunterschied.

Das ergibt psychologisch Sinn:

  1. Die Dominanz der Lautstärke (w_1 = 0.2): Wenn jemand sehr laut, schnell oder aggressiv spricht (hohes Arousal), erzeugt das bei der Zielperson fast immer sofortigen Stress (Fight-or-Flight-Reaktion), unabhängig davon, wie ähnlich sich die beiden Personen charakterlich sind.

  2. Der Charakter-Multiplikator (w_2 = 0.1): Die charakterliche Dissonanz (die Euklidische Distanz der Big-Five-Werte) ist ein feinerer, subtilerer Faktor. Er besagt: Wenn mich jemand kritisiert (negative Valenz), stresst mich das zusätzlich, wenn diese Person ein völlig anderes Weltbild oder eine völlig andere Persönlichkeit hat als ich (z.B. ein hochgradig extravertierter, strukturierter Mensch kritisiert einen introvertierten, sehr offenen Menschen). Da dieser Distanz-Wert (big5_diff) mathematisch oft größer als 1 sein kann, wird er mit dem kleineren Faktor 0.1 skaliert, damit er die Basis-Erregung nicht komplett überlagert.

Diese beiden Werte sind sogenannte Hyperparameter. Wenn die Simulation auf ein anderes Szenario anpassen werden soll (z. B. ein hochformelles Business-Meeting statt einer Talkshow), könnte man w_1 senken und w_2 erhöhen, da in professionellen Umgebungen weniger Emotion sichtbar wird, Charakterunterschiede bei Kritik aber vielleicht umso schwerer wiegen.

B. Der individuelle Stresspegel (Y-Achse in der Abbildung)

Der finale Stresspegel S_i^{(t)} ist die Summe aus vorherigem Zustand, aktuellen Einflüssen und zeitlichem Zerfall, normiert auf [0, 1].

     \begin{equation*} S_i^{(t)} = \max \left( 0.0, \min \left( 1.0, S_i^{(t-1)} + \Delta S_{i}^{(t)} - \delta_{decay} \right) \right) \end{equation*}

Erläuterung:

  • \Delta S_{i}^{(t)}: Die Netto-Veränderung durch den aktuellen Beitrag.

  • \delta_{decay}: Die natürliche Abkühlungsrate pro Zeiteinheit (Modellwert: 0.03).

C. Die kollektive Systemspannung

Um zu berechnen, ob der Raum als Ganzes zu eskalieren droht, wird die Systemspannung E_{sys} als Summe aller individuellen Stresspegel (N=5) gebildet.

     \begin{equation*} E_{sys}^{(t)} = \sum_{i=1}^{N} S_i^{(t)} \end{equation*}

Übersteigt E_{sys}^{(t)} den empirisch festgelegten Schwellenwert (z.B. 2.0), triggert die KI eine Warnung für den Moderator.

3. Semantische Disruption (D-Score)

Die Disruption misst, wie sehr ein Beitrag den inhaltlichen Fokus der Zukunft (F) von der Vergangenheit (P) weg hin zum aktuellen Beitrag (C) verschiebt.

     \begin{equation*} D_t = \cos(\vec{F}_t, \vec{C}_t) - \cos(\vec{F}_t, \vec{P}_t) \end{equation*}

Wobei die Cosinus-Ähnlichkeit definiert ist als:

     \begin{equation*} \cos(\vec{a}, \vec{b}) = \frac{\vec{a} \cdot \vec{b}}{|\vec{a}| |\vec{b}|} \end{equation*}

Erläuterung:

  • \vec{C}_t: Vektor-Embedding des aktuellen Beitrags.

  • \vec{P}_t: Durchschnittsvektor der vorangegangenen k Beiträge (Vergangenheit).

  • \vec{F}_t: Durchschnittsvektor der nachfolgenden k Beiträge (Zukunft).

Literatur

[1] ZDF (2024) https://www.zdf.de/gesellschaft/markus-lanz/markus-lanz-vom-30-mai-2024-100.html oder http://youtu.be/rpINCu5VmnY

[2] Kim M (2026) Uncovering simultaneous breakthroughs with a robust
measure of disruptiveness, Science Advances|Research Article

AI & QC & M 4.0: Quantum Cognition für das Team-Management oder von der Macht der Mathematik

(Die in diesem Blog-Beitrag enthaltene recht komplexe Mathematik der Quantenmechanik sowie die dazugehörigen Programme wurden mit der AI-Assistenz von ChatGPT4o1-preview erhalten. ChatGPT4o wurde für die Überprüfung des Blog-Beitrages verwendet. Der enthaltene Podcast wurde von der Google AI noteBookLM erstellt.)

Der nachfolgender Podcast fasst den Blog-Beitrag in englischer Sprache zusammen und wurde von der Google AI notebookLM erzeugt:

Abbildung 0:  Ein Bild, erzeugt von ChatGPT/DALL.E, das den Blog-Beitrag visuell unterstützt und im Stil von van Gogh gestaltet ist. Es zeigt Teammitglieder in einer dynamischen Interaktion, die die Konzepte der Quantum Cognition durch wellenartige Verbindungen symbolisiert.

Dieser Blog-Beitrag richtet sich an Leser mit einem Hintergrund in Management sowie an jene, die Interesse an quantenmechanischen Konzepten im Bereich der Kognition und Teamdynamik haben: Keine Angst vor Mathematik ist hilfreich!

Bei den Recherchen zu dem vorherigen Quantum Computing Blog-Beitrag bin ich auf den Begriff ‚Quantum Cognition‘ gestoßen [1]. Sofort wenn man den Wikipedia Artikel oder die wissenschaftlichen Artikel [2],[3] liest, wird man darauf hingewiesen, dass Quantum Cognition nichts mit Quantum Mind [4] oder der Idee, dass Bewusstsein durch Quanteneffekte hervorgerufen wird, zu tun hat. – Wenngleich das letzte Wort hierzu sicherlich noch nicht gesprochen ist.

Bei dem Thema Quantum Cogition geht es um die verblüffende Feststellung, dass kognitive Verzerrungen wie u.a. Tversky und Kahneman sie beschrieben haben [5], schlecht oder überhaupt nicht durch die klassische Wahrscheinlichkeitstheorie (Classical Probability Theory) beschrieben werden, aber sehr wohl durch die Quanten Wahrscheinlichkeitstheorie (Quantum Probability Theorie), wie sie im mathematischen Formalismus der Quantenmechanik enthalten ist. Das ist schon irgendwie faszinierend…und zeigt meines Erachtens die ungeheure Macht der Mathematik: Denn plötzlich wird ein mathematischer Formalismus, der in einem Gebiet entwickelt wurde, auf einem völlig anderen Gebiet angewendet.

Ich beschäftige mich in diesem Blog-Beitrag zuerst mit den Grundlagen von Quantum Cognition. Anschließend wende ich diese Grundlagen auf die Teamkommunikation an. Bei der Konzeption des Collective Mind vor ca. zwei Jahrzehnten kam die Idee auf, den Collective Mind als sogenannten verschränkten Zustand der mentalen Modelle der Teammitglieder zu verstehen. Ich werde zeigen, dass mit dem Formalismus der Quantum Cognition genau dies möglich ist. Damit ergänze ich die in den vorhergehenden Blog-Beiträgen beschriebenen klassischen Modelle des Collective Mind. – In zukünftigen Blog-Beitragen besteht Raum für eine Integration beider Ansätze😉.

Zuerst zu den Grundlagen von Quantum Cognition. Quantum Cognition benutzt drei Schlüsselelemente der Quantenmechanik:

  • Superposition (Überlagerung): Ein mentaler Zustand kann als Kombination mehrerer möglicher Zustände betrachtet werden. Damit eröffnet sich die Möglichkeit, Ambiguitäten im menschlichen Verhalten zu modellieren, sowie Unentschlossenheit in Entscheidungsprozessen zu beschreiben.
  • Nicht-Kommutativität (Interferenz): Wie in der Quantenphysik können mentale Zustände sich gegenseitig beeinflussen, was zu Verstärkungs- oder Abschwächungseffekten führt und einige nichtlineare Entscheidungsprozesse erklärt. Psychologische Beispiele hierfür sind das Priming und die verschiedenen mentalen Verzerrungen, u.a. auch der Bias.
  • Verschränkung (Entanglement): Unterschiedliche kognitive Variablen können stark miteinander verbunden sein, so dass der Zustand einer Variablen unmittelbar den Zustand einer anderen beeinflusst. Das Hebb’sche Gesetz beschreibt diesen Effekt: Psychologische Beispiele hierfür sind Gefühle, die unmittelbar die Wahrnehmung beeinflussen.

Ich habe diese drei Schlüsselelemente in den Abbildungen 1-3 skizziert. Die in diesen Abbildungen enthaltenen mathematischen Ausdrücke der Quantenmechanik sind meines Erachtens nicht wichtig für ein Verstehen der wesentlichen Aussagen dieses Blog-Beitrages. Sie mögen aber dem ein oder anderen vielleicht beim besseren Verständnis helfen.

Ich erläutere im Folgenden die in Abbildung 2 enthaltenen Aussagen zum Schlüsselelement der Nicht-Kommutativität (Interferenz) etwas genauer, u.a. deswegen weil dort der Begriff des Projektionsoperators eingeführt wird, der für die Quantenmechanik und die Quanten Cognition von großer Bedeutung ist. Für die beiden anderen Schlüsselelemente verweise ich auf die Abbildungen 1-3.

Wenn wir an eine Person oder an ein Ding denken, so rufen wir ein mentales Konzept von dieser Person oder diesem Ding ab. Nehmen wir zwei Personen aus der amerikanischen Politik: Clinton und Gore. Jeder von uns hat wahrscheinlich ein mehr oder weniger ausgeprägtes Konzept bzw. eine mentale Repräsentation oder eine Idee von Clinton und Gore. Dieses Konzept wird u.a. durch Interaktion mit der Umwelt aktiviert. In unserem Clinton-Gore-Beispiel sind Konzepte wie ‚Clinton‘ und ‚Gore‘ die grundlegenden Einheiten, die wir modellieren möchten: Nehmen wir an, jemand würde uns die Frage stellen, ob wir Clinton vertrauenswürdig finden und anschließend die Frage stellen, ob wir Gore vertrauenswürdig finden. Psychologische Experimente haben gezeigt, dass die Wahrscheinlichkeit, beide Fragen mit Ja zu beantworten auch von der Reihenfolge der Fragen abhängt [3]. D.h. die Fragen rufen Konzepte auf und die Konzepte beeinflussen sich gegenseitig, aber nicht-kommutativ. Nicht-kommutativ bedeutet, dass es auf die Reihenfolge der Fragestellung ankommt. – Ein sehr erstaunliches Phänomen. In der Welt der Quanten kennt man entsprechende Phänomene: Die Reihenfolge von Messungen hat Einfluss auf die Ergebnisse der Messungen.

In der Quantenmechanik verwendet man sogenannte Projektionsoperatoren, die eine Messung bzw. Messreihenfolge repräsentieren. Mit einem Projektionsoperator projiziert man den Ausgangszustand auf den gemessenen Zustand. Damit kann man Wahrscheinlichkeitsaussagen treffen, wie wahrscheinlich es ist, dass der Ausgangszustand in den gemessenen Zustand übergeht.

Entsprechend werden in der Quantum Cognition kognitive Projektionsoperatoren zur Modellierung der Aktivierung eines kognitiven Konzepts in einer Person benutzt. – Es findet sozusagen eine Messung statt.

Nehmen wir an, dass bei der Frage nach Clinton bei einer befragten Person eine gewisse Ambivalenz (vertrauenswürdig, nicht-vertrauenswürdig) bezüglich der Antwort vorhanden ist. Für Gore nehmen wir eine andere Ambivalenz an. Wir nehmen auch an, dass bevor die Fragen gestellt werden, es noch keine Manifestationen von Präferenzen gibt. – Es gibt zum Beispiel keinen Bias durch eine gerade stattgefundene Diskussion zu diesem Thema. Die Projektionsoperatoren konstruieren wir als ambivalente Mischung (Superposition) aus einem vertrauenswürdigen und einem nicht-vertrauenswürdigen Basiskonzept. Hierbei kann es durchaus sein, dass eine befragte Person Clinton in dieser ambivalenten Mischung für vertrauenswürdiger als nicht-vertrauenswürdig hält. Bevor die Frage gestellt wird, ist dies jedoch nicht sichtbar, die innere Haltung ist unentschieden. Entsprechendes gilt natürlich für eine andere ambivalente Mischung bei Gore.

In der Quantenmechanik bezeichnet man die Basiskonzepte als Vektoren im sogenannten Hilbertraum. Der Hilbertraum ist ein spezieller mathematischer Raum, in dem die Vektoren quantenmechanischen Operationen unterliegen. Die Projektionsoperatoren sind solche Operationen und werden als Tensoren (haben das Aussehen von Matrizen) beschrieben, die auf diese Vektoren wirken. – Tensoren sind auch die zentralen Operationen in klassischen AI-Systemen. – Im Quanten Computing implementieren die Qubits die Vektoren und die Wechselwirkung der Vektoren entsprechen den Tensoren.

Wendet man den Formalismus der Quantenmechanik an, so kann man zeigen, dass nicht-kommutative Projektionsoperatoren, angewendet auf ambivalente innere Haltungen, eine Interferenz in den Antworten erzeugen. Die Basiskonzepte ‚Clinton‘ und ‚Gore‘ interferieren wie Wellen in der Physik: U.a. interferiert das vertrauenswürdige Basiskonzept mit dem nicht-vertrauenswürdigen Basiskonzept. Dies führt auch dazu, dass die Reihenfolge der Fragen entscheidend ist, da in Abhängigkeit der Reihenfolge unterschiedliche Interferenzen auftreten. Dies bedeutet, dass die gemeinsame Wahrscheinlichkeit Clinton zuerst als vertrauenswürdig einzustufen und anschließend Core, verschieden ist von der gemeinsamen Wahrscheinlichkeit Core zuerst als vertrauenswürdig einzustufen und anschließend Clinton. – Magisch…jedoch genau solche Effekt werden tatsächlich gemessen:

Wird zuerst nach Clinton als vertrauenswürdig gefragt und dann nach Gore, ergibt sich im statistischen Mittel, dass 50% der Befragten Clinton für vertrauenswürdig halten, und 68% Gore. Stellt man die Reihenfolge um, so geben 60% Gore als vertrauenswürdig an und 57% Clinton [3]. Es entsteht also eine Diskrepanz von ca. 7-8 %, hervorgerufen durch die Reihenfolge. Mit Hilfe der Formeln in Abbildung 2 zu den Wahrscheinlichkeiten lassen sich die Wahrscheinlichkeiten P Clinton dann Gore = 0,340 und P Gore dann Clinton = 0,342 berechnen. Die gemessenen Wahrscheinlichkeiten sind klassische statistische Wahrscheinlichkeiten, enthalten also Aussagen zu einer mittleren mentalen Ambivalenz aller befragten Personen. Berücksichtigt man dies, so kann man mit Hilfe des quantenmechanischen Formalismus Aussagen über die mittlere Ambiguität und Interferenz der mentalen Konzepte treffen:

In der Sequenz ‚Clinton dann Gore‘ zeigen die Berechnungen, dass weniger Ambiguität bezüglich Gore vorliegt, wenn zuerst nach Clinton gefragt wird. Dies deutet darauf hin, dass die mentale Repräsentation von Gore klarer oder positiver ist, wenn sie durch die vorherige Frage nach Clinton beeinflusst wird.

In der Sequenz ‚Gore dann Clinton‘ zeigen die Berechnungen, dass die Ambiguität bezüglich Clinton höher ist, wenn Gore zuerst gefragt wird. Dies deutet daraufhin, dass die mentale Repräsentation von Clinton stärker vom Kontext und vorherigen Informationen abhängt.

Abbildung 1: Superposition von mentalen Basiskonzepten

Abbildung 2: Nicht-Kommutativität und Interferenz von Basiskonzepten

Abbildung 3: Verschränkung von Basiskonzepten

Nach dieser kleinen Einführung in die Schlüsselelemente der Quantum Cognition, wende ich mich dem deutlich komplexeren Thema der Team-Kommunikation bzw. der Collective Mind Modellierung eines Teams zu.

Ich wollte hier ursprünglich ein Beispiel mit drei Teammitgliedern und den Big Five Persönlichkeitsmerkmalen, die einen Hilbertraum aufspannen, skizzieren. Jedoch haben die ersten Tests mit einem dazugehörigen Simulations-Programm auf einem klassischen Computer ergeben, dass dieses Programm schon nicht mehr auf meinem Laptop mit 16 GB Hauptspeicher lauffähig ist. Der Grund liegt darin, dass ein Hilbertraum mit 32768 Dimensionen aufgespannt wird. Die Dimension 32768 = 2 hoch (3*5), ergibt sich aus 3 Teammitglieder mit jeweils 5 Big Five Dimensionen. Jede Big Five Dimension wird durch einen Zustand 1 (hohe Ausprägung) und 0 (niedrige Ausprägung) repräsentiert. Es werden also für die Beschreibung der Wechselwirkung der Personen Tensoren (Matrizen) benötig, die eine Größe 32768*32768 haben.  

Statt dessen skizziere ich hier ein Beispiel aus 3 Teammitgliedern und lediglich 2 Big Five Dimensionen, nämlich Offenheit und Gewissenhaftigkeit. Damit wird ein Hilbertraum von 64 Dimensionen aufgespannt. Die Berechnungen hierzu liegen im Sekundenbereich.

Die drei Teammitglieder nenne ich Alice, Bob und Charlie. Diese Namen sind Klassiker in jeder Literatur über Quantenmechanik.

Ich wähle als Start für meine Berechnungen folgende Big Five Dimensionen:

 OffenheitGewissenhaftigkeit
Alicehochunbestimmt
Bobunbestimmthoch
Charlieunbestimmtniedrig
Tabelle 1: Ausgangszustände der Big Five Dimensionen der Teammitglieder Alice, Bob und Charlie

Ein Zustand, der als hoch bezeichnet wird, startet mit einer Qubit ‚1‘. Ein Zustand, der als niedrig bezeichnet wird, startet mit einer Qubit ‚0‘ und ein unbestimmter Zustand wird als Superposition der Zustände hoch und niedrig modelliert. Abbildung 4 enthält diese Aussagen in einer etwas formalisierten Form.

Abbildung 4: Anfangszustände und Interaktionsoperator im Teammodell

Da wir 2 Big Five Dimensionen für 3 Teammitglieder haben, benötigen wir 6 Qubits. Wir führen keine Berechnung auf einem Quantencomputer durch, sondern arbeiten mit einer Quantensimulation, also mit einer quantenmechanischen Berechnung, durchgeführt auf einem klassischen Computer, meinem Laptop.

Diese Berechnung soll folgende Fragenstellungen untersuchen:

Wie hoch ist die Wahrscheinlichkeit, dass alle Mitglieder eine hohe Offenheit aufweisen, obwohl nur Alice dies als Präferenz mitbringt?

Wie hoch ist die Wahrscheinlichkeit, dass alle Mitglieder eine hohe Gewissenhaftigkeit aufweisen, obwohl nur Bob dies als Präferenz mitbringt?

Wie hoch ist die Wahrscheinlichkeit, dass sich das System in einem Collective Mind Zustand befindet und zwar in zwei Varianten. Variante 1: alle Offenheit-Qubits sind verschränkt. Variante 2: alle Offenheit-Qubits und alle Gewissenhhaftigkeits-Qubits sind verschränkt.

Wir definieren wieder einen Projektionsoperator, der in diesem Fall ein Interaktionsoperator ist und nehmen der Einfachheit hier an, dass lediglich gleiche Big Five Dimensionen der Teammitglieder miteinander wechselwirken. Dies ist keine grundsätzliche Einschränkung, sondern ist lediglich der schon recht hohen Komplexität geschuldet. Abbildung 4 zeigt die wesentlichen quantenmechanischen Gleichungen.

Der Interaktionsoperator​ modelliert die Tendenz von Personen, sich aufgrund von Ähnlichkeiten in ihren Merkmalen zu beeinflussen. Wenn zwei Personen ähnliche Zustände für ein Merkmal haben, verstärkt der Operator diese Ähnlichkeit durch die Interaktion.

Wir können auf dieser Basis Wahrscheinlichkeiten für den Übergang aller Teammitglieder zu hoher Offenheit bzw. hoher Gewissenhaftigkeit berechnen. Damit können wir zwei der oben gestellten Fragen beantworten.

Um die dritte Frage zu beantworten, wie wahrscheinlich ist das Eintreten eines Collective Mind (CM), ist es wieder nötig entsprechende Projektionsoperatoren für Variante 1 und Variante 2 der Verschränkung zu bilden.

Dieser Collective Mind Operator projiziert ausgehend vom vorher berechneten Interaktions-Zustand auf einen Zustand maximaler Verschmelzung der individuellen Zustände zu einem gemeinsamen Bewusstsein.

CM Variante 1: Alle Qubits sind verschränkt. Dies repräsentiert einen Zustand, in dem alle Personen in Bezug auf beide Persönlichkeitsmerkmale vollständig synchronisiert sind.

CM Variante 2: Nur die Offenheits-Qubits sind verschränkt. Lediglich die Dimension Offenheit ist verschränkt, während Gewissenhaftigkeit variiert.

Abbildung 5 zeigt die quantenmechanischen Collective Mind Projektionsoperatoren für Variante 1 und 2.

Abbildung 5: Die Collective Mind Operatoren zu Variante 1 und 2

Nun zu den Ergebnissen: Das recht komplexe Python Programm für die Colab Umgebung wurde mit der AI-Assistenz von ChatGPT 4o1-preview erstellt. Hierbei wurde die Quantum Toolbox QuTIP [6] für die quantenmechanischen Tensor-Operationen verwendet.

Die modellierten Ergebnisse entsprechen qualitativ meinen Erfahrungen in Teams:

Die Ausbildung von einer Team-Präferenz für eine der Big Five Dimensionen hängt von der Reihenfolge der Interaktionen im Team ab: Je nachdem wer zuerst spricht entwickelt sich eine unterschiedliche Dynamik. Es ist von Vorteil, wenn zuerst Personen mit ähnlichen Präferenzen die Kommunikation starten. Sie unterstützen selbst dann Team-Präferenzen, wenn sie selbst keine Präferenz darin haben.  

Die Wahrscheinlichkeit für eine Team-Präferenz Offenheit ist moderat, also nicht oberhalb von 50%, wenn nur eine Person diese als persönliche Präferenz hat.

Falls die Präferenz Gewissenhaftigkeit in einem Team durch eine Person vorhanden ist, kann es sein, dass sich die Team-Präferenz Offenheit in einem Team überhaupt nicht ausprägt.

Falls die persönliche Präferenz Gewissenhaftigkeit nur einmal (oder auch mehrmals, gemäß meiner Erfahrung) im Team vorhanden ist, ist die Wahrscheinlichkeit groß, dass sich keine Team-Präferenz Gewissenhaftigkeit ausbildet.

Abbildung 6 zeigt ein Beispiel für ein Szenario, in dem ich die weiter oben angegebenen persönlichen Präferenzen der Teammitglieder für Szenario 4 verändert habe: Die Präferenz Offenheit bleibt wie oben angegeben, jedoch setze ich die Präferenz Gewissenhaftigkeit für alle Teammitglieder auf ‚unbestimmt‘. Das erstaunliche hier ist, dass sich eine gewisse Wahrscheinlichkeit für eine Team-Präferenz Gewissenhaftigkeit ausbildet, obwohl keines der Teammitglieder diese Präferenz hat. In anderen, hier nicht gezeigten Szenarien, führt schon eine persönliche Präferenz Gewissenhaftigkeit immer zu einer sehr geringen Team-Präferenz Gewissenhaftigkeit. Auch dies entspricht meiner Erfahrung.

Abbildung 6: Die Wahrscheinlichkeiten zur Ausbildung der Team-Präferenzen Offenheit und Gewissenhaftigkeit in Abhängigkeit der Interaktionsreihenfolge. Die persönlichen Präferenzen Offenheit von Alice, Bob und Charlie entsprechen den ursprünglich festgesetzten. Die persönlichen Präferenzen Gewissenhaftigkeit für alle drei Personen wurde für dieses Szenario auf unbestimmt gesetzt.

Abbildung 7 zeigt für das Szenario 4 aus Abbildung 6 die Wahrscheinlichkeiten der Ausbildung eines Collective Mind für die Varianten 1 und 2. Die Wahrscheinlichkeit der Ausbildung eines Collective Mind für die Variante 1 (Offenheit und Gewissenhaftigkeit verschränkt) ist deutlich geringer als für Variante 2 (nur Offenheit verschränkt). Die Ausbildung des Collective Mind hängt auch ein wenig von der Interaktionsreihenfolge ab. Jedoch ist diese Abhängigkeit sehr gering: Wenn sich überhaupt ein Collective Mind ausbildet, so hat die Interaktionsreihenfolge kaum noch Einfluss darauf.

Abbildung 7: Die Wahrscheinlichkeiten zur Ausbildung eines Collective Mind für die Varianten 1 (Offenheit und Gewissenhaftigkeit sind verschränkt) und Variante 2 (nur Offenheit ist verschränkt).

Zusammenfassend stelle ich fest:

Der Quantum Cognition Formalismus liefert keine unsinnigen Ergebnisse. Im Gegenteil: Die Ergebnisse decken sich qualitativ mit meinen Erfahrungen. Ich finde die qualitative Interpretation der Ergebnisse erstaunlich nahe an der Praxis: So nahe, dass es schon sehr an Magie grenzt.

Der Nachteil ist, dass der Quantum Cognition Formalismus sehr anspruchsvoll ist. Ohne die AI-Assistenz von ChatGPT4o1-preview wäre es mir nicht möglich gewesen, diese Berechnungen durchzuführen. ChatGPT4o1-preview strauchelte auch einige Male. – Gemeinsam war es jedoch gut möglich dies aufzufangen.

Die Übertragung der Berechnungen auf ein QC Hardware System würde es erlauben, Teamgrößen von 7-10 Teammitgliedern zu modellieren. – Jedoch ist dies ein deutlicher Schritt in Richtung Komplexität, der es aber eventuell wert sein könnte.

[1] Wikipedia (2024a) Quantum Cognition, https://en.wikipedia.org/wiki/Quantum_cognition

[2] Brody D C (2023) Quantum formalism for the dynamics of cognitive psychology, https://www.nature.com/articles/s41598-023-43403-4

[3] Pothos E M und Busemeyer J R (2022) Quantum Cognition, Annual Review of Psychology, https://www.annualreviews.org/content/journals/10.1146/annurev-psych-033020-123501

[4] Wikipedia (2024b) Quantum Mind, https://en.wikipedia.org/wiki/Quantum_mind

[5] Oswald A, Köhler J, Schmitt R (2018) Project Management at the Edge of Chaos, Springer, Heidelberg

[6] QuTIP (2024) QuTIP Quantum Toolbox in Python, https://qutip.org/