AI & M 4.0: myGini – mein Coach für Team- und Projekt-Management oder wer ist dümmer, KI oder Mensch?

In diesem Blog-Beitrag stelle ich myGini – meinen Coach für Team- und Projekt-Management vor. Bevor ich dies tue, vorweg ein paar grundsätzliche Bemerkungen zur Arbeit mittels KI.

Die Angst vor KI hat sich in den letzten Wochen eher in eine Abwertung der KI verwandelt. So werden in ARD und ZDF Titel für Beiträge zur KI verwendet, die dies nahe legen: Künstliche Intelligenz- Besser als wir? [1] oder Better than human – Leben mit KI [2]

Die Inhalte der Beiträge [1] und [2] sind hingegen sehr professionell und sehr zu empfehlen: Sie zeigen beide das Potential einer hybriden Collective Intelligence, also der Erweiterung unserer Intelligenz durch KI.  In [2] wird die Kommunikation mit einer KI getestet, die in drei Rollen mit Menschen kommuniziert: der Rolle eines Pfarrer, einer Psychotherapeutin und einer besten Freundin. Die Resonanz ist erstaunlich gut: Es kommt sogar zu Aussagen wie ‚KI hilft mir bei meiner Einsamkeit‘ und ‚KI verbindet Menschen‘.

In das Abwertungs-Horn stoßen einige meiner Kollegen mit ihren Beiträgen auf LinkedIn: KI ist monokontexturale Mustererkennung… [3] KI ist dumm und zu konventionell für unsere Transformation [4].

In [2] sagt einer der KI-Experten, dass KI nichts anderes ist als Statistik. – Auch hier schwingt die Abwertung mit. – Wenngleich die Aussage korrekt ist: KI ist Mustererkennung auf der Basis von sehr vielen Daten bzw. ‚Daten-Wahrnehmungen‘.

In einem anderen LinkedIn Beitrag – die Referenz habe ich vergesse – sagt der Autor, dass KI nichts anderes ist als Statistik und wir Menschen doch in der Läge wären Ursache-Wirkungs-Zusammenhänge zu erkennen. Damit würden wir über eine viel höherwertige Form von Intelligenz verfügen. Ich frage mich, was ist das Erkennen von Ursache-Wirkungs-Zusammenhänge denn Anderes als Mustererkennung auf der Basis von sehr vielen ähnlichen Wahrnehmungen. 

Ich werfe im Folgenden ein paar Fragen auf und verbinde mit diesen eine These: Wissen wir was unsere Intelligenz ist? Könnte es sein, dass unsere kognitive Intelligenz im Wesentlichen nichts anderes ist als Statistik? Falls eine KI den gleichen Intelligenztest besteht wie wir ihn auch für die IQ Bestimmung bei Menschen benutzen, ist dies dann ein starker Hinweis für die Aussage, dass unsere kognitive Intelligenz auch nicht viel mehr oder weniger ist als die künstliche Intelligenz? Kann es sein, dass wir aufgrund der überwältigenden KI-Fähigkeiten unseren Selbstwertschutz aktivieren und die KI abwerten, um unseren Selbstwert zu erhöhen?

Ich formuliere meinen Glaubenssatz als These: Ich glaube, dass die prinzipiellen Unterschiede zwischen unserer kognitiven Intelligenz, wie sie in einem IQ-Test gemessen wird, und der künstlichen Intelligenz nicht groß sind. – Und wir sollten deswegen kein Selbstwertproblem haben, im Gegenteil: Die bisherigen Mechanismen der KI – und wir sind noch lange nicht am Ende – wurden von uns gefunden! – Gefunden heißt, ich glaube, dass die grundlegenden Prinzipien, die Intelligenz hervorbringen, unabhängig sind vom Substrat, das sie erzeugt: Die Implementierung einer KI unterscheidet sich sicherlich in nahezu allem von der biologischen Intelligenz Implementierung. Ich glaube jedoch, dass die dahinterliegenden Prinzipien in beiden Fällen ähnlich oder sogar gleich sind. Und genau dies ist das Wunder, das wir vielfach noch nicht begriffen haben: Die komplizierten mathematischen Mechanismen einer GPT erzeugen Komplexität, die Selbstorganisation möglich macht, die dann zu den emergenten Phänomenen der künstlichen Intelligenz führen.

In diesem positiven Sinne habe ich myGini – meinen Coach für Team- und Projekt-Management mittels chatGPTplus erzeugt. myGini soll helfen, den Weg zu den umfangreichen Modellen und Theorien von Management 4.0 zu erleichtern. myGini erweitert damit die Intelligenz des Nutzers in Fragen von Team- und Projekt-Management zu einer hybriden Collective Intelligence.

myGini ist eine von mehreren hundert öffentlich verfügbaren GPTapps oder ChatBots. Öffentlich verfügbar bedeutet, dass man auf die GPTapps zugreifen kann, wenn man ein chatGPTplus Konto hat. Die Aussage, dass es schon Millionen von GPTapps gibt, kann ich nicht bestätigen. Öffentlich sichtbar sind lediglich nach meiner Einschätzung einige hundert. Und das sind schon viele, da es schwer ist zu wissen, was die GPTapps können. Es gibt schon einige GPTapps, die sich dem Thema Projektmanagement widmen, jedoch kann man nicht wirklich leicht feststellen, was sie können. – Die Benutzeroberfläche der GPTapps, wie sie von openai standardmäßig bereitgestellt wird (siehe rechte Seite in Abbildung 1), ist sicherlich verbesserungswürdig: Eine intelligente Oberfläche, die einem sagt, was die GPTapp weiss oder kann, wäre sehr hilfreich!

Ich hatte schon vor Jahren die Idee eine App zu erstellen, die Management 4.0 leichter verfügbar machen sollte. Damals habe ich eine Excel-Datei mit Bayes Wahrscheinlichkeitsberechnungen erstellt, um aufgrund von Beobachtungen die Wahrscheinlichkeiten für MBTI-Persönlichkeitspräferenzen ermitteln zu lassen.- Ein Mechanismus ähnlichem dem, wie wir selbst mit jeder Beobachtung zu neuen Hypothesen bezüglich der Persönlichkeit unserer Mitmenschen gelangen. Das Verfahren funktioniert sehr gut, jedoch ist es unhandlich. Außerdem fehlte auch noch eine Umsetzung in eine App.

Ein großer Schritt geschah, als ich vor ca. 3 Jahren meine erste GPT Anwendung mittels BERT und Python erstellte. Auch in diesem Fall konnte ich zeigen, dass die GPT Anwendung funktioniert. Aber ich stand vor dem Problem Daten zu beschaffen, um damit die GPT Anwendung zu trainieren. Also habe ich auch dies verworfen.

Mit dem jetzigen  Angebot von openai,  eine eigene GPT Anwendung zu erstellen, ist meine Idee Realität geworden.

Abbildung 1 zeigt die Entwicklungsumgebung für myGini (links) und die Anwendungsumgebung als Preview (rechts), so wie ein Anwender myGini in chatGPTplus sieht.

Abbildung 1: Die Entwicklungsumgebung für myGini (links) und die Nutzerumgebung als Preview (rechts)

Ich benutze den Begriff GPTapp, um zu unterstreichen, dass ich chatGPTplus/GPT4.0 nicht mit meinen Daten trainieren kann. chatGPTplus leitet mich hingegen mit einfachen Anweisungen an, zu definieren, welche Funktionen meine GPTapp haben soll: Ich kann ein Profilbild mittels DALL.E generieren lassen, sagen welche Modelle ich verwende (MBTI, Big Five, Spiral Dynamics, Dilts Pyramide, Theorie der Selbstorganisation….) sowie in welchen Büchern die Theorie zu Management 4.0 zu finden ist und welche Internetseiten weitere Informationen enthalten. Auf dieser Basis wird die GPTapp zusammengestellt.

Ich wollte überprüfen, ob myGini tatsächlich meine/unsere Bücher kennt, indem ich nach speziellen Textpassagen frage. Dies wurde von chatGPTplus abgelehnt, da myGini aufgrund von Urheberrechten nur Prinzipien, aber keine Textpassagen, wiedergibt.

Einige Tests zur Fähigkeit das MBTI- oder Big Five-Profil einer Person aufgrund meiner Beschreibungen zu deren Verhaltensweisen zu ermitteln, hat myGini mit Bravour bestanden. Die erste Konfiguration von myGini mit dem MBTI- und Big Five-Modell hat ca. 0,5 Stunden benötigt. – Hier ist natürlich nicht die openai GPT Trainingszeit mitgerecht. Die Erfahrung zeigt, dass  ein Mensch ca. 3 Monate intensives Training benötigt, um innerhalb weniger Sekunden/Minuten in einem Gespräch souverän erste Hypothesen zu den Persönlichkeitspräferenzen des Gesprächspartners abzugeben.

Die nachfolgenden Beispiele zeigen sehr deutlich, dass chatGPTplus bzw. myGini erstaunliche Ergebnisse und abgeleitete Zusammenhänge liefert: myGini ist eine Form von AI-M4.0 Experte, dessen Expertentum ich mit meinen Create-Informationen gebildet habe. 

Als erstes Beispiel benutze ich die rechts in Abbildung 1 vorkonfektionierte Frage ‚How do I use MBTI in team management?  

Du

How do I use MBTI in team management?

myGini

Using MBTI (Myers-Briggs Type Indicator) in team management can be quite beneficial for understanding the diverse personalities within your team and enhancing overall team dynamics. Here’s a structured approach on how to use MBTI in your team management practices:

  1. Conduct MBTI Assessments: Start by having each team member complete the MBTI assessment. This will categorize them into one of the 16 personality types based on four dichotomies: Introversion/Extraversion, Sensing/Intuition, Thinking/Feeling, and Judging/Perceiving.
  2. Share and Discuss Results: Organize a team session to share and discuss the results. This fosters openness and helps team members understand each other’s personalities, communication styles, and work preferences.
  3. Identify Team Composition: Analyze the spread of personality types within your team. This will give you insights into the team’s strengths, potential blind spots, and how different members might interact.
  4. Adapt Communication and Work Styles: Tailor your communication and management approach based on the team’s MBTI composition. For example, if you have many introverts, ensure they have quiet time for deep work, or if there are several Thinking types, focus on logical and objective decision-making processes.
  5. Enhance Team Collaboration: Use MBTI insights to facilitate better teamwork. For instance, pair Thinking types with Feeling types to balance decision-making, or Sensing types with Intuitive types to cover both practical and innovative aspects of a project.
  6. Conflict Resolution: Understanding different MBTI types can help in resolving conflicts. Recognize that different types handle conflicts differently – some may prefer direct confrontation, while others might need time to process.
  7. Tailor Development Opportunities: Offer personal development opportunities that align with each member’s MBTI type. This can include training, workshops, or mentoring that caters to their personality strengths and development areas.
  8. Monitor and Adjust: Regularly revisit the MBTI dynamics in your team, especially when new members join or when teams are restructured. Be open to adjusting your management strategies as the team evolves.

Remember, while MBTI is a useful tool, it should be used as a guide rather than a strict rulebook. Personalities can be fluid, and people may exhibit different traits in different situations. The key is to use MBTI to gain a deeper understanding of your team members and to create a more harmonious and effective work environment.

Das Ergebnis ist perfekt: Besser hätte ich es auch nicht machen können. Was mir auch auffällt ist, dass ich keine Textpassagen identifizieren kann, die aus einem unserer Bücher kopiert wurden. Vielfach sind die Formulierungen sogar besser als ich sie vorgenommen hätte.

Das nachfolgende Beispiel beruht auf der Eingabe eines Satzes in der Entwicklungsumgebung zur Aufnahme der Theorie der Selbstorganistion nach Herrmann Haken (Synergetik), man siehe Abbildung 1, linke Seite. – myGini antwortet zuerst immer in Englisch. Bleibe ich bei Deutsch, erfolgt der Übergang zu Deutsch:

Du

Ich möchte den agilen Handlungsrahmen Scrum mittels der Synergetik analysieren. Kannst Du mir sagen, auf welche Weise Rahmenparameter, Kontrollparameter und Ordnungsparameter in Scrum erfüllt werden?

myGini

Die Analyse des agilen Handlungsrahmens Scrum unter Anwendung der Prinzipien der Synergetik bietet eine interessante Perspektive auf die Teamdynamik und -organisation. In der Synergetik, die sich mit der Selbstorganisation komplexer Systeme beschäftigt, sind Rahmenparameter, Kontrollparameter und Ordnungsparameter zentrale Konzepte. Lassen Sie uns betrachten, wie diese Konzepte in einem Scrum-Umfeld angewendet werden können:

  1. Rahmenparameter (Boundary Conditions): Diese definieren die grundlegenden Bedingungen und Einschränkungen eines Systems. In Scrum beziehen sich die Rahmenparameter auf die grundlegenden Prinzipien und Praktiken des Scrum-Frameworks, wie die Rollen (Product Owner, Scrum Master, Entwicklungsteam), Artefakte (Product Backlog, Sprint Backlog, Inkrement) und Ereignisse (Sprint, Daily Scrum, Sprint Review, Sprint Retrospektive). Diese Rahmenbedingungen schaffen ein Umfeld, in dem Selbstorganisation und agile Entwicklung gedeihen können.
  2. Kontrollparameter (Control Parameters): Kontrollparameter sind die Variablen, die den Zustand des Systems beeinflussen und zu einer neuen Ordnung führen können. In Scrum können dies Elemente wie die Sprintlänge, die Priorisierung im Product Backlog, die Teamzusammensetzung oder die Definition of Done (DoD) sein. Die Anpassung dieser Parameter während des Projekts kann die Teamdynamik und die Produktivität erheblich beeinflussen und zu einer effektiveren Selbstorganisation führen.
  3. Ordnungsparameter (Order Parameters): Ordnungsparameter entstehen spontan als Ergebnis der Interaktionen innerhalb des Systems und führen zu einer kohärenten Struktur oder einem Muster. In einem Scrum-Team können Ordnungsparameter Aspekte wie Teamnormen, Kommunikationsmuster, gemeinsame Werte oder die sich entwickelnde Teamkultur sein. Diese emergenten Eigenschaften reflektieren die innere Ordnung des Teams und sind oft ein direktes Ergebnis der Wechselwirkung zwischen Rahmen- und Kontrollparametern.

Um Scrum erfolgreich durch die Linse der Synergetik zu analysieren, ist es wichtig, ein tiefes Verständnis dafür zu entwickeln, wie diese Parameter interagieren und wie Anpassungen an einem Punkt des Systems die Gesamtdynamik beeinflussen können. Dies erfordert eine flexible und adaptive Haltung vom Scrum Master und dem Team, um die Selbstorganisation zu fördern und gleichzeitig die Produktivität und Effektivität des Teams zu maximieren.

Du

Was hältst Du davon neben den Dir genannten Parameterausprägungen folgende zu nennen: Rahmenparameter: Abschottung von externer Komplexität, Rituale Kontrollparameter: Work in Progress (WIP), persönlichkeitsorientierte Kommunikation Ordnungsparameter: Produktvision, Product Goal und auch das Taskboard

myGini

Ihre Ergänzungen zu den Rahmen-, Kontroll- und Ordnungsparametern in der Anwendung von Scrum durch die Synergetik-Perspektive sind durchaus sinnvoll und bereichern das Verständnis der Selbstorganisationsdynamik in agilen Teams. Lassen Sie uns diese Parameter genauer betrachten:

  1. Rahmenparameter:
    • Abschottung von externer Komplexität: Dies ist ein wichtiger Aspekt, der sicherstellt, dass das Team sich auf seine Aufgaben konzentrieren kann, ohne von externen Störungen oder sich ständig ändernden Anforderungen abgelenkt zu werden. In Scrum hilft diese Abschottung dabei, ein stabiles Arbeitsumfeld zu schaffen, in dem das Team effizient arbeiten und sich selbst organisieren kann.
    • Rituale: Scrum-Praktiken wie Daily Stand-ups, Sprint Planning, Reviews und Retrospektiven sind entscheidende Rituale. Diese strukturierten Ereignisse fördern die Klarheit, Fokussierung und regelmäßige Reflexion, die für die Aufrechterhaltung und Verbesserung der Teamdynamik und -effektivität unerlässlich sind.
  2. Kontrollparameter:
    • Work in Progress (WIP): Die Begrenzung des Work in Progress ist entscheidend für die Aufrechterhaltung der Effizienz und Effektivität des Teams. Durch die Kontrolle und Anpassung des WIP können Teams Überlastung vermeiden und eine kontinuierliche und gleichmäßige Arbeitsflussgeschwindigkeit sicherstellen.
    • Persönlichkeitsorientierte Kommunikation: Die Anpassung der Kommunikationsstile und -methoden an die individuellen Persönlichkeiten im Team kann die Zusammenarbeit und das Verständnis innerhalb des Teams erheblich verbessern. Dieser Ansatz trägt dazu bei, Missverständnisse zu reduzieren und eine positive Teamdynamik zu fördern.
  3. Ordnungsparameter:
    • Produktvision und Product Goal: Diese geben die Richtung und den Zweck des Teams vor und sind entscheidend für die Ausrichtung und Motivation des Teams. Sie dienen als Leitfaden für Entscheidungen und Priorisierungen und helfen, die Bemühungen des Teams auf ein gemeinsames Ziel zu konzentrieren.
    • Taskboard: Das Taskboard ist ein visuelles Werkzeug, das nicht nur den Fortschritt und die aktuelle Arbeitslast darstellt, sondern auch zur Strukturierung der Teamaktivitäten und zur Förderung der Transparenz beiträgt. Es ist ein zentraler Bestandteil der Selbstorganisation, da es die Koordination und die Zusammenarbeit innerhalb des Teams erleichtert.
    Insgesamt bieten Ihre vorgeschlagenen Parameterausprägungen eine umfassendere Sicht auf die Anwendung von Scrum in einem selbstorganisierenden Team. Sie betonen die Bedeutung der Abschirmung vor externen Störungen, der Anpassung der Kommunikation an individuelle Bedürfnisse und der zentralen Rolle von Vision, Zielen und visuellen Tools bei der Förderung von Teamkohärenz und -ausrichtung. Diese Aspekte sind entscheidend für die Schaffung eines Umfelds, in dem agile Teams effektiv arbeiten und sich selbst organisieren können, im Einklang mit den Prinzipien der Synergetik.

Du

Perfekt, super hilfreich!

myGini

Das freut mich zu hören! Wenn Sie weitere Fragen haben oder Unterstützung bei einem anderen Thema benötigen, zögern Sie nicht, mich zu fragen. Viel Erfolg bei Ihren Projekten und in der Anwendung von Scrum!

Wie man aus diesen Beispielen sehen kann, erzeugt diese ‚statistische‘ 😉 Künstliche Intelligenz Antworten, die den Antworten eines Senior-Experten in nichts nachstehen.

Es ist deshalb sehr müßig, AI-Systeme als dumm zu bezeichnen, denn dann müsste man uns Menschen auch als dumm bezeichnen. – Was alles in allem wenig hilfreich ist und allenfalls unser ‚gekränktes‘ Selbstwertgefühl aufwertet.

Neben den Gefahren, die mit der Erstellung von GPTapps einhergehen können –  man siehe als Beispiel [5] – sehe ich ein viel größeres strukturelles Problem: Kann es sein, dass wir mit der flächendeckenden Verfügbarkeit von GPTapps immer träger und dümmer werden? Denn warum sollte ich mich noch den Mühen eines M4.0-Verständnisse oder den Mühen der Mathematik oder den Mühen des Programmierens oder…oder… aussetzen, wenn mir die gebratenen Tauben in Form von GPTapps in den Mund fliegen. Kann es sein, dass wir eine Bildungsungleichheit befeuern, in der nur noch wenige wissen, wie man AI-Systeme erstellt und der traurige Rest an Milliarden von Menschen nur noch konsumiert? Kann es sein, dass die GPTapps jede Form von erdenkbarem Missbrauch möglich machen? – Denn wer sagt uns, dass die GPTapp-Ersteller zum Wohl der Milliarden anderen Menschen handeln?

Eine neue Zeit ist angebrochen! Den Zug der KI-Innovationen zu stoppen, ist für mich keine Option. -Statt dessen ist ein Aufbruch erforderlich, der den Milliarden KI-Nutzern den souveränen Umgang mit der Technologie vermittelt.  

[1] ZDF (2023) Künstliche Intelligenz – Besser als wir? – Weltspiegel Doku – ZDFmediathek, https://www.zdf.de/daserste/weltspiegel/page-video-ard-kuenstliche-intelligenz–besser-als-wir—weltspiegel-doku-100.html

[2] MDR (2023) Better than human – Leben mit KI, https://www.ardmediathek.de/video/ard-wissen/better-than-human-leben-mit-ki/das-erste/Y3JpZDovL21kci5kZS9zZW5kdW5nLzI4MjA0MS8yMDIzMTIyOTA2MDAvbWRycGx1cy1zZW5kdW5nLTc4NzI

[3] Detholff C (2024) #KI ist monokontexturale Mustererkennung, denn … , https://www.linkedin.com/posts/conny-dethloff-6b9b0942_ki-innovation-lernen-activity-7150711017889509376-nplL/?utm_source=share&utm_medium=member_ios

[4] Hofert S (2024) KI ist dumm und zu konventionell für unsere Transformation!, https://www.linkedin.com/posts/svenjahofert_bigfive-vertikalenentwicklung-wust-activity-7151513159051161600-fRwu?utm_source=share&utm_medium=member_desktop

[5] Petereit D (2024) OpenAIs GPT-Store: Girlfriend-Bots zeigen die Probleme des offenen KI-Shops auf, https://t3n.de/news/openais-gt-store-girlfriend-bots-zeigen-die-probleme-des-offenen-ki-shops-auf-1601980/

Rückwärtsgewandt in den Abgrund…oder… Entwickeln wir uns weiter!?

Die Geschehnisse der letzten Jahre machen mich mehr als nur besorgt: Die massive Schädigung der Natur durch uns, die Pandemie Corona, der Überfall Russlands auf die Ukraine, der Terrorakt der Hamas gegenüber Israel, das Umsichgreifen der verfassungsfeindlichen, antidemokratischen AfD, der schleichende Rückzug der Demokratie in den USA und in Europa, der Antisemitismus von rechts, links und Islamisten, die Missbrauchsskandale in der katholischen Kirche sowie die vielen Naturkatastrophen, Kriege und Terrorakte an die wir uns schon gewöhnt haben oder die keine mediale und persönliche Aufmerksamkeit erhalten.

Es macht mich umso besorgter, als dass wir in Europa glaubten, wir hätten die dunkle Seite der Vergangenheit hinter uns gelassen.

Dieser Blog-Beitrag wird stark motiviert durch einen Beitrag auf LinkedIn [1], in dem angeregt wird, dass die Diskussion um den sogenannten Purpose (Zweck/Sinn) eines Unternehmens unnötig sei, da alleine der Profit das Entscheidende sei, um das Unternehmen am Leben zu erhalten. Nicht wenige aus der Agilen Community haben dieser Aussage zugestimmt. Ich habe daraufhin folgenden Kommentar angefügt:

„Ich bin erschrocken, als ich gelesen habe, dass einige meiner Kolleg:innen, die Transformationen begleiten, der Aussage „Ein Purpose ist für Unternehmen ein Handicap!“ zustimmen und diese Aussage sogar mit der Aussage „Um zu überleben, müssen sie sich auf den Profit konzentrieren.“ verstärken. Stafford Beer als Beleg hierfür anzuführen, macht die Aussagen zu gedanklichen Irrlichtern. – Ich schließe mich der Aussage von Christian Mueller-Bagehl an: „Solche Beiträge passen aus meiner Sicht intellektuell nicht mehr in die Zeit. Sie befördern gegebenenfalls unethisches Verhalten!“ Warum?

Das Zitat von Stafford Beer hat nichts mit der Aussage zu tun, dass Organisationen keinen Purpose/Zweck/Sinn benötigen, sondern ist die Aussage, dass jedes System sich durch Selbstreferentialität ausbildet. D.H. auch u.a., dass man keiner Organisation einen Purpose/Zweck/Sinn aufsetzen kann (wie vermeintlich von nicht wenigen Vorständen/Coaches angenommen), er bildet sich vielmehr von alleine. In der Theorie der Selbstorganisation bezeichnet man die Größe, die eine sich selbständig ausbildende Ausrichtung eines Systems hervorruft, als Ordnungsparameter. – Jedes System hat einen Ordnungsparameter bzw. eine Ordnungsparameter-Hierarchie. So gibt es sicherlich Organisationen, die Geld bzw. Profit, also nicht nur eine Werterzeugung, als obersten Ordnungsparameter haben. Die Mafia gehört meines Erachtens dazu und die Deutsche Bank in der Ära Ackermann’s mit 25% Rendite gehörte auch dazu. Organisationen auf den Ordnungsparameter Profit zu reduzieren, ist meines Erachtens zutiefst kapitalistisch/neoliberal – mit all den Konsequenzen, die wir heute im Klimawandel, der Zerstörung der Natur aber auch in dem Egoismus von Gesellschaften und Individuen sehen. – Es ist eine der großen Errungenschaften des agilen Denkens, den Ordnungsparameter Profit (fast) von seinem Thron gestoßen zu haben. – Ich hoffe, der Thron wird nicht wieder errichtet.“

Was hat dieses, vielleicht auf den ersten Blick, eher harmlose Thema mit den doch sehr viel dramatischeren und schwerwiegenden Welt-Ereignissen zu tun? Ich glaube einiges und ich werde im Folgenden versuchen dies sichtbar zu machen.

Das World Economic Forum hat im Januar seinen World Risks Report rausgebracht. Abbildung 1 zeigt das globale Risikoportfolio auf der Basis von Befragungen: Man darf vermuten, dass die Größe der Kreise nicht dem jeweiligen Risikowert (= potentieller Schaden*Eintrittswahrscheinlichkeit) entsprechen und damit meines Erachtens in nicht wenigen Fällen eine Verharmlosung des jeweiligen Risikos ausdrücken. – Gleichwohl ist der World Risks Report ein wichtiges Dokument. – Mir ist nicht bekannt, dass es auf der Ebene der EU oder Deutschlands eine vergleichbare Risikoportfolioanalyse gibt bzw. öffentlich zugänglich ist. – Aus dem Projektmanagement weiß man, dass proaktives Risikomanagement ein Augenöffner für den Umgang mit Unsicherheit ist und komplexe Projekte erst erfolgreich durchführen lässt.

Abbildung 1: World Economic Forum, Global Risks Perception Survey 2022-2023 [2] – Vergrößern über rechte Maustaste

Diese Risikomap und die eingetretenen Geschehnisse der letzten Jahre werfen bei mir folgende, beunruhigende Frage auf: Bewegen wir uns rückwärtsgewandt auf einen oder sogar mehrere globale Abgründe zu?

In dem Spiegel-Beitrag aus dem Jahre 2021 „Der unvermeidliche Weg in eine grüne Zukunft“ [3] skizziert Stefan Schultz, kurz vor der letzten Bundestagswahl, das Kultur- und Bewusstsein-Entwicklungsmodell Spiral Dynamics [4,5]: Egal wer die Bundestagswahl gewinnt, unser Weg in die Zukunft ist grün, auch wenn dieser Weg über (lange) Umwege (z.B. CDU) dorthin führt. Hiermit bringt er die Beobachtung zum Ausdruck, dass die menschliche Entwicklung über Jahrtausende hinweg zu immer höheren Kultur- und Bewusstseinsstufen erfolgte. Die in Europa anstehende nächste vorherrschende Bewusstseinsstufe wird in Spiral Dynamics mit der Farbe grün gekennzeichnet.

Leider ist es nicht so, dass unsere persönliche und gesellschaftliche Entwicklung zwangsläufig immer in Richtung einer höheren Entwicklungsstufe verläuft. Ein Blick in die Geschichte zeigt dies: Die Zeit des Nazi-Deutschlands war ein gewaltiger Rückschritt, das Auftauchen der AfD ist ebenfalls ein großer Rückschritt. Entwicklung in Jahrhunderten oder -Tausenden gezählt, erfolgte bisher immer zu höheren Entwicklungsstufen, jedoch auf Zeitskalen von Jahrzehnten können erhebliche Rückschritte eintreten. Auf das Spiegel-Beispiel übertragen, könnte dies im Angesicht des Klimawandels heißen, dass eine höhere Kultur- und Bewusstseinsstufe zu spät kommt! 

Das Spiral Dynamics Modell kennzeichnet die Entwicklung von Menschen, Gruppen, Organisationen oder Gesellschaften durch sogenannte value-Meme, kurz v-Meme. V-Meme sind Gedankenschnipsel, Werte, Glaubenssätze oder Grundannahmen, die das Verhalten von Individuen, Gruppen, Organisationen oder Gesellschaften beschreiben. Nach Spiral Dynamics wird unsere Entwicklung durch verschiedene v-Mem Typen beschrieben. Die v-Mem-Typen fassen ähnliche Mem-Erscheinungsformen zusammen und werden durch einen Farbcode gekennzeichnet. Man siehe Abbildung 2.

Abbildung 2: Oben links ist eine Darstellung der derzeit sichtbaren Entwicklungsstufen sowie deren Beziehung zu den vier Grundbedürfnissen gemäß der Neuropsychotherapie [6, 7] zu sehen. Unten links ist die Spiral Darstellung nach Don Beck [8] enthalten. – Die vordere Zahl gibt an, wie viel Prozent der Weltbevölkerung sich (Stand Anfang des 21. Jahrhunderts) auf der jeweiligen höchsten Entwicklungsstufe befindet, die hintere, wie hoch der Anteil des gesellschaftlichen Einflusses der Entwicklungsstufe ist. Das rechte Bild zeigt die globale Entwicklung von Gesellschaften, dargestellt mittels v-Mem Verteilungen [9]. – Vergrößern über rechte Maustaste

Die Entwicklung wird (vereinfacht) durch die jeweils höchste v-Mem Stufe gekennzeichnet. Wobei diese höchste Entwicklungsstufe die darunter liegenden Stufen integriert: Es liegt tatsächlich eine Mischung von v-Memen vor. Diese ist charakteristisch für einen Menschen, eine Gruppe, eine Organisation oder eine Gesellschaft zum jeweiligen Betrachtungs-Zeitpunkt. Das sogenannte ‚center of gravity‘ berücksichtigt den v-Mem Schwerpunkt innerhalb eines Menschen oder innerhalb eines sozialen Systems, und kann damit von der höchsten erreichten Entwicklungsstufe stark abweichen.

Bezüglich der Verbindung von Spiral Dynamics (und der Integralen Theorie) zur Gesellschaftstheorie/Soziologie und Politik verweise ich auf die sehr lesenswerte Magisterarbeit von David Kriegleder [10]. Für einen aktuelle Eindruck von der Bedeutung von Spiral Dynamics im politischen Raum verweise ich auf [4, 5, 11, 12, 13].

Das Spiral Dynamics Modell ist ein zentrales Modell im Management 4.0. Ich habe im Laufe der letzten Jahre mehrmals dieses Modell in diesem Blog verwendet, um Führungs-, Team oder Gesellschaftsfragestellungen zu behandeln:

Der Blog-Beitrag ‚Cultural Entropy: Corona deckt unsere Werte auf!‘ [14] vom März 2020 zeigt anhand von Spiral Dynamics und dem Barrett Value Modell das limitierende Potential von Werten auf: Die stark limitierenden v-Meme Purpur (Mystik), Rot (Macht), Blau (Ordnung) haben in allen westlichen Gesellschaftsschichten eine ähnliche Verteilung. – Bildung und Wohlstand begrenzen leider nicht unmittelbar die Verbreitung limitierender v-Meme.

Der Blog-Beitrag ‚Projekt-Controlling, alles eine Frage der richtigen Werkzeuge!?‘ [15] vom März 2019 zeigt den Zusammenhang von Spiral Dynamics und den vier Grundbedürfnissen des Menschen gemäß Neuropsychotherapie-Erkenntnissen auf. Das rot v-Mem lässt sich dem Grundbedürfnis nach Selbstwertschutz und -Erhöhung zuordnen, das blaue v-Mem wird dem Grundbedürfnis nach Orientierung und Kontrolle zugeordnet, das orange v-Mem lässt sich dem Grundbedürfnis nach Lustgewinn und Unlustvermeidung zuordnen und das grüne v-Mem wird dem Grundbedürfnis nach Bindung zugeordnet. Ein traditionelles Mindset verorten wir in der Dominanz von rotem v-Mem (Macht, Status) und blauem v-Mem (Ordnung, Kontrolle und Sicherheit). Ein agiles Mindset ist ein Mindset, in dem Offenheit, Neugier und Respekt vor Mensch, Tier und Natur vorherrschen. – Wir verorten hier die orangen und grünen v-Meme.
Hass und Gewalt entwickeln sich aus einer sehr großen Dominanz von mythischen, roten und blauen v-Memen: Wenn Macht und Status sowie Ordnung und Kontrolle aus Sicht der jeweiligen Personen oder Gruppen drohen verloren zu gehen oder schon verloren gegangen sind, entfalten limitierende v-Meme ihre destruktive Wirkung.   

Der Blog-Beitrag ‚Gesellschaftlicher Wandel – Sein oder Nichtsein?- Das ist hier die Frage!‘ [16] vom Mai 2020 skizziert die v-Mem-Struktur der amerikanischen und deutschen Gesellschaft. In beiden Gesellschaften zeigen ca. 40% der Bevölkerung eine höchste Entwicklungsstufe, die durch die limitierenden v-Meme bestimmt wird. – In den USA ist der Anteil sogar größer als in Europa. (man siehe auch Abbildung 2, rechts).

Der Blog-Beitrag ‚Governance: Die hohe Kunst der Führung von Gesellschaft, Unternehmen und Projekten‘ [17] vom September 2018 zeigt, dass Führung entsteht, wenn die v-Meme des Führenden mit den v-Memen des oder der Geführten in Resonanz treten. Führende die lediglich über limitierende v-Meme verfügen, sprechen auch nur Personen mit limitierenden Werten an.

Der Blog-Beitrag ‚Projekte neu gedacht: Entwicklungsstufen, Selbstorganisation und Co-Evolution‘ [18] vom Februar 2019 zeigt, dass eine hohe individuelle Bewusstseinsstufe notwendig ist, um mit Komplexität und daraus resultierender Unsicherheit umgehen zu können. Die individuelle Bewusstseinsstufe kann jedoch keine Wirksamkeit entfalten, wenn der Kontext (die Kultur der Organisation oder Gesellschaft und die verfügbaren Technologien) dies nicht möglich macht.

Berücksichtigen wir all die oben genannten Erkenntnisse, so ergeben sich folgende Aussagen für die oben genannten Geschehnisse und Risiken:

In Deutschland (und Europa) macht die Angst vor dem Verlust von Selbstwirksamkeit (Wohlstandsverlust, Verlust an Macht und Status) und die Angst vor Unsicherheit (Verlust an Ordnungs- und Sicherheitsgefühl) die purpurnen, roten und blauen v-Meme wieder sichtbar: Sie waren in den letzten Jahrzehnten nicht verschwunden, sie werden nur jetzt wieder sichtbar. Dies erklärt meines Erachtens das Auftauchen von Verschwörungstheorien, das Erstarken der AfD, den Antisemitismus, die Fremdenfeindlichkeit sowie das permanente Ausweichen vor schnellen und konsequenten Klimaschutzmaßnahmen. Der Glaube an Markt und Technologie, ausgedrückt im orangen v-Mem, ist leider nicht hilfreich, sondern trägt zum Erstarken der v-Meme mit limitierendem Potential bei. Im integralen Verständnis muss es die Aufgabe der grünen (und orangen) v-Meme sein, mit geeigneten Mitteln, Gesellschaftsgruppen mit purpurnen, roten und blauen v-Memen die Angst vor Wohlstands- und Sicherheitsverlust zu nehmen: Dies wird tragischerweise wahrscheinlich auch heißen müssen, dass die durch Migration hervorgerufene Komplexität reguliert wird: Migranten mit limitierenden v-Memen führen zu einem Erstarken von europäischen Gesellschaftsgruppen mit ebenfalls limitierenden v-Memen. Zusätzlich ist es notwendig alle Themen, die die Selbstwirksamkeit einschränken, mit äußerster Vorsicht zu handhaben.  

In anderen Gesellschaften, wie Russland oder im islamischen Raum, sind die Gesellschaftsanteile mit limitierenden v-Memen deutlich höher als in Europa (man siehe Abbildung 2). – Bezüglich Russlands verweise ich auf das gerade erschienene Buch von Olaf Kühl [19]. Dies wiegt umso schwerer, als die Führung in solchen Ländern selbst durch limitierende v-Meme geleitet wird und aufgrund des oben geschilderten Führungs-Resonanzeffektes die Entwicklung zu höheren Kultur- und Bewusstseinsstufen verhindert. –  Mögliche individuelle oder gesellschaftliche orangene, grüne oder höhere v-Meme haben keine Chancen der Wirksamkeit. Wie die Fehleinschätzung zu Putin zeigt, ist es erforderlich keine naiven Politik-Glaubensätze wie ‚Wandel durch Handel‘ (dies ist ein typisches orangenes Mem mit blauen und roten Anteilen) zu verfolgen, sondern komplexere Strategien, die die oben genannten Zusammenhänge berücksichtigen.

Unsere Gesellschaft differenziert sich immer weiter aus – dies gilt global: Es entstehen durch Selbstorganisation viele unterschiedliche Gruppierungen. Die jeweilige Führung tritt mit ihren jeweiligen v-Memen in Resonanz mit (zukünftigen) Mitgliedern der Gesellschaftsgruppe. Falls die v-Meme einen stark limitierenden Charakter haben, bilden sich auch Ziele als Ordnungsparameter heraus, die diesen limitierenden v-Memen entsprechen. Rahmenparameter wie Ausgrenzung und Isolation verstärken diese Mechanismen noch. Wer sich mit der Selbstorganisation von Organisationen beschäftigt hat, wird diesen Prozess bestätigen können.

Die limitierenden v-Meme erzeugen eine sehr destruktive Kraft, wenn psychische Störungen und/oder traumatische Erlebnisse für Individuum oder für Völker hinzukommen. Im Israel-Palästina Konflikt können wir dies beobachten. Die Israelis sind als Volk durch den Holokaust traumatisiert, die Palästinenser durch die jahrzehntelange Ausgrenzung. Israel hat als Volk eine westliche v-Mem Struktur, auch wenn starke Gruppierungen mit einer limitierenden v-Mem-Struktur zurzeit die Politik bestimmen. Ich gehe davon aus, dass das ‚center of gravity‘ der palästinensischen v-Mem Struktur eher limitierenden Charakter hat. Beide Völker werden meines Erachtens durch Personen vertreten, die keine integrierenden v-Meme erkennen lassen, sondern vielmehr limitierende v-Meme. Dies ist ein Kontext, der einen idealen Nährboden für das Entstehen und Bestehen der Terrororganisation Hamas darstellt.        

Ich komme zurück zu meinem LinkedIn Kommentar: Meines Erachtens lässt die Aussage, dass Unternehmen keinen Zweck/Sinn (Purpose) benötigen, sondern, dass der Profit als Ordnungsparameter völlig genügt, limitierende v-Meme erkennen. Schaut man sich den genauen Wortlaut, auch in den bejahenden Kommentaren an, so zeigt die Aussage, orange v-Meme unterlegt mit blauen und teilweise sogar roten v-Memen. Das merkliche Auftauchen des grünen v-Mems in unserer Gesellschaft hat die Einführung des Purpose ermöglicht und gehört heute elementar zum agilen und komplexitäts-meisternden Handeln.– Deshalb wiegt die Aussage zum Streichen des Purpose umso schwerer, als die kommentierenden und bejahenden Personen zur Agilen Community gehören. An diesem Beispiel kann man sehen, dass rückwärtsgewandtes Denken und Handeln auch in vermeintlich einfachen Zusammenhängen auftreten können. – Tragisch wird es, wenn eine Mehrheit immer öfter rückwärtsgewandtes Handeln und Denken erkennen lässt. – Dann ist es nämlich tatsächlich zu spät für uns!

[1] Oswald A (2023) LinkedIn Kommentar, https://www.linkedin.com/feed/update/urn:li:activity:7118869083718082560/

[2] World Economic Forum (2023) Global Risks Report 2023, https://www.weforum.org/publications/global-risks-report-2023/,

[3] Schultz S (2023) Der unvermeidliche Weg in eine grüne Zukunft, https://www.spiegel.de/wirtschaft/soziales/bundestagswahl-und-spiral-dynamics-der-unvermeidliche-weg-in-eine-gruene-zukunft-a-0b3fe0ab-a59e-43ae-b868-d61e8c46340d?sara_ref=re-so-app-sh, erschienen am 24.07.2021, zugegriffen am 05.11.2023

[4] Wikipedia (2023a) Spiral Dynamics, https://de.wikipedia.org/wiki/Spiral_Dynamics, zugegriffen am 13.11.2023

[5] Wikipedia (2023b) Spiral Dynamics, https://en.wikipedia.org/wiki/Spiral_Dynamics, zugegriffen am 13.11.2023

[6] Grawe K (2004) Neuropsychotherapie. Hogrefe, Göttingen

[7] Oswald A, Köhler J, Schmitt R (2017) Projektmanagement am Rande des Chaos, 2. Auflage, Springer Vieweg, Heidelberg. This book is avalaible in English: Oswald A, Köhler J, Schmitt R (2018) Project Management at the Edge of Chaos, Springer Verlag, Heidelberg

[8] Beck D E, Cowan C C (2007) Spiral Dynamics: Leadership, Werte und Wandel. J. Kamphausen Verlag & Distribution GmbH, Bielefeld

[9] Center for human emergence, middle east (2023) https://www.humanemergencemiddleeast.org/different-values-different-democracy-alan-tonkin.php, zugegriffen am 13.11.2023

[10] Kriegleder D (2010) Die Integral-Theorie Ken Wilbers und ihre Implikationen für die Politikwissenschaft, Magister Arbeit, Universität Wien

[11] Integrales Forum (2023) https://www.integralesforum.org/, zugegriffen am 13.11.2023

[12] SDi / D·A·CH (Spiral Dynamics integral im Raum Deutschland – Österreich – Schweiz), https://spiraldynamics-integral.de/, zugegriffen am 13.11.2023

[13] Institut für Integrale Studien (2023) https://www.ifis-freiburg.de/, zugegriffen am 13.11.2023

[14] Oswald A (2021) Cultural Entropy: Corona deckt unsere Werte auf!, Blog-Beitrag März 2020, https://agilemanagement40.com/cultural-entropy-corona-deckt-unsere-werte-auf

[15] Oswald A (2021) Projekt-Controlling, alles eine Frage der richtigen Werkzeuge!?, Blog-Beitrag März 2019, https://agilemanagement40.com/projekt-controlling-alles-eine-frage-der-richtigen-werkzeuge

[16] Oswald A (2021) Gesellschaftlicher Wandel – Sein oder Nichtsein? – Das ist hier die Frage!, Blog-Beitrag vom Mai 2020, https://agilemanagement40.com/gesellschaftlicher-wandel-sein-oder-nichtsein-das-ist-hier-die-frage

[17] Oswald A (2018) Governance: Die hohe Kunst der Führung von Gesellschaft, Unternehmen und Projekten, Blog-Beitrag vom September 2018,  https://agilemanagement40.com/governance-die-hohe-kunst-der-fuehrung-von-gesellschaft-unternehmen-und-projekten

[18] Oswald A (2019) Projekte neu gedacht: Entwicklungsstufen, Selbstorganisation und Co-Evolution, Blog-Beitrag vom Februar 2019, https://agilemanagement40.com/projekte-neu-gedacht-entwicklungsstufen-selbstorganisation-und-co-evolution

[19] Kühl O (2023) Z: Kurze Geschichte Russlands, von seinem Ende her gesehen, Rowohlt Berlin, 1. Kindle Edition

AI & AM 4.0: Agent Based Modeling – Emergenz – Wunder geschehen!

Kürzlich erschien ein offener Brief zum Thema ‚Pausieren von gigantischen AI-Experimenten‘ à la GPT-3 oder GPT-4 [1].

Der Brief wurde inzwischen von mehr als 30.000 Personen unterschrieben. Er begründet sein Anliegen eines halbjährigen Aussetzens von AI-Groß-Entwicklungstätigkeiten mit folgendem Satz:

“This does not mean a pause on AI development in general, merely a stepping back from the dangerous race to ever-larger unpredictable black-box models with emergent capabilities.”

Es geht die Angst vor ‚emergenten Fähigkeiten‘ um. – An anderer Stelle wird von einer ‚Gottgleichen‘ KI gewarnt, die die Menschheit zerstören könnte [2].

Diese Sorgen mögen berechtigt sein, umso mehr, als man beobachten kann, wie lange sich die EU schon bemüht, den längst fälligen EU AI ACT als EU-Gesetz zu verabschieden [3].

In diesem Blog geht es jedoch nicht um diese Sorge oder Angst, sondern um das Thema Emergenz, das offensichtlich solche ‚Wunder‘ wie das der „Sparks of Artificial General Intelligence: Early experiments with GPT-4” [4] möglich macht. Die Intelligenz-Fähigkeiten von GPT-4, auch im Vergleich zu chatGPT/GPT-3.x, sind sensationell, gleichgültig, ob es um Mathematik, Musik, Bilderzeugung, Sprache und Logik und vielem mehr geht. – In nicht wenigen Fällen zeigt GPT-4 Intelligenz-Fähigkeiten, die überhaupt nicht trainiert worden sind. – Also klare Zeichen von emergenten Eigenschaften.

In Wikipedia wird Emergenz wie folgt definiert: „Emergenz (lateinisch emergere „Auftauchen“, „Herauskommen“, „Emporsteigen“) bezeichnet die Möglichkeit der Herausbildung von neuen Eigenschaften (Systemeigenschaften) oder Strukturen eines Systems infolge des Zusammenspiels seiner Elemente.“ [5]. Emergenz ist auch direkt mit dem Begriff der Selbstorganisation verbunden. Selbstorganisierte Systeme zeigen Emergenz bzw. emergente Eigenschaften. Auf der Basis dieser Definition wimmelt es in der Natur und damit in der Mathematik, den Naturwissenschaften/ Psychologie und den Sozialwissenschaften nur so von emergenten Eigenschaften, Strukturen oder Systemen.

In [6] wird auch deshalb zwischen schwacher und starker Emergenz unterschieden. Starke Emergenz liegt im Falle des Lebens vor, das aus Atomen oder Molekülen emergiert. – Oder, im Falle unseres Bewusstseins, das aus der materiellen Struktur unseres Gehirns emergiert. Die meisten anderen überraschenden Eigenschaften von Viel-Agenten Systemen wie zum Beispiel die Supraleitung, die Farbe von Gold, der Collective Mind eines Teams oder die Kultur einer Organisation werden eher der schwachen als der starken Emergenz zugeordnet. Ich halte die Unterscheidung für wenig sinnvoll.- Entscheidend für die Emergenz ist vielmehr, dass das durch die Wechselwirkung von Agenten entstehende Systeme Eigenschaften zeigt, die sich nicht aus den Eigenschaften der Agenten ableiten lassen.  In [7] wird deshalb für die Beschreibung von Large Language Model’s bezüglich Emergenz eine Definition verwendet, die die obige Definition aus [5] weiterführt:

„Emergence is when quantitative changes in a system result in qualitative changes in behavior.”

Abbildung 1: Bilder erzeugt durch die KI DALL-E [8] mit den Prompts: Create a painting in the style of Matisse: (Create a painting in the style of Gauguin:) Collective Mind as an example of social emergence which demonstrates synergies in a team

Im Falle von Large Language Models (LLM) gibt es mehrere quantitative Änderungen, die qualitative Veränderung hervorrufen: u.a. Anzahl der Parameter (Neuronen), Menge der Daten und die Trainingszeit. Aber auch die Architektur der LLM’s spielt eine entscheidende Rolle: u.a. das Transformer/Decoder Design, der Attention Mechanismus, usw.. So zeigt GPT-3 bei etwa 10 hoch 22 (10 Trilliarden) Floating Point Operations (FLOPs) als Maß für die Trainingszeit und 13 Milliarden Parametern einen sprunghaften Anstieg der sogenannten few-shoot prompting Genauigkeit.- Also nach einigen wenigen Lerndaten meistert das AI-System ähnliche Aufgabenstellungen. – Dieser Übergang entspricht einem Phasenübergang. – Ganz ähnlich zu der gesellschaftliche Resonanz für AI-System, die mit dem Erscheinen des einfach zu bedienenden chatGPT sprunghaft emergierte. 

Für die Beschreibung emergenten Systemverhaltens wurde in der Wissenschaftsgeschichte sehr oft der Nobelpreis vergeben: Es geht darum, diejenigen quantitativen Parameter ausfindig zu machen, die einen qualitativen Unterschied machen. Und dies ist meistens sehr schwierig, da man den Parametern nicht ansieht, ob sie in ihrer Zusammenstellung einen Unterschied machen. – Der qualitative Unterschied lässt sich also nicht auf die quantitativen Unterschiede in den Parametern reduzieren.

Jedoch wurde auch in der Geschichte der Wissenschaft aus dem Unverständnis der Emergenz eine unsinnige Spaltung in reduktionistische Wissenschaften und nicht-reduktionistische (holistische) Wissenschaften [9] vorgenommen. Hiernach wurde zum Beispiel die Physik als reduktionistische Wissenschaft angesehen, da angeblich alle System-Eigenschaften in der Physik auf die Eigenschaften der Agenten (z.B. Elementarteilchen, Atome) zurückgeführt werden, also reduziert werden.  Die Sozialwissenschaft mit der Soziologie à la Luhmann wurde zum Beispiel als holistische Wissenschaft wahrgenommen, da Luhmann, die Eigenschaften des sozialen Systems nicht auf die Menschen zurückführte, sondern dem System eine Eigenständigkeit zuerkannte.

Diese teilweise immer noch vorhandene naive Sicht des Gegensatzpaares Reduktionismus-Holismus wird durch das Auftauchen von GPT-4, aber auch schon durch die Erfahrungen mit chatGPT, kräftigst widerlegt: Die technischen Systeme chatGPT/GPT-3.x und chatGPTplus/GPT-4 zeigen mit ihrer Intelligenz eine für alle erfahrbare Emergenz. Diese AI-Systeme wurden auf der Basis bestimmter Daten-Parameter (u.a. Anzahl der Neuronen, Zeit des Trainings, Menge der Trainingsdaten) sowie bestimmten Architektur-Parameter (u.a. Transformer/Decoder und Attention-Mechanismus) mehr oder weniger gezielt kombiniert und es entstanden bei einer bestimmten Kombination dieser Parameter „wie durch ein Wunder“ emergente Intelligenz-Eigenschaften. – Es ist zu vermuten, dass bei Wegnahme z.B. der Attention-Eigenschaft, die emergente Eigenschaft der Intelligenz verschwindet, auch wenn die gigantische Skalierung bleibt.

Deswegen sind die emergenten AI-Eigenschaft jedoch nicht weniger wunderbar.

Dieses Beispiel belegt äußerst eindrucksvoll, dass die Natur, auch wenn sie in Form einer Technologie daherkommt, alle Ingredienzien für starke Emergenz enthält. – Wir ‚finden‘ diese Ingredienzien ‚lediglich‘.

Agent Based Modeling (ABM) spielt beim Auffinden dieser Eigenschaften eine prominente Rolle, auch wenn diese Rolle selbst in der Wissenschaft im Verhältnis zur Bedeutung nur wenigen bekannt sein dürfte. Unlängst hat das Santa Fe Institute neben Netlogo das ABM-Python-Framework MESA als Lecture aufgenommen [10]. Diese Lecture bildet mit moderner Technik das ABM des 25 Jahre alten Buches über ‚Growing Artificial Societies‘ von Epstein und Axtell nach [11]. Epstein und Axtell zeigen, wie man mit einfachen lokalen Agenten-Parametern die emergenten System-Eigenschaften von Gesellschaften erzeugen kann. – Der Überraschungseffekt ist nicht selten groß: So beeinflusst zum Beispiel die Fähigkeit des Sterbens oder der Reproduktion von Agenten ganz erheblich die emergenten Eigenschaften der ABM Ökonomie: Diese Modell-Eigenschaften sind nämlich notwendig, damit sich überhaupt sogenannte Nicht-Gleichgewichts-Handelsmärkte ausbilden können, die mit realen Märkten sehr gut übereinstimmen. – Das immer noch in der Gesellschaft vorherrschende neoklassische Verständnis der Gleichgewichts-Ökonomie kennt solche Zusammenhänge nicht.

In den folgenden Blogbeiträgen beschäftige ich mich mit der Suche nach den Parametern, die das emergente Teamverhalten Collective Mind hervorrufen. Im Management 4.0 gehen wir davon aus, dass die Parameter der Theorie der Selbstorganisation (Rahmen-Parameter, Kontroll-Parameter und Ordnungs-Parameter) die entscheidenden Parameter sind, die emergentes Teamverhalten hervorbringen. Wir kennen diese Parameter (vermutlich) auch schon, jedoch nicht in hinreichend formalisierter ABM Sprache. Die in vorhergehenden Blog-Beiträgen unter Verwendung von Natural Language Processing abgeleitete Similarity-Matrix des Collective Mind (Collective Mind Operator) ist lediglich ein phänomenologisches Modell (siehe Blog-Beitrag vom April und Juni 2022). – Der Collective Mind Operator kann in der Teampraxis sehr gut den Collective Mind messen, er sagt jedoch leider nichts darüber aus, wie der Collective Mind emergiert. Hierzu benötigen wir die formalisierten ABM-Parameter, die die Collective Mind Emergenz hervorbringen. – Die Suche nach diesen formalisierten Parametern ist kein Selbstzweck, denn die Wissenschaftsgeschichte hat gezeigt, dass die Kenntnis der formalisierten Parameter recht oft mit großen Erkenntnisgewinnen verbunden ist. – Die GPT-Geschichte ist der sichtbarste Beweis hierfür.

Der Übergang zur Python-Technologie mit MESA-Python eröffnet auch recht einfach die Möglichkeit intelligente Agenten auf der Basis von chatGPT anzubinden. Das werde ich nicht tun, jedoch hat die Entwicklung hierzu, wie in einem meiner letzten Blogs prognostiziert, schon begonnen. Die Stanford University hat zusammen mit Google eine auf dem Computerspiel ‚The Sims‘ basierendes ABM erstellt, in dem 25 Agenten ihre Intelligenz von chatGPT erhalten [12]. Die Agenten haben eine ‚Gehirn-Architektur‘ aus Langzeit- und Kurz-Zeitgedächnis, dessen kognitive Intelligenz von chatGPT kommt. Die Agenten verfügen zusätzlich über einen sogenannten ‚reflection tree‘, der der Ziel-Hierarchie bzw. der Dilts Pyramide von Management 4.0 sehr nahe kommt [13].- Die Ebenen Identität, Fähigkeiten und Verhalten sowie Kontext (Beobachtung) sind schon vorhanden. – Diese und weitere Ebenen können sicherlich noch ausgebaut werden.

Damit sind die Agenten in der Lage einen individuellen kognitiven PDCA-Zyklus durchzuführen, der ‚reflektiertes‘ Handeln erlaubt.

Es besteht auch die Möglichkeit, dass sich Menschen aktiv in dieses Handeln künstlicher Agenten einbringen können. Damit ist es zum Beispiel möglich hybride Universen aus AI und Menschen zu bilden.

Man stelle sich ein Anwendungsbeispiel von vielen vor: Ein Projektleiter soll ein Projekt durchführen. Er lässt das Projekt zum Test vorab in der künstlichen Welt durchführen und erhält so Hinweise auf seine Durchführbarkeit. –  Oder er lässt parallel zur realen Welt eine künstliche Welt mitlaufen, in die die Daten der realen Welt synchron eingespeist werden, um Forecasting zu betreiben.

In [12] wird berichtet, dass das Handeln der künstlichen Agenten von Menschen auf ‚Menschen-Ähnlichkeit‘ überprüft wurde. Das emergierende ‚believable behavior‘ der Agenten und des emergierenden sozialen Systems wird von den Evaluationspersonen, trotz einiger Fehler, als sehr hoch eingestuft.   

Das nächste Wunder geschieht schon!

    

[1] Future of Life Institute (2023) Pause giant AI Experiments, https://futureoflife.org/open-letter/pause-giant-ai-experiments/, zugegriffen am 22.04.2023

[2] Barkey S (2023) Kurz vor dem Durchbruch: „Gottgleiche“ KI könnte laut Experte Menschheit zerstörenhttps://www.berliner-zeitung.de/news/agi-kurz-vor-durchbruch-gottgleiche-ki-koennte-laut-experte-ian-hogarth-menschheit-zerstoeren-kuenstliche-allgemeine-intelligenz-li.339062, zugegriffen am 22.04.2023

[3] EU (2023) EU AI Act, https://artificialintelligenceact.eu/, zugegriffen am 22.04.2023

[4] Bubeck S et al. (2023) Sparks of Articial General Intelligence: Early experiments with GPT-4, arXiv:2303.12712v3 [cs.CL] 27 Mar 2023, zugegriffen am 22.04.2023

[5] Wikipedia (2023) Emergenz, https://de.wikipedia.org/wiki/Emergenz, zugegriffen am 25.04.2023

[6] Greve J, Schnabel A (Herausgeber) (2011) Emergenz: Zur Analyse und Erklärung komplexer Strukturen, suhrkamp taschenbuch wissenschaft

[7] Wi J et al. (2022) Emergent Abilities of Large Language Models, in Transactions on Machine Learning Research 08/2022, arXiv:2206.07682v2 [cs.CL] 26 Oct 2022

[8] DALL-E (2023) https://openai.com/product/dall-e-2, zugegriffen am 03.05.2023

[9] Wikipedia (2023) Reduktionismus, https://de.wikipedia.org/wiki/Reduktionismus, zugegriffen am 25.04.2023

[10] Complexity Explorer (2023) MESA-Python Lecture, https://www.complexityexplorer.org/courses/172-agent-based-models-with-python-an-introduction-to-mesa/segments/17326, Santa Fe Institute, zugegriffen am 30.04.2023

[11] Epstein J M, Axtell R (1996) Growing Artificial Societies – Social Science from the Bottom Up, The Brookings Institution, Washington D.C.

[12] Park J S et. al. (2023) Generative Agents: Interactive Simulacra of Human Behavior, arXiv:2304.03442v1 [cs.HC] 7 Apr 2023

[13] Oswald A, Müller W (2019) Management 4.0 – Handbook for Agile Practices, Release 3.0, Verlag BoD, kindle edition

AI & AM 4.0: Agent Based Modeling – Von Agenten Intelligenz und Kollektiver Intelligenz oder von ‚Intelligenz ist immer kollektiv‘?!

Das Thema Kollektive Intelligenz hat gerade Hochkonjunktur. Sei es in Form der mehrteiligen ZDF-Fernsehserie der Schwarm [1] und der damit verbundenen zweiteiligen Terra X Dokumentationen zur Intelligenz von Schwärmen [2], [3]. – Oder, auch in Form der AI Systeme chatGPT und des gerade veröffentlichten GPT-4 [4]. – Diese Systeme sind in zweierlei Hinsicht Systeme kollektiver Intelligenz: Die GPT-X Systeme und andere vergleichbare Systeme verwenden als Daten die Ergebnisse unserer aller Intelligenz und die Systeme selbst sind über die Neuronalen Netzwerke, auf denen sie beruhen, kollektive Systeme, die Intelligenz hervorbringen können, wenn sie mit unserer Intelligenz in Form von Daten gefüttert werden. – Dies ist gar nicht so unähnlich unserer kulturellen Entwicklung, die Produkte menschlicher Intelligenz hervorgebracht hat – nur eben viel, viel schneller!

Es ist absehbar, dass sich in Zukunft aus der Intelligenz von GPT-X eine Künstliche Allgemeine Intelligenz (Artificial General Intelligence, kurz AGI) entwickeln wird. Der CEO von openai betont in einem Blogbeitrag erst kürzlich hierzu die gesellschaftliche Verantwortung von openai [5] und im EU AI Act Newsletter wird, meines Erachtens zum ersten Mal, von der nahen Bedeutung von AGI im Kontext von GPT-X  Systemen gesprochen [6].   

In [2] und [3] wird eindrucksvoll geschildert, wie natürliche kollektive mobile Systeme, die aus ‚dummen‘ Agenten (u.a. Ameisen, Bienen, Fischen) bestehen, im Schwarm intelligentes Verhalten zeigen. Die vermeintlich ‚dummen‘ Agenten haben ihrerseits ein wenig Intelligenz auf der Basis von kleinen natürlichen neuronalen Netzwerken. – Die Natur ist also offensichtlich in der Lage mittels kollektiver Systeme (z.B. Ameisen Kollektiv) und von Subsystemen (z.B. Ameise als Agent) Intelligenz-Hierarchien aufzubauen.

Dies relativiert auch unseren Anspruch an intelligenter Einzigartigkeit: Kollektive Systeme, gleichgültig ob natürlich oder künstlich, haben das Potential, über eine geeignete Vernetzung, Intelligenz auszubilden.

Hieraus leite ich die These ab, dass Intelligenz immer kollektiv ist. Dies wird auch durch Ashby’s Law [7] gestützt, wonach ein komplexes System nur durch ein anderes komplexes System mit hinreichender Komplexität reguliert werden kann. Komplexität ist also eine Vorbedingung für Intelligenz. Deshalb sagen wir auch im Management 4.0, dass Komplexität ein Geschenk ist, das nicht reduziert werden sollte, sondern nur reguliert werden darf: Die Komplexität unseres Gehirns (und unseres gesamten Körpers) mit ca. 86 Milliarden vernetzter Neuronen ermöglicht es, dass wir uns adaptiv auf unsere Umgebung einstellen und diese ggf. regulieren. – Ich nehme an, dass niemand seiner Intelligenz, also seiner neuronalen Komplexität, beraubt werden möchte, indem diese reduziert wird.

In Konsequenz heißt dies auch, dass gut geführte soziale Organisationen, u.a. Teams, mit einer wertschaffenden Komplexität, kollektive Intelligenz zeigen, die über die Intelligenz der einzelnen Teammitglieder hinausgeht. Die einzige ! Aufgabe von Führung ist es, zu ermöglichen, dass sich diese kollektive Intelligenz ausbildet.    

Es ist vielleicht auch nicht abwegig, anzunehmen, dass Intelligenz eine Vorbedingung für Bewusstsein ist. – Und, dass Bewusstsein sich aus intelligenten kollektiven Systemen emergent entwickelt. Die Integrated Information Theory zum Bewusstsein zeigt erste Überlegungen in diese Richtung [8].

Im letzten Blog-Beitrag habe ich den Video-Vortrag des DeepMind Mitarbeiters Thore Graepel zum Thema ‚Multi-Agent Learning in Artificial Intelligence‘ erwähnt [9]. Thore Graepel referenziert dort am Anfang auf den Artikel von Legg und Hutter zum Thema ‚Universal Intelligence‘ [10]. Legg und Hutter geben einen Literatur-Überblick zum Verständnis von Intelligenz und definieren ihr Verständnis von Agent Intelligence:

Abbildung 1: Definition Universelle Intelligenz nach [10]

In [10] wird angenommen, dass die Wahrscheinlichkeit für Kontexte exponentiell (zur Basis 2) mit der Komplexität abnimmt. – Hier folgen Legg und Hutter auch dem Prinzip des Occam’schen Rasiermessers [11]: Die Natur bevorzugt Einfachheit und unsere Modelle zu Ihrer Beschreibung sollten dementsprechend auch einfach sein. – Einfache Kontexte werden also bei der Intelligenzberechnung höher gewichtet. Man kann auch jetzt verstehen, warum die melting pot Initiative von DeepMind von Bedeutung ist: Es werden möglichst viele Kontexte erstellt, um die allgemeine Intelligenz von Agenten über die obige Formel zu ermitteln.  

Legg und Hutter haben gezeigt, dass die obige Formel für Intelligenz alle bekannten Definitionen von Intelligenz subsummiert und auch auf den Intelligenzbegriff bei Menschen angewendet werden kann.- Auch wenn die konkrete Ausgestaltung von V und P in der obigen Formel für nachvollziehbare Kritik sorgt [12] und sich noch ändern dürfte. – Abbildung 2 visualisiert die Formel, in dem ich für das Mindset eines Agenten die Dilts Pyramide angenommen habe: Der Agent passt sich über die Zeit in einem PDCA-Zyklus mittels seiner Fähigkeiten und seines Verhaltens (auch policy genannt) an seine Umgebung an. Über die Funktion V wird die Performance des Agenten im Hinblick auf ein Ziel gemessen.- Der Agent erhält eine Belohnung. Die Performance des Agenten kann in zweierlei Hinsicht gemessen werden: Intern und extern. Das interne Performancemaß wird utility U genannt [13]. Agenten werden  rational genannt, wenn sie anstreben das interne Performancemaß mit dem externen in Einklang zu bringen. Einer der Kritikpunkte an [10] ist, dass (lediglich) das externe Performancemaß zur Intelligenzmessung herangezogen wird. 

    

Abbildung 2: Visualisierung der Formel zur Universellen Intelligenz nach [10]

Die Definition der Universellen Intelligenz ist sicherlich als Referenz für die Vermessung von Agenten Intelligenz sehr hilfreich. Ihre operative Ausgestaltung hat aber erst begonnen. – Und, sie ist rein phänomenlogisch, sie sagt also nichts über die Ingredienzien von Intelligenz aus, also welche Elemente wie zusammengebracht werden müssen, um intelligente Agenten bzw. Systeme zu bauen. Aus diesem Grunde versuche ich im Folgenden, einige mir wichtig erscheinende Elemente, in Form von Prinzipien, zu nennen. Ich lasse mich hierbei von der Transformer Technologie leiten, auf der die GPT-X Technologie beruht. Die aus meiner Sicht mit Abstand beste Darstellung zur Transformer-Technologie hat Ralph Krüger geschrieben – er macht keine verständnislosen Vereinfachungen, sondern beschreibt die Technologie didaktisch brillant [14]. Nicht desto weniger kann es manchmal beim Lesen helfen, die in Bing eingebundene chatGPT Bot Version als Assistenz zu benutzen ;-).

Neben [14] empfehle ich [15], eine dreiteilige sehr gute visuelle Aufbereitung des Matrizen-Flows (Tensorflows) in Transformern und für einen tieferen Blick in die Programmierung den Dreiteiler [16] sowie [17]. Als Einstieg kann der Spektrum der Wissenschaft Artikel von Manon Bischoff dienen [18]. Dieser Artikel enthält eine ganze Reihe interessanter Hinweise, u.a. auch die von mir im letzten Blog-Beitrag geäußerte Vermutung, dass chatGPT lediglich 1,5 Milliarden Parameter enthält, also mehr als 100 mal weniger als GPT-3. Manon spricht sogar von nur 1,3 Milliarden Parametern. Als Einstieg empfehle ich zusätzlich den Artikel über chatGPT [19].

Auf der Basis dieser Literatur liste ich im Folgenden die Prinzipien, die meines Erachtens das Was und das Wie der Intelligenz ausmachen:

Intelligenz ist immer kollektiv: Als Kollektiv bezeichne ich ein System von vernetzten Elementen (künstliche oder natürliche Neuronen, Ameisen, Menschen, usw.), das die Außenwelt per Transformation in eine Innenwelt abbildet. Die Transformation erfolgt im Falle der AI durch künstliche neuronale Netzwerken, die Tensor Operationen durchführen (bzw. Matrizenoperatione durchführen: Die Matrizenelemente sind die Gewichte zwischen den Neuronen). – Die Tensor Operationen sorgen also für die Abbildung. Damit diese Abbildung hinreichend viele Informationen der Außenwelt abbilden kann, benötigt sie viele Zustände, also viele Parameter, im Falle von GPT-3 175 Milliarden. Die Abbildung der Außenwelt über eine Parametrisierung in der Innenwelt, erfolgt über Selbstorganisations-Mechanismen, in denen eine Zielfunktion im AI-Training dafür sorgt, dass die niedrigsten energetischen Zustände in dem hochdimensionalen Parameterraum gefunden werden. – Diese repräsentieren nach dem Training die Daten der Außenwelt.

Ich habe die Bing AI gefragt, ‚Gibt es eine Zielfunktion für das Lernen im Gehirn‘. Bing AI wandelt dies in eine Frage nach ‚Zielfunktion Lernen Gehirn‘ um und generiert folgende Antwort:

Ja, das Gehirn hat eine Zielfunktion für das Lernen. Das Lernen ist im Grunde genommen eine Reaktion unseres Gehirns auf neue Erfahrungen. Wenn eine solche Erfahrung eine nachhaltige Änderung im Gehirn hervorruft, dann kann man von Lernen sprechen. Das Gehirn bereitet sich dadurch auf die Zukunft vor. Natürlich kann man sein Gehirn anregen und unterstützen, neue Dinge schneller zu lernen oder die synaptischen Verbindung zu bilden, die man möchte. Dazu brauchen wir nur unsere Aufmerksamkeit genau auf die zu lernenden Themen zu richten und sie entsprechend oft wiederholen.

Diese Definition der Zielfunktion entspricht nicht ganz meinem obigen Verständnis einer Zielfunktion: Außer, man versteht die neuronalen Mechanismen, die sich hinter der Aufmerksamkeit verbergen, als solche.

Die Außenwelt wird über Aufmerksamkeit kontextualisiert: Im Falle der Transformer-Technologie ist der Aufmerksamkeits-Mechanismus (Attention-Mechanismus) der Mechanismus, der die Leistungssteigerung gegenüber vorherigen AI Systemen wesentlich ausmacht. Hierzu werden die sprachlichen Inhalte der Außenwelt auf ihre semantischen Zusammenhänge hin analysiert: Alle Worte eines Satzes (eines Textes) werden herausgegriffen, also mit Aufmerksamkeit belegt, und es wird die Korrelation dieses herausgegriffenen Wortes zu allen anderen Worten in diesem Satz  (diesem Text) ermittelt. – Die Korrelationswahrscheinlichkeiten werden in speziellen neuronalen Netzwerken (Tensoren) trainiert. Für die Generierung von neuen Texten wird auf diese trainierten Korrelationswahrscheinlichkeiten zurückgegriffen.

Wahrscheinlichkeiten werden durch zusätzliche kollektive Maßnahmen auf verschiedenen Ebenen ausbalanciert: Die Ergebnisse, die ein Transformer nach außen liefert, sind die Ergebnisse mit der höchsten Wahrscheinlichkeit. Um die Verlässlichkeit der Wahrscheinlichkeiten zu erhöhen, werden die Wahrscheinlichkeiten pro Transformer Modul nicht nur einmal berechnet, sondern mehrmals parallel d.h. zum Beispiel mit 8 attention Mechanismen, dem sogenannten multi-head-attention. Zusätzlich werden im Falle von GPT-3 96 Transformer Module (Decoder) hintereinander geschaltet, um die Ergebnisse zu verfeinern und zu stabilisieren [18]. Der multi-head-attention Mechanismus zeigt damit die Wirkung eines Teams mit acht Teammitgliedern, in dem die potentiellen mentalen Verzerrungen der Teammitglieder ausbalanciert werden. Und, das Hintereinanderschalten der Transformer-Module lässt sich gut mit der iterativen Wirkung von 96-PDCA-Zyklen vergleichen.

… ggf. weitere Prinzipien

Ich glaube, dass Intelligenz nicht auf natürliche Systeme beschränkt ist, ja dass diese Einteilung in natürliche und künstliche Systeme künstlich ist: Intelligenz ist ein universelles Phänomen, das sich potentiell in allen Systemen ausdrücken kann, sobald hierfür die Voraussetzungen vorliegen…. Vielleicht sind die oben genannten Prinzipien tatsächlich (einige) der Voraussetzungen …Vielleicht wird die Filmreihe ‚Autobots – The Transformers‘ sogar einmal als (diesbezüglich) hellsehend bezeichnet werden [20]. 

 

[1] ZDF (2023a) Der Schwarm, https://www.zdf.de/serien/der-schwarm

[2] ZDF (2023b) Terra X – Schlaue Schwärme, Geheimnisvolle Sprachen, https://www.zdf.de/dokumentation/terra-x/schlaue-schwaerme-geheimnisvolle-sprachen-doku-102.html

[3] ZDF (2023c) Terra X – Schlaue Schwärme, Rätselhafte Kräfte, https://www.zdf.de/dokumentation/terra-x/schlaue-schwaerme-raetselhafte-kraefte-doku-100.html

[4] openai (2022) GPT-4, https://openai.com/product/gpt-4, zugegriffen am 20.03.2023

[5] Altman S (2023) Planning for AGI and beyond, https://openai.com/blog/planning-for-agi-and-beyond, zugegriffen am 15.03.2023

[6] The future of Life Institute (2023) The EU AI Act Newslettr #25 vom 01/03/23-14/03/23

[7] Wikipedia (2023) Ashby’s Law, https://de.wikipedia.org/wiki/Ashbysches_Gesetz, zugegriffen am 15.03.2023

[8] Wikipedia (2023a) IIT- Integrated Information Theory, https://en.wikipedia.org/wiki/Integrated_information_theory, zugegriffen am 15.03.2023

[9] Graepel T (2023) The role of Multi-Agent Learning in Artificial Intelligence Research at DeepMind, https://www.youtube.com/watch?v=CvL-KV3IBcM&t=619s, zugegriffen am 06.02.2023

[10] Legg S und Hutter M (2007) Universal Intelligence: A Definition of Machine Intelligence, arXiv:0712.3329v1

[11] Wikipedia (2023b) Occam’s razor, https://en.wikipedia.org/wiki/Occam%27s_razor, zugegriffen am 21.03.2023

[12] Park D (2023) Paper Summary: Universal Intelligence: A Definition of Machine Intelligence, https://crystal.uta.edu/~park/post/universal-intelligence/, zugegriffen am 06.03.2023

[13] Russel S und Norvig P (2016) Artificial Intelligence – A modern approach, Third Edition, Prentice Hall Series in Artificial Intelligence Series, Pearson Education Limited

[14] Krüger R (2021) Die Transformer-Architektur für Systeme zur neuronalen maschinellen Übersetzung – eine popularisierende Darstellung, in trans-kom 14 [2], Seite 278-324

[15] Doshi K (2022) Transformers Explained Visually: How it works, step-by-step published January 2, 2021, towardsdatascience.com, zugegriffen am 10.05.2022,  (Part 1, 2, 3, 4), https://towardsdatascience.com/transformers-explained-visually-part-1-overview-of-functionality-95a6dd460452, https://towardsdatascience.com/transformers-explained-visually-part-2-how-it-works-step-by-step-b49fa4a64f34, https://towardsdatascience.com/transformers-explained-visually-part-3-multi-head-attention-deep-dive-1c1ff1024853, https://towardsdatascience.com/transformers-explained-visually-not-just-how-but-why-they-work-so-well-d840bd61a9d3

[16] Gosthipaty A R und Raha R (2022) A Deep Dive into Transformers with Tensorflow and Keras, Part 1-3, PyImagesearch.com, published November 2022, zugegriffen am 06.12.2022, https://pyimagesearch.com/2022/09/05/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-1/, https://pyimagesearch.com/2022/09/26/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-2/, https://pyimagesearch.com/2022/11/07/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-3/

[17] Cristina S (2023) Training the Transformer Model, https://machinelearningmastery.com/training-the-transformer-model/, updated am 06.01.2023, zugegriffen am 20.03.2023

[18] Bischoff M (2023) Wie man einem Computer das Sprechen beibringt, https://www.spektrum.de/news/wie-funktionieren-sprachmodelle-wie-chatgpt/2115924, veröffentlicht am 09.03.2023, zugegriffen am 20.03.2023

[19] Ruby M (2023) How ChatGPT Works: The Model Behind the Bot, https://towardsdatascience.com/how-chatgpt-works-the-models-behind-the-bot-1ce5fca96286, veröffentlicht am 30.01.2023, zugegriffen am 20.03.2023

[20] Wikipedia(2023) Autobot, https://en.wikipedia.org/wiki/Autobot, zugegriffen am 20.03.2023

Transformatives Bogenschießen: Von ‚agilen‘ Überzeugungen oder „von den Türen, die wir heute aufmachen, durch die wir morgen gehen [1]“

Im letzten Blogbeitrag habe ich mein neues Seminar Transformatives Bogenschießen erstmalig vorgestellt.

In diesem Blog-Beitrag skizziere ich die Wirkweise von Transformativem Bogenschießen.

Transformatives Bogenschießen (TB) kann eine Ressource sein oder als Katalysator für die individuelle Veränderungsarbeit, d.h. für die mentale Problembehandlung, eingesetzt werden.

TB als Ressource bedeutet, dass dem Menschen wichtige Aspekte, wie die Gesundheit, die Kraft, die Ruhe oder die Intuition, gestärkt werden. Ich skizziere hierzu zwei Beispielen aus meiner TB-Selbsterfahrung – Gesundheit sowie Ruhe und Intuition:

Gesundheit: Nach ca. zwei Stunden Bildschirmarbeit, habe ich Probleme, meine Augen auf den Bildschirm zu fokussieren. Dies wird zunehmend von einem Gefühl von Unwohlsein und Stress begleitet. – Wahrscheinlich wurde dies durch die Bildschirmarbeit, während der langen virtuellen Meetings in der Coronazeit ausgelöst oder beschleunigt. Ich nutze Bogenschießen für meine Gesundheit, indem ich in meinem Garten schieße: Beim Fokussieren auf größere Distanzen werden meine Augen entlastet und dies beseitigt schon nach kurzer Zeit das Unwohlsein.

Ruhe und Intuition: Beim intuitiven Bogenschießen wird nicht explizit gezielt, sondern man vertraut sich und den Schuss dem Körpergefühl an. Gehen dem Bogenschießen keine stressigen Stunden voraus, bin ich mit meinem Trefferbereich zufrieden. – Körpergefühl und mentale Ausrichtung sind im Einklang. Im Falle von vorausgehenden stressigen Stunden, u.a. durch zu viel Bildschirmarbeit, ist der Trefferbereich wesentlich schlechter. Die erforderliche Ruhe und die Intuition bilden sich jedoch durch TB nach einer gewissen Zeit wieder erfolgreich aus. Der Trefferbereich wird deutlich besser: Körper und Geist entspannen sich und geraten wieder in Einklang. – Sehr wesentlich ist, dass sich im Bogenschießen das Gefühl für Zeit ändert. Die Intuition verbindet in dem Zeitraum des Loslassens der Sehne die Fäden der Vergangenheit und Gegenwart zu einem Faden der Zukunft. – Insbesondere für Menschen, die unter Zeit die Uhrzeit verstehen, ist dies eine besondere Erfahrung von Zeit [1].
TB ist kein körperliches Auspowern wie bei vielen anderen Sportarten, sondern sorgt, wie in diesem Beispiel, für eine ruhige Pflege der Intuition. Transformatives Bogenschießen als Ressource für Ruhe und Intuition entspricht im Wesentlichen dem Meditativen Bogenschießen [2].

Bogenschießen als Ressource entwickelt sich nur, wenn man bereit ist, das im Seminar Gelernte regelmäßig anzuwenden. – Denn die Ressource wird sich erst nach einigen Wochen des Übens entfalten.

Nach dem Erlernen der Techniken des Bogenschießens und dem Erfahren des Bogenschießens als Ressource, ist die individuelle Veränderungsarbeit der dritte Teil des Seminars. Hierbei ist zu beachten, dass der Durchgang durch das sogenannte ‚Transformative Tor‘ in die Veränderungsarbeit nur sinnvoll ist, wenn die Teilnehmer die Technik des Bogenschießens gut (genug) beherrschen. Falls die Teilnehmer die Technik des Bogenschießens kennen, aber wiederholt nicht umsetzen können, ist dies ein starkes Indiz für ein mentales Problem, gemäß der Erfahrung „Bogenschießen wirkt wie ein Spiegel der Seele“. Die mentale Ausrichtung, erworben in der Vergangenheit, „verzerrt“ die Schieß- und Ziel-Technik. Die Teilnehmer nehmen diese „Verzerrung“ meistens selbst wahr und ziehen auch sehr oft eine Verbindung zu ihrem Alltag. Lediglich in einigen Fällen ist es angebracht, dass der Trainer „anstupsend“ hilft. Selbstverständlich sind diese Erkenntnisse zuerst einmal nur Hypothesen. Der Trainer unterstützt die Teilnehmer bei der nachfolgenden Analyse und dem Auflösen des Problems sowie dem Transfer in den jeweiligen individuellen Alltag.

In dem Video [2] kann man erkennen, dass die Technik der Teilnehmer nicht gut ausgebildet ist: Entweder wurde vom Trainer nicht auf eine gute Technik geachtet oder das erkennbare, nicht gut Ankern ist ein Indiz für ein mentales Problem. Gutes Ankern bedeutet, dass die Sehne vollständig ausgezogen wird und die Hand mit der ausgezogenen Sehne und dem Pfeil an der Wange angelegt wird, also geankert, wird. Nehmen wir zur Illustration hier an, dass das schlechte Ankern im Video ein Indiz für ein mentales Problem sei. Möglich Probleme könnten zum Beispiel sein: Berührungsangst, zu große Aggressionshemmung oder fehlende Durchsetzungskraft. Die Identifikation des Problems erfolgt im Schießen, indem die Teilnehmer:in die ‚Unsauberkeit‘ in der Technik selbst wahrnimmt und dieser eine Bedeutung zuschreibt. Dies geschieht oft durch Metaphern, z.B. für das obige Beispiel Berührungsangst könnte die Metapher heißen „Ich kann die Kluft nicht überbrücken“. Ist die Metapher da und wurde durch die Teilnehmer:in die Verbindung zum Alltag hergestellt, wird das Problem im Bogenschießen aufgelöst: Es wird zum Beispiel erfolgreich über eine Kluft geschossen. Der abschließende Transfer in den Alltag wird besiegelt. – Die Erfahrung zeigt, dass diese Form der transformativen Veränderungsarbeit sehr erfolgreich ist, d.h. die Veränderung setzt tatsächlich ein.    

Dieser Teil des TB-Seminars ist auf das Seminar beschränkt, da hierfür im Normalfall eine professionelle Begleitung durch einen Trainer oder einen Coach für Transformatives Bogenschießen notwendig ist.

Die oben geschilderten Problembeispiele aber auch die in einer Organisation vorliegenden Widerstände für die erfolgreiche Umsetzung von Transformationen, also grundlegende Veränderungen, beruhen auf Überzeugungen. Im Management 4.0 verwenden wir die Dilts Pyramide [3], um die enorme Bedeutung von Überzeugungen (Glaubenssätzen, Grundannahmen, Prinzipien) für die Veränderung sichtbar zu machen. Die Dilts Pyramide visualisiert, dass Überzeugungen Abstraktionen sind, die aus der Erfahrung in einem jeweiligen Kontext abgeleitet werden. Die individuelle Persönlichkeit stellt eine Disposition für Überzeugungen dar oder anders ausgedrückt, Überzeugungen spiegeln nicht wider, was man weiß, sondern, drücken aus, wer man ist [4].



Abbildung 1: Vier Bilder erzeugt von der Künstlichen Intelligenz DALL-E 2 [5] mit dem Prompt ‚A painting in the style of Chagall: Transformative archery opens doors‘

Kommen wir zu einer Erklärung, warum TB wirkt!

Ich verwende hierzu die Theorie des Predictive Processing wie sie von Philipp Sterzer in [4] skizziert wird. Sterzer ist Psychiater und Neurowissenschaftler. Er zeigt auf der Basis von wissenschaftlichen Fakten, dass die fundamentalen Mechanismen von Überzeugungen für sogenannte ‚normale‘ Überzeugungen, Verschwörungsüberzeugungen, wahnhafte Vorstellungen und schizophrenen Wahn gleich sind.

Nach der Predictive Processing Theorie, also der Theorie der vorhersagenden Verarbeitung, arbeitet unser Gehirn mit einem hypothetischen Modell der Welt. Dieses Modell wird im Idealfall fortwährend an die Weltdaten angepasst, um so neue Vorhersagen zu erzeugen. Überzeugungen sind Teil jenes inneren Modells der Welt, das unser Gehirn für Vorhersagen nutzt.  Überzeugungen sind „Hypothesen über allgemeine und zeitlich stabile Gesetzmäßigkeiten“, die wir in der Welt wahrgenommen haben. Unser Gehirn folgt einem Plan-Do-Check-Act Zyklus: Es werden Hypothesen gebildet, auf der Basis von Hypothesen wird gehandelt, das Handeln wird überprüft und dann ggf. angepasst. Es gibt eine Hierarchie von Vorhersagen, eine Hierarchie vom kognitiven Abstraktem zum sinnlich Konkreten, die es ermöglich Komplexität zu regulieren und Unsicherheit abzubauen. – Ich verweise auch hier auf die Zielhierarchie (vom Big Picture zum Detail) im Management 4.0, die genau diese Funktion hat [6].
Hinzu kommt, dass Vorhersage und Sinnesdaten nach ihrer Präzision, ihrer beigemessenen Wahrscheinlichkeit, gewichtet werden. Nach der Predictive Processing Theorie erzeugen wir Vorhersagen auf der Basis der Differenz von Vorhersage- und Sinnesdaten-Präzision. Die Größere der beiden Präzisionen leitet unsere Vorhersagen und unser Handeln. Der Neuromodulator Dopamin ist von großer Bedeutung für die Balance der beiden Präzisionen. Dopamin wird nicht nur bei Sport und Freude ausgeschüttet, sondern auch bei Stress. Dopamin verändert die Sinnes-Wahrnehmung und übergewichtet die Sinnesdaten-Präzision. Dies kann auch zu Halluzinationen oder Wahnvorstellungen führen: „Die empirischen Befunde …. sprechen für ein (Präzisions-) Ungleichgewicht zwischen Vorhersagen und Sinnesdaten als Grundlage für die Entstehung von Psychosen. Die Folge des Dopaminüberschusses ist somit, dass Sinnesreize, die sonst keine Beachtung fänden, als bedeutsam registriert werden. Man spricht von aberranter Salienz, was so viel heißt wie fehlgeleitete Auffälligkeit.“ Fehlgeleitete Auffälligkeiten erzeugen Angst, und erfordern eine Korrektur des Weltbildes. Und dieses Weltbild muss so konstruiert sein, dass es die fehlgeleitete Auffälligkeit erklärt, also Komplexität reguliert [4].

Das Übergewichten der Vorhersage-Präzision der Überzeugungen kann zur Irrationalität führen, die allerdings adaptiv ist und einen evolutionären Vorteil bringt. Ein Beispiel [4]:

Ein Spaziergänger identifiziert im Dunkeln eine auf dem Boden erkennbare Schlangenform als Schlange. Es gibt keine Evidenz wonach dies tatsächlich eine Schlange ist, jedoch sind die Kosten dieser Erkenntnis eventuell geringer als der Biss einer Schlange, wenn sich die Schlangenform dann wirklich leider als Schlange herausstellen sollte. – Auch wenn sich bei vorsichtigem Annähern herausstellen sollte, dass es nur ein Ast in Schlangenform ist. In diesem Sinn können irrationale Überzeugungen adaptiv sein und stellen evolutionär einen Vorteil dar.

In diesem Beispiel ist die sogenannte Sinnesdaten-Präzision gering. Der Vergleich von Vorhersage-Präzision und Sinnesdaten-Präzision fällt zu Gunsten der Vorhersage-Präzision aus: Die Überzeugung erhält Vorrang. Das Gehirn ist also genau genommen eine „Präzisionsgewichtungsmaschine“ [4].

Im ‚Idealfall‘ sollten Vorhersage-Präzision und Sinnesdaten-Präzision nahe beieinander liegen. – In diesem Fall stellt sich Agilität ein, deshalb habe ich auch im Titel des Blogs von ‚agilen‘ Überzeugungen gesprochen. Problematisch wird es, wenn eine der Präzisionen dominiert. Würde im unserem Beispiel der Schlangenform, die Vorhersage-Präzision stark dominieren, wird im schlimmsten Fall keine Überprüfung in der Wirklichkeit mehr stattfinden. Die Schlangenform wäre dann definitiv eine Schlange. Würde im Beispiel die Sinnesdaten-Präzision überwiegen, wird eine potenzielle Gefahr nicht mehr wahrgenommen, erst dann, wenn es schon zu spät ist.       

Die Wirkung von TB lässt sich auf der Basis der Predictive Processing Theorie wie folgt erklären:

  • Falls Bogenschießen mit Freude erfolgt – insbesondere, wenn Bogenschießen als Ressource empfunden wird – wird die Dopaminausschüttung angeregt.
  • Die Sinnesdaten-Präzision bekommt eine größere Bedeutung, ggf. wird sie übergewichtet.
  • Die Wahrnehmung öffnet sich für das Erkennen einer ‚(kleinen) Unsauberkeit‘ in der Ziel- und Schiesstechnik.
  • Diese Offenheit ermöglicht das Erfahren von Problem-Zusammenhängen im Schießen und im Alltag. Die bisherige Überzeugung wird hinterfragt, die blockierende Vorhersage-Präzision untergewichtet.
  • Die Ausbildung von Metaphern und das Auflösen des Problems im Schießen schlägt die Brücke zum Alltag.
  • Eine neue Überzeugung wird neben die alte Überzeugung gesetzt. Die neue Überzeugung ist im Alltag zu stabilisieren, damit die neu Vorhersage-Präzision groß genug werden kann.

Überzeugungen sichtbar zu machen, in Frage zu stellen und ggf. durch neue Überzeugungen zu ersetzen, dies ist adaptiv, ist agil! – Überzeugungen sollten immer nur Hypothesen sein, die sich ggf. als falsch herausstellen.

Man könnte annehmen, dass ähnliche Sportarten (u.a. Speerwerfen, DART, Golf, …) wie Bogenschießen transformativ eingesetzt werden können. Dies mag sein, jedoch gebe ich zwei Aspekte zu bedenken: Bogenschießen knüpft sehr stark an unsere archaischen Wurzeln an, damit könnte u.a. ein hoher Dopamin-Ausstoß verbunden sein. Was aber viel wichtiger ist, dass die archaischen Wurzeln durch sehr viele Metaphern – wie ‚keinen Pfeil mehr im Köcher haben‘ oder ‚ins Schwarze getroffen haben‘ – in unserem Denken verwurzelt sind und diese Verbindungen mittels Jahrzehnten kreativer therapeutischer Veränderungsarbeit [7] gehoben worden sind.

Transformatives Bogenschießen dient dazu, zu lernen, Überzeugungen in Frage zu stellen. Damit werden Überzeugungen adaptiv und öffnen uns die Türen, durch die wir gehen (können).

Weitere Informationen zu den TB-Seminaren finden Sie unter https://www.socialtechnologies.de/training.

 

[1] Lesch H und Forstner U (202119) Zeit – Ein Physiker und eine Philosophin spielen mit der Zeit, Patmos Verlag, kindle Ausgabe

[2] Bayrischer Rundfunk (2022) Meditatives Bogenschießen https://www.youtube.com/watch?v=wY1NF3zguKc

[3] Oswald A, Müller W (2019) Management 4.0 – Handbook for Agile Practices, Release 3, BoD Verlag, Norderstedt Management 4.0

[4] Sterzer P (2022) Die Illusion der Vernunft – Warum wir von unseren Überzeugungen nicht zu überzeugt sein sollten, Ullstein Buchverlage GmbH, Berlin, kindle Ausgabe

[5] DALL-E 2 (2023) https://openai.com/dall-e-2/, zugegriffen am 04.01.2023

[6] Oswald A, Köhler J, Schmitt R (2016) Projektmanagement am Rande des Chaos, Springer, Heidelberg

[7] Schäfer K-H (2018) Therapeutisches Bogenschießen, 2. Auflage, Ernst Reinhardt Verlag München

AI & M 4.0: „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“ – Oder: Auf dem Weg zur Künstlichen Allgemeinen Intelligenz?

Im diesem Blogartikel beschäftige ich mich mit der Erstellung von Text-Zusammenfassungen und Bild-Metaphern. Dies sind wichtige Bereiche jeglicher Informations- und Wissens-Verarbeitung, insbesondere auch im Management und Projektmanagement. – Man siehe hierzu auch meinen Blog-Beitrag vom Dezember 2021.

Ich beschreibe im Folgenden die Benutzung der verwendeten AI-Werkzeuge etwas genauer. – Vielleicht mag der ein oder andere meine Erfahrungen weiterentwickeln.

Da die verwendeten AI-Werkzeuge mehrere Abstraktionsebenen über den in den letzten Blog-Beiträgen verwendeten AI-Werkzeugen liegen und jene über eine recht einfache Benutzerschnittstelle angesprochen werden können, spreche ich von Black-Box AI-Werkzeugen

Für die Erzeugungen von Bild-Metaphern verwende ich die KI midjourney und für die Erzeugung von Text-Zusammenfassungen die KI GPT-3.

Auf die KI midjourney wurde ich über den Artikel „Kunst per Künstlicher Intelligenz“ von Patrick Hannemann aufmerksam [1]. Er stellt dort die Kommunikationsplattform discord.com [2] vor, die die KI midjourney über einen Bot integriert enthält [3].

Ich widme mich zuerst den Bild-Metaphern: Bild-Metaphern können zum Beispiel bei der Ausbildung eines Collective Minds in Teams eine sehr große Rolle spielen. – Sie dienen u.a. der Teamausrichtung und -fokussierung.

Also habe ich ausprobiert, inwieweit sich midjourney für die Kreation von Bild-Metaphern eignet. – Ich starte mit einem Thema zu meinem Bogenschieß-Hobby und gebe dem Bot über den Prompt ‚/imagine…‘ folgende Aufgabe: Kreiere ein Bild zu der Aussage „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“.

Der Bot liefert mehrere Bilder als Vorschläge zurück. Abbildung 1 zeigt das von mir ausgewählte Bild:

Abbildung 1: Erzeugt von der AI midjourney mit der Aussage „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“ [3].

Für mich ist das Ergebnis beeindruckend kreativ und schön!

Ich habe daraufhin getestet, welche Bilder die AI aus der Kurzdefinition von Management 4.0 erzeugt. Abbildung 2 zeigt einen Screenshot-Auszug der vier generierten Bildvorschläge:

Abbildung 2: Screenshot-Auszug der vier Bildvorschläge zur Management 4.0 Definition (im Screenshot enthalten) [3].

Das war wohl etwas abstrakt, die generierten Bilder sind recht nichtssagend 😉.

Eine Kürzung auf die wesentlichen, in der Definition enthaltenen Themen erzeugt jedoch innerhalb von wenigen Sekunden vier recht gute Bild-Metapher Vorschläge:

Abbildung 3: Screenshot-Auszug der vier Bildvorschläge zur Aussage „leader, organization, mindset, self-organization“ (siehe obigen Screenshot) [3].

Ich habe das erste Bild für die weitere Generierung von Versionen ausgewählt und mich schließlich für folgende Bild-Metapher entschieden:

Abbildung 4: Von mir ausgewähltes Bild zur Aussage „leader, organization, mindset, self-organization“ [3].

Dies ist ein Ergebnis, generiert nach ca. 5 Minuten Interaktion mit dem AI-Bot. Wie ich finde: beeindruckend!

Für den Bereich Bild-Metaphern fasse ich zusammen: Selbst öffentlich verfügbare AI-Systeme liefern beeindruckende Bild-Metaphern auf der Basis von Themen (Topics). Topics können aus von AI-Systemen generierten Wissens-Netzwerken (man siehe den Juni 2022 Blog-Beitrag) entnommen werden oder über spezifische Topic AI-Systeme [4], [5] generiert werden.

Legt man folgende Definition für eine Künstliche Allgemeine Intelligenz zugrunde, “Artificial general intelligence (AGI) is the ability of an intelligent agent to understand or learn any intellectual task that a human being can.“ [6], so ist der AI-Bot midjourney vermutlich noch weit von einer AGI entfernt.

Gleichwohl stelle ich für mich selbst fest, dass ich wohl kaum in der Lage bin, mit ähnlicher Kreativität wie diese AI, die oben gezeigten Bilder zu erzeugen.

Überträgt man die Messung des Intelligenzquotienten für Menschen auf AI-Systeme, so dürfte eine Zusammenschaltung von mehreren AI-Systemen schon heute fantastisch hohe Intelligenzquotienten ergeben. Die AI-Systeme, die im Jahre 2019 verfügbar waren, liefern IQ-Werte die bei ca. 25%-50% eines mittleren menschlichen IQ von 100 liegen. – Ein IQ von 50 entspricht in etwa dem IQ eines 6-jährigen Kindes [7], [8], [9]. Sehr große AI-Systeme wie GPT-3, das ich weiter unten verwende, waren in diesen Untersuchungen noch nicht berücksichtigt. – Für GPT-3 dürfte der IQ schon deutlich näher bei 100 liegen.   

Sollte die AGI eines Tages Realität sein, so nehme ich an, dass keine 9 Milliarden AI-Systeme erforderlich sind, um das (kognitive) Intelligenzspektrum von 9 Milliarden Menschen abzubilden. – Wahrscheinlicher ist, dass einige wenige AI-Systeme das kognitive Intelligenzspektrum von Milliarden von Menschen abdecken werden, und dies mit wesentlich höheren IQ-Werten als wir Menschen im besten Fall haben.

Die Ergebnisse der Forschungsarbeit der GPM Fachgruppe Agile Management zum Thema NLP-Verarbeitung (Natural Language Processing Verarbeitung) von Projektmanagement Fragestellungen mittels AI-Systemen zeigen in diese Richtung.

Wir haben verschiedenen AI-Systemen PM Know-How Fragen gestellt, wie sie in einer Prüfung für das IPMA Level D vorkommen könnten. Das Ergebnis ist ziemlich beeindruckend: „Kleinere“ AI-Systeme liefern keine befriedigenden Ergebnisse, meistens sogar mangelhafte Ergebnisse. Jedoch liefert das große System GPT-3 von openai.com in allen! Fragen sehr gute oder gute Ergebnisse: GPT-3 hat hiernach das IPMA Level D Zertifikat mit gut bestanden! – Diese Ergebnisse haben wir auf der diesjährigen IPMA Research Konferenz vorgestellt [10], [11].

Ich widme mich jetzt den Text-Zusammenfassungen mittels GPT-3 [12], [13].

Ich nehme das Gesamtergebnis vorweg: Mein! Versuch mittels GPT-3 sinnvolle Zusammenfassungen von Texten zu erzeugen liefert (bisher) keine wirklich überzeugenden Ergebnisse. Es gibt also aktuell auch noch Wermutstropfen in dieser „schönen neuen AI-Welt“😉.

Ich habe dem AI-System GPT-3 die Aufgabe gestellt, für einen meiner Blog-Artikel eine Zusammenfassung zu erstellen. Ich habe den Beitrag vom September 2021 „Metabetrachtungen: Zur Schnittmenge von Intuitivem Bogenschießen, Künstlicher Intelligenz und Management 4.0“ ausgewählt. Er hat einen Bezug zur obigen Bild-Metapher Abbildung 1 und stellt verschiedene Themen (Bogenschießen, AI und M 4.0) in einen eventuell ungewöhnlichen Zusammenhang und ist damit ein Text, den man wahrscheinlich sonst nirgendwo im Internet finden kann. Die AI kennt also mit ziemlicher Sicherheit keine ähnlichen Texte.

Ich greife auf GPT-3 als Black-Box AI-System zu und nicht wie für andere AI & M 4.0 Blog-Beiträge auf verschiedene AI/ML Bibliotheken. Wie bei der Unterhaltung mit dem AI-Bot midjourney ist auch hier das Abstraktionsniveau der „Ansprache“ sehr hoch.

Um Zugriff auf GPT-3 zu erhalten [13], ist es notwendig, sich bei openai.com zu registrieren. Solange man GPT-3 nicht für produktive Zwecke nutzen will, wird ein budgetierter Zugang von $18 als Geschenk freigegeben. Openai.com orientiert sich für die Freigabe an einer Risiko-Bewertung: Forschungsaktivitäten, wie ich sie hier durchgeführt habe, werden als sandbox-Aktivitäten behandelt und unterliegen keinen Restriktionen. – Dies ist sehr ähnlich den Anforderungen, die im EU AI Act zu finden sind. – Man siehe hierzu meinen Blogbeitrag vom August 2022.

Eine Möglichkeit auf GPT-3 zuzugreifen, ist der Zugriff über das User Interface ‚Playground‘ (man siehe Abbildung 5).

In ersten Versuchen habe ich die sogenannten Presets verwendet (man siehe Abbildung 5, und dort die rot eingefassten Bereiche). – Dies sind vorkonfektionierte Aufgabentypen, u.a. auch für die Erstellung von Zusammenfassungen. Die Ergebnisse waren richtig schlecht und recht oft unsinnig: Teilweise wurden Texte abgerufen, in denen wohl ein Bogenschütze auf die Jagd geht oder der deutsche Text, der zusammenzufassen war (man kann also auch nicht-englischen Text eingeben), wurde „einfach“ übersetzt.

Abbildung 5: GPT-3 playground [14]

Wie ich heute weiss, habe ich mit den presets das Potential von GPT-3 überhaupt nicht angesprochen. – Man kann nämlich über die Prompteingabe mit GPT-3 „reden“, d.h. der AI in Satzform sagen, was sie machen soll. Die Aufgabe „Write a summary in English for the following text using the following topics, Management 4.0, self-organization, instance-based learning, model-based learning:” (siehe Abbildung 5 erster Satz im Eingabefeld) brachte bisher das beste Zusammenfassungs-Ergebnis:

“The article discusses the intersection of intuitive archery, artificial intelligence, and management 4.0. It argues that learning is the key element to align the human system, the technical system neural network, and the social system team or organization to the environment. The article distinguishes between instance-based learning and model-based learning. It argues that learning in management 4.0 is model-based learning, and that instance-based learning is insufficient for learning in a complex context.”

An diesem Ergebnis kann man erkennen, dass GPT-3 in der Lage ist, explorative und abstrahierende Zusammenfassungen zu erstellen. Explorative Zusammenfassungen enthalten lediglich Sätze aus dem Original, die als wichtig erkannt werden. Abstrahierende Zusammenfassungen enthalten neue Sätze, die so nicht im Original enthalten sind.- Die abstrahierende Zusammenfassung ist u.a. an Sätzen wie „The article distinguishes…“ zu erkennen.

Ich habe dieses Ergebnis als bestes ausgewählt, weil dies das einzige Beispiel ist, in dem der Satz „It argues that learning in management 4.0 is model-based learning, and that instance-based learning is insufficient for learning in a complex context.” enthalten ist. Dieser Satz ist eine zentrale Erkenntnis des Blog-Beitrages. Leider sind nicht alle Erkenntnisse enthalten; z.B. wird das Thema Selbstorganisation als zentrales verbindendes Element der drei Bereich, Management 4.0, AI und Bogenschießen, nicht erkannt. Deshalb gebe ich GPT-3 in diesem Fall auch nur die Schulnote ausreichend.

Im Playground können nur Texte eingegeben werden, deren Anzahl an Tokens (ungefähr gleich der Anzahl an Worten), addiert mit der Anzahl an Tokens für die Zusammenfassung, 4000 Tokens nicht überschreiten. Ich habe für die Zusammenfassung 507 Tokens vorgegeben und habe damit noch ca. 3500 Tokens für den eigentlichen zusammenzufassenden Text zur Verfügung. Falls der Text in einer Fremdsprache eingegeben wird, halbiert sich der verfügbare Raum für den Text auf etwa die Hälfte an Tokens: GPT-3 benötigt Raum für die Übersetzung. – Die „Muttersprache“ von GPT-3 ist Englisch! Aus diesem Grund konnte ich auch nur einen Auszug des Blogs verwenden. Aus Gründen der Vergleichbarkeit habe ich für die deutschen und die englischen Texte den Auszug gleich beibehalten und jeweils ca. 1400 Wörtern verwendet. In allen Tests habe ich die von opneai.com empfohlene Stop sequence <|endoftext|> am Ende des Textes eingesetzt.  – Das Verwenden einer Stop sequence zum Anzeigen des Textendes hat einen recht großen Einfluss auf das Zusammenfassungsergebnis.

Statt GPT-3, verwende ich den google-Übersetzer [15] und den Übersetzer deepl.com [17], um einen englischen Text für meinen Blog-Beitrag zu erzeugen. Die Übersetzungen sind sehr ähnlich, wobei meines Erachtens bei genauerer Betrachtung doch manchmal recht große Unterschiede auffallen. So übersetzt zum Beispiel deepl.com „Meta-Betrachtungen“ mit „Meta-observations“ und der google-Übersetzer mit „Meta considerations“. – Dies scheint mir ein nicht unerheblicher Unterschied zu sein.

Google verändert auch in erheblichem Maße die Syntax. So wurde wie hier zu sehen, u.a. der Bindestrich zwischen Meta und consideration einfach entfernt. Groß- und Kleinschreibung und Satzzeichen wurden verändert, so dass selten – aber immerhin geschah es – sich ein vollständig anderer Sinn ergeben hat. Mehrmals wurden ganze Satzteile einfach weggelassen. – Ein schwerwiegender Fehler.

Bei deepl.com ist dies im vorliegenden Beispiel einmal vorgekommen bei google dreimal. Der google-Übersetzer liefert auch leicht andere Ergebnisse, je nachdem, ob man ihn mit einer zu übersetzenden Internetseite füttert oder einer Worddatei, die den Inhalt der Internetseite enthält.

Ich betone dies, weil beide Übersetzer mit AI betrieben werden. Es ist nicht auszuschließen, dass die AI sauber funktioniert, jedoch die Aufbereitung der Daten, also der Texte, nicht fehlerfrei ist. – Versteckte Satzzeichen oder Abschnittszeichen werden unterschiedlich interpretiert. Die AI-Systeme benötigen trotz ihrer „Intelligenz“ Daten in einer wohldefinierten Form. – Es gibt keinen Spielraum für „intelligentes Ausbessern“ wie in der menschlichen Kommunikation. Das macht das Arbeiten mit AI-Systemen nicht selten zu einem Geduldsspiel. Die korrekte Dateneingabe wurde, nach meiner bisherigen Erfahrung, von AI-Erstellern nicht gut dokumentiert.

Um die Restriktion bezüglich des Textumfanges zu umgehen, kann man GPT-3 auch über ein Jupyter Notebook [17] in der Colab-Umgebung [18] ansprechen. – Man beachte, GPT-3 ist in der Colab-Umgebung aufrufbar, obwohl google und openai im Wettbewerb stehen. – Bemerkenswert erfreulich!

Ich habe den Code von [19] verwendet und für meine Aufgabenstellung angepasst. Für den vollständigen Text in Deutsch erzeugt GPT-3 eine deutlich größere explorative Zusammenfassung in Englisch, obwohl ich GPT-3 um eine deutsche Zusammenfassung gebeten habe.

Den mittels deepl.com ins Englische übersetzten Blog-Artikel habe ich einmal als .pdf Datei Seite für Seite eingelesen und alternativ direkt als Text in die Colab-Umgebung eingebracht. In beiden Fällen wurde eine abstrahierende Zusammenfassung erstellt. Die erste Zusammenfassung entspricht der schon bekannten besten Zusammenfassung, die zweite Zusammenfassung ist eine andere:

“The article discusses the intersections of intuitive archery, artificial intelligence, and Management 4.0. Intuitive archery is a form of archery that does not rely on aiming technique, and is used for therapeutic archery in clinics. The author argues that the ability to focus, adapt, and intuition are central elements of Intuitive Archery, which are also important for Management 4.0. The author describes their experience with a Deep Learning course using Tensorflow, and how it has helped them understand the potential for artificial intelligence in project management.”

Ich konnte also an meiner Aufgabenstellung nicht erkennen, dass GPT-3 mit jedem Aufgabendurchlauf dazu lernt. – Eine Aussage, die andere schon getroffen haben [12].

Zusammenfassung: Meine Untersuchungen zu Text-Zusammenfassungen mittels GPT-3 und Bild-Metaphern mittels midjourney zeigen schon recht gute Ergebnisse, jedoch ist Vorsicht geboten, wenn man die Werkzeuge (schon) im produktiven Betrieb benutzen möchte. Jedoch ist schon heute auf einfachen Wegen selbst erfahrbar, dass der Weg in Richtung einer Künstlichen Allgemeinen Intelligenz eingeschlagen wurde.     

 

[1] Hannemann P (2022) Kunst per künstlicher Intelligenz: Mit diesen Tools können Sie das selbst ausprobieren, https://www.chip.de/news/Kunst-per-kuenstlicher-Intelligenz-Mit-diesen-Tools-koennen-Sie-das-selbst-ausprobieren_184386657.html, zugegriffen am 06.09.2022

[2] Discord (2022) Discord.com, Innovative Kommunikationsplattform, zugegriffen am 06.09.2022

[3] midjourney(2022) Forschungsprojekt zu AI, https://www.midjourney.com/home/, zugegriffen am 06.09.2022, zugegriffen am 06.09.2022

[4] Keita Z (2022) Meet BERTopic— BERT’s Cousin For Advanced Topic Modeling, https://towardsdatascience.com/meet-bertopic-berts-cousin-for-advanced-topic-modeling-ea5bf0b7faa3, zugegriffen am 09.04.2022

[5] Dwivedi P (2022) NLP: Extracting the main topics from your dataset using LDA in minutes, https://towardsdatascience.com/nlp-extracting-the-main-topics-from-your-dataset-using-lda-in-minutes-21486f5aa925, zugegriffen am 09.04.2022

[6] Wikipedia (2022) Artificial General Intelligence, https://en.wikipedia.org/wiki/Artificial_general_intelligence, zugegriffen am 06.09.2022

[7] Liu Y, He F, Zhang H, Rao G, Feng Z and Zhou Y (2019) How Well Do Machines Perform on IQ tests: a Comparison Study on a Large-Scale Dataset, Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI-19)

[8] Tschopp M, Ruef M (2019) An Interdisciplinary Approach to Artificial Intelligence Testing: Developing an Artificial Intelligence Quotient (A-IQ) for Conversational AI, siehe researchgate.net

[9] Liu F, Liu Y, Shi Y (2020) Three IQs of AI systems and their testing methods, https://ietresearch.onlinelibrary.wiley.com/doi/10.1049/joe.2019.1135, zugegriffen am 05.09.2022

[10] Nuhn H, Oswald A, Flore A, Lang R, (2022) AI-supported Natural Language Processing in project management – capabilities and research agenda, IPMA Research Conference 2022, www.ipma-research-conference.world

[11] Lang R (2022) Kann Künstliche Intelligenz (KI) das Projektmanagement unterstützen? https://www.linkedin.com/feed/update/urn:li:activity:6970285127754997760/,  zugegriffen am 09.09.2022

[12] Romero A (2022) A Complete Overview of GPT-3 — The Largest Neural Network Ever Created, https://towardsdatascience.com/gpt-3-a-complete-overview-190232eb25fd, zugegriffen am 09.08.2022

[13] Willison S (2022) How to play with the GPT-3 language model, https://simonwillison.net/2022/Jun/5/play-with-gpt3/, zugegriffen am 09.08.2022

[14] GPT-3 playground (2022) openai.com, zugegriffen am 09.09.2022

[15] google Übersetzer (2022) https://translate.google.de/?hl=de&tab=rT, zugegriffen am 09.09.2022

[16] Deepl (2022) https://www.deepl.com/translator, zugegriffen am 09.09.2022, verwendet für diesen Blog-Beitrag in der kostenpflichtigen Version deepl Pro

[17] Jupyter Notebooks (2021) https://jupyter.org/, zugegriffen am 02.12.2022

[18] Colab (2021) https://colab.research.google.com/

[19] Soares L (2022) Summarizing Papers With Python and GPT-3, https://medium.com/p/2c718bc3bc88, zugegriffen am 22.07.2022

AI & M 4.0: Sein als Netzwerk – Den Collective Mind als Netzwerk sichtbar machen

Über Jahrhunderte hinweg haben die berühmtesten Philosophen versucht das „Ding an sich“ auszuleuchten und zu finden. Es ist ihnen nicht gelungen, da es meines Erachtens das „Ding an sich“ nicht gibt.

Es gibt Dinge oder Objekte, aber diese werden ganz entscheidend durch ihre Wechselwirkung mit ihrer Umgebung bestimmt. – Andere Umgebungen und schon sind Objekte oft ganz anders. – Die Relationen, also die Beziehungen, zwischen den Objekten bestimmen ganz entscheidend das Sein. – Deswegen habe ich diesem Blog-Beitrag den Titel „Sein als Netzwerk“ gegeben.

Das Studium von Netzwerken in Natur, Sozialem oder Technik mittels mathematischer Methoden ist schon mehrere hundert Jahre alt und ist eng mit dem Namen des französischen Mathematiker’s Pierre-Simon Laplace verbunden [1]. – Im zwanzigsten Jahrhundert wurde die Netzwerkanalyse zu einer vollständigen Disziplin, u.a. in den Sozialwissenschaften, ausgebaut [2], [3].

Die erfolgreiche Netzwerkanalyse ist einer der Grundpfeiler für den Erfolg von google: Der PageRank Algorithmus misst die Bedeutung von Internetknoten (homepages) im Netzwerk Internet [4]. – Weiter unten werde ich diesen Algorithmus für das Vermessen der Bedeutung von Begriffen in einem Text benutzten. – Denn ich nehmen an, dass bedeutende Begriffe und deren Relationen die mentale Ausrichtung eines Teams beschreiben.  

Die Netzwerkanalyse, oft auch Graphentheorie genannt, hat in den letzten Jahren im Bereich AI/ML eine enorme Bedeutung erhalten: Graphentheorie und Neuronale Netzwerke sind eine Relation 😉 eingegangen. Es entstand die AI/ML Disziplin Graph Neural Networks (GNN) [5]. – Im letzten Blog-Beitrag war Word-embedding der Schwerpunkt. GNN basieren auf dem Embedding von Netzwerken in höher-dimensionale abstrakte Räume. – Einige der aktuellen spektakulären AI/ML Erfolge, wie zum Beispiel in der Medikamentenerforschung, gehen auf diese Relation von Graphentheorie und AI/ML zurück.

GNN sind high-end AI/ML Systeme, die aktuell sehr viel Know-How erfordern. In vielen Fällen dürfte es jedoch genügen, Netzwerke lediglich sichtbar zu machen und erste Analysen, wie den mathematisch recht einfachen PageRank Algorithmus, anzuwenden. Genau dies will ich in diesem Artikel an einem Beispiel demonstrieren. – Hierbei steht, wie schon im letzten Beitrag, die grundlegende Idee im Vordergrund und nicht die Erzeugung oder Vermarktung eines vollständigen Produktes.

In meinem Blog-Beitrag vom Dezember 2021 habe ich erstmals für die IPMA PM Kompetenzbereiche Beispiele zu Graphen Anwendungen genannt. Hier nochmals einige Beispiele:

Führung und Stakeholder: Soziale Netzwerke können mittels Graphen oder GNN analysiert werden. Dies kann auf Teamebene und auf der Ebene aller Stakeholder erfolgen. Hierzu wird u.a. der eMail-Austausch einer Organisation analysiert und in einem Graphen sichtbar gemacht. Relative einfache Werkzeuge, wie der PageRank Algorithmus zeigen die relative Bedeutung von Knoten (d.h. hier Personen) im Netzwerk an.

Führung, Kommunikation, Teamarbeit: Die verbale Kommunikation wird mittels Graphen analysiert und die Analyse wird als Feedback in das Team gegeben. Oder die AI/ML Analyse unterstützt die Führungskraft bei ihrer Selbstreflexion und abgeleiteten Team-Interventionen. Aus der Analyse der Kommunikation lassen sich auch Collective Mind Target Hierarchien erzeugen. Das Beispiel, das ich weiter unten skizziere, gehört in diese Kategorie.

Planung und Steuerung: Aus Texten werden Graphen abgeleitet, aus denen wiederum Projektpläne erzeugt werden. Auf der Basis der Graphen und mittels GNN werden u.a. Risiken ermittelt und Aufwände abgeleitet. Diese Informationen können im Projektzeitverlauf auch für das Projektmonitoring verwendet werden.

Die letzte Kategorie ist eine deutlich anspruchsvollere Aufgabe als die beiden vorherigen Anwendungskategorien. Die beiden ersten Anwendungskategorien lassen sich in der ersten Ausbaustufe mit den in diesem Blog skizzierten Techniken bewältigen.

Im letzten Blogbeitrag habe ich die Ähnlichkeit von (gesprochenen) Texten, d.h. die Similarity, dazu benutzt, ein Maß für die Stärke des Collective Mind abzuleiten. In diesem Fall wurden Wort-Relationen über deren Einbettung in einen hochdimensionalen abstrakten Raum benutzt, um die Similarity zu berechnen.

In diesem Blogbeitrag will ich die Graphentheorie und AI/ML dazu benutzten, Texte auf enthaltene Relationen zu analysieren und diese Relationen in einem Graphen sichtbar zu machen. – Es steht also die Visualisierung von Kommunikation im Vordergrund: Die Visualisierung mittels Graphen macht in einer Kommunikation sehr schnell Zusammenhänge sichtbar. Die These ist, dass über visualisiertes Feedback in ein Team, der Prozess der Collective Mind Ausbildung deutlich beschleunigt wird.      

Ich benutze den Code von Thomas Bratanic [6], der auf towardsdatascience.com zu finden ist. Towardsdatascience.com ist eine hervorragende Fundgruppe für alle möglichen Fragestellungen rund um das Thema AI/ML.

Bratanic demonstriert die Graphenanalyse am Beispiel der Analyse von Wikipedia-Seiten zu drei Wissenschaftlerinnen. Hierzu werden die Wikipedia-Seiten in page.summaries mit einfachen Sätzen zusammengefasst. – Wir werden später sehen, dass diese einfachen Sätze (derzeit noch) notwendig sind, um die NLP-Verarbeitung gut durchzuführen. Abbildung 1 zeigt einen Auszug aus diesem Ergebnis:

Abbildung 1: Auszug einer Analyse von Wikipedia Daten zu drei Wissenschaftlerinnen gemäß Thomas Bratanic [6].

Die Grundidee ist einfach: Es werden Sätze in Texten oder Gesprochenem in „Subjekt-Relation->Objekt“ Strukturen (S-R->O Strukturen) zerlegt. Zum Beispiel ergibt der Satz „Alfred wohnt in Stolberg.“ die Struktur „Alfred – wohnt in -> Stolberg“. Die gefundenen S-R->O Strukturen werden in eine Graphen-Datenbank transferiert. Hier können verschiedene Netzwerkanalysen durchgeführt werden.

Die AI/ML Technik hierzu ist schon nicht mehr so einfach: Wie im letzten Blog-Beitrag kommt die NLP-Bibliothek spaCy [7] zum Einsatz. Hinzukommen diverse raffinierte NLP-Python-Skripte, die high-end Transformator Pipeline aus der tensorflow-Technologie [8] und zum Schluss die Graphendatenbank Neo4j [9]. Das Ganze ist nach diversen Anpassungen und einige Zeit später als Jupyter-Notebook [10] in der Colab-Umgebung [11] lauffähig.

Wie schon im letzten Blogbeitrag, habe ich der Einfachheit wegen den Text der Definition von Agile Management 4.0 benutzt. Der erste Lauf mit diesem Text zeigt jedoch, dass kaum Relationen extrahiert wurden. – Der Text ist zu verschachtelt geschrieben. Dementsprechend habe ich ihn in einfache Sätze umgeschrieben. – Ich hätte auch einen entsprechenden AI/ML pre-processing Schritt vorwegschalten können, der Text in einfachen Text mit S-R->O Strukturen transformiert. Dies hätte den Aufwand jedoch deutlich erhöht. – Mit entsprechenden AI/ML Techniken stellt dies jedoch kein prinzipielles Problem dar. – Ich habe den Text auch teilweise belassen wie er ist, um die Auswirkungen zu sehen.

 
Hier der verwendete Text:

“Agile Management is a leadership and management practice. Agile Management is able to act in an agile and proactive way. Agile Management is for acting in a complex environment. The complex environment is characterized by uncertainty. Agile Management is described as an Agile Mindset. The Agile Mindset is focused on leadership. The basis of leadership is self-leadership. Leadership is based on respect for basic human needs. Leadership demands an understanding of complex systems. Leadership regulates complexity. Regulation of complexity is done by iterative procedures. Leadership is based on people who use self-organization in teams. Agile Management creates fluid organizations.  Fluid organizations promote adaptable and fast delivery of useful results and create innovative customer solutions through proactive dealing with changes.”

Dieser Text wird von dem AI/ML-System in S-R->O Strukturen transferiert, die in der Graphendatenbank Neo4j folgende Visualisierung erhalten:

 

Abbildung 2: Screenshot der Neo4j Visualisierung der NLP extrahierten S-R->O Strukturen.

Agile Management und leadership werden als zentrale Knoten erkannt. Die Sätze

„Regulation of complexity is done by iterative procedures.”

und

Fluid organizations promote adaptable and fast delivery of useful results and create innovative customer solutions through proactive dealing with changes.”

sind in zwei getrennten Netzwerkclustern enthalten.  Der zweiten Satz ist auch nicht vollständig abgebildet. Dies ist meinem unzureichenden manuellen Pre-Processing geschuldet. Bei diesem Satz kann man auch schön erkennen, dass „Fluid organization“ und „fluid organization“ nicht als gleiche Nomen erkannt werden.

Für den ganzen Text gilt, dass die Verben des Textes in allgemeinere Relationsbezeichnungen abgebildet werden. Diese haben ihren Ursprung in einem entsprechenden vorgegebenen NLP Training von spaCy.

Auch mit diesen Einschränkungen stellt die Visualisierung des Textes einen erheblichen Mehrwert dar: Denn man möge sich nur vorstellen, dass ein entsprechendes AI/ML System online und ad hoc Teamkommunikation auf solche Weise visualisiert als Feedback an das Team zurückgibt. – Dies würde meines Erachtens den Kommunikationsprozess erheblich beschleunigen und die Visualisierung wäre auch gleichzeitig eine Visualisierung des gerade vorhandenen Collective Mind’s. Im Falle einer komplexen Kommunikation wäre die Visualisierung um so hilfreicher: Dies umso mehr, wenn die Visualisierung mehrere oder viele Netzwerkcluster zu Tage fördern würde. Dies entspräche mehreren Gesprächsthemen oder -lagern, die ggf. für mehrere (konkurrierende) Collective Mind’s stünden.

Neben der Visualisierung können diverse Werkzeuge der Netzwerktheorie verwendet werden, um Netzwerke zu analysieren [12]. – Dies ist umso notwendiger, je komplexer die Netzwerke aus Personen, Worten, homepages, Molekülen usw. sind.  Neo4j stellt mehr als hundert solcher Werkzeuge zu Verfügung, u.a. auch den PageRank Algorithmus. Abbildung 3 zeigt die PageRank-Auswertung für den Graphen aus Abbildung 2.

Abbildung 3: PageRanking für den Graphen aus Abbildung 3

Das PageRanking ist für diesen einfachen Graphen sicherlich keine große Überraschungen: Agile Management und leadership sind die beiden Begriffe, die im Netzwerk gemäß diesem Algorithmus am wichtigsten sind. Für größere Graphen erwarte ich jedoch erhebliche Überraschungseffekte in den Teams oder Organisation, deren Kommunikation auf diese Weise analysiert wird.

Agile Management und leadership sind zwei Begriffs-Attraktoren, die die Ausrichtung der gedachten Teamkommunikation, anzeigen: Das Begriffs-Netzwerk visualisiert den Collective Mind oder den fehlenden Collective Mind einer Kommunikation, je nachdem wie viele konkurrierende Netzwerkcluster (Communities) mit ähnlichem PageRanking es gibt.

Dieses kleine Beispiel illustriert, dass man mit den Mittel von AI/ML erhebliche Informationen über Teams oder Organisationen gewinnen kann. Diese Informationen können im Guten wie im Bösen eingesetzt werden. Berücksichtigt man, dass das Know-how von google und Co. Lichtjahre weiter ist als mein Eigenes, so ist die Einbettung in eine AI Ethik um so wichtiger. Deshalb beabsichtige ich, mich im nächsten Blog mit dem EU AI Act zu beschäftigen [13].

 

[1] Laplace Matrix (2022) https://en.wikipedia.org/wiki/Laplacian_matrix, Wikipedia, zugegriffen am 19.06.2022

[2] Jansen D (1999) Einführung in die Netzwerkanalyse, VS Verlag für Sozialwissenschaften

[3] Wasserman S, Faust K (1994) Social Network Analysis, Cambridge University Press

[4] PageRank (2022) https://en.wikipedia.org/wiki/PageRank, Wikipedia, zugegriffen am 19.06.2022

[5] Hamilton W L (2020) Graph Representation Learning, Morgan&Claypool Publishers

[6] Bratanic T (2022) Extract knowledge from text: End-to-end information extraction pipeline with spaCy and Neo4j, published May 6, 2022, https://towardsdatascience.com/extract-knowledge-from-text-end-to-end-information-extraction-pipeline-with-spacy-and-neo4j-502b2b1e0754, towardsdatascience.com, zugegriffen am 10.05.2022

[7] spaCy (2022) https://spacy.io/models/de, zugegriffen am 20.04.2022

[8] Transformers (2022) https://huggingface.co/docs/transformers/main_classes/pipelines, huggingface.co, zugegriffen am 20.04.2022

[9] Neo4j (2022) neo4j.com, zugegriffen am 23.06.2022

[10] Jupyter Notebooks (2021) https://jupyter.org/, zugegriffen am 02.12.2022

[11] Colab (2021) https://colab.research.google.com/

[12] Scifo E (2020) Hands-on Graph Analytics with Neo4J, Packt Publishing, Birmingham, kindle edition

[13] EU AI Act (2022) https://artificialintelligenceact.eu/, Europe Administration

AI & M 4.0: Collective Mind, Proxies und word embedding

Eine Warnung vorweg: Ich benutzte im Blog Mathematik und AI Techniken, da ich versuche, den Begriff Collective Mind damit besser auszuleuchten. Vielleicht motiviert dies den ein oder anderen Leser, den Blog-Beitrag genau aus diesem Grunde zu lesen.

Der Begriff Collective Mind wurde erstmals 2007 von Jens Köhler und mir, im Zusammenhang mit der Erstellung unseres Buches „Die Collective Mind Methode“, geprägt [1]. Später ist der Collective Mind, als einer der zentralen Begriffe, in Management 4.0 eingegangen.

Wir verstehen unter Collective Mind (CM) einerseits einen kollektiven Flow-Zustand, der für Team oder organisationale Hochleistung steht und andererseits steht er auch für einen Operator, also Modelle und Theorien, der diesen Zustand beschreibt und herbeiführt.

Wir benutzen in der Collective Mind Theorie zwar verschiedene Modelle (Persönlichkeitkeitsmodelle, Wertemodelle, Team-Heterogenitätsmodelle, Kommunikationsmodelle usw.) mit denen wir den Collective Mind herbeiführen; und das funktioniert sehr gut, wie wir in mehr als 15 Jahren Praxis zeigen konnten, jedoch ist es uns bisher nicht gelungen den Flow-Zustand selbst, den Collective Mind, durch ein Modell oder eine Theorie zu beschreiben. Wir arbeiten stattdessen mit Metaphern oder wir verwenden Stellvertretermodelle, kurz Proxies, um ihn zu beschreiben. Diese Proxies sind:

  • Mitwirkungs- und Redezeit: Der CM ist dann besonders stark, wenn alle Teammitglieder nahezu gleichstark mitwirken, also sie zum Beispiel in nahezu allen Teammeetings anwesend sind und ihre Redezeit nahezu gleich verteilt ist.
  • Ähnlichkeit in der Wort- und Bild-Wahl: Der CM ist dann besonders stark, wenn alle Teammitglieder ähnliche Worte und/oder Bilder benutzen, um einen Projektsachverhalt zu beschreiben. – Es findet ein Spiegeln im gesprochenen Wort und im Bild statt.
  • Zufriedenheit: Der CM ist besonders stark, wenn alle Teammitglieder der Arbeit im Team eine sehr hohe Zufriedenheit attestieren und sie das Gefühl haben einen sinnvollen Beitrag zu leisten.
  • Spiegeln der Körpersprache: Der CM ist besonders stark, wenn alle Teammitglieder in ihrer Körpersprache die Köpersprache der anderen spiegeln.

Im Idealfall treffen für ein CM Hochleistungsteam alle diese Proxies gleichzeitig zu.

Diese Stellvertretermodelle können sich auch über die Zeit entwickeln: Zum Beispiel benutzen die Teammitglieder am Anfang völlig unterschiedliche Beschreibungen (Sätze, Bilder), um ein Projektziel oder einzelne Anforderungen zu konkretisieren. Steigt der Collective Mind, werden die Unterschiede geringer. Jedoch kann im Team etwas passieren, das den Collective Mind zerstört oder wieder ins Wanken bringt. Die Unterschiede in den Proxies werden entsprechend wieder größer. Beispiele für solche Ereignisse, die den CM wieder verändern, sind neue Teammitglieder oder wechselhafte Anwesenheiten von Teammitgliedern oder neue Erkenntnisse, die nicht von allen im gleichen Maße gesehen und geteilt werden.

Die Leser dieses Blogs dürften diese empirischen Aussagen bei geneigter Bobachtung in ihren Teams sehr schnell bestätigen. Ich verweise diesbezüglich auch auf das Whitepaper von Armatowski et. al., das anlässlich der IPMA Research Conference zum Thema Selbstorganisation erstellt wurde [2]. – Das Whitepaper skizziert für das Autorenteam den Prozess der Selbstorganisation, also der Ausbildung eines CM’s, während der IPMA Research Hackdays 2020.

Im Bereich der Wissenschaften, insbesondere derjenigen, die Sachverhalte auch mathematisch beschreiben, hat man sich inzwischen weitgehend daran gewöhnt die Realität mit den Proxies für die Realität gleichzusetzen: Zum Beispiel werden elektrische Erscheinungen einem elektrischen Feld E zugeschrieben (Fett gedruckte Buchstaben bezeichnen hier eine sogenannte Vektorgröße, die durch einen Betrag und eine Richtung beschrieben wird). – Wahrscheinlich käme kaum jemand auf die Idee, E als Proxy zu betrachten. – Falls es doch mal durch einen genialen Wissenschaftler geschieht, bringt dieser die Erkenntnis einen Schritt weiter, in dem er die dem Proxy hinterlegten Annahmen radikal hinterfragt.

Alle anderen dürften über Jahrzehnte oder sogar Jahrhunderte hinweg das elektrische Feld E mit der „wahren“ elektrischen Realität gleichsetzen. – Lediglich im Bereich der Quantenmechanik ist diese breite Sicherheit nie so wirklich wahrgeworden. – Die Unterschiede zwischen alltäglicher Erfahrung und quantenmechanischer Beobachtung und den assoziierten Proxies ist nach wie vor zu groß.

Proxies sind also nur Stellvertreter, also Modelle oder Theorien, die unsere Beobachtungen zusammenfassen bzw. abstrahieren. So gesehen ist es sicherlich legitim die obigen Collective Mind Proxies für den „wahren“ Collective Mind zu verwenden. Verwendet man zusätzlich die Mathematik zur Beschreibung, so ergibt sich ein deutlich besseres und erweitertes Verständnis der Zusammenhängen, nicht selten werden Zusammenhänge erst sichtbar. – Eine Aussage, die nach meiner Erfahrung immer gültig ist, vorausgesetzt man berücksichtigt wie auch bei anderen (mentalen) Modellen, dass Proxies nicht zwangsläufig die Realität sind.

Setzt man die mathematische Beschreibung in Technologie, in unserem Fall in Artificial Intelligence Technologie, um, so lässt sich der CM viel besser fassen. Wie wir gleich sehen werden, lassen sich die Collective Mind Proxies in der Praxis gut operationalisieren und gut überprüfen.

Wir führen das mathematische Gebilde „Tensorfeld Collective Mind CM(x,t)“ ein, das vom Ort x und der Zeit t abhängt.

Was verstehe ich darunter?

Im Kontext von Management oder Projekt Management kann man sich sehr gut vergegenwärtigen, dass der Collective Mind wie ein abgeschossener Pfeil eine Richtung haben muss, denn Projektziele oder die Ziele einzelner Personen oder Organisationen werden u.a. durch eine Richtung beschrieben. Er hat auch einen Betrag, nämlich die Energie, die im Team, in der Person oder der Organisation zu diesem Ziel vorhanden ist. Dass der CM sich zeitlich ändern kann, habe ich schon oben erläutert. – Er kann natürlich auch vom Ort abhängen. – Der Collective Mind innerhalb eines (größeren) Teams oder einer Organisation kann durchaus von Ort zu Ort unterschiedlich sein: Verschiedene Sub-Teams eines Teams haben unterschiedliche Collective Minds, verschiedene Sub-Organisationen (Abteilungen) einer Organisation haben wahrscheinlich auch unterschiedliche Collective Minds.

Mit diesen Annahmen setze ich die obigen verbalen Proxies in Mathematik um: Die Aussage „in etwa gleiche Mitwirkungs- und Redezeit“ kann man in Differenzen umsetzen, indem wir die Redezeiten jeder Person mit jeder anderen Person vergleichen. Es entsteht eine Matrix, oder allgemeiner ein Tensor oder Tensorfeld. – Die bekannteste google AI/ML Plattform auf der Basis neuronaler Netzwerk heißt tensorflow, weil Tensoren durch das Netzwerk aus künstlichen Neuronen fließen [3].

Auch die Ähnlichkeit in der Wortwahl kann man durch Differenzen darstellen. Die Differenzen in der Wortwahl bilden ebenfalls ein Orts- und Zeit-abhängiges Tensorfeld.

Auf der Basis der obigen verbalen Proxies führen wir eine mathematische Form für den Operator des Collective Minds, CMO(x,t) (das hochgestellte O steht für Operator), ein:  

CMO(x, t) ~ proxyCMO(x, t) = SO(x, t)*MO(x,t)

Diese Gleichung drückt aus, dass wir annehmen, dass das „unbekannte Wesen“ CMO(x, t) näherungsweise durch einen proxyCMO(x,t) beschrieben werden kann; und dass zwei Faktoren – nach jetziger Erkenntnis – diesen proxyCMO(x,t) bestimmen. Ich habe Faktoren gewählt, um auszudrücken, dass im Idealfall alle zwei Faktoren, SO und MO, vorhanden und groß sein müssen, um einen großen CMO(x,t) zu erhalten.

SO(x,t) = Similarity: Dieser Faktor “misst” Mitwirkungs- und Redezeit sowie Wortähnlichkeit (Ähnlichkeiten in Bildern berücksichtigen wir der Einfachheit wegen hier nicht). Wir können diese beiden Proxies gut in einer Größe zusammenfassen: Wählen wir SO(x,t) geeignet, so kann SO(x,t) nur dann eine hohe Similiarity ausweisen, wenn man gleich große Text – oder Redeblöcke miteinander vergleicht und dies kann nur dann der Fall sein, wenn die Teammitglieder in etwa gleich lange anwesend sind und gleichlange sprechen.

MO(x,t) = Mood: Dieser Faktor misst die Stimmung, die Zufriedenheit im Team oder in der Organisation. Dieser Faktor schließt auch die Häufigkeit und Intensität des körperlichen Spiegelns ein.

Ob man mehrere Faktoren benötigt, ist mir zurzeit noch nicht klar, denn SO kann nur dann hoch sein, wenn MO hoch ist. – Nur zufriedene Teammitglieder reden in etwa gleich viel mit einer ähnlichen (spiegelnden) Kommunikation in Sprache und Körper. – Jedoch könnte man Unterschiede zwischen Körpersprache und gesprochenem Wort benutzen, um Dysfunktionalitäten aufzudecken. Hierzu wäre eine entsprechende visuelle AI notwendig und dies geht in jedem Fall weit über diesen Blog hinaus.

Ich tue jetzt mal so, als wenn einige Jahrzehnte verstrichen seien und wir uns wie beim elektrischen Feld E daran gewöhnt hätten, Proxy und Realität gleichzusetzen:  Wir setzen also in der obigen Gleichung CMO und proxyCMO gleich und wir nehmen der Einfachheit wegen an, dass die Similarity genügt, um den CMO zu beschreiben:

CMO(x, t) = SO(x, t)

SO(x, t) ist eine symmetrische Matrix deren Elemente Sij(x,t) Differenzen von zwei Vektoren sind, nämlich die Differenz zwischen dem Wortanteil und der Wortwahl des Teammitgliedes i und derjenigen des Teammitgliedes j. Wortanteil und Wortwahl jedes Teammitgliedes werden durch einen Vektor in einem verbalen Raum ausgedrückt.

Jetzt müssen wir „nur noch“ einen geeigneten Operator SO(x,t) finden, der in einem verbalen Raum Vektoren aufspannt. – Ohne die Fortschritte in AI/ML wäre hier das Ende meiner Ausführungen erreicht. – Die enormen Fortschritte in der Verarbeitung der natürlichen Sprache mittels AI/ML, also dem AI/ML-Teilgebiet NLP (Natural Language Processing), machen es mir möglich, weiterzukommen.

Im Jahre 2013 wurde die fundamentale Idee veröffentlicht, Text bzw. Worte in Vektoren zu transferieren: Es werden Worte in einen Vektorraum eingebettet. Deshalb nennt man diese Technik auch word embedding. Word embedding wird auch mit dem Namen der wahrscheinlich bekanntesten AI/ML NLP Bibliothek „word2vec“ von google gleichgesetzt. [4, 5]. Jedem Wort wird hierzu ein token, eine Zahl, zugeordnet und dieses token wird in einen hochdimensionalen Raum, typischer Weise mit 300 Dimensionen! eingebettet [6, 7, 8]. Die hohe Dimension des (Wort-) Raumes erlaubt es, Worte nach 300 Dimensionen zu differenzieren. Das Verblüffende ist, dass Neuronale Netzwerke, die mittels Texten trainiert werden, die Worte eines Textes nicht beliebig in diesem Raum verteilen, sondern gemäß Sinn, wie wir ihn auch wahrnehmen. Man kann dann sogar mit diesen Wortvektoren „rechnen“, z.B. König-Mann+Frau = Königin. Dieses Rechen hat auch dazu geführt, dass man Vorurteile und Diskriminierungen in Datensätzen aufgedeckt hat, also z.B. Arzt-Mann+Frau = Krankenschwester. – Wohlgemerkt, Datensätze die unsere diskriminierende Realität beschreiben.
Wer sich von der hinterlegten Technik beeindrucken lassen möchte, den verweise ich auf die word embedding Illustration von tensorflow [9]. 

Dies word embedding ist für mich eine mehr als nur erstaunliche Erfahrung. – Sie  stützt einen meiner wichtigsten Glaubenssätze: „Das Sein unterscheidet nicht zwischen belebt und unbelebt, oder zwischen bewusst und unbewusst, wir treffen überall auf die gleichen fundamentalen Prinzipien, auch wenn deren Erscheinungen  auf den ersten Blick sehr unterschiedlich sein mögen.“

Eine der bekanntesten NLP Bibilotheken, die word2vec Funktionalität integriert, ist spaCy [10]. Ich benutze spaCy, um SO(x, t) an einem einfachen Beispiel zu berechnen. Ich lehne mich an Beispiele aus [11] an und zeige im Folgenden den Code wie er in einem Jupyter Notebook [12] in der google Colab-Umgebung [13] lauffähig ist. Zunächst eine kleine Illustration von word embedding:

pip install spacy

!python -m spacy download en_core_web_md

import en_core_web_md

nlp = en_core_web_md.load()

vocab =nlp(‚cat dog tiger elephant bird monkey lion cheetah burger pizza food cheese wine salad noodles macaroni fruit vegetable‘)

words = [word.text for word in vocab]

vecs = np.vstack([word.vector for word in vocab if word.has_vector])

pca = PCA(n_components=2)

vecs_transformed = pca.fit_transform(vecs)

plt.figure(figsize=(20,15))

plt.scatter(vecs_transformed[:,0], vecs_transformed[:,1])

for word, coord in zip(words, vecs_transformed):

  x,y = coord

  plt.text(x,y, word, size=15)

plt.show()

Unter Anwendung des obigen Codes wird folgendes Bild erzeugt:

Abbildung 1: 300-dimensionales Wortvektor-Modell projiziert auf 2 Dimensionen

Ich gehe nicht auf die Details des Code-Beispiels ein, lediglich einige Hinweise, um das Wesentliche des Blogbeitrags zu erfassen: Ich benutze ein vortrainiertes englisches Vektormodell „en_core_web_md“ und übergebe diesem einige englische Worte ‚cat dog tiger elephant bird monkey lion cheetah burger pizza food cheese wine salad noodles macaroni fruit vegetable‘, die das vortrainierte Modell in einem 300-dimensionalen Vektorraum verortet. Um diese Verortung darstellen zu können, wird die Verortung mit der mathematischen Technik PCA auf zwei Dimensionen in der Abbildung 1 projiziert. – Dadurch kommt es zu visuellen Überlappungen, wie man im Bild sehen kann. Auch erkennt man sehr schön, dass das vortrainierte Modell gemäß der Bedeutung der Worte Bedeutungscluster gebildet hat.

Wenden wir uns jetzt der Similarity zu, indem wir die Similarity von Vektoren berechnen:

Abbildung 2: Zwei übliche Definitionen von Wort Similarity

Abbildung 2 erläutert die beiden gebräuchlichen NLP Similarities. Word2vec verwendet hierbei lediglich die Cosine-Similarity. Werden ganze Sätze oder Texte auf Similarity geprüft „misst“ word2vec die Ähnlichkeit der Texte über Mittelwertbildung der beteiligten Vektoren bzw. Worte.

Die damit verbundenen Ergebnisse sind verblüffend, wie das nachfolgende einfache Beispiel zeigt:

doc1 = nlp(‚I visited England.‘)

doc2 = nlp(‚I went to London‘)

doc1.similarity(doc2)

Die Cosine-Similarity liegt für dieses Beispiel bei sα = 0,84. Die Similarity wird von word2vec auf den Bereich 0 bis 1 normiert (Anm.: Die Similarity könnte auch zwischen -1 und 1 liegen, was für unsere Betrachtung besser geeignet wäre).

Jedoch… die Euclidean-Similarity, berechnet mittels des Codes aus [14], ergibt eine sehr geringe Similarity von sr = 0,08.

D.h. Die Wordvektoren zeigen zwar in die gleiche Richtung liegen aber in völlig unterschiedlichen Raumbereichen des 300-dimensionalen Wortvektorraumes. – Beide Aussagen sind also nicht identisch, haben jedoch eine hohe Bedeutungs-Affinität.

Ein anderes Beispiel: Ich möchte die Similarity von zwei Texten aus unserem Buch Management 4.0 [15] vergleichen: Ich vergleiche eine Kurzfassung der Management 4.0 Definition mit der Langfassung der Definition:

doc1 = nlp(‚With a systemic leadership approach, Management 4.0 provides the guiding competence for viable learning organizations in complex situations and environments. Management 4.0 integrates an Agile Mindset, the universal principle of self-organization as a governance guideline, and relevant work techniques, for sustainable working models of the future.‘)

doc2 = nlp(‚We understand Agile Management as a leadership and management practice, to be able to act in an agile and proactive way in a complex environment characterized by uncertainty.  It is described as an Agile Mindset with a focus on: leadership for which self-leadership is the basis; leadership, which is based on a respect for basic human needs; leadership, which demands an understanding of complex systems and promotes their regulation through iterative procedures; people who self-organize in teams; fluid organizations, which promote adaptable and fast delivery of useful results and create innovative customer solutions through proactive dealing with changes‘)

Das Ergebnis für die Cosine-Similarity, von word2vec, ist wieder verblüffend:

doc1.similarity(doc2)

sα = 0,97

Die Euclidean-Similarity berechnet mit dem Code aus [14] ergibt sr = 0,46. Also verglichen mit der Similarity aus dem vorherigen Beispiel sehr hoch.

Auf der Basis dieser Beispiel-Daten kann ich einen Beispiel Similarity-Operator angeben: Wir nehmen der Einfachheit wegen an, dass die obigen beiden Texte aus dem Management 4.0 Buch von zwei Personen gesprochen wurden. Damit ergibt sich der Collective Mind Operator dieser beiden Personen zu:

SO(x, t) ist eine symmetrische 2*2 Matrix (ich bitte darum, kleine farbliche Unsauberkeiten in der Formeldarstellung zu übersehen, hier bei sα): Die Nicht-Diagonal Elemente sind hier keine einfachen Skalare, sondern bilden jeweils einen Vektor in einem Similarity Raum. Da wir mit überschaubarer Mathematik (d.h. einfacher Matrizenrechnung) weiterkommen wollen, wandeln wir diese Vektoren in Skalare um. Die einfachste Weise, dies zu tun, ist sr(x,t) nicht zu berücksichtigen und die resultierende Größe als Skalar anzusehen. Ich könnte auch die Länge des Similarity-Vektors in die obige Matrix einsetzen. – Der Vektorbetrag wäre dann so etwas wie eine integrierte Similarity. – Das Weglassen von sr(x,t) hat im Rahmen dieser Vereinfachungen keinen wesentlichen Einfluss auf die nachfolgenden Ausführungen.

Damit ergibt sich:

Man kann diese Matrix auch als sogenannte Heat Matrix darstellen, in dem die Similarities farblich codiert werden: Dies wurde in [16] benutzt, um die Similarity der Reden deutscher Politiker visuell darzustellen.

Wir haben bisher zwar einen Operator für den CM definiert, jedoch den CM selbst nicht ermittelt. Dies tue ich jetzt:

Für den Operator CMO(x, t) können wir sogenannte Eigenwerte und Eigenvektoren berechnen. Eigenvektoren sind diejenigen Vektoren, die unter der Anwendung des Operators lediglich ihren Betrag verändern, jedoch ihre Richtung beibehalten. Die Veränderung des Betrages bei Anwendung des Operators wird Eigenwert genannt. Den größten Eigenwert und dessen zugehörigen Eigenvektor assoziiere ich mit dem Collective Mind Vektor CMvektor dieser beiden kommunizierenden Personen (es gibt noch einen zweiten Eigenwert und Eigenvektor, der aber hier (wahrscheinlich) keinen Sinn machen):

Das Internet stellt auch für solche Berechnungen eine App zur Verfügung [17]. Der Vektor CM bekommt damit folgende mathematische Gestalt:

Der Eigenvektor liegt also auf der „Diagonalen zwischen zwei Personen“ und hat einen Eigenwert der größer als 1 und maximal 2 ist. Die Mathematik spiegelt mein Verständnis eines CM wider. Deshalb sage ich: „Gar nicht schlecht für den Anfang 😉, jedoch werden Synergieeffekte (d.h. Eigenwerte größer 2) und Effekte des gegenseitigen Blockierens (d.h. Eigenwerte kleiner 1) nicht abgebildet. Letzteres hängt auch damit zusammen, dass die word2vec Similarity per Definition nicht kleiner Null ist.

In unserem Beispiel ist der Eigenvektor und der Eigenwert statisch, da die Similarity keine explizite Zeitabhängigkeit enthält. Im Allgemeinen ist die Similarity eine  zeit- und ortsabhängige Größe. Damit werden die Berechnungen viel aufwendiger, unterscheiden sich jedoch nicht von den einfachen Ausführungen hier.

Es ist also möglich Zeitscheiben zu definieren, in denen eine AI synchron in Teammeetings die Gespräche aufnimmt, die Gespräche transkribiert und dann wie hier geschildert (und evtl. mit weiteren AI Techniken) die Similarity berechnet. Die Darstellung der Similarity als Zeitreihen und des zeitlichen Verlaufes des Vektors CM könnte als Feedback-Mechansimus eingesetzt werden, um eine Teamreflexion zu unterstützen. – Die AI übernimmt damit eine „Coaching“ Funktion. – Dieser Blog-Beitrag skizziert also die Ausgestaltung der AI-Anwendung Collective Mind im IPMA Kompetenz Bereich Teamarbeit, aus meinem Dezember 2021 Blog-Beitrag.

[1] Köhler J, Oswald A. (2009) Die Collective Mind Methode, Projekterfolg durch Soft Skills, Springer Verlag

[2] Armatowski S., Herrmann P., Müller M., Schaffitzel N., Wagner R (2021) The importance of Mindset, Culture and Atmosphere for Self-Organisation in Projects, White Paper IPMA, erstellt anläßlich der IPMA Research Conference 2020

[3] tensorflow (2022) tensorflow.org, zugegriffen am 16.04.2022

[4] google (2022) word2vec, https://code.google.com/archive/p/word2vec/, zugegriffen am 16.04.2022

[5] Wikipedia (2022) word2vec, https://en.wikipedia.org/wiki/Word2vec, zugegriffen am 16.04.2022

[6] Karani D (2022) Introduction to Word Embedding and Word2Vec, https://towardsdatascience.com/introduction-to-word-embedding-and-word2vec-652d0c2060fa, zugegriffen am 20.04.2022

[7] Megret P (2021) Gensim word2vec tutorial,  https://www.kaggle.com/pierremegret/gensim-word2vec-tutorial , zugegriffen am 20.04.2022

[8] Delaney J (2021) Visualizing Word Vectors with t-SNE, https://www.kaggle.com/jeffd23/visualizing-word-vectors-with-t-sne/notebook , zugegriffen am 20.04.2022

[9] word embedding playground (2022) http://projector.tensorflow.org/

[10] Spacy (2022) https://spacy.io/models/de, zugegriffen am 20.04.2022

[11] Altinok D (2021) Mastering spaCy, Verlag Packt, kindle edition

[12] Jupyter Notebooks (2021) https://jupyter.org/, zugegriffen am 02.12.2021

[13] Colab (2021) https://colab.research.google.com/

[14]   NewsCatcher Engineering Team (2022) https://newscatcherapi.com/blog/ultimate-guide-to-text-similarity-with-python, zugegriffen am 20.04.2022

[15] Oswald A, Müller W (2019) Management 4.0 – Handbook for Agile Practices, Verlag BoD, kindle edition

[16] Timmermann T (2022) https://blog.codecentric.de/2019/03/natural-language-processing-basics/, zugegriffen am 20.04.2022

[17]   Виктор Мухачев (2022) https://matrixcalc.org/de/, zugegriffen am 20.04.2022   

AI & M 4.0: Hybrid Collective Intelligence in Organisation und Gesellschaft

Dieser Blogbeitrag ergänzt meinen vorherigen Blogbeitrag, insbesondere die dort gelisteten Kernaussagen des Buches „The Age of AI: And Our Human Future“ des ehemaligen amerikanische Außenminister Kissinger sowie des ehemaligen google CEO Schmidt und des MIT Professor Huttenlocher [1].

Hybrid (Collective) Intelligence liegt vor, wenn unsere menschliche (kollektive) Intelligenz durch die (kollektive) Intelligenz von Artificial Intelligence ergänzt wird und sich damit eine Erweiterung der Wahrnehmung unserer Realität ergibt, so dass wir komplexe Fragestellungen beantworten können, die wir ohne AI nicht oder nur mit deutlich größerem Aufwand beantworten könnten. Diese Definition lehnt sich an diejenige in [2] an.

Hybrid (Collective) Intelligence führt insbesondere für das Projekt Management zu drei zentralen Veränderungen:

  • Der Innovationsprozess wird sich substanziell verändern, da ein oder mehrere AI Systeme den F&E Suchraum allein oder in Zusammenarbeit mit Menschen erheblich erweitern und verändern werden [3].
  • Das (Projekt) Management hat zu berücksichtigen, dass Aufgaben zwischen Mensch und AI, alleine oder zusammen, zu verteilen sind. – Entscheidungsprozesse werden sich in dieser Zusammensetzung erheblich verändern [4]. – Man siehe hierzu auch die Liste an AI/ML Erweiterungen im letzten Blog-Beitrag.
  • AI Systeme werden in nahezu alle Projektlösungen einfließen und damit wird AI zur Kernkompetenz in der Projektarbeit. Gleichzeit sind die Auswirkungen der AI Projektlösungen für die Stakeholder, die Gesellschaft und die Natur zu berücksichtigen.

Ich verwende als Definition von Intelligenz eine recht unübliche Definition, die meines Erachtens aber umso treffender ist. Diese Definition wurde wohl erstmals von Alex Wissner-Gross vorgeschlagen [5, 6]: “Intelligence is the ability to maximize future options in order to accomplish complex tasks.” – Diese Definition lässt sich u.a. in eine mathematische Gleichung übersetzen und ist universell auf alle Objekte (belebte, unbelebte, soziale) anwendbar. Im Kontext von AI bedeutet dies zum Beispiel, dass eine AI zur Natural Language Processing (NLP) nicht nur die trainierten Texte oder recht ähnliche in Frage-Antwort Situationen wiedererkennt, sondern die Flexibilität besitzt auch Fragen zu beantworten, die nicht genau den trainierten Fragen entsprechen. Neben der neuronalen Architektur des Neuronalen Netzwerkes wird dies vor allem durch die vielen Parameter-Freiheitsgrade erreicht. – Die Freiheitsgrade von State-of-The-Art AI NLP Systemen umfassen aktuell mehrere 100 Million Parameter.

Die Fähigkeit zukünftige Optionen zu maximieren, ist also die Fähigkeit Freiheit bzw. freies Handeln unter antizipierten zukünftigen Randbedingungen zu maximieren. Falls wir nicht wollen, dass die AI „ihre Freiheit“ (in Zukunft) auf Kosten unserer Freiheit maximiert, ist es notwendig, Randbedingungen für sie zu setzen. Dies bedeutet die Einführung einer Governance für Hybride (Collective) Intelligence (kurz HCI Governance), die zudem adaptiv, also in einem PDCA-Zyklus, in die Zukunft fortzuschreiben ist.
Die Einführung einer HCI Governance wird umso notwendiger, je mehr sich die AI von einer schwachen AI zu einer starken (und allgemeinen) AI oder Superintelligenz entwickelt [7, 8]. – Die genaue Verortung des aktuellen Intelligenzgrades der AI-Systeme und deren zukünftiger Entwicklung ist jedoch nicht wesentlich, denn wir wissen heute schon, dass eine HCI Governance Not tut, da neben den Segnungen der Realitätserweiterungen durch AI auch schon Freiheitseinschränkungen (u.a. Diskriminierungen, fake news, Beeinflussung von demokratischen Wahlen) durch AI aufgetreten sind.

Peeters et al. haben unlängst in ihrem sehr lesenswerten Artikel „Hybrid Collective Intelligence in a Human-AI Society“ drei verschiedene Basis-Haltungen zum Umgang mit AI identifiziert [9]:

  • Technology-centric perspective
  • Human-centric perspective
  • Collective-Intelligence perspective

Das Bemerkenswerte ihrer Analyse, die durch das niederländische Verteidigungsministerium gesponsort wurde, ist, dass sie für jede dieser Haltungen (im Artikel sprechen sie von „perspectives“) Glaubenssysteme und dazugehörige Kontexte identifiziert haben. – Also ganz im Sinne von Management 4.0.

Ich nenne hier, als Beispiel, nur jeweils einen Glaubenssatz pro Haltung:

  • Technology-centric perspective: “When sufficiently developed, AI technology can applied to solve any problem.”
  • Human-centric perspective: “Artificial intelligence only exhibits part of human cognition and is therefore insufficient for many real-world problems.”
  • Collective-intelligence perspective: “Intelligence should not be studied at the level of individual humans or AI-machines, but at the group level of humans and AI-machines working together.”

In [10] werden die EU-Haltung und die USA-Haltung miteinander verglichen: Die EU-(Administrations-)Haltung ist tendenziell eine human-centric perspective und die USA-Haltung ist tendenziell eine technology-centric perspective. – Hieraus erklären sich u.a. die diversen Bestrebungen der EU-Administration amerikanische AI-Konzerne wie google, meta/facebook, apple und amazon durch Gesetze und Strafen zu regulieren.  

Mit Hilfe dieser drei Basis-Haltungen bzw. -Perspektiven zur AI lässt sich auch die Grundhaltung in [1] beschreiben: Sie ist tendenziell eine human-centric perspective ergänzt um die technology-centric perspectice und die collective-intelligence perspective. Im Wissen um diese, aber insbesondere auch wegen der in den USA vorherrschenden technology-centric perspective, fordern die Autoren eine Regulation der AI, also die Einführung einer Governance für AI Systeme. Dies ist umso wichtiger, da auf der Basis der technology-centric perspective schon heute weltweit AI gestützte Waffensysteme entwickelt und genutzt werden.

Berühmte Vertreter der technology-centric perspective in den USA sind Peter Kurzweil [11] und die mit ihm verbundene Singularity University [12]. – Ein Kennzeichen dieser Haltung ist der Glaube, dass in absehbarer Zukunft, im Jahre 2045, die Fähigkeiten der AI diejenigen der Menschheit übersteigen werden.

In [9] wird betont, dass keine der obigen Basis-Haltungen richtiger oder besser ist, sondern dass der Kontext die Basis-Haltung bestimmen sollte. – Was leider nur selten geschieht. – In [13] wird die zentrale Bedeutung der Reflexion und der kritischen Auseinandersetzung mit dem sozialen Kontext, also den aktiven Werten, Glaubensätzen und Prinzipien für das Design, die Implementierung und die Operationalisierung von AI Systemen diskutiert. Falls die Metakompetenz für diese (Selbst-) Reflexion und kritische Auseinandersetzung nicht vorhanden ist, wird eine AI Ethik nicht angenommen und damit auch nicht verantwortungsvoll umgesetzt. In [14] habe ich die “Forderung” aufgestellt, dass Projekte mit hoher Komplexität, eine türkis/teal Kultur benötigen: “Ideally, this requires a mindset of all key stakeholders that also contains red, blue and orange value meme components (red means power orientation, blue means control and order orientation, and orange means entrepreneurship and linear-scientific-thinking orientation), but is mainly shaped by the transformational value meme components, namely green (compassion), yellow (nonlinear networked system thinking) and teal (holistic-transcendental orientation).” Alle Teammitglieder und insbesondere der Projektleiter sollten über die Metakompetenz verfügen, ihre eigenen Werte und Glaubenssätze im jeweiligen Kontext kritisch zu hinterfragen, um bewusst AI Systeme ethisch verantwortungsvoll zu designen, zu implementieren und zu operationalisieren.  

Meine persönlich präferierte Basis-Haltung ist die collective-intelligence perspective. Wenn ich AI Systeme erstelle liegt meine Haltung hingegen eher auf der technology-centric perspective und im Schreiben dieses Blog-Beitrages eher auf der human-centric perspective.    

Schaut man sich die Definitionen für AI der großen AI-Konzerne an, so lassen diese eine recht eindeutige AI-Haltung der jeweiligen Autoren erkennen:

IBM: “Artificial intelligence leverages computers and machines to mimic the problem-solving and decision-making capabilities of the human mind.” [15]: technology-centric perspective

Microsoft (deutsch): „Unter künstlicher Intelligenz (AI) verstehen wir Technologien, die menschliche Fähigkeiten im Sehen, Hören, Analysieren, Entscheiden und Handeln ergänzen und stärken.“ [16]: collective-intelligence perspective

Microsoft (amerikanisch): “Artificial intelligence (AI) is the capability of a computer to imitate intelligent human behavior. Through AI, machines can analyze images, comprehend speech, interact in natural ways, and make predictions using data.” [17]: technology-centric perspective. – Die Microsoft AI Internetseite [18] „AI for Good“ zeigt hingegen eine eher human-centric oder collective-intelligence perspective.

Google CEO: “At its heart, AI is computer programming that learns and adapts. It can’t solve every problem, but its potential to improve our lives is profound. At Google, we use AI to make products more useful—from email that’s spam-free and easier to compose, to a digital assistant you can speak to naturally, to photos that pop the fun stuff out for you to enjoy.” [19]: collective-intelligence perspective

Die Internetseite von google [20] und diejenige von meta/facebook [21] lassen eine Mischung aus technology-centric- und collective-intelligence-perspective erkennen.

Die OECD hat im Jahre 2019 ihr Dokument „Artificial Intelligence in Society“ vorgelegt, und definiert dort ihre human-centric perspective, die sie auch so nennt [22]: Hiernach müssen AI Systeme u.a. Menschenwürde und -rechte sowie die Demokratie gewährleisten, indem sie u.a. transparent, nachvollziehbar, vertrauenswürdig, sicher und steuerbar sind und bleiben. – Eine gestaltende Auseinandersetzung mit dem sozio-technischen System Mensch-Künstliche Intelligenz, im Sinne des Designs einer Governance, findet jedoch nicht statt.

Eine ähnliche Aussage ergibt sich für Deutschland: In [23] werden unter dem Titel „The making of AI Society: AI futures frames in German political and media discourses” die sogenannten „AI future frames“ für Deutschland untersucht. – AI future frames sind mentale Rahmen, in denen die AI Zukunft gesetzt wird. Das Ergebnis ist eher ernüchternd: „By mirroring the past in the future, alternative future visions are excluded, and past and current assumptions, beliefs, and biases are maintained. Despite the allegedly disruptive potential of emerging AI.” Hiernach denkt die deutsche Politik die neoliberale Politik der letzten Jahrzehnte unter dem Label „AI Made in Germany“ oder AI German einfach fort: „successful innovation = welfare generating future = political stability“. Die Lippenbekenntnisse der deutschen politischen Administration bis zur Wahl 2021 sind human-centric; im Tun überlassen sie die AI Governance dem Markt und eine AI Ethik explizit den deutschen Industrieunternehmen. – Eine entsprechende politische Governance, die den zentralen Aussagen in [1] Rechnung trägt, gibt es nicht. – Eine Einbettung in eine europäische AI Strategie fehlt völlig!

Die EU Kommission hat letztes Jahr in [24] einen Vorschlag für ein Regulationspapier erstellt, das in erster Linie als harmonisierende Referenz für die EU Administration dienen soll: Ein seitenstarkes Papier mit vielen Details; ich vermisse mal wieder ein Großes Bild, das zu einem Collective Mind in der EU (Administration) führen könnte. 

Wie könnten die Eckpfeiler eines Großen Bildes einer AI bzw. HCI Governance aussehen? Hier ein Vorschlag:

Rahmenparameter:

Landesspezifische AI Governance Systeme sind in eine europäische AI Governance eingebettet. – Die Strukturen der AI Governance sind auf allen europäischen Ebenen ähnlich. – Die (europäische) AI Governance folgt in ihrer Struktur einer Ziel-Hierachie: Vom Großen Bild zum Detail. Der transformative Charakter der AI Governance ist in die Governance einer ökologisch-ökonomischen Transformation (u.a. Nachhaltigkeit für Natur, Tier und Mensch, hin zu einer an sozialer Gerechtigkeit und Gleichheit orientierten Ökonomie, die Wachstum nicht als Allheilmittel verkauft) eingebettet

Kontrollparameter:

Die Kontrollparameter orientieren sich an den zentralen Aussagen aus [1]: Eine europäische AI Ethik und Gesetzgebung sorgt für eine Regulation der AI Freiheiten. Die AI Ethik und Gesetzgebung wird von der Politik gestaltet. Z.B. heißt dies, dass der Wert AI Transparenz politisch definiert wird und gesetzlich verankert wird.- Dies könnte zum Beispiel heißen, dass AI Systeme in Europa vor staatlichen Organen nach Bedarf offengelegt werden müssen.

Da AI Systeme unsere Welt transformieren, ist es notwendig dafür zu sorgen, dass die Schere zwischen AI-Wissenden und AI-Nichtwissenden nicht zu einer Verschärfung von Ungleichheit führt. Ein entsprechendes Bildungskonzept ist notwendig: AI gehört als Pflichtfach in die Schulen und AI gehört in die Curricula aller universitären Disziplinen.

Ordnungsparameter:             

Als Großes Bild für den Ordnungsparameter schlage ich vor „European Ecosystem for Hybrid Collective Intelligence“. Die Ausgestaltung dieses Großen Bildes heißt u.a. dass neben einer gemeinsamen europäischen AI Governance eine gemeinsame AI Infrastruktur aufgebaut wird. – Es werden Mechanismen bereitgestellt, die das Silo-Denken und -Handeln von Industrie und politischen Administrationen auflösen. U.a. wird eine „AI für Jedermann“ aufgebaut und die die obigen drei Sichten human-centric, technology-centric und collective intelligence integriert: Die sozio-technische HCI Integration wird also bewusst europäisch gestaltet.  

 

[1] Kissinger H A, Schmidt E, Huttenlocher D (2021) The Age of AI: And Our Human Future, kindle edition
[2] Dominik Dellermann, Adrian Calma, Nikolaus Lipusch, Thorsten Weber, Sascha Weigel, Philipp Ebel (2021) The future of human-AI collaboration: a taxonomy of design knowledge for hybrid intelligence systems, arXiv.org > cs > arXiv:2105.03354
[3] Dragos‑Cristian Vasilescu, Michael Filzmoser (2021) Machine invention systems: a (r)evolution of the invention process?, Journal AI & Society, January 2021
[4] Phanish Puranam (2021) Human–AI collaborative decision‑making as an organization design Problem, Journal of Organization Design (2021) 10:75–80
[5] Alex Wissner-Gross (2022) A new equation for intelligence, https://www.youtube.com/watch?v=auT-pA5_O_A, march 2020, zugegriffen am 07.02.2022
[6] Ron Schmelzer (2022) https://www.forbes.com/sites/cognitiveworld/2020/02/27/cant-define-ai-try-defining-intelligence/?sh=6f658a955279, Forbes Blog February 2020, zugegriffen am 07.02.2022
[7] Bernard Marr (2022) The Key Definitions Of Artificial Intelligence (AI) That Explain Its Importance, Forbes Blog February 2018, https://www.forbes.com/sites/bernardmarr/2018/02/14/the-key-definitions-of-artificial-intelligence-ai-that-explain-its-importance/?sh=219cbb1f4f5d , zugegriffen am 07.01.2022
[8] Wikipedia (2022) Artificial Intelligence, https://en.wikipedia.org/wiki/Artificial_intelligence, zugegriffen am 07.02.2022
[9] Peeters M M M, van Diggelen J, van den Bosch K, Bronhorst A, Neerinex M A, Schraagen J M, Raaijmakers S (2021) Hybrid Collective Intelligence in a Human-AI Society, in AI & Society Journal, March 2021
[10] Roberts H, Cowls J, Hine E, Mazzi E, Tsamados A, Taddeo M, Floridi L (2021) Achieving a ‘Good AI Society’: Coparing the Aims and Progress of the EU and the US, SSRN Journal, January 2021
[11] Kurzweil R (2022) https://www.kurzweilai.net/, zugegriffen am 07.02.2022
[12] Singularity University (2022) https://www.su.org/ , zugegriffen am 07.02.2022
[13] Krijger J (2021) Enter the metrics: critical theory and organizational operationalization of AI ethics, Journal AI & Society, September 2021
[14] Oswald A (2022) The Whole – More than the Sum of Its Parts! Self-Organization – The Universal Principle! in Ding R, Wagner R, Bodea CN (editors) Research on Project, Programme and Portfolio Management – Projects as an Arena for Self-Organizing, Lecture Notes in Management and Industrial Engineering, Springer Nature
[15] IBM (2022) Artificial Intelligence, https://www.ibm.com/cloud/learn/what-is-artificial-intelligence, zugegriffen am 07.02.2022
[16] Microsoft (2022) Künstliche Intelligenz, https://news.microsoft.com/de-at/microsoft-erklart-was-ist-kunstliche-intelligenz-definition-funktionen-von-ki/, zugegriffen am 07.02.2022
[17] Microsoft (2022) Artificial Intelligence Architecture, https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/ai-overview, zugegriffen am 07.02.2022
[18] Microsoft (2022) AI for Good, https://www.microsoft.com/en-us/ai/ai-for-good, zugegriffen am 07.02.2022
[19] Sundar Pichai (2022) AI at Google: our principles, https://www.blog.google/technology/ai/ai-principles/, Blog of CEO google, june 2018, zugegriffen am 07.02.2022
[20] Google (2022) Google AI: Advancing AI for everyone, https://ai.google/, zugegriffen am 07.02.2022
[21] Meta AI (Facebook) (2022) Bringing the world closer together by advancing AI, https://ai.facebook.com/, zugegriffen am 07.02.2022
[22] OECD (2019) Artificial Intelligence in Society, Online Version, https://www.oecd-ilibrary.org/sites/eedfee77-en/index.html?itemId=/content/publication/eedfee77-en&_csp_=5c39a73676a331d76fa56f36ff0d4aca&itemIGO=oecd&itemContentType=book
[23] Köstler L, Ossewaarde R (2020) The making of AI Society: AI futures frames in German political and media discourses, in AI & Society Journal, February 2021, Springer Nature
[24] Europäische Kommission (2021) Proposal for a REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL LAYING DOWN HARMONISED RULES ON ARTIFICIAL INTELLIGENCE (ARTIFICIAL INTELLIGENCE ACT) AND AMENDING CERTAIN UNION LEGISLATIVE ACTS, https://eur-lex.europa.eu/legal-content/EN/ALL/?uri=CELEX:52021PC0206, zugegriffen am 07.02.2022