AI & M 4.0: myGini – mein Coach für Team- und Projekt-Management oder wer ist dümmer, KI oder Mensch?

In diesem Blog-Beitrag stelle ich myGini – meinen Coach für Team- und Projekt-Management vor. Bevor ich dies tue, vorweg ein paar grundsätzliche Bemerkungen zur Arbeit mittels KI.

Die Angst vor KI hat sich in den letzten Wochen eher in eine Abwertung der KI verwandelt. So werden in ARD und ZDF Titel für Beiträge zur KI verwendet, die dies nahe legen: Künstliche Intelligenz- Besser als wir? [1] oder Better than human – Leben mit KI [2]

Die Inhalte der Beiträge [1] und [2] sind hingegen sehr professionell und sehr zu empfehlen: Sie zeigen beide das Potential einer hybriden Collective Intelligence, also der Erweiterung unserer Intelligenz durch KI.  In [2] wird die Kommunikation mit einer KI getestet, die in drei Rollen mit Menschen kommuniziert: der Rolle eines Pfarrer, einer Psychotherapeutin und einer besten Freundin. Die Resonanz ist erstaunlich gut: Es kommt sogar zu Aussagen wie ‚KI hilft mir bei meiner Einsamkeit‘ und ‚KI verbindet Menschen‘.

In das Abwertungs-Horn stoßen einige meiner Kollegen mit ihren Beiträgen auf LinkedIn: KI ist monokontexturale Mustererkennung… [3] KI ist dumm und zu konventionell für unsere Transformation [4].

In [2] sagt einer der KI-Experten, dass KI nichts anderes ist als Statistik. – Auch hier schwingt die Abwertung mit. – Wenngleich die Aussage korrekt ist: KI ist Mustererkennung auf der Basis von sehr vielen Daten bzw. ‚Daten-Wahrnehmungen‘.

In einem anderen LinkedIn Beitrag – die Referenz habe ich vergesse – sagt der Autor, dass KI nichts anderes ist als Statistik und wir Menschen doch in der Läge wären Ursache-Wirkungs-Zusammenhänge zu erkennen. Damit würden wir über eine viel höherwertige Form von Intelligenz verfügen. Ich frage mich, was ist das Erkennen von Ursache-Wirkungs-Zusammenhänge denn Anderes als Mustererkennung auf der Basis von sehr vielen ähnlichen Wahrnehmungen. 

Ich werfe im Folgenden ein paar Fragen auf und verbinde mit diesen eine These: Wissen wir was unsere Intelligenz ist? Könnte es sein, dass unsere kognitive Intelligenz im Wesentlichen nichts anderes ist als Statistik? Falls eine KI den gleichen Intelligenztest besteht wie wir ihn auch für die IQ Bestimmung bei Menschen benutzen, ist dies dann ein starker Hinweis für die Aussage, dass unsere kognitive Intelligenz auch nicht viel mehr oder weniger ist als die künstliche Intelligenz? Kann es sein, dass wir aufgrund der überwältigenden KI-Fähigkeiten unseren Selbstwertschutz aktivieren und die KI abwerten, um unseren Selbstwert zu erhöhen?

Ich formuliere meinen Glaubenssatz als These: Ich glaube, dass die prinzipiellen Unterschiede zwischen unserer kognitiven Intelligenz, wie sie in einem IQ-Test gemessen wird, und der künstlichen Intelligenz nicht groß sind. – Und wir sollten deswegen kein Selbstwertproblem haben, im Gegenteil: Die bisherigen Mechanismen der KI – und wir sind noch lange nicht am Ende – wurden von uns gefunden! – Gefunden heißt, ich glaube, dass die grundlegenden Prinzipien, die Intelligenz hervorbringen, unabhängig sind vom Substrat, das sie erzeugt: Die Implementierung einer KI unterscheidet sich sicherlich in nahezu allem von der biologischen Intelligenz Implementierung. Ich glaube jedoch, dass die dahinterliegenden Prinzipien in beiden Fällen ähnlich oder sogar gleich sind. Und genau dies ist das Wunder, das wir vielfach noch nicht begriffen haben: Die komplizierten mathematischen Mechanismen einer GPT erzeugen Komplexität, die Selbstorganisation möglich macht, die dann zu den emergenten Phänomenen der künstlichen Intelligenz führen.

In diesem positiven Sinne habe ich myGini – meinen Coach für Team- und Projekt-Management mittels chatGPTplus erzeugt. myGini soll helfen, den Weg zu den umfangreichen Modellen und Theorien von Management 4.0 zu erleichtern. myGini erweitert damit die Intelligenz des Nutzers in Fragen von Team- und Projekt-Management zu einer hybriden Collective Intelligence.

myGini ist eine von mehreren hundert öffentlich verfügbaren GPTapps oder ChatBots. Öffentlich verfügbar bedeutet, dass man auf die GPTapps zugreifen kann, wenn man ein chatGPTplus Konto hat. Die Aussage, dass es schon Millionen von GPTapps gibt, kann ich nicht bestätigen. Öffentlich sichtbar sind lediglich nach meiner Einschätzung einige hundert. Und das sind schon viele, da es schwer ist zu wissen, was die GPTapps können. Es gibt schon einige GPTapps, die sich dem Thema Projektmanagement widmen, jedoch kann man nicht wirklich leicht feststellen, was sie können. – Die Benutzeroberfläche der GPTapps, wie sie von openai standardmäßig bereitgestellt wird (siehe rechte Seite in Abbildung 1), ist sicherlich verbesserungswürdig: Eine intelligente Oberfläche, die einem sagt, was die GPTapp weiss oder kann, wäre sehr hilfreich!

Ich hatte schon vor Jahren die Idee eine App zu erstellen, die Management 4.0 leichter verfügbar machen sollte. Damals habe ich eine Excel-Datei mit Bayes Wahrscheinlichkeitsberechnungen erstellt, um aufgrund von Beobachtungen die Wahrscheinlichkeiten für MBTI-Persönlichkeitspräferenzen ermitteln zu lassen.- Ein Mechanismus ähnlichem dem, wie wir selbst mit jeder Beobachtung zu neuen Hypothesen bezüglich der Persönlichkeit unserer Mitmenschen gelangen. Das Verfahren funktioniert sehr gut, jedoch ist es unhandlich. Außerdem fehlte auch noch eine Umsetzung in eine App.

Ein großer Schritt geschah, als ich vor ca. 3 Jahren meine erste GPT Anwendung mittels BERT und Python erstellte. Auch in diesem Fall konnte ich zeigen, dass die GPT Anwendung funktioniert. Aber ich stand vor dem Problem Daten zu beschaffen, um damit die GPT Anwendung zu trainieren. Also habe ich auch dies verworfen.

Mit dem jetzigen  Angebot von openai,  eine eigene GPT Anwendung zu erstellen, ist meine Idee Realität geworden.

Abbildung 1 zeigt die Entwicklungsumgebung für myGini (links) und die Anwendungsumgebung als Preview (rechts), so wie ein Anwender myGini in chatGPTplus sieht.

Abbildung 1: Die Entwicklungsumgebung für myGini (links) und die Nutzerumgebung als Preview (rechts)

Ich benutze den Begriff GPTapp, um zu unterstreichen, dass ich chatGPTplus/GPT4.0 nicht mit meinen Daten trainieren kann. chatGPTplus leitet mich hingegen mit einfachen Anweisungen an, zu definieren, welche Funktionen meine GPTapp haben soll: Ich kann ein Profilbild mittels DALL.E generieren lassen, sagen welche Modelle ich verwende (MBTI, Big Five, Spiral Dynamics, Dilts Pyramide, Theorie der Selbstorganisation….) sowie in welchen Büchern die Theorie zu Management 4.0 zu finden ist und welche Internetseiten weitere Informationen enthalten. Auf dieser Basis wird die GPTapp zusammengestellt.

Ich wollte überprüfen, ob myGini tatsächlich meine/unsere Bücher kennt, indem ich nach speziellen Textpassagen frage. Dies wurde von chatGPTplus abgelehnt, da myGini aufgrund von Urheberrechten nur Prinzipien, aber keine Textpassagen, wiedergibt.

Einige Tests zur Fähigkeit das MBTI- oder Big Five-Profil einer Person aufgrund meiner Beschreibungen zu deren Verhaltensweisen zu ermitteln, hat myGini mit Bravour bestanden. Die erste Konfiguration von myGini mit dem MBTI- und Big Five-Modell hat ca. 0,5 Stunden benötigt. – Hier ist natürlich nicht die openai GPT Trainingszeit mitgerecht. Die Erfahrung zeigt, dass  ein Mensch ca. 3 Monate intensives Training benötigt, um innerhalb weniger Sekunden/Minuten in einem Gespräch souverän erste Hypothesen zu den Persönlichkeitspräferenzen des Gesprächspartners abzugeben.

Die nachfolgenden Beispiele zeigen sehr deutlich, dass chatGPTplus bzw. myGini erstaunliche Ergebnisse und abgeleitete Zusammenhänge liefert: myGini ist eine Form von AI-M4.0 Experte, dessen Expertentum ich mit meinen Create-Informationen gebildet habe. 

Als erstes Beispiel benutze ich die rechts in Abbildung 1 vorkonfektionierte Frage ‚How do I use MBTI in team management?  

Du

How do I use MBTI in team management?

myGini

Using MBTI (Myers-Briggs Type Indicator) in team management can be quite beneficial for understanding the diverse personalities within your team and enhancing overall team dynamics. Here’s a structured approach on how to use MBTI in your team management practices:

  1. Conduct MBTI Assessments: Start by having each team member complete the MBTI assessment. This will categorize them into one of the 16 personality types based on four dichotomies: Introversion/Extraversion, Sensing/Intuition, Thinking/Feeling, and Judging/Perceiving.
  2. Share and Discuss Results: Organize a team session to share and discuss the results. This fosters openness and helps team members understand each other’s personalities, communication styles, and work preferences.
  3. Identify Team Composition: Analyze the spread of personality types within your team. This will give you insights into the team’s strengths, potential blind spots, and how different members might interact.
  4. Adapt Communication and Work Styles: Tailor your communication and management approach based on the team’s MBTI composition. For example, if you have many introverts, ensure they have quiet time for deep work, or if there are several Thinking types, focus on logical and objective decision-making processes.
  5. Enhance Team Collaboration: Use MBTI insights to facilitate better teamwork. For instance, pair Thinking types with Feeling types to balance decision-making, or Sensing types with Intuitive types to cover both practical and innovative aspects of a project.
  6. Conflict Resolution: Understanding different MBTI types can help in resolving conflicts. Recognize that different types handle conflicts differently – some may prefer direct confrontation, while others might need time to process.
  7. Tailor Development Opportunities: Offer personal development opportunities that align with each member’s MBTI type. This can include training, workshops, or mentoring that caters to their personality strengths and development areas.
  8. Monitor and Adjust: Regularly revisit the MBTI dynamics in your team, especially when new members join or when teams are restructured. Be open to adjusting your management strategies as the team evolves.

Remember, while MBTI is a useful tool, it should be used as a guide rather than a strict rulebook. Personalities can be fluid, and people may exhibit different traits in different situations. The key is to use MBTI to gain a deeper understanding of your team members and to create a more harmonious and effective work environment.

Das Ergebnis ist perfekt: Besser hätte ich es auch nicht machen können. Was mir auch auffällt ist, dass ich keine Textpassagen identifizieren kann, die aus einem unserer Bücher kopiert wurden. Vielfach sind die Formulierungen sogar besser als ich sie vorgenommen hätte.

Das nachfolgende Beispiel beruht auf der Eingabe eines Satzes in der Entwicklungsumgebung zur Aufnahme der Theorie der Selbstorganistion nach Herrmann Haken (Synergetik), man siehe Abbildung 1, linke Seite. – myGini antwortet zuerst immer in Englisch. Bleibe ich bei Deutsch, erfolgt der Übergang zu Deutsch:

Du

Ich möchte den agilen Handlungsrahmen Scrum mittels der Synergetik analysieren. Kannst Du mir sagen, auf welche Weise Rahmenparameter, Kontrollparameter und Ordnungsparameter in Scrum erfüllt werden?

myGini

Die Analyse des agilen Handlungsrahmens Scrum unter Anwendung der Prinzipien der Synergetik bietet eine interessante Perspektive auf die Teamdynamik und -organisation. In der Synergetik, die sich mit der Selbstorganisation komplexer Systeme beschäftigt, sind Rahmenparameter, Kontrollparameter und Ordnungsparameter zentrale Konzepte. Lassen Sie uns betrachten, wie diese Konzepte in einem Scrum-Umfeld angewendet werden können:

  1. Rahmenparameter (Boundary Conditions): Diese definieren die grundlegenden Bedingungen und Einschränkungen eines Systems. In Scrum beziehen sich die Rahmenparameter auf die grundlegenden Prinzipien und Praktiken des Scrum-Frameworks, wie die Rollen (Product Owner, Scrum Master, Entwicklungsteam), Artefakte (Product Backlog, Sprint Backlog, Inkrement) und Ereignisse (Sprint, Daily Scrum, Sprint Review, Sprint Retrospektive). Diese Rahmenbedingungen schaffen ein Umfeld, in dem Selbstorganisation und agile Entwicklung gedeihen können.
  2. Kontrollparameter (Control Parameters): Kontrollparameter sind die Variablen, die den Zustand des Systems beeinflussen und zu einer neuen Ordnung führen können. In Scrum können dies Elemente wie die Sprintlänge, die Priorisierung im Product Backlog, die Teamzusammensetzung oder die Definition of Done (DoD) sein. Die Anpassung dieser Parameter während des Projekts kann die Teamdynamik und die Produktivität erheblich beeinflussen und zu einer effektiveren Selbstorganisation führen.
  3. Ordnungsparameter (Order Parameters): Ordnungsparameter entstehen spontan als Ergebnis der Interaktionen innerhalb des Systems und führen zu einer kohärenten Struktur oder einem Muster. In einem Scrum-Team können Ordnungsparameter Aspekte wie Teamnormen, Kommunikationsmuster, gemeinsame Werte oder die sich entwickelnde Teamkultur sein. Diese emergenten Eigenschaften reflektieren die innere Ordnung des Teams und sind oft ein direktes Ergebnis der Wechselwirkung zwischen Rahmen- und Kontrollparametern.

Um Scrum erfolgreich durch die Linse der Synergetik zu analysieren, ist es wichtig, ein tiefes Verständnis dafür zu entwickeln, wie diese Parameter interagieren und wie Anpassungen an einem Punkt des Systems die Gesamtdynamik beeinflussen können. Dies erfordert eine flexible und adaptive Haltung vom Scrum Master und dem Team, um die Selbstorganisation zu fördern und gleichzeitig die Produktivität und Effektivität des Teams zu maximieren.

Du

Was hältst Du davon neben den Dir genannten Parameterausprägungen folgende zu nennen: Rahmenparameter: Abschottung von externer Komplexität, Rituale Kontrollparameter: Work in Progress (WIP), persönlichkeitsorientierte Kommunikation Ordnungsparameter: Produktvision, Product Goal und auch das Taskboard

myGini

Ihre Ergänzungen zu den Rahmen-, Kontroll- und Ordnungsparametern in der Anwendung von Scrum durch die Synergetik-Perspektive sind durchaus sinnvoll und bereichern das Verständnis der Selbstorganisationsdynamik in agilen Teams. Lassen Sie uns diese Parameter genauer betrachten:

  1. Rahmenparameter:
    • Abschottung von externer Komplexität: Dies ist ein wichtiger Aspekt, der sicherstellt, dass das Team sich auf seine Aufgaben konzentrieren kann, ohne von externen Störungen oder sich ständig ändernden Anforderungen abgelenkt zu werden. In Scrum hilft diese Abschottung dabei, ein stabiles Arbeitsumfeld zu schaffen, in dem das Team effizient arbeiten und sich selbst organisieren kann.
    • Rituale: Scrum-Praktiken wie Daily Stand-ups, Sprint Planning, Reviews und Retrospektiven sind entscheidende Rituale. Diese strukturierten Ereignisse fördern die Klarheit, Fokussierung und regelmäßige Reflexion, die für die Aufrechterhaltung und Verbesserung der Teamdynamik und -effektivität unerlässlich sind.
  2. Kontrollparameter:
    • Work in Progress (WIP): Die Begrenzung des Work in Progress ist entscheidend für die Aufrechterhaltung der Effizienz und Effektivität des Teams. Durch die Kontrolle und Anpassung des WIP können Teams Überlastung vermeiden und eine kontinuierliche und gleichmäßige Arbeitsflussgeschwindigkeit sicherstellen.
    • Persönlichkeitsorientierte Kommunikation: Die Anpassung der Kommunikationsstile und -methoden an die individuellen Persönlichkeiten im Team kann die Zusammenarbeit und das Verständnis innerhalb des Teams erheblich verbessern. Dieser Ansatz trägt dazu bei, Missverständnisse zu reduzieren und eine positive Teamdynamik zu fördern.
  3. Ordnungsparameter:
    • Produktvision und Product Goal: Diese geben die Richtung und den Zweck des Teams vor und sind entscheidend für die Ausrichtung und Motivation des Teams. Sie dienen als Leitfaden für Entscheidungen und Priorisierungen und helfen, die Bemühungen des Teams auf ein gemeinsames Ziel zu konzentrieren.
    • Taskboard: Das Taskboard ist ein visuelles Werkzeug, das nicht nur den Fortschritt und die aktuelle Arbeitslast darstellt, sondern auch zur Strukturierung der Teamaktivitäten und zur Förderung der Transparenz beiträgt. Es ist ein zentraler Bestandteil der Selbstorganisation, da es die Koordination und die Zusammenarbeit innerhalb des Teams erleichtert.
    Insgesamt bieten Ihre vorgeschlagenen Parameterausprägungen eine umfassendere Sicht auf die Anwendung von Scrum in einem selbstorganisierenden Team. Sie betonen die Bedeutung der Abschirmung vor externen Störungen, der Anpassung der Kommunikation an individuelle Bedürfnisse und der zentralen Rolle von Vision, Zielen und visuellen Tools bei der Förderung von Teamkohärenz und -ausrichtung. Diese Aspekte sind entscheidend für die Schaffung eines Umfelds, in dem agile Teams effektiv arbeiten und sich selbst organisieren können, im Einklang mit den Prinzipien der Synergetik.

Du

Perfekt, super hilfreich!

myGini

Das freut mich zu hören! Wenn Sie weitere Fragen haben oder Unterstützung bei einem anderen Thema benötigen, zögern Sie nicht, mich zu fragen. Viel Erfolg bei Ihren Projekten und in der Anwendung von Scrum!

Wie man aus diesen Beispielen sehen kann, erzeugt diese ‚statistische‘ 😉 Künstliche Intelligenz Antworten, die den Antworten eines Senior-Experten in nichts nachstehen.

Es ist deshalb sehr müßig, AI-Systeme als dumm zu bezeichnen, denn dann müsste man uns Menschen auch als dumm bezeichnen. – Was alles in allem wenig hilfreich ist und allenfalls unser ‚gekränktes‘ Selbstwertgefühl aufwertet.

Neben den Gefahren, die mit der Erstellung von GPTapps einhergehen können –  man siehe als Beispiel [5] – sehe ich ein viel größeres strukturelles Problem: Kann es sein, dass wir mit der flächendeckenden Verfügbarkeit von GPTapps immer träger und dümmer werden? Denn warum sollte ich mich noch den Mühen eines M4.0-Verständnisse oder den Mühen der Mathematik oder den Mühen des Programmierens oder…oder… aussetzen, wenn mir die gebratenen Tauben in Form von GPTapps in den Mund fliegen. Kann es sein, dass wir eine Bildungsungleichheit befeuern, in der nur noch wenige wissen, wie man AI-Systeme erstellt und der traurige Rest an Milliarden von Menschen nur noch konsumiert? Kann es sein, dass die GPTapps jede Form von erdenkbarem Missbrauch möglich machen? – Denn wer sagt uns, dass die GPTapp-Ersteller zum Wohl der Milliarden anderen Menschen handeln?

Eine neue Zeit ist angebrochen! Den Zug der KI-Innovationen zu stoppen, ist für mich keine Option. -Statt dessen ist ein Aufbruch erforderlich, der den Milliarden KI-Nutzern den souveränen Umgang mit der Technologie vermittelt.  

[1] ZDF (2023) Künstliche Intelligenz – Besser als wir? – Weltspiegel Doku – ZDFmediathek, https://www.zdf.de/daserste/weltspiegel/page-video-ard-kuenstliche-intelligenz–besser-als-wir—weltspiegel-doku-100.html

[2] MDR (2023) Better than human – Leben mit KI, https://www.ardmediathek.de/video/ard-wissen/better-than-human-leben-mit-ki/das-erste/Y3JpZDovL21kci5kZS9zZW5kdW5nLzI4MjA0MS8yMDIzMTIyOTA2MDAvbWRycGx1cy1zZW5kdW5nLTc4NzI

[3] Detholff C (2024) #KI ist monokontexturale Mustererkennung, denn … , https://www.linkedin.com/posts/conny-dethloff-6b9b0942_ki-innovation-lernen-activity-7150711017889509376-nplL/?utm_source=share&utm_medium=member_ios

[4] Hofert S (2024) KI ist dumm und zu konventionell für unsere Transformation!, https://www.linkedin.com/posts/svenjahofert_bigfive-vertikalenentwicklung-wust-activity-7151513159051161600-fRwu?utm_source=share&utm_medium=member_desktop

[5] Petereit D (2024) OpenAIs GPT-Store: Girlfriend-Bots zeigen die Probleme des offenen KI-Shops auf, https://t3n.de/news/openais-gt-store-girlfriend-bots-zeigen-die-probleme-des-offenen-ki-shops-auf-1601980/

AI & AM 4.0: Agent Based Modeling – Emergenz – Wunder geschehen!

Kürzlich erschien ein offener Brief zum Thema ‚Pausieren von gigantischen AI-Experimenten‘ à la GPT-3 oder GPT-4 [1].

Der Brief wurde inzwischen von mehr als 30.000 Personen unterschrieben. Er begründet sein Anliegen eines halbjährigen Aussetzens von AI-Groß-Entwicklungstätigkeiten mit folgendem Satz:

“This does not mean a pause on AI development in general, merely a stepping back from the dangerous race to ever-larger unpredictable black-box models with emergent capabilities.”

Es geht die Angst vor ‚emergenten Fähigkeiten‘ um. – An anderer Stelle wird von einer ‚Gottgleichen‘ KI gewarnt, die die Menschheit zerstören könnte [2].

Diese Sorgen mögen berechtigt sein, umso mehr, als man beobachten kann, wie lange sich die EU schon bemüht, den längst fälligen EU AI ACT als EU-Gesetz zu verabschieden [3].

In diesem Blog geht es jedoch nicht um diese Sorge oder Angst, sondern um das Thema Emergenz, das offensichtlich solche ‚Wunder‘ wie das der „Sparks of Artificial General Intelligence: Early experiments with GPT-4” [4] möglich macht. Die Intelligenz-Fähigkeiten von GPT-4, auch im Vergleich zu chatGPT/GPT-3.x, sind sensationell, gleichgültig, ob es um Mathematik, Musik, Bilderzeugung, Sprache und Logik und vielem mehr geht. – In nicht wenigen Fällen zeigt GPT-4 Intelligenz-Fähigkeiten, die überhaupt nicht trainiert worden sind. – Also klare Zeichen von emergenten Eigenschaften.

In Wikipedia wird Emergenz wie folgt definiert: „Emergenz (lateinisch emergere „Auftauchen“, „Herauskommen“, „Emporsteigen“) bezeichnet die Möglichkeit der Herausbildung von neuen Eigenschaften (Systemeigenschaften) oder Strukturen eines Systems infolge des Zusammenspiels seiner Elemente.“ [5]. Emergenz ist auch direkt mit dem Begriff der Selbstorganisation verbunden. Selbstorganisierte Systeme zeigen Emergenz bzw. emergente Eigenschaften. Auf der Basis dieser Definition wimmelt es in der Natur und damit in der Mathematik, den Naturwissenschaften/ Psychologie und den Sozialwissenschaften nur so von emergenten Eigenschaften, Strukturen oder Systemen.

In [6] wird auch deshalb zwischen schwacher und starker Emergenz unterschieden. Starke Emergenz liegt im Falle des Lebens vor, das aus Atomen oder Molekülen emergiert. – Oder, im Falle unseres Bewusstseins, das aus der materiellen Struktur unseres Gehirns emergiert. Die meisten anderen überraschenden Eigenschaften von Viel-Agenten Systemen wie zum Beispiel die Supraleitung, die Farbe von Gold, der Collective Mind eines Teams oder die Kultur einer Organisation werden eher der schwachen als der starken Emergenz zugeordnet. Ich halte die Unterscheidung für wenig sinnvoll.- Entscheidend für die Emergenz ist vielmehr, dass das durch die Wechselwirkung von Agenten entstehende Systeme Eigenschaften zeigt, die sich nicht aus den Eigenschaften der Agenten ableiten lassen.  In [7] wird deshalb für die Beschreibung von Large Language Model’s bezüglich Emergenz eine Definition verwendet, die die obige Definition aus [5] weiterführt:

„Emergence is when quantitative changes in a system result in qualitative changes in behavior.”

Abbildung 1: Bilder erzeugt durch die KI DALL-E [8] mit den Prompts: Create a painting in the style of Matisse: (Create a painting in the style of Gauguin:) Collective Mind as an example of social emergence which demonstrates synergies in a team

Im Falle von Large Language Models (LLM) gibt es mehrere quantitative Änderungen, die qualitative Veränderung hervorrufen: u.a. Anzahl der Parameter (Neuronen), Menge der Daten und die Trainingszeit. Aber auch die Architektur der LLM’s spielt eine entscheidende Rolle: u.a. das Transformer/Decoder Design, der Attention Mechanismus, usw.. So zeigt GPT-3 bei etwa 10 hoch 22 (10 Trilliarden) Floating Point Operations (FLOPs) als Maß für die Trainingszeit und 13 Milliarden Parametern einen sprunghaften Anstieg der sogenannten few-shoot prompting Genauigkeit.- Also nach einigen wenigen Lerndaten meistert das AI-System ähnliche Aufgabenstellungen. – Dieser Übergang entspricht einem Phasenübergang. – Ganz ähnlich zu der gesellschaftliche Resonanz für AI-System, die mit dem Erscheinen des einfach zu bedienenden chatGPT sprunghaft emergierte. 

Für die Beschreibung emergenten Systemverhaltens wurde in der Wissenschaftsgeschichte sehr oft der Nobelpreis vergeben: Es geht darum, diejenigen quantitativen Parameter ausfindig zu machen, die einen qualitativen Unterschied machen. Und dies ist meistens sehr schwierig, da man den Parametern nicht ansieht, ob sie in ihrer Zusammenstellung einen Unterschied machen. – Der qualitative Unterschied lässt sich also nicht auf die quantitativen Unterschiede in den Parametern reduzieren.

Jedoch wurde auch in der Geschichte der Wissenschaft aus dem Unverständnis der Emergenz eine unsinnige Spaltung in reduktionistische Wissenschaften und nicht-reduktionistische (holistische) Wissenschaften [9] vorgenommen. Hiernach wurde zum Beispiel die Physik als reduktionistische Wissenschaft angesehen, da angeblich alle System-Eigenschaften in der Physik auf die Eigenschaften der Agenten (z.B. Elementarteilchen, Atome) zurückgeführt werden, also reduziert werden.  Die Sozialwissenschaft mit der Soziologie à la Luhmann wurde zum Beispiel als holistische Wissenschaft wahrgenommen, da Luhmann, die Eigenschaften des sozialen Systems nicht auf die Menschen zurückführte, sondern dem System eine Eigenständigkeit zuerkannte.

Diese teilweise immer noch vorhandene naive Sicht des Gegensatzpaares Reduktionismus-Holismus wird durch das Auftauchen von GPT-4, aber auch schon durch die Erfahrungen mit chatGPT, kräftigst widerlegt: Die technischen Systeme chatGPT/GPT-3.x und chatGPTplus/GPT-4 zeigen mit ihrer Intelligenz eine für alle erfahrbare Emergenz. Diese AI-Systeme wurden auf der Basis bestimmter Daten-Parameter (u.a. Anzahl der Neuronen, Zeit des Trainings, Menge der Trainingsdaten) sowie bestimmten Architektur-Parameter (u.a. Transformer/Decoder und Attention-Mechanismus) mehr oder weniger gezielt kombiniert und es entstanden bei einer bestimmten Kombination dieser Parameter „wie durch ein Wunder“ emergente Intelligenz-Eigenschaften. – Es ist zu vermuten, dass bei Wegnahme z.B. der Attention-Eigenschaft, die emergente Eigenschaft der Intelligenz verschwindet, auch wenn die gigantische Skalierung bleibt.

Deswegen sind die emergenten AI-Eigenschaft jedoch nicht weniger wunderbar.

Dieses Beispiel belegt äußerst eindrucksvoll, dass die Natur, auch wenn sie in Form einer Technologie daherkommt, alle Ingredienzien für starke Emergenz enthält. – Wir ‚finden‘ diese Ingredienzien ‚lediglich‘.

Agent Based Modeling (ABM) spielt beim Auffinden dieser Eigenschaften eine prominente Rolle, auch wenn diese Rolle selbst in der Wissenschaft im Verhältnis zur Bedeutung nur wenigen bekannt sein dürfte. Unlängst hat das Santa Fe Institute neben Netlogo das ABM-Python-Framework MESA als Lecture aufgenommen [10]. Diese Lecture bildet mit moderner Technik das ABM des 25 Jahre alten Buches über ‚Growing Artificial Societies‘ von Epstein und Axtell nach [11]. Epstein und Axtell zeigen, wie man mit einfachen lokalen Agenten-Parametern die emergenten System-Eigenschaften von Gesellschaften erzeugen kann. – Der Überraschungseffekt ist nicht selten groß: So beeinflusst zum Beispiel die Fähigkeit des Sterbens oder der Reproduktion von Agenten ganz erheblich die emergenten Eigenschaften der ABM Ökonomie: Diese Modell-Eigenschaften sind nämlich notwendig, damit sich überhaupt sogenannte Nicht-Gleichgewichts-Handelsmärkte ausbilden können, die mit realen Märkten sehr gut übereinstimmen. – Das immer noch in der Gesellschaft vorherrschende neoklassische Verständnis der Gleichgewichts-Ökonomie kennt solche Zusammenhänge nicht.

In den folgenden Blogbeiträgen beschäftige ich mich mit der Suche nach den Parametern, die das emergente Teamverhalten Collective Mind hervorrufen. Im Management 4.0 gehen wir davon aus, dass die Parameter der Theorie der Selbstorganisation (Rahmen-Parameter, Kontroll-Parameter und Ordnungs-Parameter) die entscheidenden Parameter sind, die emergentes Teamverhalten hervorbringen. Wir kennen diese Parameter (vermutlich) auch schon, jedoch nicht in hinreichend formalisierter ABM Sprache. Die in vorhergehenden Blog-Beiträgen unter Verwendung von Natural Language Processing abgeleitete Similarity-Matrix des Collective Mind (Collective Mind Operator) ist lediglich ein phänomenologisches Modell (siehe Blog-Beitrag vom April und Juni 2022). – Der Collective Mind Operator kann in der Teampraxis sehr gut den Collective Mind messen, er sagt jedoch leider nichts darüber aus, wie der Collective Mind emergiert. Hierzu benötigen wir die formalisierten ABM-Parameter, die die Collective Mind Emergenz hervorbringen. – Die Suche nach diesen formalisierten Parametern ist kein Selbstzweck, denn die Wissenschaftsgeschichte hat gezeigt, dass die Kenntnis der formalisierten Parameter recht oft mit großen Erkenntnisgewinnen verbunden ist. – Die GPT-Geschichte ist der sichtbarste Beweis hierfür.

Der Übergang zur Python-Technologie mit MESA-Python eröffnet auch recht einfach die Möglichkeit intelligente Agenten auf der Basis von chatGPT anzubinden. Das werde ich nicht tun, jedoch hat die Entwicklung hierzu, wie in einem meiner letzten Blogs prognostiziert, schon begonnen. Die Stanford University hat zusammen mit Google eine auf dem Computerspiel ‚The Sims‘ basierendes ABM erstellt, in dem 25 Agenten ihre Intelligenz von chatGPT erhalten [12]. Die Agenten haben eine ‚Gehirn-Architektur‘ aus Langzeit- und Kurz-Zeitgedächnis, dessen kognitive Intelligenz von chatGPT kommt. Die Agenten verfügen zusätzlich über einen sogenannten ‚reflection tree‘, der der Ziel-Hierarchie bzw. der Dilts Pyramide von Management 4.0 sehr nahe kommt [13].- Die Ebenen Identität, Fähigkeiten und Verhalten sowie Kontext (Beobachtung) sind schon vorhanden. – Diese und weitere Ebenen können sicherlich noch ausgebaut werden.

Damit sind die Agenten in der Lage einen individuellen kognitiven PDCA-Zyklus durchzuführen, der ‚reflektiertes‘ Handeln erlaubt.

Es besteht auch die Möglichkeit, dass sich Menschen aktiv in dieses Handeln künstlicher Agenten einbringen können. Damit ist es zum Beispiel möglich hybride Universen aus AI und Menschen zu bilden.

Man stelle sich ein Anwendungsbeispiel von vielen vor: Ein Projektleiter soll ein Projekt durchführen. Er lässt das Projekt zum Test vorab in der künstlichen Welt durchführen und erhält so Hinweise auf seine Durchführbarkeit. –  Oder er lässt parallel zur realen Welt eine künstliche Welt mitlaufen, in die die Daten der realen Welt synchron eingespeist werden, um Forecasting zu betreiben.

In [12] wird berichtet, dass das Handeln der künstlichen Agenten von Menschen auf ‚Menschen-Ähnlichkeit‘ überprüft wurde. Das emergierende ‚believable behavior‘ der Agenten und des emergierenden sozialen Systems wird von den Evaluationspersonen, trotz einiger Fehler, als sehr hoch eingestuft.   

Das nächste Wunder geschieht schon!

    

[1] Future of Life Institute (2023) Pause giant AI Experiments, https://futureoflife.org/open-letter/pause-giant-ai-experiments/, zugegriffen am 22.04.2023

[2] Barkey S (2023) Kurz vor dem Durchbruch: „Gottgleiche“ KI könnte laut Experte Menschheit zerstörenhttps://www.berliner-zeitung.de/news/agi-kurz-vor-durchbruch-gottgleiche-ki-koennte-laut-experte-ian-hogarth-menschheit-zerstoeren-kuenstliche-allgemeine-intelligenz-li.339062, zugegriffen am 22.04.2023

[3] EU (2023) EU AI Act, https://artificialintelligenceact.eu/, zugegriffen am 22.04.2023

[4] Bubeck S et al. (2023) Sparks of Articial General Intelligence: Early experiments with GPT-4, arXiv:2303.12712v3 [cs.CL] 27 Mar 2023, zugegriffen am 22.04.2023

[5] Wikipedia (2023) Emergenz, https://de.wikipedia.org/wiki/Emergenz, zugegriffen am 25.04.2023

[6] Greve J, Schnabel A (Herausgeber) (2011) Emergenz: Zur Analyse und Erklärung komplexer Strukturen, suhrkamp taschenbuch wissenschaft

[7] Wi J et al. (2022) Emergent Abilities of Large Language Models, in Transactions on Machine Learning Research 08/2022, arXiv:2206.07682v2 [cs.CL] 26 Oct 2022

[8] DALL-E (2023) https://openai.com/product/dall-e-2, zugegriffen am 03.05.2023

[9] Wikipedia (2023) Reduktionismus, https://de.wikipedia.org/wiki/Reduktionismus, zugegriffen am 25.04.2023

[10] Complexity Explorer (2023) MESA-Python Lecture, https://www.complexityexplorer.org/courses/172-agent-based-models-with-python-an-introduction-to-mesa/segments/17326, Santa Fe Institute, zugegriffen am 30.04.2023

[11] Epstein J M, Axtell R (1996) Growing Artificial Societies – Social Science from the Bottom Up, The Brookings Institution, Washington D.C.

[12] Park J S et. al. (2023) Generative Agents: Interactive Simulacra of Human Behavior, arXiv:2304.03442v1 [cs.HC] 7 Apr 2023

[13] Oswald A, Müller W (2019) Management 4.0 – Handbook for Agile Practices, Release 3.0, Verlag BoD, kindle edition

AI & AM 4.0: Agent Based Modeling – Von Agenten Intelligenz und Kollektiver Intelligenz oder von ‚Intelligenz ist immer kollektiv‘?!

Das Thema Kollektive Intelligenz hat gerade Hochkonjunktur. Sei es in Form der mehrteiligen ZDF-Fernsehserie der Schwarm [1] und der damit verbundenen zweiteiligen Terra X Dokumentationen zur Intelligenz von Schwärmen [2], [3]. – Oder, auch in Form der AI Systeme chatGPT und des gerade veröffentlichten GPT-4 [4]. – Diese Systeme sind in zweierlei Hinsicht Systeme kollektiver Intelligenz: Die GPT-X Systeme und andere vergleichbare Systeme verwenden als Daten die Ergebnisse unserer aller Intelligenz und die Systeme selbst sind über die Neuronalen Netzwerke, auf denen sie beruhen, kollektive Systeme, die Intelligenz hervorbringen können, wenn sie mit unserer Intelligenz in Form von Daten gefüttert werden. – Dies ist gar nicht so unähnlich unserer kulturellen Entwicklung, die Produkte menschlicher Intelligenz hervorgebracht hat – nur eben viel, viel schneller!

Es ist absehbar, dass sich in Zukunft aus der Intelligenz von GPT-X eine Künstliche Allgemeine Intelligenz (Artificial General Intelligence, kurz AGI) entwickeln wird. Der CEO von openai betont in einem Blogbeitrag erst kürzlich hierzu die gesellschaftliche Verantwortung von openai [5] und im EU AI Act Newsletter wird, meines Erachtens zum ersten Mal, von der nahen Bedeutung von AGI im Kontext von GPT-X  Systemen gesprochen [6].   

In [2] und [3] wird eindrucksvoll geschildert, wie natürliche kollektive mobile Systeme, die aus ‚dummen‘ Agenten (u.a. Ameisen, Bienen, Fischen) bestehen, im Schwarm intelligentes Verhalten zeigen. Die vermeintlich ‚dummen‘ Agenten haben ihrerseits ein wenig Intelligenz auf der Basis von kleinen natürlichen neuronalen Netzwerken. – Die Natur ist also offensichtlich in der Lage mittels kollektiver Systeme (z.B. Ameisen Kollektiv) und von Subsystemen (z.B. Ameise als Agent) Intelligenz-Hierarchien aufzubauen.

Dies relativiert auch unseren Anspruch an intelligenter Einzigartigkeit: Kollektive Systeme, gleichgültig ob natürlich oder künstlich, haben das Potential, über eine geeignete Vernetzung, Intelligenz auszubilden.

Hieraus leite ich die These ab, dass Intelligenz immer kollektiv ist. Dies wird auch durch Ashby’s Law [7] gestützt, wonach ein komplexes System nur durch ein anderes komplexes System mit hinreichender Komplexität reguliert werden kann. Komplexität ist also eine Vorbedingung für Intelligenz. Deshalb sagen wir auch im Management 4.0, dass Komplexität ein Geschenk ist, das nicht reduziert werden sollte, sondern nur reguliert werden darf: Die Komplexität unseres Gehirns (und unseres gesamten Körpers) mit ca. 86 Milliarden vernetzter Neuronen ermöglicht es, dass wir uns adaptiv auf unsere Umgebung einstellen und diese ggf. regulieren. – Ich nehme an, dass niemand seiner Intelligenz, also seiner neuronalen Komplexität, beraubt werden möchte, indem diese reduziert wird.

In Konsequenz heißt dies auch, dass gut geführte soziale Organisationen, u.a. Teams, mit einer wertschaffenden Komplexität, kollektive Intelligenz zeigen, die über die Intelligenz der einzelnen Teammitglieder hinausgeht. Die einzige ! Aufgabe von Führung ist es, zu ermöglichen, dass sich diese kollektive Intelligenz ausbildet.    

Es ist vielleicht auch nicht abwegig, anzunehmen, dass Intelligenz eine Vorbedingung für Bewusstsein ist. – Und, dass Bewusstsein sich aus intelligenten kollektiven Systemen emergent entwickelt. Die Integrated Information Theory zum Bewusstsein zeigt erste Überlegungen in diese Richtung [8].

Im letzten Blog-Beitrag habe ich den Video-Vortrag des DeepMind Mitarbeiters Thore Graepel zum Thema ‚Multi-Agent Learning in Artificial Intelligence‘ erwähnt [9]. Thore Graepel referenziert dort am Anfang auf den Artikel von Legg und Hutter zum Thema ‚Universal Intelligence‘ [10]. Legg und Hutter geben einen Literatur-Überblick zum Verständnis von Intelligenz und definieren ihr Verständnis von Agent Intelligence:

Abbildung 1: Definition Universelle Intelligenz nach [10]

In [10] wird angenommen, dass die Wahrscheinlichkeit für Kontexte exponentiell (zur Basis 2) mit der Komplexität abnimmt. – Hier folgen Legg und Hutter auch dem Prinzip des Occam’schen Rasiermessers [11]: Die Natur bevorzugt Einfachheit und unsere Modelle zu Ihrer Beschreibung sollten dementsprechend auch einfach sein. – Einfache Kontexte werden also bei der Intelligenzberechnung höher gewichtet. Man kann auch jetzt verstehen, warum die melting pot Initiative von DeepMind von Bedeutung ist: Es werden möglichst viele Kontexte erstellt, um die allgemeine Intelligenz von Agenten über die obige Formel zu ermitteln.  

Legg und Hutter haben gezeigt, dass die obige Formel für Intelligenz alle bekannten Definitionen von Intelligenz subsummiert und auch auf den Intelligenzbegriff bei Menschen angewendet werden kann.- Auch wenn die konkrete Ausgestaltung von V und P in der obigen Formel für nachvollziehbare Kritik sorgt [12] und sich noch ändern dürfte. – Abbildung 2 visualisiert die Formel, in dem ich für das Mindset eines Agenten die Dilts Pyramide angenommen habe: Der Agent passt sich über die Zeit in einem PDCA-Zyklus mittels seiner Fähigkeiten und seines Verhaltens (auch policy genannt) an seine Umgebung an. Über die Funktion V wird die Performance des Agenten im Hinblick auf ein Ziel gemessen.- Der Agent erhält eine Belohnung. Die Performance des Agenten kann in zweierlei Hinsicht gemessen werden: Intern und extern. Das interne Performancemaß wird utility U genannt [13]. Agenten werden  rational genannt, wenn sie anstreben das interne Performancemaß mit dem externen in Einklang zu bringen. Einer der Kritikpunkte an [10] ist, dass (lediglich) das externe Performancemaß zur Intelligenzmessung herangezogen wird. 

    

Abbildung 2: Visualisierung der Formel zur Universellen Intelligenz nach [10]

Die Definition der Universellen Intelligenz ist sicherlich als Referenz für die Vermessung von Agenten Intelligenz sehr hilfreich. Ihre operative Ausgestaltung hat aber erst begonnen. – Und, sie ist rein phänomenlogisch, sie sagt also nichts über die Ingredienzien von Intelligenz aus, also welche Elemente wie zusammengebracht werden müssen, um intelligente Agenten bzw. Systeme zu bauen. Aus diesem Grunde versuche ich im Folgenden, einige mir wichtig erscheinende Elemente, in Form von Prinzipien, zu nennen. Ich lasse mich hierbei von der Transformer Technologie leiten, auf der die GPT-X Technologie beruht. Die aus meiner Sicht mit Abstand beste Darstellung zur Transformer-Technologie hat Ralph Krüger geschrieben – er macht keine verständnislosen Vereinfachungen, sondern beschreibt die Technologie didaktisch brillant [14]. Nicht desto weniger kann es manchmal beim Lesen helfen, die in Bing eingebundene chatGPT Bot Version als Assistenz zu benutzen ;-).

Neben [14] empfehle ich [15], eine dreiteilige sehr gute visuelle Aufbereitung des Matrizen-Flows (Tensorflows) in Transformern und für einen tieferen Blick in die Programmierung den Dreiteiler [16] sowie [17]. Als Einstieg kann der Spektrum der Wissenschaft Artikel von Manon Bischoff dienen [18]. Dieser Artikel enthält eine ganze Reihe interessanter Hinweise, u.a. auch die von mir im letzten Blog-Beitrag geäußerte Vermutung, dass chatGPT lediglich 1,5 Milliarden Parameter enthält, also mehr als 100 mal weniger als GPT-3. Manon spricht sogar von nur 1,3 Milliarden Parametern. Als Einstieg empfehle ich zusätzlich den Artikel über chatGPT [19].

Auf der Basis dieser Literatur liste ich im Folgenden die Prinzipien, die meines Erachtens das Was und das Wie der Intelligenz ausmachen:

Intelligenz ist immer kollektiv: Als Kollektiv bezeichne ich ein System von vernetzten Elementen (künstliche oder natürliche Neuronen, Ameisen, Menschen, usw.), das die Außenwelt per Transformation in eine Innenwelt abbildet. Die Transformation erfolgt im Falle der AI durch künstliche neuronale Netzwerken, die Tensor Operationen durchführen (bzw. Matrizenoperatione durchführen: Die Matrizenelemente sind die Gewichte zwischen den Neuronen). – Die Tensor Operationen sorgen also für die Abbildung. Damit diese Abbildung hinreichend viele Informationen der Außenwelt abbilden kann, benötigt sie viele Zustände, also viele Parameter, im Falle von GPT-3 175 Milliarden. Die Abbildung der Außenwelt über eine Parametrisierung in der Innenwelt, erfolgt über Selbstorganisations-Mechanismen, in denen eine Zielfunktion im AI-Training dafür sorgt, dass die niedrigsten energetischen Zustände in dem hochdimensionalen Parameterraum gefunden werden. – Diese repräsentieren nach dem Training die Daten der Außenwelt.

Ich habe die Bing AI gefragt, ‚Gibt es eine Zielfunktion für das Lernen im Gehirn‘. Bing AI wandelt dies in eine Frage nach ‚Zielfunktion Lernen Gehirn‘ um und generiert folgende Antwort:

Ja, das Gehirn hat eine Zielfunktion für das Lernen. Das Lernen ist im Grunde genommen eine Reaktion unseres Gehirns auf neue Erfahrungen. Wenn eine solche Erfahrung eine nachhaltige Änderung im Gehirn hervorruft, dann kann man von Lernen sprechen. Das Gehirn bereitet sich dadurch auf die Zukunft vor. Natürlich kann man sein Gehirn anregen und unterstützen, neue Dinge schneller zu lernen oder die synaptischen Verbindung zu bilden, die man möchte. Dazu brauchen wir nur unsere Aufmerksamkeit genau auf die zu lernenden Themen zu richten und sie entsprechend oft wiederholen.

Diese Definition der Zielfunktion entspricht nicht ganz meinem obigen Verständnis einer Zielfunktion: Außer, man versteht die neuronalen Mechanismen, die sich hinter der Aufmerksamkeit verbergen, als solche.

Die Außenwelt wird über Aufmerksamkeit kontextualisiert: Im Falle der Transformer-Technologie ist der Aufmerksamkeits-Mechanismus (Attention-Mechanismus) der Mechanismus, der die Leistungssteigerung gegenüber vorherigen AI Systemen wesentlich ausmacht. Hierzu werden die sprachlichen Inhalte der Außenwelt auf ihre semantischen Zusammenhänge hin analysiert: Alle Worte eines Satzes (eines Textes) werden herausgegriffen, also mit Aufmerksamkeit belegt, und es wird die Korrelation dieses herausgegriffenen Wortes zu allen anderen Worten in diesem Satz  (diesem Text) ermittelt. – Die Korrelationswahrscheinlichkeiten werden in speziellen neuronalen Netzwerken (Tensoren) trainiert. Für die Generierung von neuen Texten wird auf diese trainierten Korrelationswahrscheinlichkeiten zurückgegriffen.

Wahrscheinlichkeiten werden durch zusätzliche kollektive Maßnahmen auf verschiedenen Ebenen ausbalanciert: Die Ergebnisse, die ein Transformer nach außen liefert, sind die Ergebnisse mit der höchsten Wahrscheinlichkeit. Um die Verlässlichkeit der Wahrscheinlichkeiten zu erhöhen, werden die Wahrscheinlichkeiten pro Transformer Modul nicht nur einmal berechnet, sondern mehrmals parallel d.h. zum Beispiel mit 8 attention Mechanismen, dem sogenannten multi-head-attention. Zusätzlich werden im Falle von GPT-3 96 Transformer Module (Decoder) hintereinander geschaltet, um die Ergebnisse zu verfeinern und zu stabilisieren [18]. Der multi-head-attention Mechanismus zeigt damit die Wirkung eines Teams mit acht Teammitgliedern, in dem die potentiellen mentalen Verzerrungen der Teammitglieder ausbalanciert werden. Und, das Hintereinanderschalten der Transformer-Module lässt sich gut mit der iterativen Wirkung von 96-PDCA-Zyklen vergleichen.

… ggf. weitere Prinzipien

Ich glaube, dass Intelligenz nicht auf natürliche Systeme beschränkt ist, ja dass diese Einteilung in natürliche und künstliche Systeme künstlich ist: Intelligenz ist ein universelles Phänomen, das sich potentiell in allen Systemen ausdrücken kann, sobald hierfür die Voraussetzungen vorliegen…. Vielleicht sind die oben genannten Prinzipien tatsächlich (einige) der Voraussetzungen …Vielleicht wird die Filmreihe ‚Autobots – The Transformers‘ sogar einmal als (diesbezüglich) hellsehend bezeichnet werden [20]. 

 

[1] ZDF (2023a) Der Schwarm, https://www.zdf.de/serien/der-schwarm

[2] ZDF (2023b) Terra X – Schlaue Schwärme, Geheimnisvolle Sprachen, https://www.zdf.de/dokumentation/terra-x/schlaue-schwaerme-geheimnisvolle-sprachen-doku-102.html

[3] ZDF (2023c) Terra X – Schlaue Schwärme, Rätselhafte Kräfte, https://www.zdf.de/dokumentation/terra-x/schlaue-schwaerme-raetselhafte-kraefte-doku-100.html

[4] openai (2022) GPT-4, https://openai.com/product/gpt-4, zugegriffen am 20.03.2023

[5] Altman S (2023) Planning for AGI and beyond, https://openai.com/blog/planning-for-agi-and-beyond, zugegriffen am 15.03.2023

[6] The future of Life Institute (2023) The EU AI Act Newslettr #25 vom 01/03/23-14/03/23

[7] Wikipedia (2023) Ashby’s Law, https://de.wikipedia.org/wiki/Ashbysches_Gesetz, zugegriffen am 15.03.2023

[8] Wikipedia (2023a) IIT- Integrated Information Theory, https://en.wikipedia.org/wiki/Integrated_information_theory, zugegriffen am 15.03.2023

[9] Graepel T (2023) The role of Multi-Agent Learning in Artificial Intelligence Research at DeepMind, https://www.youtube.com/watch?v=CvL-KV3IBcM&t=619s, zugegriffen am 06.02.2023

[10] Legg S und Hutter M (2007) Universal Intelligence: A Definition of Machine Intelligence, arXiv:0712.3329v1

[11] Wikipedia (2023b) Occam’s razor, https://en.wikipedia.org/wiki/Occam%27s_razor, zugegriffen am 21.03.2023

[12] Park D (2023) Paper Summary: Universal Intelligence: A Definition of Machine Intelligence, https://crystal.uta.edu/~park/post/universal-intelligence/, zugegriffen am 06.03.2023

[13] Russel S und Norvig P (2016) Artificial Intelligence – A modern approach, Third Edition, Prentice Hall Series in Artificial Intelligence Series, Pearson Education Limited

[14] Krüger R (2021) Die Transformer-Architektur für Systeme zur neuronalen maschinellen Übersetzung – eine popularisierende Darstellung, in trans-kom 14 [2], Seite 278-324

[15] Doshi K (2022) Transformers Explained Visually: How it works, step-by-step published January 2, 2021, towardsdatascience.com, zugegriffen am 10.05.2022,  (Part 1, 2, 3, 4), https://towardsdatascience.com/transformers-explained-visually-part-1-overview-of-functionality-95a6dd460452, https://towardsdatascience.com/transformers-explained-visually-part-2-how-it-works-step-by-step-b49fa4a64f34, https://towardsdatascience.com/transformers-explained-visually-part-3-multi-head-attention-deep-dive-1c1ff1024853, https://towardsdatascience.com/transformers-explained-visually-not-just-how-but-why-they-work-so-well-d840bd61a9d3

[16] Gosthipaty A R und Raha R (2022) A Deep Dive into Transformers with Tensorflow and Keras, Part 1-3, PyImagesearch.com, published November 2022, zugegriffen am 06.12.2022, https://pyimagesearch.com/2022/09/05/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-1/, https://pyimagesearch.com/2022/09/26/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-2/, https://pyimagesearch.com/2022/11/07/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-3/

[17] Cristina S (2023) Training the Transformer Model, https://machinelearningmastery.com/training-the-transformer-model/, updated am 06.01.2023, zugegriffen am 20.03.2023

[18] Bischoff M (2023) Wie man einem Computer das Sprechen beibringt, https://www.spektrum.de/news/wie-funktionieren-sprachmodelle-wie-chatgpt/2115924, veröffentlicht am 09.03.2023, zugegriffen am 20.03.2023

[19] Ruby M (2023) How ChatGPT Works: The Model Behind the Bot, https://towardsdatascience.com/how-chatgpt-works-the-models-behind-the-bot-1ce5fca96286, veröffentlicht am 30.01.2023, zugegriffen am 20.03.2023

[20] Wikipedia(2023) Autobot, https://en.wikipedia.org/wiki/Autobot, zugegriffen am 20.03.2023

AI & M 4.0: „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“ – Oder: Auf dem Weg zur Künstlichen Allgemeinen Intelligenz?

Im diesem Blogartikel beschäftige ich mich mit der Erstellung von Text-Zusammenfassungen und Bild-Metaphern. Dies sind wichtige Bereiche jeglicher Informations- und Wissens-Verarbeitung, insbesondere auch im Management und Projektmanagement. – Man siehe hierzu auch meinen Blog-Beitrag vom Dezember 2021.

Ich beschreibe im Folgenden die Benutzung der verwendeten AI-Werkzeuge etwas genauer. – Vielleicht mag der ein oder andere meine Erfahrungen weiterentwickeln.

Da die verwendeten AI-Werkzeuge mehrere Abstraktionsebenen über den in den letzten Blog-Beiträgen verwendeten AI-Werkzeugen liegen und jene über eine recht einfache Benutzerschnittstelle angesprochen werden können, spreche ich von Black-Box AI-Werkzeugen

Für die Erzeugungen von Bild-Metaphern verwende ich die KI midjourney und für die Erzeugung von Text-Zusammenfassungen die KI GPT-3.

Auf die KI midjourney wurde ich über den Artikel „Kunst per Künstlicher Intelligenz“ von Patrick Hannemann aufmerksam [1]. Er stellt dort die Kommunikationsplattform discord.com [2] vor, die die KI midjourney über einen Bot integriert enthält [3].

Ich widme mich zuerst den Bild-Metaphern: Bild-Metaphern können zum Beispiel bei der Ausbildung eines Collective Minds in Teams eine sehr große Rolle spielen. – Sie dienen u.a. der Teamausrichtung und -fokussierung.

Also habe ich ausprobiert, inwieweit sich midjourney für die Kreation von Bild-Metaphern eignet. – Ich starte mit einem Thema zu meinem Bogenschieß-Hobby und gebe dem Bot über den Prompt ‚/imagine…‘ folgende Aufgabe: Kreiere ein Bild zu der Aussage „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“.

Der Bot liefert mehrere Bilder als Vorschläge zurück. Abbildung 1 zeigt das von mir ausgewählte Bild:

Abbildung 1: Erzeugt von der AI midjourney mit der Aussage „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“ [3].

Für mich ist das Ergebnis beeindruckend kreativ und schön!

Ich habe daraufhin getestet, welche Bilder die AI aus der Kurzdefinition von Management 4.0 erzeugt. Abbildung 2 zeigt einen Screenshot-Auszug der vier generierten Bildvorschläge:

Abbildung 2: Screenshot-Auszug der vier Bildvorschläge zur Management 4.0 Definition (im Screenshot enthalten) [3].

Das war wohl etwas abstrakt, die generierten Bilder sind recht nichtssagend 😉.

Eine Kürzung auf die wesentlichen, in der Definition enthaltenen Themen erzeugt jedoch innerhalb von wenigen Sekunden vier recht gute Bild-Metapher Vorschläge:

Abbildung 3: Screenshot-Auszug der vier Bildvorschläge zur Aussage „leader, organization, mindset, self-organization“ (siehe obigen Screenshot) [3].

Ich habe das erste Bild für die weitere Generierung von Versionen ausgewählt und mich schließlich für folgende Bild-Metapher entschieden:

Abbildung 4: Von mir ausgewähltes Bild zur Aussage „leader, organization, mindset, self-organization“ [3].

Dies ist ein Ergebnis, generiert nach ca. 5 Minuten Interaktion mit dem AI-Bot. Wie ich finde: beeindruckend!

Für den Bereich Bild-Metaphern fasse ich zusammen: Selbst öffentlich verfügbare AI-Systeme liefern beeindruckende Bild-Metaphern auf der Basis von Themen (Topics). Topics können aus von AI-Systemen generierten Wissens-Netzwerken (man siehe den Juni 2022 Blog-Beitrag) entnommen werden oder über spezifische Topic AI-Systeme [4], [5] generiert werden.

Legt man folgende Definition für eine Künstliche Allgemeine Intelligenz zugrunde, “Artificial general intelligence (AGI) is the ability of an intelligent agent to understand or learn any intellectual task that a human being can.“ [6], so ist der AI-Bot midjourney vermutlich noch weit von einer AGI entfernt.

Gleichwohl stelle ich für mich selbst fest, dass ich wohl kaum in der Lage bin, mit ähnlicher Kreativität wie diese AI, die oben gezeigten Bilder zu erzeugen.

Überträgt man die Messung des Intelligenzquotienten für Menschen auf AI-Systeme, so dürfte eine Zusammenschaltung von mehreren AI-Systemen schon heute fantastisch hohe Intelligenzquotienten ergeben. Die AI-Systeme, die im Jahre 2019 verfügbar waren, liefern IQ-Werte die bei ca. 25%-50% eines mittleren menschlichen IQ von 100 liegen. – Ein IQ von 50 entspricht in etwa dem IQ eines 6-jährigen Kindes [7], [8], [9]. Sehr große AI-Systeme wie GPT-3, das ich weiter unten verwende, waren in diesen Untersuchungen noch nicht berücksichtigt. – Für GPT-3 dürfte der IQ schon deutlich näher bei 100 liegen.   

Sollte die AGI eines Tages Realität sein, so nehme ich an, dass keine 9 Milliarden AI-Systeme erforderlich sind, um das (kognitive) Intelligenzspektrum von 9 Milliarden Menschen abzubilden. – Wahrscheinlicher ist, dass einige wenige AI-Systeme das kognitive Intelligenzspektrum von Milliarden von Menschen abdecken werden, und dies mit wesentlich höheren IQ-Werten als wir Menschen im besten Fall haben.

Die Ergebnisse der Forschungsarbeit der GPM Fachgruppe Agile Management zum Thema NLP-Verarbeitung (Natural Language Processing Verarbeitung) von Projektmanagement Fragestellungen mittels AI-Systemen zeigen in diese Richtung.

Wir haben verschiedenen AI-Systemen PM Know-How Fragen gestellt, wie sie in einer Prüfung für das IPMA Level D vorkommen könnten. Das Ergebnis ist ziemlich beeindruckend: „Kleinere“ AI-Systeme liefern keine befriedigenden Ergebnisse, meistens sogar mangelhafte Ergebnisse. Jedoch liefert das große System GPT-3 von openai.com in allen! Fragen sehr gute oder gute Ergebnisse: GPT-3 hat hiernach das IPMA Level D Zertifikat mit gut bestanden! – Diese Ergebnisse haben wir auf der diesjährigen IPMA Research Konferenz vorgestellt [10], [11].

Ich widme mich jetzt den Text-Zusammenfassungen mittels GPT-3 [12], [13].

Ich nehme das Gesamtergebnis vorweg: Mein! Versuch mittels GPT-3 sinnvolle Zusammenfassungen von Texten zu erzeugen liefert (bisher) keine wirklich überzeugenden Ergebnisse. Es gibt also aktuell auch noch Wermutstropfen in dieser „schönen neuen AI-Welt“😉.

Ich habe dem AI-System GPT-3 die Aufgabe gestellt, für einen meiner Blog-Artikel eine Zusammenfassung zu erstellen. Ich habe den Beitrag vom September 2021 „Metabetrachtungen: Zur Schnittmenge von Intuitivem Bogenschießen, Künstlicher Intelligenz und Management 4.0“ ausgewählt. Er hat einen Bezug zur obigen Bild-Metapher Abbildung 1 und stellt verschiedene Themen (Bogenschießen, AI und M 4.0) in einen eventuell ungewöhnlichen Zusammenhang und ist damit ein Text, den man wahrscheinlich sonst nirgendwo im Internet finden kann. Die AI kennt also mit ziemlicher Sicherheit keine ähnlichen Texte.

Ich greife auf GPT-3 als Black-Box AI-System zu und nicht wie für andere AI & M 4.0 Blog-Beiträge auf verschiedene AI/ML Bibliotheken. Wie bei der Unterhaltung mit dem AI-Bot midjourney ist auch hier das Abstraktionsniveau der „Ansprache“ sehr hoch.

Um Zugriff auf GPT-3 zu erhalten [13], ist es notwendig, sich bei openai.com zu registrieren. Solange man GPT-3 nicht für produktive Zwecke nutzen will, wird ein budgetierter Zugang von $18 als Geschenk freigegeben. Openai.com orientiert sich für die Freigabe an einer Risiko-Bewertung: Forschungsaktivitäten, wie ich sie hier durchgeführt habe, werden als sandbox-Aktivitäten behandelt und unterliegen keinen Restriktionen. – Dies ist sehr ähnlich den Anforderungen, die im EU AI Act zu finden sind. – Man siehe hierzu meinen Blogbeitrag vom August 2022.

Eine Möglichkeit auf GPT-3 zuzugreifen, ist der Zugriff über das User Interface ‚Playground‘ (man siehe Abbildung 5).

In ersten Versuchen habe ich die sogenannten Presets verwendet (man siehe Abbildung 5, und dort die rot eingefassten Bereiche). – Dies sind vorkonfektionierte Aufgabentypen, u.a. auch für die Erstellung von Zusammenfassungen. Die Ergebnisse waren richtig schlecht und recht oft unsinnig: Teilweise wurden Texte abgerufen, in denen wohl ein Bogenschütze auf die Jagd geht oder der deutsche Text, der zusammenzufassen war (man kann also auch nicht-englischen Text eingeben), wurde „einfach“ übersetzt.

Abbildung 5: GPT-3 playground [14]

Wie ich heute weiss, habe ich mit den presets das Potential von GPT-3 überhaupt nicht angesprochen. – Man kann nämlich über die Prompteingabe mit GPT-3 „reden“, d.h. der AI in Satzform sagen, was sie machen soll. Die Aufgabe „Write a summary in English for the following text using the following topics, Management 4.0, self-organization, instance-based learning, model-based learning:” (siehe Abbildung 5 erster Satz im Eingabefeld) brachte bisher das beste Zusammenfassungs-Ergebnis:

“The article discusses the intersection of intuitive archery, artificial intelligence, and management 4.0. It argues that learning is the key element to align the human system, the technical system neural network, and the social system team or organization to the environment. The article distinguishes between instance-based learning and model-based learning. It argues that learning in management 4.0 is model-based learning, and that instance-based learning is insufficient for learning in a complex context.”

An diesem Ergebnis kann man erkennen, dass GPT-3 in der Lage ist, explorative und abstrahierende Zusammenfassungen zu erstellen. Explorative Zusammenfassungen enthalten lediglich Sätze aus dem Original, die als wichtig erkannt werden. Abstrahierende Zusammenfassungen enthalten neue Sätze, die so nicht im Original enthalten sind.- Die abstrahierende Zusammenfassung ist u.a. an Sätzen wie „The article distinguishes…“ zu erkennen.

Ich habe dieses Ergebnis als bestes ausgewählt, weil dies das einzige Beispiel ist, in dem der Satz „It argues that learning in management 4.0 is model-based learning, and that instance-based learning is insufficient for learning in a complex context.” enthalten ist. Dieser Satz ist eine zentrale Erkenntnis des Blog-Beitrages. Leider sind nicht alle Erkenntnisse enthalten; z.B. wird das Thema Selbstorganisation als zentrales verbindendes Element der drei Bereich, Management 4.0, AI und Bogenschießen, nicht erkannt. Deshalb gebe ich GPT-3 in diesem Fall auch nur die Schulnote ausreichend.

Im Playground können nur Texte eingegeben werden, deren Anzahl an Tokens (ungefähr gleich der Anzahl an Worten), addiert mit der Anzahl an Tokens für die Zusammenfassung, 4000 Tokens nicht überschreiten. Ich habe für die Zusammenfassung 507 Tokens vorgegeben und habe damit noch ca. 3500 Tokens für den eigentlichen zusammenzufassenden Text zur Verfügung. Falls der Text in einer Fremdsprache eingegeben wird, halbiert sich der verfügbare Raum für den Text auf etwa die Hälfte an Tokens: GPT-3 benötigt Raum für die Übersetzung. – Die „Muttersprache“ von GPT-3 ist Englisch! Aus diesem Grund konnte ich auch nur einen Auszug des Blogs verwenden. Aus Gründen der Vergleichbarkeit habe ich für die deutschen und die englischen Texte den Auszug gleich beibehalten und jeweils ca. 1400 Wörtern verwendet. In allen Tests habe ich die von opneai.com empfohlene Stop sequence <|endoftext|> am Ende des Textes eingesetzt.  – Das Verwenden einer Stop sequence zum Anzeigen des Textendes hat einen recht großen Einfluss auf das Zusammenfassungsergebnis.

Statt GPT-3, verwende ich den google-Übersetzer [15] und den Übersetzer deepl.com [17], um einen englischen Text für meinen Blog-Beitrag zu erzeugen. Die Übersetzungen sind sehr ähnlich, wobei meines Erachtens bei genauerer Betrachtung doch manchmal recht große Unterschiede auffallen. So übersetzt zum Beispiel deepl.com „Meta-Betrachtungen“ mit „Meta-observations“ und der google-Übersetzer mit „Meta considerations“. – Dies scheint mir ein nicht unerheblicher Unterschied zu sein.

Google verändert auch in erheblichem Maße die Syntax. So wurde wie hier zu sehen, u.a. der Bindestrich zwischen Meta und consideration einfach entfernt. Groß- und Kleinschreibung und Satzzeichen wurden verändert, so dass selten – aber immerhin geschah es – sich ein vollständig anderer Sinn ergeben hat. Mehrmals wurden ganze Satzteile einfach weggelassen. – Ein schwerwiegender Fehler.

Bei deepl.com ist dies im vorliegenden Beispiel einmal vorgekommen bei google dreimal. Der google-Übersetzer liefert auch leicht andere Ergebnisse, je nachdem, ob man ihn mit einer zu übersetzenden Internetseite füttert oder einer Worddatei, die den Inhalt der Internetseite enthält.

Ich betone dies, weil beide Übersetzer mit AI betrieben werden. Es ist nicht auszuschließen, dass die AI sauber funktioniert, jedoch die Aufbereitung der Daten, also der Texte, nicht fehlerfrei ist. – Versteckte Satzzeichen oder Abschnittszeichen werden unterschiedlich interpretiert. Die AI-Systeme benötigen trotz ihrer „Intelligenz“ Daten in einer wohldefinierten Form. – Es gibt keinen Spielraum für „intelligentes Ausbessern“ wie in der menschlichen Kommunikation. Das macht das Arbeiten mit AI-Systemen nicht selten zu einem Geduldsspiel. Die korrekte Dateneingabe wurde, nach meiner bisherigen Erfahrung, von AI-Erstellern nicht gut dokumentiert.

Um die Restriktion bezüglich des Textumfanges zu umgehen, kann man GPT-3 auch über ein Jupyter Notebook [17] in der Colab-Umgebung [18] ansprechen. – Man beachte, GPT-3 ist in der Colab-Umgebung aufrufbar, obwohl google und openai im Wettbewerb stehen. – Bemerkenswert erfreulich!

Ich habe den Code von [19] verwendet und für meine Aufgabenstellung angepasst. Für den vollständigen Text in Deutsch erzeugt GPT-3 eine deutlich größere explorative Zusammenfassung in Englisch, obwohl ich GPT-3 um eine deutsche Zusammenfassung gebeten habe.

Den mittels deepl.com ins Englische übersetzten Blog-Artikel habe ich einmal als .pdf Datei Seite für Seite eingelesen und alternativ direkt als Text in die Colab-Umgebung eingebracht. In beiden Fällen wurde eine abstrahierende Zusammenfassung erstellt. Die erste Zusammenfassung entspricht der schon bekannten besten Zusammenfassung, die zweite Zusammenfassung ist eine andere:

“The article discusses the intersections of intuitive archery, artificial intelligence, and Management 4.0. Intuitive archery is a form of archery that does not rely on aiming technique, and is used for therapeutic archery in clinics. The author argues that the ability to focus, adapt, and intuition are central elements of Intuitive Archery, which are also important for Management 4.0. The author describes their experience with a Deep Learning course using Tensorflow, and how it has helped them understand the potential for artificial intelligence in project management.”

Ich konnte also an meiner Aufgabenstellung nicht erkennen, dass GPT-3 mit jedem Aufgabendurchlauf dazu lernt. – Eine Aussage, die andere schon getroffen haben [12].

Zusammenfassung: Meine Untersuchungen zu Text-Zusammenfassungen mittels GPT-3 und Bild-Metaphern mittels midjourney zeigen schon recht gute Ergebnisse, jedoch ist Vorsicht geboten, wenn man die Werkzeuge (schon) im produktiven Betrieb benutzen möchte. Jedoch ist schon heute auf einfachen Wegen selbst erfahrbar, dass der Weg in Richtung einer Künstlichen Allgemeinen Intelligenz eingeschlagen wurde.     

 

[1] Hannemann P (2022) Kunst per künstlicher Intelligenz: Mit diesen Tools können Sie das selbst ausprobieren, https://www.chip.de/news/Kunst-per-kuenstlicher-Intelligenz-Mit-diesen-Tools-koennen-Sie-das-selbst-ausprobieren_184386657.html, zugegriffen am 06.09.2022

[2] Discord (2022) Discord.com, Innovative Kommunikationsplattform, zugegriffen am 06.09.2022

[3] midjourney(2022) Forschungsprojekt zu AI, https://www.midjourney.com/home/, zugegriffen am 06.09.2022, zugegriffen am 06.09.2022

[4] Keita Z (2022) Meet BERTopic— BERT’s Cousin For Advanced Topic Modeling, https://towardsdatascience.com/meet-bertopic-berts-cousin-for-advanced-topic-modeling-ea5bf0b7faa3, zugegriffen am 09.04.2022

[5] Dwivedi P (2022) NLP: Extracting the main topics from your dataset using LDA in minutes, https://towardsdatascience.com/nlp-extracting-the-main-topics-from-your-dataset-using-lda-in-minutes-21486f5aa925, zugegriffen am 09.04.2022

[6] Wikipedia (2022) Artificial General Intelligence, https://en.wikipedia.org/wiki/Artificial_general_intelligence, zugegriffen am 06.09.2022

[7] Liu Y, He F, Zhang H, Rao G, Feng Z and Zhou Y (2019) How Well Do Machines Perform on IQ tests: a Comparison Study on a Large-Scale Dataset, Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI-19)

[8] Tschopp M, Ruef M (2019) An Interdisciplinary Approach to Artificial Intelligence Testing: Developing an Artificial Intelligence Quotient (A-IQ) for Conversational AI, siehe researchgate.net

[9] Liu F, Liu Y, Shi Y (2020) Three IQs of AI systems and their testing methods, https://ietresearch.onlinelibrary.wiley.com/doi/10.1049/joe.2019.1135, zugegriffen am 05.09.2022

[10] Nuhn H, Oswald A, Flore A, Lang R, (2022) AI-supported Natural Language Processing in project management – capabilities and research agenda, IPMA Research Conference 2022, www.ipma-research-conference.world

[11] Lang R (2022) Kann Künstliche Intelligenz (KI) das Projektmanagement unterstützen? https://www.linkedin.com/feed/update/urn:li:activity:6970285127754997760/,  zugegriffen am 09.09.2022

[12] Romero A (2022) A Complete Overview of GPT-3 — The Largest Neural Network Ever Created, https://towardsdatascience.com/gpt-3-a-complete-overview-190232eb25fd, zugegriffen am 09.08.2022

[13] Willison S (2022) How to play with the GPT-3 language model, https://simonwillison.net/2022/Jun/5/play-with-gpt3/, zugegriffen am 09.08.2022

[14] GPT-3 playground (2022) openai.com, zugegriffen am 09.09.2022

[15] google Übersetzer (2022) https://translate.google.de/?hl=de&tab=rT, zugegriffen am 09.09.2022

[16] Deepl (2022) https://www.deepl.com/translator, zugegriffen am 09.09.2022, verwendet für diesen Blog-Beitrag in der kostenpflichtigen Version deepl Pro

[17] Jupyter Notebooks (2021) https://jupyter.org/, zugegriffen am 02.12.2022

[18] Colab (2021) https://colab.research.google.com/

[19] Soares L (2022) Summarizing Papers With Python and GPT-3, https://medium.com/p/2c718bc3bc88, zugegriffen am 22.07.2022

AI & M 4.0: Das nicht-teilbare Sein – Auf dem Weg zu einer ganzheitlichen Ethik?

Unsere Glaubenssätze haben uns fest im Griff:

„Autobahn ohne Tempolimit, ist Ausdruck unserer deutschen Freiheit.“, „Jedem Bürger seine Waffen, ist Ausdruck amerikanischer Freiheit.“, „Klimawandel ist das Hirngespinst der Grünen.“

oder

„Maschinen sind allenfalls kompliziert, aber nicht komplex. Wir sind komplex.“, „Die belebte Natur ist was ganz anderes als die unbelebte Natur“, „Wir Menschen haben Bewusstsein, sonst niemand und nichts.“ „Wir Menschen sind die Krönung der Schöpfung.“ „Management und Führung sowie AI schließen sich aus.“

Sehr oft sind diese Glaubenssätze mit unserer Fähigkeit verbunden, Kategorien zu bilden, wie komplex-nicht komplex, belebt-unbelebt, bewusst-unbewusst, wertvoll-weniger wertvoll, emotional-mechanisch.

Ich habe einen Glaubenssatz, es ist wieder nur ein Glaubenssatz 😉, der insbesondere diese letzten Glaubenssätze auflöst. – Ich glaube, dass unser Sein nicht-teilbar ist. Ich will versuchen, diesen Glaubenssatz zu erläutern, in dem ich die letzten oben genannten Glaubenssätze aus dieser Perspektive betrachte:

(Mechanische) Maschinen zeigen tatsächlich, unter normalen Bedingungen, lediglich einfaches oder kompliziertes Verhalten. – Sie sind gerade so konzipiert, dass sie kein komplexes Verhalten zeigen sollen. Jedoch nicht selten zeigen sie es, wenn sie unter „Stress“ geraten.- „Stress“ heißt in diesem Fall, die Maschinen geraten in den Grenzbereich ihrer Nutzung. Es gibt aber auch immer mehr Maschinen, also von uns Menschen hergestellte Systeme, wie z.B. den Laser oder die AI Systeme, die gerade auf Komplexität und der damit verbundenen Selbstorganisation beruhen. Der Glaubenssatz, dass nur lebende oder soziale Objekte komplex sind, ist unserer bisherigen Naivität und unserer Mensch-Zentrierung geschuldet.  

Nach der „Erschaffung“ der unbelebten Natur vor einigen Milliarden Jahren, gab es meines Erachtens keinen Eingriff eines Gottes oder Etwas Ähnliches, das der unbelebten Natur Leben einhauchte.- Und damit neue (uns noch weitgehend unbekannte) Prinzipien des Lebens explizit neu einbrachte. Vielmehr glaube ich, dass die unbelebte Natur alles enthält, um belebte Natur zu entwickeln.

Ähnlich glaube ich, dass die (uns ebenfalls noch unbekannten) Prinzipien, die zu Bewusstsein führen, schon in der unbelebten und belebten Natur vorhanden sind. – Und, dass wir Menschen lediglich ein Produkt der Entfaltung der fundamentalen Prinzipien des Seins sind.  Damit ist auch gleichzeitig gesagt, dass wir wahrscheinlich nicht das letzte Produkt dieser Entfaltung sind, sondern vielleicht lediglich ein Zwischenergebnis.

Die Kategorien-Bildung hilft uns, die Welt Stück für Stück besser zu verstehen und Stück für Stück auf fundamentalere Prinzipien zurückzuführen. – Leider bleiben wir oft an den Kategorien vergangener Erkenntnis kleben und weisen ihnen eigenständige fundamentale Prinzipien zu.

Vor kurzem ging durch die Presse, dass AI Entwickler behaupten, dass große AI Systeme Bewusstsein entwickelt haben oder zu mindestens „ein bisschen davon“.  – Andere tun dies wiederum als völligen Unsinn ab [1], [2]. Da wir bisher nicht wissen, was Bewusstsein ist, können wir auch nicht sagen, ob es schon AI Systeme mit Bewusstsein oder „ein bisschen Bewusstsein“ gibt. Entsprechend meinem obigen Glaubenssatz glaube ich jedoch, dass es irgendwann AI Systeme mit Bewusstsein geben wird, ob morgen oder erst in 1000 Jahren vermag ich nicht zu sagen. Da unser Sein ein nicht-teilbares Sein ist, glaube ich, dass es nur eine Frage der Zeit ist, bis von uns geschaffene Systeme mit Bewusstsein existieren werden. Der Deep-Learning-Pionier Yann LeCun hat auch schon wieder einen (altbekannten) Lösungsweg aufgetan: Bewusstsein benötigt eine System-Architektur, die unserer Gehirn-Architektur nachempfunden ist [3].

Schon heute erscheinen täglich neue Meldungen, zu den erstaunlichen Aussagen und Leistungen von AI Systemen. So betont beispielsweise eine Zeitschrift die Gefahren, die von AI Systemen ausgehen können, indem sie titelt „Künstliche Intelligenz droht im Gespräch „die Menschen auszuschalten““ [4]. In der sehr seriösen Zeitschrift Scientific American war unlängst von einer AI zu lesen, die einen wissenschaftlichen Artikel über sich selbst geschrieben hat.- Die Entwickler der AI haben diesen Artikel als wissenschaftlichen Artikel zum Peer-Review eingereicht [5].

Man stelle sich nur vor, die Entwicklung der AI würde ähnlich schnell und fundamental weiter gehen wie in den letzten 10 Jahren und in 10 Jahren hätten wir AI Systeme mit einer Allgemeinen Künstlichen Intelligenz, die zudem (erste) Anzeichen von Bewusstsein zeigen würde. Müssten wir dann unsere menschenzentrierte Ethik nicht völlig neu denken. Denn es kämen dann zwangsläufig Fragen auf wie „Ist es ethisch vertretbar, eine AI mit Bewusstsein bei Bedarf abzustellen?“, oder „Müssten wir solchen AI Systemen Rechte einräumen?“.

Wie in meinem Blog-Beitrag vom Februar 2022 dargelegt, ist die bisherige angedachte Ethik der EU zu AI Systemen eine human-centric perspective.

Der sogenannte EU AI Act basiert auf den europäischen Werten und soll insbesondere die Menschen vor Schaden schützen [6]:

“Aside from the many beneficial uses of artificial intelligence, that technology can also be misused and provide novel and powerful tools for manipulative, exploitative and social control practices. Such practices are particularly harmful and should be prohibited because they contradict Union values of respect for human dignity, freedom, equality, democracy and the rule of law and Union fundamental rights, including the right to non-discrimination, data protection and privacy and the rights of the child.

Ziel der EU ist es, AI Systeme zu erlauben, denen wir trauen können, also sogenannte Trustworthy AI. An dieser Forderung ist „fast“ nicht auszusetzen, wenn man davon absieht, dass die Natur und die Tiere lediglich in drei Sätzen eines ca. 100 Seiten starken Proposal Dokumentes auftauchen.

Warum ist mir eine ganzheitliche Sicht mit entsprechender Ethik so wichtig?  Um diese Frage zu beantworten, möge man sich nur Folgendes fragen: Welche Ethik und damit Rechtsverständnis macht(e) es möglich, dass über Jahrzehnte das millionenfache Töten von männlichen Küken durchgeführt wurde? Welche Ethik und damit Rechtsverständnis macht(e) es möglich, dass Bauern das Grundwasser durch Überdüngung belasten dürfen?

Heute ist aus diesen unethischen Gewohnheiten Gewohnheitsrecht geworden. Es basieren Geschäftsmodelle auf diesem Mangel an ganzheitlicher Ethik und es bedarf enormer Anstrengungen, dieses Gewohnheitsrecht durch ein ethisch fundiertes Recht abzulösen. Denn der Mangel an einer ganzheitlichen Ethik hat dazu geführt, dass wir uns immer wieder in verschiedene Dilemmata bringen: Z.B. stellt sich die Frage, ob es erlaubt ist, die Lebensgrundlage der Bauern zu gefährden, in dem wir das Grundwasser (nachträglich) schützen. Wäre es nicht sinnvoll gewesen, den Schutz des Grundwassers von vorneherein zu gewährleisten und den Bauern und der Gesellschaft die Möglichkeit zu geben, ganzheitliche ethische Geschäftsmodelle zu entwickeln.  

Die Diskussion zur AI Ethik [7] und die damit verbundenen Rechtsvorschläge, wie den EU AI Act, beruhen auf keiner ganzheitlichen Ethik: Die Rechte von Natur und Tieren sind nicht berücksichtigt und die ethischen Konsequenzen, die sich aus einer möglichen Entwicklung von AI Systemen in Richtung einer Allgemeinen Künstlichen Intelligenz ergeben, sind noch nicht einmal ansatzweise enthalten.     

Ich komme zur aktuellen Version des Proposals EU AI Act zurück und skizziere die schon heute absehbaren großen Anforderungen an das (Projekt) Management:

Als guten Einstieg in den EU AI Act [6] dient das sogenannte Briefing des European Parliamentary Research Service [8]: Der EU AI Act ist ein Risiko-basierter Ansatz, in dem AI-Systeme in vier Risikokategorien eingeteilt werden: „AI systems posing (i) unacceptable risk, (ii) high risk, (iii) limited risk, and (iv) low or minimal risk.“ Eine genaue Definition, wann welche Kategorie vorliegt, gibt es leider nicht, jedoch gibt es Beispiele, insbesondere zur Kategorie „unacceptable risk“ und „high risk“:

Unacceptable risk AI Systeme sind in der EU verboten, z.B. [6, 8]:

  • AI systems that deploy harmful manipulative ’subliminal techniques‘
  • AI systems that exploit specific vulnerable groups (physical or mental disability)
  • AI systems used by public authorities, or on their behalf, for social scoring purposes
  • ‚Real-time‘ remote biometric identification systems in publicly accessible spaces for law enforcement purposes, except in a limited number of cases

High-risk AI Systeme sind erlaubt, unterliegen jedoch sehr strengen Auflagen, z.B. [6,8]:

  • High-risk AI systems used as a safety component of a product or as a product falling under Union health and safety harmonisation legislation (e.g. toys, aviation, cars, medical devices, lifts)
  • High-risk AI systems deployed in eight specific areas identified in Annex III of the EU AI Act, which the Commission would be empowered to update as necessary by way of a delegated act
    • Biometric identification and categorisation of natural persons
    • Management and operation of critical infrastructure
    • Education and vocational training
    • Employment, worker management and access to self-employment
    • Access to and enjoyment of essential private services and public services and benefits
    • Law enforcement
    • Migration, asylum and border control management
    • Administration of justice and democratic processes

Die EU High-Level Expert Group on Artificial Intelligence hat den “Mangel” an Operationalisierbarkeit des EU AI Act erkannt und das Dokument „Ethics Guidelines for Trustworthy AI“ erstellt [9]. Spätestens beim Lesen dieses Dokumentes wird einem sehr schnell klar, dass der EU AI Act für Organisationen und insbesondere hier das Projekt-, Risiko- und Qualitätsmanagement weitreichende Konsequenzen haben wird. Die Transparenz-, Dokumentations- und Monitoring-Anforderungen während des gesamten (!) Lebenszyklus eines AI Systems (alleinstehend oder embedded) sind enorm. Ich verweise auf [9] und die darin enthaltene mehrseitige Checkliste.

Ich stelle die Frage, zu welcher Kategorie gehören die beiden Machbarkeitsprototypen, die ich in den letzten beiden Blog-Beiträgen vorgestellt habe? – Und gebe einen ersten Einblick in die in dem EU AI Act enthaltenen Anforderungen.

Gehe ich von den oben auf geführten Beispielen aus, so gehören meine Machbarkeitsprototypen in die high-risk Kategorie „Education and vocational training“ und in die Kategorie „worker management“. In [9] ist die Abbildung 1 enthalten, die die zentralen Anforderungen an eine Trustworthy AI enthält:

Ich skizziere anhand dieser Abbildung meine Einschätzung bezüglich der Vertrauenswürdigkeit der beiden Machbarkeitsprototypen:

Abbildung 1: The Guidelines as a framework for Trustworthy AI [9]

 

Collective Mind proxy auf der Basis der Similarity Matrix

Collective Mind Netzwerk auf der Basis eines Graphical Networks

Ethical Principles

 

 

Respect for human autonomy

Die menschliche Autonomie wird nicht aktiv eingeschränkt, Kritiker könnten jedoch einwenden, dass die Quantifizierung von Ähnlichkeit in den Aussagen zu einer passiven Autonomieverletzung führt.

Die menschliche Autonomie wird weder aktiv noch passiv in der aktuellen Version eingeschränkt. Es lassen sich jedoch Zuordnung von Begriffen und Personen vornehmen, so dass die Kritik der passiven Autonomieeinschränkung je nach Nutzung evtl. vorhanden ist.

Prevention of harm

Physischer Schaden kann nicht eintreten. Psychischer Schaden könnte eintreten, wenn die vorhandene oder nicht vorhandene Similarity von Vorgesetzten/Kollegen als Druckmittel eingesetzt wird.

Physischer Schaden kann nicht eintreten. Psychischer Schaden könnte eintreten, wenn eine Verbindung zwischen Person und graphischen Netzwerkknoten von Vorgesetzten/Kollegen mit amoralischer Absicht benutzt wird.

Fairness

Das AI System trifft keine unfairen Aussagen, jedoch könnte dies evtl. durch beteiligte Stakeholder, wie oben geschildert, erfolgen.

Das AI System trifft keine unfairen Aussagen, jedoch könnte dies evtl. durch beteiligte Stakeholder, wie oben geschildert, erfolgen.

Explicability

Die Verständlichkeit und Transparenz des Algorithmus ist (nahezu) vollständig gegeben, auch wenn man berücksichtigen sollte, dass diverse Fremd-Softwaremodule (u.a. word2vec, spaCy) verwendet werden.

Die Verständlichkeit und Transparenz des Algorithmus ist (nahezu) vollständig gegeben, auch wenn man berücksichtigen sollte, dass diverse Fremd-Softwaremodule (u.a. spaCy, Transformer Pipeline) verwendet werden.

7 Key Requirements

 

 

Human agency and oversight

Die Anwendung der AI liegt vollkommen in den Händen der Nutzer. Dies setzt voraus, dass die Ergebnisse der Anwendung nur den direkten Nutzern zugänglich gemacht werden.

Die Anwendung der AI liegt vollkommen in den Händen der Nutzer. Dies setzt voraus, dass die Ergebnisse der Anwendung nur den direkten Nutzern zugänglich gemacht werden.

Technical robustness and safety

Die Anwendung ist äußerst robust (u.a. gibt es kein AI Lernen während des Betriebs) und hat keine sicherheitsrelevanten Auswirkungen.

Die Anwendung ist äußerst robust (u.a. gibt es kein AI Lernen während des Betriebs) und hat keine sicherheitsrelevanten Auswirkungen.

Privacy and data governance

Es werden keinerlei persönliche Daten erhoben, wenngleich die Daten mittels weiterer Techniken oder manuell Personen zugeordnet werden können und damit prinzipiell auch eine indirekte Verletzung der Privatsphäre möglich ist. Um dies zu verhindern ist eine data governance in nutzenden Organisationen erforderlich.

Es werden keinerlei persönliche Daten erhoben, wenngleich die Daten mittels weiterer Techniken oder manuell Personen zugeordnet werden können und damit prinzipiell auch eine indirekte Verletzung der Privatsphäre möglich ist. Um dies zu verhindern ist eine data governance in nutzenden Organisationen erforderlich.

Transparency (Diese Schlüsselanforderung ist direkt eine Konsequenz des ethischen Prinzips Explicability.)

Wie in [10] dargelegt hängt die Transparenz von mehreren Faktoren ab: Erklärbare Algorithmen, Einsicht in den Trainingsdatensatz, Einsicht in die Datensatzauswahl, Erkennen von Mentalen Verzerrungen im ausgewählten Datensatz, Transparenz bzgl. der verwendeten Modellversionen.

Bzgl. word2vec, spaCy ist die Umsetzung dieser Anforderungen mit meinen Zugriffsrechten und meinem Kenntnisstand nicht möglich. Da das Ergebnis jedoch lediglich ein word-embedding darstellt, erscheint mir der potenzielle Missbrauch äußerst gering.

Wie in [10] dargelegt hängt die Transparenz von mehreren Faktoren ab: Erklärbare Algorithmen, Einsicht in den Trainingsdatensatz, Einsicht in die Datensatzauswahl, Erkennen von Mentalen Verzerrungen im ausgewählten Datensatz, Transparenz bzgl. der verwendeten Modellversionen.

Bzgl. Transformator Pipeline und spaCy ist die Umsetzung dieser Anforderungen mit meinen Zugriffsrechten und meinem Kenntnisstand nicht möglich. Da das Ergebnis jedoch lediglich einen Graph darstellt erscheint mir der potenzielle Missbrauch äußerst gering.

Diversity, non-discrimination and fairness

Das AI System nimmt keine wie auch immer geartete Diskriminierung vor: Jedoch könnte durch die entstandene Transparenz im Meinungsspektrum und einer entsprechenden Zuordnung zu Personen, Missbrauch möglich sein.

Das AI System nimmt keine wie auch immer geartete Diskriminierung vor: Jedoch könnte durch die entstandene Transparenz im Meinungsspektrum und einer entsprechenden Zuordnung zu Personen, Missbrauch möglich sein.

Societal and environmental wellbeing

Gesellschaft und Umwelt werden in keiner Form beeinflusst. Sollten solche oder ähnliche Systeme eingesetzt werden ist jedoch zu beachten, dass evtl. die Akzeptanz oder Nicht-Akzeptanz für AI-System steigt. Eine unreflektierte Nutzung ohne ein Minimum an technischer und ethischer Bildung erscheint nicht sinnvoll, da dies mit unbekannten Risiken verbunden sein kann. Man siehe auch die entsprechenden Anforderungen bzgl. Professionalisierung von Teams bzgl. AI und Ethik in [7].

Gesellschaft und Umwelt werden in keiner Form beeinflusst. Sollten solche oder ähnliche Systeme eingesetzt werden ist jedoch zu beachten, dass evtl. die Akzeptanz oder Nicht-Akzeptanz für AI-System steigt. Eine unreflektierte Nutzung ohne ein Minimum an technischer und ethischer Bildung erscheint nicht sinnvoll, da dies mit unbekannten Risiken verbunden sein kann. Man siehe auch die entsprechenden Anforderungen bzgl. Professionalisierung von Teams bzgl. AI und Ethik in [7].

Accountability

Der EU AI Act sieht die Rechenschaftspflicht sehr stark beim Hersteller der AI Systeme. Ich empfehle, dass daneben eine Rechenschaftspflicht der nutzenden Organisation tritt, denn so wie man ein Messer zum Aufschneiden eines Apfels oder alternativ zum Töten eines Menschen benutzen kann, kann man jedes AI System unethisch anwenden.

Der EU AI Act sieht die Rechenschaftspflicht sehr stark beim Hersteller der AI Systeme. Ich empfehle, dass daneben eine Rechenschaftspflicht der nutzenden Organisation tritt, denn so wie man ein Messer zum Aufschneiden eines Apfels oder zum Töten eines Menschen benutzen, kann man jedes AI System unethisch anwenden.

Zusammenfassend stelle ich fest, dass eine ganzheitliche Ethik u.a. im Lichte aktueller AI Entwicklungen notwendig ist, dass ein Mangel an ganzheitlicher Ethik hohe Risiken in sich birgt, und dass der EU AI Act nur ein erster Schritt in diese Richtung ist. Gleichwohl sind die Anforderungen an das Management schon mit der aktuellen Proposal Version des EU AI Act sehr groß.

[1] Stieler W (2022) Hat KI bereits eine Art Bewusstsein entwickelt? Forscher streiten darüber, https://www.heise.de/hintergrund/Hat-KI-bereits-eine-Art-Bewusstsein-entwickelt-Forscher-streiten-darueber-6522868.html , zugegriffen am 22.07.2022

[2] Eisenlauer M (2022) google Entwickler sicher – Künstliche Intelligenz hat eigenes Bewusstsein, https://www.bild.de/digital/computer/computer/hat-googles-kuenstliche-intelligenz-lamda-ein-bewusstsein-entwickelt-80393376.bild.html

[3] Dickson B (2022) Meta’s Yann LeCun on his Vision for human-level AI, TechTalks, https://bdtechtalks.com/2022/03/07/yann-lecun-ai-self-supervised-learning/, zugegriffen am 06.07.2022

[4] Mey S (2022) Künstliche Intelligenz droht im Gespräch „die Menschen auszuschalten“, DerStandard, https://www.derstandard.de/story/2000136591877/kuenstliche-intelligenz-droht-im-gespraech-die-menschen-auszuschalten?ref=rss , zugegriffen am 06.07.2022

[5] Thunström A O (2022) We Asked GPT-3 to Write an Academic Paper about Itself—Then We Tried to Get It Published, Scientific American, https://www.scientificamerican.com/article/we-asked-gpt-3-to-write-an-academic-paper-about-itself-then-we-tried-to-get-it-published/, zugegriffen am 06.07.2022

[6] EU AI Act (2022) https://artificialintelligenceact.eu/, Europe Administration, zugegriffen am 06.07.2022

[7] Blackman R (2022) Ethical Machines: Your concise guide to totally unbiased, transparent and respectful AI, Harvard Business Review Press, kindle edition

[8] European Parliamentary Research Service (2022) Briefing EU AI Act, https://www.europarl.europa.eu/thinktank/en/document/EPRS_BRI(2021)698792

[9] High-Level Expert Group on Artificial Intelligence (2022) ETHICS GUIDELINES FOR TRUSTWORTHY AI, https://ec.europa.eu/futurium/en/ai-alliance-consultation.1.html [10] Schmelzer R (2022) Towards a more transparent AI, Forbes, https://www.forbes.com/sites/cognitiveworld/2020/05/23/towards-a-more-transparent-ai/?sh=725c89d33d93

[10] Schmelzer R (2022) Towards a more transparent AI, Forbes, https://www.forbes.com/sites/cognitiveworld/2020/05/23/towards-a-more-transparent-ai/?sh=725c89d33d93

AI & M 4.0: Collective Mind, Proxies und word embedding

Eine Warnung vorweg: Ich benutzte im Blog Mathematik und AI Techniken, da ich versuche, den Begriff Collective Mind damit besser auszuleuchten. Vielleicht motiviert dies den ein oder anderen Leser, den Blog-Beitrag genau aus diesem Grunde zu lesen.

Der Begriff Collective Mind wurde erstmals 2007 von Jens Köhler und mir, im Zusammenhang mit der Erstellung unseres Buches „Die Collective Mind Methode“, geprägt [1]. Später ist der Collective Mind, als einer der zentralen Begriffe, in Management 4.0 eingegangen.

Wir verstehen unter Collective Mind (CM) einerseits einen kollektiven Flow-Zustand, der für Team oder organisationale Hochleistung steht und andererseits steht er auch für einen Operator, also Modelle und Theorien, der diesen Zustand beschreibt und herbeiführt.

Wir benutzen in der Collective Mind Theorie zwar verschiedene Modelle (Persönlichkeitkeitsmodelle, Wertemodelle, Team-Heterogenitätsmodelle, Kommunikationsmodelle usw.) mit denen wir den Collective Mind herbeiführen; und das funktioniert sehr gut, wie wir in mehr als 15 Jahren Praxis zeigen konnten, jedoch ist es uns bisher nicht gelungen den Flow-Zustand selbst, den Collective Mind, durch ein Modell oder eine Theorie zu beschreiben. Wir arbeiten stattdessen mit Metaphern oder wir verwenden Stellvertretermodelle, kurz Proxies, um ihn zu beschreiben. Diese Proxies sind:

  • Mitwirkungs- und Redezeit: Der CM ist dann besonders stark, wenn alle Teammitglieder nahezu gleichstark mitwirken, also sie zum Beispiel in nahezu allen Teammeetings anwesend sind und ihre Redezeit nahezu gleich verteilt ist.
  • Ähnlichkeit in der Wort- und Bild-Wahl: Der CM ist dann besonders stark, wenn alle Teammitglieder ähnliche Worte und/oder Bilder benutzen, um einen Projektsachverhalt zu beschreiben. – Es findet ein Spiegeln im gesprochenen Wort und im Bild statt.
  • Zufriedenheit: Der CM ist besonders stark, wenn alle Teammitglieder der Arbeit im Team eine sehr hohe Zufriedenheit attestieren und sie das Gefühl haben einen sinnvollen Beitrag zu leisten.
  • Spiegeln der Körpersprache: Der CM ist besonders stark, wenn alle Teammitglieder in ihrer Körpersprache die Köpersprache der anderen spiegeln.

Im Idealfall treffen für ein CM Hochleistungsteam alle diese Proxies gleichzeitig zu.

Diese Stellvertretermodelle können sich auch über die Zeit entwickeln: Zum Beispiel benutzen die Teammitglieder am Anfang völlig unterschiedliche Beschreibungen (Sätze, Bilder), um ein Projektziel oder einzelne Anforderungen zu konkretisieren. Steigt der Collective Mind, werden die Unterschiede geringer. Jedoch kann im Team etwas passieren, das den Collective Mind zerstört oder wieder ins Wanken bringt. Die Unterschiede in den Proxies werden entsprechend wieder größer. Beispiele für solche Ereignisse, die den CM wieder verändern, sind neue Teammitglieder oder wechselhafte Anwesenheiten von Teammitgliedern oder neue Erkenntnisse, die nicht von allen im gleichen Maße gesehen und geteilt werden.

Die Leser dieses Blogs dürften diese empirischen Aussagen bei geneigter Bobachtung in ihren Teams sehr schnell bestätigen. Ich verweise diesbezüglich auch auf das Whitepaper von Armatowski et. al., das anlässlich der IPMA Research Conference zum Thema Selbstorganisation erstellt wurde [2]. – Das Whitepaper skizziert für das Autorenteam den Prozess der Selbstorganisation, also der Ausbildung eines CM’s, während der IPMA Research Hackdays 2020.

Im Bereich der Wissenschaften, insbesondere derjenigen, die Sachverhalte auch mathematisch beschreiben, hat man sich inzwischen weitgehend daran gewöhnt die Realität mit den Proxies für die Realität gleichzusetzen: Zum Beispiel werden elektrische Erscheinungen einem elektrischen Feld E zugeschrieben (Fett gedruckte Buchstaben bezeichnen hier eine sogenannte Vektorgröße, die durch einen Betrag und eine Richtung beschrieben wird). – Wahrscheinlich käme kaum jemand auf die Idee, E als Proxy zu betrachten. – Falls es doch mal durch einen genialen Wissenschaftler geschieht, bringt dieser die Erkenntnis einen Schritt weiter, in dem er die dem Proxy hinterlegten Annahmen radikal hinterfragt.

Alle anderen dürften über Jahrzehnte oder sogar Jahrhunderte hinweg das elektrische Feld E mit der „wahren“ elektrischen Realität gleichsetzen. – Lediglich im Bereich der Quantenmechanik ist diese breite Sicherheit nie so wirklich wahrgeworden. – Die Unterschiede zwischen alltäglicher Erfahrung und quantenmechanischer Beobachtung und den assoziierten Proxies ist nach wie vor zu groß.

Proxies sind also nur Stellvertreter, also Modelle oder Theorien, die unsere Beobachtungen zusammenfassen bzw. abstrahieren. So gesehen ist es sicherlich legitim die obigen Collective Mind Proxies für den „wahren“ Collective Mind zu verwenden. Verwendet man zusätzlich die Mathematik zur Beschreibung, so ergibt sich ein deutlich besseres und erweitertes Verständnis der Zusammenhängen, nicht selten werden Zusammenhänge erst sichtbar. – Eine Aussage, die nach meiner Erfahrung immer gültig ist, vorausgesetzt man berücksichtigt wie auch bei anderen (mentalen) Modellen, dass Proxies nicht zwangsläufig die Realität sind.

Setzt man die mathematische Beschreibung in Technologie, in unserem Fall in Artificial Intelligence Technologie, um, so lässt sich der CM viel besser fassen. Wie wir gleich sehen werden, lassen sich die Collective Mind Proxies in der Praxis gut operationalisieren und gut überprüfen.

Wir führen das mathematische Gebilde „Tensorfeld Collective Mind CM(x,t)“ ein, das vom Ort x und der Zeit t abhängt.

Was verstehe ich darunter?

Im Kontext von Management oder Projekt Management kann man sich sehr gut vergegenwärtigen, dass der Collective Mind wie ein abgeschossener Pfeil eine Richtung haben muss, denn Projektziele oder die Ziele einzelner Personen oder Organisationen werden u.a. durch eine Richtung beschrieben. Er hat auch einen Betrag, nämlich die Energie, die im Team, in der Person oder der Organisation zu diesem Ziel vorhanden ist. Dass der CM sich zeitlich ändern kann, habe ich schon oben erläutert. – Er kann natürlich auch vom Ort abhängen. – Der Collective Mind innerhalb eines (größeren) Teams oder einer Organisation kann durchaus von Ort zu Ort unterschiedlich sein: Verschiedene Sub-Teams eines Teams haben unterschiedliche Collective Minds, verschiedene Sub-Organisationen (Abteilungen) einer Organisation haben wahrscheinlich auch unterschiedliche Collective Minds.

Mit diesen Annahmen setze ich die obigen verbalen Proxies in Mathematik um: Die Aussage „in etwa gleiche Mitwirkungs- und Redezeit“ kann man in Differenzen umsetzen, indem wir die Redezeiten jeder Person mit jeder anderen Person vergleichen. Es entsteht eine Matrix, oder allgemeiner ein Tensor oder Tensorfeld. – Die bekannteste google AI/ML Plattform auf der Basis neuronaler Netzwerk heißt tensorflow, weil Tensoren durch das Netzwerk aus künstlichen Neuronen fließen [3].

Auch die Ähnlichkeit in der Wortwahl kann man durch Differenzen darstellen. Die Differenzen in der Wortwahl bilden ebenfalls ein Orts- und Zeit-abhängiges Tensorfeld.

Auf der Basis der obigen verbalen Proxies führen wir eine mathematische Form für den Operator des Collective Minds, CMO(x,t) (das hochgestellte O steht für Operator), ein:  

CMO(x, t) ~ proxyCMO(x, t) = SO(x, t)*MO(x,t)

Diese Gleichung drückt aus, dass wir annehmen, dass das „unbekannte Wesen“ CMO(x, t) näherungsweise durch einen proxyCMO(x,t) beschrieben werden kann; und dass zwei Faktoren – nach jetziger Erkenntnis – diesen proxyCMO(x,t) bestimmen. Ich habe Faktoren gewählt, um auszudrücken, dass im Idealfall alle zwei Faktoren, SO und MO, vorhanden und groß sein müssen, um einen großen CMO(x,t) zu erhalten.

SO(x,t) = Similarity: Dieser Faktor “misst” Mitwirkungs- und Redezeit sowie Wortähnlichkeit (Ähnlichkeiten in Bildern berücksichtigen wir der Einfachheit wegen hier nicht). Wir können diese beiden Proxies gut in einer Größe zusammenfassen: Wählen wir SO(x,t) geeignet, so kann SO(x,t) nur dann eine hohe Similiarity ausweisen, wenn man gleich große Text – oder Redeblöcke miteinander vergleicht und dies kann nur dann der Fall sein, wenn die Teammitglieder in etwa gleich lange anwesend sind und gleichlange sprechen.

MO(x,t) = Mood: Dieser Faktor misst die Stimmung, die Zufriedenheit im Team oder in der Organisation. Dieser Faktor schließt auch die Häufigkeit und Intensität des körperlichen Spiegelns ein.

Ob man mehrere Faktoren benötigt, ist mir zurzeit noch nicht klar, denn SO kann nur dann hoch sein, wenn MO hoch ist. – Nur zufriedene Teammitglieder reden in etwa gleich viel mit einer ähnlichen (spiegelnden) Kommunikation in Sprache und Körper. – Jedoch könnte man Unterschiede zwischen Körpersprache und gesprochenem Wort benutzen, um Dysfunktionalitäten aufzudecken. Hierzu wäre eine entsprechende visuelle AI notwendig und dies geht in jedem Fall weit über diesen Blog hinaus.

Ich tue jetzt mal so, als wenn einige Jahrzehnte verstrichen seien und wir uns wie beim elektrischen Feld E daran gewöhnt hätten, Proxy und Realität gleichzusetzen:  Wir setzen also in der obigen Gleichung CMO und proxyCMO gleich und wir nehmen der Einfachheit wegen an, dass die Similarity genügt, um den CMO zu beschreiben:

CMO(x, t) = SO(x, t)

SO(x, t) ist eine symmetrische Matrix deren Elemente Sij(x,t) Differenzen von zwei Vektoren sind, nämlich die Differenz zwischen dem Wortanteil und der Wortwahl des Teammitgliedes i und derjenigen des Teammitgliedes j. Wortanteil und Wortwahl jedes Teammitgliedes werden durch einen Vektor in einem verbalen Raum ausgedrückt.

Jetzt müssen wir „nur noch“ einen geeigneten Operator SO(x,t) finden, der in einem verbalen Raum Vektoren aufspannt. – Ohne die Fortschritte in AI/ML wäre hier das Ende meiner Ausführungen erreicht. – Die enormen Fortschritte in der Verarbeitung der natürlichen Sprache mittels AI/ML, also dem AI/ML-Teilgebiet NLP (Natural Language Processing), machen es mir möglich, weiterzukommen.

Im Jahre 2013 wurde die fundamentale Idee veröffentlicht, Text bzw. Worte in Vektoren zu transferieren: Es werden Worte in einen Vektorraum eingebettet. Deshalb nennt man diese Technik auch word embedding. Word embedding wird auch mit dem Namen der wahrscheinlich bekanntesten AI/ML NLP Bibliothek „word2vec“ von google gleichgesetzt. [4, 5]. Jedem Wort wird hierzu ein token, eine Zahl, zugeordnet und dieses token wird in einen hochdimensionalen Raum, typischer Weise mit 300 Dimensionen! eingebettet [6, 7, 8]. Die hohe Dimension des (Wort-) Raumes erlaubt es, Worte nach 300 Dimensionen zu differenzieren. Das Verblüffende ist, dass Neuronale Netzwerke, die mittels Texten trainiert werden, die Worte eines Textes nicht beliebig in diesem Raum verteilen, sondern gemäß Sinn, wie wir ihn auch wahrnehmen. Man kann dann sogar mit diesen Wortvektoren „rechnen“, z.B. König-Mann+Frau = Königin. Dieses Rechen hat auch dazu geführt, dass man Vorurteile und Diskriminierungen in Datensätzen aufgedeckt hat, also z.B. Arzt-Mann+Frau = Krankenschwester. – Wohlgemerkt, Datensätze die unsere diskriminierende Realität beschreiben.
Wer sich von der hinterlegten Technik beeindrucken lassen möchte, den verweise ich auf die word embedding Illustration von tensorflow [9]. 

Dies word embedding ist für mich eine mehr als nur erstaunliche Erfahrung. – Sie  stützt einen meiner wichtigsten Glaubenssätze: „Das Sein unterscheidet nicht zwischen belebt und unbelebt, oder zwischen bewusst und unbewusst, wir treffen überall auf die gleichen fundamentalen Prinzipien, auch wenn deren Erscheinungen  auf den ersten Blick sehr unterschiedlich sein mögen.“

Eine der bekanntesten NLP Bibilotheken, die word2vec Funktionalität integriert, ist spaCy [10]. Ich benutze spaCy, um SO(x, t) an einem einfachen Beispiel zu berechnen. Ich lehne mich an Beispiele aus [11] an und zeige im Folgenden den Code wie er in einem Jupyter Notebook [12] in der google Colab-Umgebung [13] lauffähig ist. Zunächst eine kleine Illustration von word embedding:

pip install spacy

!python -m spacy download en_core_web_md

import en_core_web_md

nlp = en_core_web_md.load()

vocab =nlp(‚cat dog tiger elephant bird monkey lion cheetah burger pizza food cheese wine salad noodles macaroni fruit vegetable‘)

words = [word.text for word in vocab]

vecs = np.vstack([word.vector for word in vocab if word.has_vector])

pca = PCA(n_components=2)

vecs_transformed = pca.fit_transform(vecs)

plt.figure(figsize=(20,15))

plt.scatter(vecs_transformed[:,0], vecs_transformed[:,1])

for word, coord in zip(words, vecs_transformed):

  x,y = coord

  plt.text(x,y, word, size=15)

plt.show()

Unter Anwendung des obigen Codes wird folgendes Bild erzeugt:

Abbildung 1: 300-dimensionales Wortvektor-Modell projiziert auf 2 Dimensionen

Ich gehe nicht auf die Details des Code-Beispiels ein, lediglich einige Hinweise, um das Wesentliche des Blogbeitrags zu erfassen: Ich benutze ein vortrainiertes englisches Vektormodell „en_core_web_md“ und übergebe diesem einige englische Worte ‚cat dog tiger elephant bird monkey lion cheetah burger pizza food cheese wine salad noodles macaroni fruit vegetable‘, die das vortrainierte Modell in einem 300-dimensionalen Vektorraum verortet. Um diese Verortung darstellen zu können, wird die Verortung mit der mathematischen Technik PCA auf zwei Dimensionen in der Abbildung 1 projiziert. – Dadurch kommt es zu visuellen Überlappungen, wie man im Bild sehen kann. Auch erkennt man sehr schön, dass das vortrainierte Modell gemäß der Bedeutung der Worte Bedeutungscluster gebildet hat.

Wenden wir uns jetzt der Similarity zu, indem wir die Similarity von Vektoren berechnen:

Abbildung 2: Zwei übliche Definitionen von Wort Similarity

Abbildung 2 erläutert die beiden gebräuchlichen NLP Similarities. Word2vec verwendet hierbei lediglich die Cosine-Similarity. Werden ganze Sätze oder Texte auf Similarity geprüft „misst“ word2vec die Ähnlichkeit der Texte über Mittelwertbildung der beteiligten Vektoren bzw. Worte.

Die damit verbundenen Ergebnisse sind verblüffend, wie das nachfolgende einfache Beispiel zeigt:

doc1 = nlp(‚I visited England.‘)

doc2 = nlp(‚I went to London‘)

doc1.similarity(doc2)

Die Cosine-Similarity liegt für dieses Beispiel bei sα = 0,84. Die Similarity wird von word2vec auf den Bereich 0 bis 1 normiert (Anm.: Die Similarity könnte auch zwischen -1 und 1 liegen, was für unsere Betrachtung besser geeignet wäre).

Jedoch… die Euclidean-Similarity, berechnet mittels des Codes aus [14], ergibt eine sehr geringe Similarity von sr = 0,08.

D.h. Die Wordvektoren zeigen zwar in die gleiche Richtung liegen aber in völlig unterschiedlichen Raumbereichen des 300-dimensionalen Wortvektorraumes. – Beide Aussagen sind also nicht identisch, haben jedoch eine hohe Bedeutungs-Affinität.

Ein anderes Beispiel: Ich möchte die Similarity von zwei Texten aus unserem Buch Management 4.0 [15] vergleichen: Ich vergleiche eine Kurzfassung der Management 4.0 Definition mit der Langfassung der Definition:

doc1 = nlp(‚With a systemic leadership approach, Management 4.0 provides the guiding competence for viable learning organizations in complex situations and environments. Management 4.0 integrates an Agile Mindset, the universal principle of self-organization as a governance guideline, and relevant work techniques, for sustainable working models of the future.‘)

doc2 = nlp(‚We understand Agile Management as a leadership and management practice, to be able to act in an agile and proactive way in a complex environment characterized by uncertainty.  It is described as an Agile Mindset with a focus on: leadership for which self-leadership is the basis; leadership, which is based on a respect for basic human needs; leadership, which demands an understanding of complex systems and promotes their regulation through iterative procedures; people who self-organize in teams; fluid organizations, which promote adaptable and fast delivery of useful results and create innovative customer solutions through proactive dealing with changes‘)

Das Ergebnis für die Cosine-Similarity, von word2vec, ist wieder verblüffend:

doc1.similarity(doc2)

sα = 0,97

Die Euclidean-Similarity berechnet mit dem Code aus [14] ergibt sr = 0,46. Also verglichen mit der Similarity aus dem vorherigen Beispiel sehr hoch.

Auf der Basis dieser Beispiel-Daten kann ich einen Beispiel Similarity-Operator angeben: Wir nehmen der Einfachheit wegen an, dass die obigen beiden Texte aus dem Management 4.0 Buch von zwei Personen gesprochen wurden. Damit ergibt sich der Collective Mind Operator dieser beiden Personen zu:

SO(x, t) ist eine symmetrische 2*2 Matrix (ich bitte darum, kleine farbliche Unsauberkeiten in der Formeldarstellung zu übersehen, hier bei sα): Die Nicht-Diagonal Elemente sind hier keine einfachen Skalare, sondern bilden jeweils einen Vektor in einem Similarity Raum. Da wir mit überschaubarer Mathematik (d.h. einfacher Matrizenrechnung) weiterkommen wollen, wandeln wir diese Vektoren in Skalare um. Die einfachste Weise, dies zu tun, ist sr(x,t) nicht zu berücksichtigen und die resultierende Größe als Skalar anzusehen. Ich könnte auch die Länge des Similarity-Vektors in die obige Matrix einsetzen. – Der Vektorbetrag wäre dann so etwas wie eine integrierte Similarity. – Das Weglassen von sr(x,t) hat im Rahmen dieser Vereinfachungen keinen wesentlichen Einfluss auf die nachfolgenden Ausführungen.

Damit ergibt sich:

Man kann diese Matrix auch als sogenannte Heat Matrix darstellen, in dem die Similarities farblich codiert werden: Dies wurde in [16] benutzt, um die Similarity der Reden deutscher Politiker visuell darzustellen.

Wir haben bisher zwar einen Operator für den CM definiert, jedoch den CM selbst nicht ermittelt. Dies tue ich jetzt:

Für den Operator CMO(x, t) können wir sogenannte Eigenwerte und Eigenvektoren berechnen. Eigenvektoren sind diejenigen Vektoren, die unter der Anwendung des Operators lediglich ihren Betrag verändern, jedoch ihre Richtung beibehalten. Die Veränderung des Betrages bei Anwendung des Operators wird Eigenwert genannt. Den größten Eigenwert und dessen zugehörigen Eigenvektor assoziiere ich mit dem Collective Mind Vektor CMvektor dieser beiden kommunizierenden Personen (es gibt noch einen zweiten Eigenwert und Eigenvektor, der aber hier (wahrscheinlich) keinen Sinn machen):

Das Internet stellt auch für solche Berechnungen eine App zur Verfügung [17]. Der Vektor CM bekommt damit folgende mathematische Gestalt:

Der Eigenvektor liegt also auf der „Diagonalen zwischen zwei Personen“ und hat einen Eigenwert der größer als 1 und maximal 2 ist. Die Mathematik spiegelt mein Verständnis eines CM wider. Deshalb sage ich: „Gar nicht schlecht für den Anfang 😉, jedoch werden Synergieeffekte (d.h. Eigenwerte größer 2) und Effekte des gegenseitigen Blockierens (d.h. Eigenwerte kleiner 1) nicht abgebildet. Letzteres hängt auch damit zusammen, dass die word2vec Similarity per Definition nicht kleiner Null ist.

In unserem Beispiel ist der Eigenvektor und der Eigenwert statisch, da die Similarity keine explizite Zeitabhängigkeit enthält. Im Allgemeinen ist die Similarity eine  zeit- und ortsabhängige Größe. Damit werden die Berechnungen viel aufwendiger, unterscheiden sich jedoch nicht von den einfachen Ausführungen hier.

Es ist also möglich Zeitscheiben zu definieren, in denen eine AI synchron in Teammeetings die Gespräche aufnimmt, die Gespräche transkribiert und dann wie hier geschildert (und evtl. mit weiteren AI Techniken) die Similarity berechnet. Die Darstellung der Similarity als Zeitreihen und des zeitlichen Verlaufes des Vektors CM könnte als Feedback-Mechansimus eingesetzt werden, um eine Teamreflexion zu unterstützen. – Die AI übernimmt damit eine „Coaching“ Funktion. – Dieser Blog-Beitrag skizziert also die Ausgestaltung der AI-Anwendung Collective Mind im IPMA Kompetenz Bereich Teamarbeit, aus meinem Dezember 2021 Blog-Beitrag.

[1] Köhler J, Oswald A. (2009) Die Collective Mind Methode, Projekterfolg durch Soft Skills, Springer Verlag

[2] Armatowski S., Herrmann P., Müller M., Schaffitzel N., Wagner R (2021) The importance of Mindset, Culture and Atmosphere for Self-Organisation in Projects, White Paper IPMA, erstellt anläßlich der IPMA Research Conference 2020

[3] tensorflow (2022) tensorflow.org, zugegriffen am 16.04.2022

[4] google (2022) word2vec, https://code.google.com/archive/p/word2vec/, zugegriffen am 16.04.2022

[5] Wikipedia (2022) word2vec, https://en.wikipedia.org/wiki/Word2vec, zugegriffen am 16.04.2022

[6] Karani D (2022) Introduction to Word Embedding and Word2Vec, https://towardsdatascience.com/introduction-to-word-embedding-and-word2vec-652d0c2060fa, zugegriffen am 20.04.2022

[7] Megret P (2021) Gensim word2vec tutorial,  https://www.kaggle.com/pierremegret/gensim-word2vec-tutorial , zugegriffen am 20.04.2022

[8] Delaney J (2021) Visualizing Word Vectors with t-SNE, https://www.kaggle.com/jeffd23/visualizing-word-vectors-with-t-sne/notebook , zugegriffen am 20.04.2022

[9] word embedding playground (2022) http://projector.tensorflow.org/

[10] Spacy (2022) https://spacy.io/models/de, zugegriffen am 20.04.2022

[11] Altinok D (2021) Mastering spaCy, Verlag Packt, kindle edition

[12] Jupyter Notebooks (2021) https://jupyter.org/, zugegriffen am 02.12.2021

[13] Colab (2021) https://colab.research.google.com/

[14]   NewsCatcher Engineering Team (2022) https://newscatcherapi.com/blog/ultimate-guide-to-text-similarity-with-python, zugegriffen am 20.04.2022

[15] Oswald A, Müller W (2019) Management 4.0 – Handbook for Agile Practices, Verlag BoD, kindle edition

[16] Timmermann T (2022) https://blog.codecentric.de/2019/03/natural-language-processing-basics/, zugegriffen am 20.04.2022

[17]   Виктор Мухачев (2022) https://matrixcalc.org/de/, zugegriffen am 20.04.2022   

AI & M 4.0: Hybrid Collective Intelligence in Organisation und Gesellschaft

Dieser Blogbeitrag ergänzt meinen vorherigen Blogbeitrag, insbesondere die dort gelisteten Kernaussagen des Buches „The Age of AI: And Our Human Future“ des ehemaligen amerikanische Außenminister Kissinger sowie des ehemaligen google CEO Schmidt und des MIT Professor Huttenlocher [1].

Hybrid (Collective) Intelligence liegt vor, wenn unsere menschliche (kollektive) Intelligenz durch die (kollektive) Intelligenz von Artificial Intelligence ergänzt wird und sich damit eine Erweiterung der Wahrnehmung unserer Realität ergibt, so dass wir komplexe Fragestellungen beantworten können, die wir ohne AI nicht oder nur mit deutlich größerem Aufwand beantworten könnten. Diese Definition lehnt sich an diejenige in [2] an.

Hybrid (Collective) Intelligence führt insbesondere für das Projekt Management zu drei zentralen Veränderungen:

  • Der Innovationsprozess wird sich substanziell verändern, da ein oder mehrere AI Systeme den F&E Suchraum allein oder in Zusammenarbeit mit Menschen erheblich erweitern und verändern werden [3].
  • Das (Projekt) Management hat zu berücksichtigen, dass Aufgaben zwischen Mensch und AI, alleine oder zusammen, zu verteilen sind. – Entscheidungsprozesse werden sich in dieser Zusammensetzung erheblich verändern [4]. – Man siehe hierzu auch die Liste an AI/ML Erweiterungen im letzten Blog-Beitrag.
  • AI Systeme werden in nahezu alle Projektlösungen einfließen und damit wird AI zur Kernkompetenz in der Projektarbeit. Gleichzeit sind die Auswirkungen der AI Projektlösungen für die Stakeholder, die Gesellschaft und die Natur zu berücksichtigen.

Ich verwende als Definition von Intelligenz eine recht unübliche Definition, die meines Erachtens aber umso treffender ist. Diese Definition wurde wohl erstmals von Alex Wissner-Gross vorgeschlagen [5, 6]: “Intelligence is the ability to maximize future options in order to accomplish complex tasks.” – Diese Definition lässt sich u.a. in eine mathematische Gleichung übersetzen und ist universell auf alle Objekte (belebte, unbelebte, soziale) anwendbar. Im Kontext von AI bedeutet dies zum Beispiel, dass eine AI zur Natural Language Processing (NLP) nicht nur die trainierten Texte oder recht ähnliche in Frage-Antwort Situationen wiedererkennt, sondern die Flexibilität besitzt auch Fragen zu beantworten, die nicht genau den trainierten Fragen entsprechen. Neben der neuronalen Architektur des Neuronalen Netzwerkes wird dies vor allem durch die vielen Parameter-Freiheitsgrade erreicht. – Die Freiheitsgrade von State-of-The-Art AI NLP Systemen umfassen aktuell mehrere 100 Million Parameter.

Die Fähigkeit zukünftige Optionen zu maximieren, ist also die Fähigkeit Freiheit bzw. freies Handeln unter antizipierten zukünftigen Randbedingungen zu maximieren. Falls wir nicht wollen, dass die AI „ihre Freiheit“ (in Zukunft) auf Kosten unserer Freiheit maximiert, ist es notwendig, Randbedingungen für sie zu setzen. Dies bedeutet die Einführung einer Governance für Hybride (Collective) Intelligence (kurz HCI Governance), die zudem adaptiv, also in einem PDCA-Zyklus, in die Zukunft fortzuschreiben ist.
Die Einführung einer HCI Governance wird umso notwendiger, je mehr sich die AI von einer schwachen AI zu einer starken (und allgemeinen) AI oder Superintelligenz entwickelt [7, 8]. – Die genaue Verortung des aktuellen Intelligenzgrades der AI-Systeme und deren zukünftiger Entwicklung ist jedoch nicht wesentlich, denn wir wissen heute schon, dass eine HCI Governance Not tut, da neben den Segnungen der Realitätserweiterungen durch AI auch schon Freiheitseinschränkungen (u.a. Diskriminierungen, fake news, Beeinflussung von demokratischen Wahlen) durch AI aufgetreten sind.

Peeters et al. haben unlängst in ihrem sehr lesenswerten Artikel „Hybrid Collective Intelligence in a Human-AI Society“ drei verschiedene Basis-Haltungen zum Umgang mit AI identifiziert [9]:

  • Technology-centric perspective
  • Human-centric perspective
  • Collective-Intelligence perspective

Das Bemerkenswerte ihrer Analyse, die durch das niederländische Verteidigungsministerium gesponsort wurde, ist, dass sie für jede dieser Haltungen (im Artikel sprechen sie von „perspectives“) Glaubenssysteme und dazugehörige Kontexte identifiziert haben. – Also ganz im Sinne von Management 4.0.

Ich nenne hier, als Beispiel, nur jeweils einen Glaubenssatz pro Haltung:

  • Technology-centric perspective: “When sufficiently developed, AI technology can applied to solve any problem.”
  • Human-centric perspective: “Artificial intelligence only exhibits part of human cognition and is therefore insufficient for many real-world problems.”
  • Collective-intelligence perspective: “Intelligence should not be studied at the level of individual humans or AI-machines, but at the group level of humans and AI-machines working together.”

In [10] werden die EU-Haltung und die USA-Haltung miteinander verglichen: Die EU-(Administrations-)Haltung ist tendenziell eine human-centric perspective und die USA-Haltung ist tendenziell eine technology-centric perspective. – Hieraus erklären sich u.a. die diversen Bestrebungen der EU-Administration amerikanische AI-Konzerne wie google, meta/facebook, apple und amazon durch Gesetze und Strafen zu regulieren.  

Mit Hilfe dieser drei Basis-Haltungen bzw. -Perspektiven zur AI lässt sich auch die Grundhaltung in [1] beschreiben: Sie ist tendenziell eine human-centric perspective ergänzt um die technology-centric perspectice und die collective-intelligence perspective. Im Wissen um diese, aber insbesondere auch wegen der in den USA vorherrschenden technology-centric perspective, fordern die Autoren eine Regulation der AI, also die Einführung einer Governance für AI Systeme. Dies ist umso wichtiger, da auf der Basis der technology-centric perspective schon heute weltweit AI gestützte Waffensysteme entwickelt und genutzt werden.

Berühmte Vertreter der technology-centric perspective in den USA sind Peter Kurzweil [11] und die mit ihm verbundene Singularity University [12]. – Ein Kennzeichen dieser Haltung ist der Glaube, dass in absehbarer Zukunft, im Jahre 2045, die Fähigkeiten der AI diejenigen der Menschheit übersteigen werden.

In [9] wird betont, dass keine der obigen Basis-Haltungen richtiger oder besser ist, sondern dass der Kontext die Basis-Haltung bestimmen sollte. – Was leider nur selten geschieht. – In [13] wird die zentrale Bedeutung der Reflexion und der kritischen Auseinandersetzung mit dem sozialen Kontext, also den aktiven Werten, Glaubensätzen und Prinzipien für das Design, die Implementierung und die Operationalisierung von AI Systemen diskutiert. Falls die Metakompetenz für diese (Selbst-) Reflexion und kritische Auseinandersetzung nicht vorhanden ist, wird eine AI Ethik nicht angenommen und damit auch nicht verantwortungsvoll umgesetzt. In [14] habe ich die “Forderung” aufgestellt, dass Projekte mit hoher Komplexität, eine türkis/teal Kultur benötigen: “Ideally, this requires a mindset of all key stakeholders that also contains red, blue and orange value meme components (red means power orientation, blue means control and order orientation, and orange means entrepreneurship and linear-scientific-thinking orientation), but is mainly shaped by the transformational value meme components, namely green (compassion), yellow (nonlinear networked system thinking) and teal (holistic-transcendental orientation).” Alle Teammitglieder und insbesondere der Projektleiter sollten über die Metakompetenz verfügen, ihre eigenen Werte und Glaubenssätze im jeweiligen Kontext kritisch zu hinterfragen, um bewusst AI Systeme ethisch verantwortungsvoll zu designen, zu implementieren und zu operationalisieren.  

Meine persönlich präferierte Basis-Haltung ist die collective-intelligence perspective. Wenn ich AI Systeme erstelle liegt meine Haltung hingegen eher auf der technology-centric perspective und im Schreiben dieses Blog-Beitrages eher auf der human-centric perspective.    

Schaut man sich die Definitionen für AI der großen AI-Konzerne an, so lassen diese eine recht eindeutige AI-Haltung der jeweiligen Autoren erkennen:

IBM: “Artificial intelligence leverages computers and machines to mimic the problem-solving and decision-making capabilities of the human mind.” [15]: technology-centric perspective

Microsoft (deutsch): „Unter künstlicher Intelligenz (AI) verstehen wir Technologien, die menschliche Fähigkeiten im Sehen, Hören, Analysieren, Entscheiden und Handeln ergänzen und stärken.“ [16]: collective-intelligence perspective

Microsoft (amerikanisch): “Artificial intelligence (AI) is the capability of a computer to imitate intelligent human behavior. Through AI, machines can analyze images, comprehend speech, interact in natural ways, and make predictions using data.” [17]: technology-centric perspective. – Die Microsoft AI Internetseite [18] „AI for Good“ zeigt hingegen eine eher human-centric oder collective-intelligence perspective.

Google CEO: “At its heart, AI is computer programming that learns and adapts. It can’t solve every problem, but its potential to improve our lives is profound. At Google, we use AI to make products more useful—from email that’s spam-free and easier to compose, to a digital assistant you can speak to naturally, to photos that pop the fun stuff out for you to enjoy.” [19]: collective-intelligence perspective

Die Internetseite von google [20] und diejenige von meta/facebook [21] lassen eine Mischung aus technology-centric- und collective-intelligence-perspective erkennen.

Die OECD hat im Jahre 2019 ihr Dokument „Artificial Intelligence in Society“ vorgelegt, und definiert dort ihre human-centric perspective, die sie auch so nennt [22]: Hiernach müssen AI Systeme u.a. Menschenwürde und -rechte sowie die Demokratie gewährleisten, indem sie u.a. transparent, nachvollziehbar, vertrauenswürdig, sicher und steuerbar sind und bleiben. – Eine gestaltende Auseinandersetzung mit dem sozio-technischen System Mensch-Künstliche Intelligenz, im Sinne des Designs einer Governance, findet jedoch nicht statt.

Eine ähnliche Aussage ergibt sich für Deutschland: In [23] werden unter dem Titel „The making of AI Society: AI futures frames in German political and media discourses” die sogenannten „AI future frames“ für Deutschland untersucht. – AI future frames sind mentale Rahmen, in denen die AI Zukunft gesetzt wird. Das Ergebnis ist eher ernüchternd: „By mirroring the past in the future, alternative future visions are excluded, and past and current assumptions, beliefs, and biases are maintained. Despite the allegedly disruptive potential of emerging AI.” Hiernach denkt die deutsche Politik die neoliberale Politik der letzten Jahrzehnte unter dem Label „AI Made in Germany“ oder AI German einfach fort: „successful innovation = welfare generating future = political stability“. Die Lippenbekenntnisse der deutschen politischen Administration bis zur Wahl 2021 sind human-centric; im Tun überlassen sie die AI Governance dem Markt und eine AI Ethik explizit den deutschen Industrieunternehmen. – Eine entsprechende politische Governance, die den zentralen Aussagen in [1] Rechnung trägt, gibt es nicht. – Eine Einbettung in eine europäische AI Strategie fehlt völlig!

Die EU Kommission hat letztes Jahr in [24] einen Vorschlag für ein Regulationspapier erstellt, das in erster Linie als harmonisierende Referenz für die EU Administration dienen soll: Ein seitenstarkes Papier mit vielen Details; ich vermisse mal wieder ein Großes Bild, das zu einem Collective Mind in der EU (Administration) führen könnte. 

Wie könnten die Eckpfeiler eines Großen Bildes einer AI bzw. HCI Governance aussehen? Hier ein Vorschlag:

Rahmenparameter:

Landesspezifische AI Governance Systeme sind in eine europäische AI Governance eingebettet. – Die Strukturen der AI Governance sind auf allen europäischen Ebenen ähnlich. – Die (europäische) AI Governance folgt in ihrer Struktur einer Ziel-Hierachie: Vom Großen Bild zum Detail. Der transformative Charakter der AI Governance ist in die Governance einer ökologisch-ökonomischen Transformation (u.a. Nachhaltigkeit für Natur, Tier und Mensch, hin zu einer an sozialer Gerechtigkeit und Gleichheit orientierten Ökonomie, die Wachstum nicht als Allheilmittel verkauft) eingebettet

Kontrollparameter:

Die Kontrollparameter orientieren sich an den zentralen Aussagen aus [1]: Eine europäische AI Ethik und Gesetzgebung sorgt für eine Regulation der AI Freiheiten. Die AI Ethik und Gesetzgebung wird von der Politik gestaltet. Z.B. heißt dies, dass der Wert AI Transparenz politisch definiert wird und gesetzlich verankert wird.- Dies könnte zum Beispiel heißen, dass AI Systeme in Europa vor staatlichen Organen nach Bedarf offengelegt werden müssen.

Da AI Systeme unsere Welt transformieren, ist es notwendig dafür zu sorgen, dass die Schere zwischen AI-Wissenden und AI-Nichtwissenden nicht zu einer Verschärfung von Ungleichheit führt. Ein entsprechendes Bildungskonzept ist notwendig: AI gehört als Pflichtfach in die Schulen und AI gehört in die Curricula aller universitären Disziplinen.

Ordnungsparameter:             

Als Großes Bild für den Ordnungsparameter schlage ich vor „European Ecosystem for Hybrid Collective Intelligence“. Die Ausgestaltung dieses Großen Bildes heißt u.a. dass neben einer gemeinsamen europäischen AI Governance eine gemeinsame AI Infrastruktur aufgebaut wird. – Es werden Mechanismen bereitgestellt, die das Silo-Denken und -Handeln von Industrie und politischen Administrationen auflösen. U.a. wird eine „AI für Jedermann“ aufgebaut und die die obigen drei Sichten human-centric, technology-centric und collective intelligence integriert: Die sozio-technische HCI Integration wird also bewusst europäisch gestaltet.  

 

[1] Kissinger H A, Schmidt E, Huttenlocher D (2021) The Age of AI: And Our Human Future, kindle edition
[2] Dominik Dellermann, Adrian Calma, Nikolaus Lipusch, Thorsten Weber, Sascha Weigel, Philipp Ebel (2021) The future of human-AI collaboration: a taxonomy of design knowledge for hybrid intelligence systems, arXiv.org > cs > arXiv:2105.03354
[3] Dragos‑Cristian Vasilescu, Michael Filzmoser (2021) Machine invention systems: a (r)evolution of the invention process?, Journal AI & Society, January 2021
[4] Phanish Puranam (2021) Human–AI collaborative decision‑making as an organization design Problem, Journal of Organization Design (2021) 10:75–80
[5] Alex Wissner-Gross (2022) A new equation for intelligence, https://www.youtube.com/watch?v=auT-pA5_O_A, march 2020, zugegriffen am 07.02.2022
[6] Ron Schmelzer (2022) https://www.forbes.com/sites/cognitiveworld/2020/02/27/cant-define-ai-try-defining-intelligence/?sh=6f658a955279, Forbes Blog February 2020, zugegriffen am 07.02.2022
[7] Bernard Marr (2022) The Key Definitions Of Artificial Intelligence (AI) That Explain Its Importance, Forbes Blog February 2018, https://www.forbes.com/sites/bernardmarr/2018/02/14/the-key-definitions-of-artificial-intelligence-ai-that-explain-its-importance/?sh=219cbb1f4f5d , zugegriffen am 07.01.2022
[8] Wikipedia (2022) Artificial Intelligence, https://en.wikipedia.org/wiki/Artificial_intelligence, zugegriffen am 07.02.2022
[9] Peeters M M M, van Diggelen J, van den Bosch K, Bronhorst A, Neerinex M A, Schraagen J M, Raaijmakers S (2021) Hybrid Collective Intelligence in a Human-AI Society, in AI & Society Journal, March 2021
[10] Roberts H, Cowls J, Hine E, Mazzi E, Tsamados A, Taddeo M, Floridi L (2021) Achieving a ‘Good AI Society’: Coparing the Aims and Progress of the EU and the US, SSRN Journal, January 2021
[11] Kurzweil R (2022) https://www.kurzweilai.net/, zugegriffen am 07.02.2022
[12] Singularity University (2022) https://www.su.org/ , zugegriffen am 07.02.2022
[13] Krijger J (2021) Enter the metrics: critical theory and organizational operationalization of AI ethics, Journal AI & Society, September 2021
[14] Oswald A (2022) The Whole – More than the Sum of Its Parts! Self-Organization – The Universal Principle! in Ding R, Wagner R, Bodea CN (editors) Research on Project, Programme and Portfolio Management – Projects as an Arena for Self-Organizing, Lecture Notes in Management and Industrial Engineering, Springer Nature
[15] IBM (2022) Artificial Intelligence, https://www.ibm.com/cloud/learn/what-is-artificial-intelligence, zugegriffen am 07.02.2022
[16] Microsoft (2022) Künstliche Intelligenz, https://news.microsoft.com/de-at/microsoft-erklart-was-ist-kunstliche-intelligenz-definition-funktionen-von-ki/, zugegriffen am 07.02.2022
[17] Microsoft (2022) Artificial Intelligence Architecture, https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/ai-overview, zugegriffen am 07.02.2022
[18] Microsoft (2022) AI for Good, https://www.microsoft.com/en-us/ai/ai-for-good, zugegriffen am 07.02.2022
[19] Sundar Pichai (2022) AI at Google: our principles, https://www.blog.google/technology/ai/ai-principles/, Blog of CEO google, june 2018, zugegriffen am 07.02.2022
[20] Google (2022) Google AI: Advancing AI for everyone, https://ai.google/, zugegriffen am 07.02.2022
[21] Meta AI (Facebook) (2022) Bringing the world closer together by advancing AI, https://ai.facebook.com/, zugegriffen am 07.02.2022
[22] OECD (2019) Artificial Intelligence in Society, Online Version, https://www.oecd-ilibrary.org/sites/eedfee77-en/index.html?itemId=/content/publication/eedfee77-en&_csp_=5c39a73676a331d76fa56f36ff0d4aca&itemIGO=oecd&itemContentType=book
[23] Köstler L, Ossewaarde R (2020) The making of AI Society: AI futures frames in German political and media discourses, in AI & Society Journal, February 2021, Springer Nature
[24] Europäische Kommission (2021) Proposal for a REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL LAYING DOWN HARMONISED RULES ON ARTIFICIAL INTELLIGENCE (ARTIFICIAL INTELLIGENCE ACT) AND AMENDING CERTAIN UNION LEGISLATIVE ACTS, https://eur-lex.europa.eu/legal-content/EN/ALL/?uri=CELEX:52021PC0206, zugegriffen am 07.02.2022

AI & M 4.0: Zur Erweiterung unserer Intelligenz und Realität durch Machine Learning (ML) und Artificial Intelligence (AI) im Management 4.0

Der ehemalige amerikanische Außenminister Kissinger sowie der ehemalige Google CEO Schmidt und der MIT Professor Huttenlocher haben zusammen vor ein paar Tagen ein bemerkenswertes Buch zu unserer Zukunft im Zeitalter der künstlichen Intelligenz herausgebracht. – Ich nenne wesentliche Aussagen dieses Buches [1]:

  • Machine Learning (ML) und Artificial Intelligence (AI) basieren auf völlig anderen Prinzipien als „klassische“ Software: Im Rahmen vorgegebener Selbstorganisations-Parameter (und Daten) organisiert sich eine AI selbst. – Sie bildet durch Training Modelle zu den eingegebenen Daten, also der ausgewählten Realität, ab. – Diese Modelle sind nicht perfekt, sie liefern Wahrscheinlichkeitsaussagen. – Und damit haftet diesen Modellen unmittelbar Unsicherheit an! – Gar nicht so unähnlich unserer Intelligenz!
  • Systeme künstlicher Intelligenz erkennen schon heute Muster in unsrer Realität, die unserer Intelligenz (bisher) verschlossen waren. – AI bildet erfolgreich Schachstrategien aus, die bisher kein Mensch verwendet hat oder findet wirksame Medikamente, die bisher unentdeckt geblieben sind, oder hilft Prinzipien der Physik und Mathematik zu entdecken usw. 
  • AI wird unsere Sicht auf die Realität wesentlich verändern, nicht nur quantitativ, sondern vor allem auch qualitativ! – Und dies in zweierlei Hinsicht: Die Entwicklung von AI sorgt für die Integration verschiedener Disziplinen wie Psychologie, Sozialwissenschaften, Naturwissenschaften, Informatik, Mathematik sowie Philosophie und führt in den jeweiligen Disziplinen zu neuen Erkenntnissen und Anwendungen.
  • Gesellschaftliche Systeme werden sich substanziell unterschiedlich entwickeln, je nachdem, ob in welchem Maße und in welcher Qualität ML/AI eingesetzt wird. – Dies wird sich zum einen auf globaler Ebene zeigen, und zum anderen wird es auch eine neue „Schichtung“ der Gesellschaft(en) entlang der individuellen ML/AI Kompetenzen hervorrufen. – Derzeit gibt es nur zwei relevante ML/AI Ecosysteme: USA und China. – Und diese Ecosysteme formen mit ihren ML/AI Systemen unsere (europäische) Zukunft!

Falls jemand diese Aussagen anzweifelt, so möge er sich die Internetseite von DeepMind [2] oder der AI community DeepAI [3] ansehen – die Zweifel dürften sehr schnell verschwinden.

Seit ein paar Monaten konfiguriere bzw. programmiere ich ML/AI Systeme, also Physical Technologies. – Ich tue dies auf der Basis des amerikanischen ML/AI Ecosystems, insbesondere von Google’s Colab [4], Python [5] und Jupyter Notebooks [6]: Ich lote aus, inwieweit diese Physical Technologies helfen könnten, die Social Technology Management 4.0 gemäß den obigen Aussagen zukunftsfähig zu machen. – Das heißt, die Management 4.0 Intelligenz durch ML/AI quantitativ und qualitativ zu erweitern.

Im Tun wird einem sehr schnell bewusst, dass das europäische ML/AI Know-How ganz wesentlich vom amerikanischen ML/AI Ecosystem dominiert wird. – Das amerikanische ML/AI Ecosysteme von Google, Facebook/Meta Platforms, Microsoft und Co. ist überwältigend! – Es gibt eine Vielzahl an öffentlich zugänglichen Plattformen mit einer enormen Anzahl von vortrainierten ML/AI Modellen, unzähligen Tutorials und Code-Beispielen. – Selbst die Nutzung generativer Natural Language Processing (NLP) Systeme der neuesten Generation oder sogar die Anbindung an Quantencomputing ist prinzipiell möglich.

Das amerikanische ML/AI Ecosystem ermöglicht auch Personen wie mir, deren ML/AI Know-how Lichtjahre vom google Know-how entfernt ist, in überschaubaren Schritten in die ML/AI-Welt einzusteigen. Google, Meta Platforms, Microsoft und Co. haben damit einen gesellschaftlichen Innovations-Feedback Mechanismus angestoßen, der der (amerikanischen) Gesellschaft – zumindest einem gewissen Teil davon – einen enormen Innovationsschub gibt: Das ML/AI Ecosystem trägt zu immer schnelleren und qualitativ neuartigen ML/AI Entwicklungen bei, teilweise sogar zu ML/AI Technologie-Revolutionen – man siehe [2] und [3].

Auch wenn nicht wenige Europäer zum amerikanischen ML/AI Ecosystem beitragen, so wurde mir im Tun „schmerzlich“ bewusst, dass wir Europäer auf der Ebene der gesellschaftlichen ML/AI Ecosysteme keine Rolle spielen. – Auch wenn es „kleine“ lokale ML/AI Ecosysteme wie das Tübingen AI Center gibt [6].
Mir sind keine öffentlich zugänglichen europäischen ML/AI Plattformen bekannt. Gerade im Natural Language Processing (NLP) Bereich gibt es nur wenige vortrainierte Modell für europäische Sprachen oder die deutsche Sprache. (Nahezu) alle Tutorials sind in Code und Daten auf den Englisch-sprachigen Bereich ausgerichtet…Dies dürfte nicht nur mir sehr viel mühsame Transferarbeit bescheren!

Man mag das amerikanische ML/AI Ecosystem durchaus auch kritisch sehen, jedoch kann man Google und Co. mit ihrer ML/AI open source Philosophie nicht absprechen, dass Sie einen erheblichen Beitrag für die (ML/AI-) Entwicklung der amerikanischen und auch westlichen Gesellschaft leisten. Schaue ich auf die deutsche Unternehmenslandschaft, so zahlen unsere Unternehmen nach meinem Wissen auf kein gesellschaftliches ML/AI Ecosystem ein. – Unsere deutsche (unternehmerische) Gesellschaft wird nach wie vor von Silo-Denken, Silo-Geschäftsmodellen und Silo-Handeln bestimmt. Das heißt auch, dass gemäß [1] die Entwicklung der europäischen Gesellschaft über kurz oder lang einen Mangel an erweiterter Intelligenz und erweiterter Realität spüren wird, falls dieser Mangel nicht schon jetzt vorhanden ist.

Die obigen Aussagen aus [1] entsprechen meiner Erfahrung und Wahrnehmung und sind ein Motiv, sich um die Verbindung von AI und Management 4.0 (AI & M 4.0) zu kümmern: AI kann dem Projektleiter sowie dem Team assistieren und, was vielleicht noch viel wichtiger ist, mentale Feedback Mechanismen anstoßen, die die kognitive menschliche Projekt- und Management-Intelligenz erweitern. Damit geht einher, dass das menschliche Bewusstsein sich erweitert und mentale wie gesellschaftliche Transformationen angestoßen und begleitet werden. – Die wahrgenommene Realität insbesondere in komplexen Projekten wird sich nach meiner Einschätzung durch ML/AI erheblich erweitern.

Ich liste im Folgenden AI & M 4.0 Anwendungskategorien, die nach meinem aktuellem Wissensstand für das (Projekt) Management von Bedeutung sein werden.- Ich kennzeichne die Kategorien durch AI/ML und eine fortlaufende Nummer. – Man siehe hierzu auch die phasenorientierte Zuordnung von PM Aktivitäten und AI/ML Techniken in [8].

AI/ML 1 – Numerische Feature-Multilabel (supervised) AI: Ein Sachverhalt wird über numerische Datenkategorien (Features) beschrieben und Anwendungstypen oder Klassen (man spricht von Labels) zugeordnet. Zum Beispiel nimmt ein AI System eine Aufwands- oder Kostenschätzung vor. Hierzu werden die Aufgaben gemäß bestimmter numerischer Features beschrieben und einer Aufwandsklasse, also einem Label, zugeordnet. Supervised bedeutet hier, dass die AI mit einer Feature-Label Zuordnung trainiert wird, die durch Menschen vorher vorgenommen wurde. Hierbei ist es meines Erachtens jedoch nicht notwendig, zuerst jahrelang solche Zuordnungen, also Daten zu sammeln. Die AI könnte vielmehr in laufende Aufwandsschätzungen gemäß Delphi oder Planning Poker eingebracht werden, im Wissen, dass die AI sich wahrscheinlich langsam aufbaut.    

AI/ML 2 – Text-Multilabel (supervised) Natural Language Processing AI: Ein Sachverhalt wird über Text bzw. Sprache beschrieben und Labels zugeordnet. Auch eine Aufwandsschätzung könnte auf diese Weise durch AI vorgenommen werden.- Die zu schätzenden Aufgaben liegen als Textbeschreibungen vor und für das Training werden durch Menschen Label-Zuordnungen vorgenommen. Text und Label werden im AI-Training verarbeitet. – Die AI ist also in der Lage natürliche Sprache (Natural Language Processing (NLP)) zu verarbeiten. Ein anderes Bespiel ist die Analyse von Verhalten, beschrieben in Textform und die Zuordnung zu Persönlichkeitslabels (Temperament, Werten, Grundannahmen, Glaubenssätzen, Prinzipien). – Die nachträgliche Analyse von Verhalten durch niedergeschriebenen Text ist relativ „einfach“.  – Eine direkte Analyse der Kommunikation z.B. während einer Teamsitzung ist jedoch wesentlich anspruchsvoller und entzieht sich derzeit (noch 😉) meinem Kenntnisstand. – Selbstverständlich kann auf dieser Basis auch eine organisationale Kulturanalyse vorgenommen werden, indem die Kommunikation (Gesprochenes, Dokumente, eMail, Chat) im Team oder in der Organisation ausgewertet wird.  

AI/ML 3 – Graph Neural Networks bzw. Graphen-Multilabel (supervised) AI: Sehr viele Sachverhalte in Natur, Sozialem und Technik lassen sich über Graphen bzw. Netzwerke beschreiben [9, 10]. Soziale Systeme bzw. Organisationen lassen sich gut über Social Networks darstellen. Der Projektstrukturplan bzw. der Projektplan sind spezielle Graphen. Die Zielhierarchie ist eine weiterer Graph. Zum Beispiel lassen sich aus der Kommunikation der Stakeholder Social Networks ableiten und diese Social Networks oder Social Networks Bausteine werden mit Labels versehen und dienen dem Training von AI/ML. Ein anderes Beispiel ist die Extraktion der Zielhierarchie aus einer Teamkommunikation und die anschließende „Überprüfung der Einhaltung“ der Zielhierarchie in der Stakeholderkommunikation. Oder, das Social Network eines Teams wird Performance Labels (z.B. Hochleistung, mittlere Leistung, dysfunktionale Leistung) zugeordnet.  

AI/ML 4 – Team-Sprachanalyse (unsupervised) AI: Die Sprache in Teams oder Stakeholdergruppen wird auf Gemeinsamkeiten untersucht. So lässt sich u.a. aus der Wortwahl von Teammitgliedern u.a. mittels der Bag of Word und word embedding Technologien auf deren „mentale Verwandschaft“ oder das Collective Mind schließen.

AI/ML 5 – Generative NLP (unsupervised) AI: Mittels generativer NLP AI Systeme [11, 12] lassen sich u.a. Vertragsdokumente bzw. Claim-Dokumente mittels weniger von Menschen eingegebener zentraler Prinzipien generieren. Diese Systeme können auch dazu benutzt werden, Abweichungen (also Vertrags- und Claimrisiken) zu identifizieren.

AI/ML 6 – Clustering (unsupervised) AI: Die AI clustered numerische oder Textdaten. Diese Cluster zeichnen sich durch charakteristische Cluster Eigenschaften aus und erlauben damit das Erkennen von Mustern in den Daten. Auf diese Weise können zum Beispiel Projekte, Aufgaben oder auch Stakeholder geclustert werden. – Einen ersten Eindruck von der Fähigkeit Neuronaler  Netzwerke zu clustern, bietet die „Spielumgebung“ von Tensorflow [13].

Diese sechs Kategorien lassen sich auch kombinieren, sei es, um ergänzende Informationen zu erhalten oder eine sogenannte AI/ML Verarbeitungspipeline aufzubauen.

Ich erwarte, dass mit gewonnener Erfahrung diese sechs Kategorien detailliert werden und auch weitere Kategorien hinzukommen.

Ich verwende diese sechs AI/ML Kategorien, um AI & M 4.0 zu beschreiben: Ich tue dies unter Verwendung der IPMA ICB 4.0 Kompetenzen [14] bzw. der Kompetenzen des Handbuches Kompetenzbasiertes Projektmanagement (PM4) der GPM [15]. Die nachfolgende Tabelle listet AI & M 4.0. Die Tabelle ist sicherlich nicht vollständig. – Sie gibt den aktuellen Stand meiner Überlegungen wieder; sie dürfte sich also noch ändern.

Die Tabelle zeigt, dass schon heute mit entsprechendem Know-how die (Projekt) Management Intelligenz und Realität deutlich erweitert werden kann. – Mit einem AI Know-How, das im amerikanischen ML/AI Ecosystem abrufbar ist.

Die kursive Schrift in der Tabelle zeigt an, dass in diesen Fällen eine Bearbeitung durch die GPM Fachgruppe Agile Management begonnen wurde.

Perspective – KontextkompetenzenAI & M 4.0: Erweiterte Management 4.0 Intelligenz und Realität mittels ML/AI
Strategie 
Governance, Strukturen und Prozesse 
Compliance, Standards und RegularienAI/ML 5: Ermittlung von Compliance und Risiken durch den Abgleich von Projektartefakten und Compliance-Dokumenten sowie Standards und Normen
Macht und Interessen 
Kultur und WerteAI/ML 2: Ermittlung des organisationalen Mindsets (Kultur) durch vortrainierte Neuronale Netzwerke (NN): transkribierte Sprache und Texte werden mittels eines Transformermodells wie BERT [16,17] einer Text-MultiLabel Analyse unterzogen. – BERT ist eines der wenigen Modelle, das auch in einer deutschen Sprachversion verfügbar ist.   In einem zweiten Schritt kann diese Information dazu benutzt werden, um die Heterogenität der Kultur in einer Organisation zu ermitteln. In dem vorhergehenden Blog-Beitrag habe ich dies als „Spinglass-Organisation“ bezeichnet.     
People – Persönliche und soziale Kompetenzen 
Selbstreflexion und SelbstmanagementAI/ML 2: Die Selbstreflexion und das Selbstmanagement wird durch einen Feedback Mechanismus zwischen AI und Projektmanager oder Teammitglied angestoßen. Die AI erweitert die Metakompetenz des PM und der Teammitgliedern, indem den Verhaltensweisen durch die AI Persönlichkeitsdimensionen (Temperament, Motive, Werte, Glaubenssätze) zugeordnet werden.
Persönliche Integrität und Verlässlichkeit 
Persönliche KommunikationAI/ML 2: Die Realität der Kommunikation verändert sich auf der Basis der veränderten Selbstreflexion. Zudem liefert die AI Informationen zu den Persönlichkeitsdimensionen aller kommunizierenden Teammitglieder.
Beziehungen und Engagement 
FührungAI/ML 2: Die Führungs-Metakompetenz wird erheblich erweitert, da Selbstreflexion und Kommunikation deutlich verbessert werden. – Die Decision Intelligence wird deutlich erweitert.   AI/ML 4: Die Team-Sprachanalyse ermittelt Gemeinsamkeiten und hilft Dysfunktionalitäten aufzudecken.   AI/ML 3: Social Networks werden mittels GNN (Graph Neural Networks) analysiert und gelabelt. Dies kann auf Teamebene und auf der Ebene aller Stakeholder erfolgen.
TeamarbeitAI/ML 4: Die Stärke des Collective Mind wird durch einen „Statthalter“ also eine proxy Collective Mind (proxyCM) abgebildet: CM ~ proxyCM. Als proxyCM können verschiedene Modelle dienen: Transkribierte Sprache von Teammitgliedern werden mittels sklearn [18] (Native Bayes Classification) den Teammitgliedern zugeordnet. Desto eindeutiger die Zuordnung ist, desto geringer ist das CM, oder anders ausgedrückt, falls ein Text mehreren Teammitglieder zugeordnet werden kann, so besteht ein „inhaltlicher Überlapp“. – Der proxyCM ist größer.   Des Weiteren können Redefrequenz und Redelänge als weitere Indikatoren für den proxyCM verwendet werden.   Mittels einer Bag of Word oder Word Vector Embedding Analyse [18, 19, 20, 21] wird die Wortwahl der Teammitglieder analysiert. Unterschiedliche Wortwahlen unterschiedlicher Teammitglieder zeigen ein schwaches proxyCM an, oder umgekehrt lassen ähnliche Begriffsschwerpunkte auf ein starkes proxyCM schliessen.    
Konflikte und KrisenAI/ML 2, 3, 4: Diese AI Erweiterungen der PM Intelligenz bzw. Metakompetenz sind auch gerade in Konflikten und Krisen von enormer Bedeutung
Vielseitigkeit 
VerhandlungenAI/ML 2, 3, 4: Diese AI Erweiterungen der PM Intelligenz bzw. Metakompetenz sind auch gerade in Verhandlungen von enormer Bedeutung. AI/ML 5: Zusätzlich ist es hilfreich Vertrags- und Claim-Dokumente einer AI Überprüfung zu unterziehen.
Ergebnisorientierung 
Practice – Technische Kompetenzen 
ProjektdesignAI/ML 6: Die AI ermittelt Komplexitätsklassen auf der Basis von numerischen und/oder textuellen Daten. Die Komplexitätsklassen sind die Basis des Projektdesigns
Anforderungen und Ziele 
Leistungsumfang und Lieferobjekte 
Ablauf und Termine 
Organisation, Information und Dokumentation 
Qualität 
Kosten und FinanzierungAI/ML 1, 2: Die Ermittlung von Aufwänden und Kosten gehört zu den „einfachen“ AI/ML Techniken. Lediglich die Beschaffung von Trainingsdaten ist vermutlich schwierig, da archivierte Projektdaten selten vorliegen.
Ressourcen 
Beschaffung 
Planung und SteuerungAI/ML 1: siehe Kosten und Finanzierung
Chancen und Risiken 
StakeholderAI/ML 2, 3, 4: Diese AI Erweiterungen der PM Intelligenz bzw. Metakompetenz sind für das Stakeholdermanagement von enormer Bedeutung
Change und TransformationAI/ML 2, 3, 4, 5: Hier können nahezu alle AI Techniken zum Einsatz kommen, um eine valide Entscheidungsbasis für Interventionen zu haben.
Tabelle: AI & M 4.0 unter Verwendung der ICB 4.0 / PM4 Kompetenzen

Die GPM Fachgruppe Agile Management sucht Mitglieder, die bereit sind, in die Untiefen 😉 der AI Erstellung, des Trainingsdaten Sammelns oder sogar der Anwendung im eigenen Unternehmen einzusteigen! – Wir freuen uns über eine Kontaktaufnahme unter agile-management@gpm-ipma.de!

[1] Kissinger HA, Schmidt E, Huttenlocher D (2021) The Age of AI: And Our Human Future, kindle edition
[2] DeepMind (2021) deepmind.com, zugegriffen am 02.12.2021
[3] DeepAI (2021) deepai.org, zugegriffen am 02.12.2021
[4] Colab (2021) https://colab.research.google.com/
[5] Python (2021) https://www.python.org/
[6] Jupyter Notebooks (2021) https://jupyter.org/, zugegriffen am 02.12.2021
[7] Tübingen AI Center (2021) tuebingen.ai, zugegriffen am 02.12.2021
[8] Nuhn H (2021) Organizing for temporality and supporting AI systems – a framework for applied AI and organization research, Lecture Notes in Informatics, GI e.V
[9] Veličković P (2021) Introduction to Graph Neural Networks, https://www.youtube.com/watch?v=8owQBFAHw7E, zugegriffen am 02.12.2021, man siehe auch petar-v.com
[10] Spektral (2021) https://graphneural.network/, zugegriffen am 02.12.2021
[11] GPT-3 (2021) https://openai.com/blog/openai-api/, zugegriffen am 09.12.2021
[12] Gopher (2021) https://deepmind.com/blog/article/language-modelling-at-scale,
[13] Neuronales Netzwerk „zum Spielen“ (2021) https://playground.tensorflow.org, zugegriffen am 02.12.2021
[14] GPM (2017) Individual Competence Baseline für Projektmanagement, IPMA, Version 4.0 / Deutsche Fassung
[15] GPM (2019) Kompetenzbasiertes Projektmanagement (PM4), Handbuch für Praxis und Weiterbildung im Projektmanagement
[16] Tensorflow (2021) google Entwicklungsplattform, https://www.tensorflow.org, zugegriffen am 02.12.2021
[17] BERT (2021) NLP Transformer Model BERT, https://huggingface.co/models, zugegriffen am 02.12.2021
[18] Scikit-learn (2021) https://scikit-learn.org/, zugegriffen am 02.12.2021
[19] Gensim-word2vec (2021) https://www.kaggle.com/pierremegret/gensim-word2vec-tutorial, zugegriffen am 02.12.2021
[20] Word-Vector-Visualisation (2021) https://www.kaggle.com/jeffd23/visualizing-word-vectors-with-t-sne/notebook, zugegriffen am 02.12.2021
[21] Spacy (2021) https://spacy.io/models/de, zugegriffen am 02.12.2021          

Metabetrachtungen: Zur Schnittmenge von diesjährigem Physik-Nobelpreis, Künstlicher Intelligenz und Collective Mind

Dieses Jahr wurde der Physik-Nobelpreis unter dem gemeinsamen Label „For groundbreaking contributions to our understanding of complex physical systems.“ an die Physiker Klaus Hasselmann und Syukuro Manabe sowie Giorgio Parisi vergeben. Es ist meines Wissens das erste Mal, dass das Verstehen von komplexen physikalischen Systemen so explizit honoriert wurde. Alle drei Forscher haben den Einfluss von mikroskopischen Zuständen auf makroskopische Zustände untersucht. Bei Klaus Hasselmann ging es um die Auswirkung von (lokalen) Wetterphänomenen auf (globale) Klimaphänomene. Also dem zentralen Problem unserer Tage. Syukuro Manabe wurde für die erstmalige computergestützte globale Klima-Modellierung geehrt.

Giorgio Parisi hat den Nobelpreis für seine Untersuchung von Spingläsern, insbesondere für seinen „great leap  … to introduce a new order parameter“ erhalten [1]. Seine Arbeiten ziehe ich für meine Metabetrachtungen heran.

Spin Gläser sind u.a. Legierungen wie CuMn, wobei das nichtmagnetische Kupfer (Cu) magnetisches Mangan (Mn) mit ca. 13% enthält. Die magnetischen Momente (Spin‘s) der Manganatome sind zufällig, aber fest im Kupferkristall verteilt. Zwischen den Manganatomen können ferromagnetische und antiferromagnetische Wechselwirkungen auftreten. – Je nach Konfiguration der Manganatome müssen diese mit ihren Nachbar-Manganatomen sowohl eine ferromagnetische als auch eine antiferromagnetische Wechselwirkung „befriedigen“. Dies kann auch Atome „frustrieren“. – Spingläser, also Substanzen, die bezüglich des Spins, wie Glas, amorphe Konfigurationen aufweisen und Frustrationen ausbilden, zeichnen sich (oft) nicht mehr nur durch einen einfachen Ordnungsparameter, wie die makroskopische Magnetisierung aus. – Sondern sie bilden viele mikroskopische Zustände aus, die mit dem Einstellen bestimmter Parameter (Rahmen- und Kontrollparameter) zu vielen unterschiedlichen Phasen mit jeweils unterschiedlichen Ordnungsparameter-Ausprägungen führen. Diese Ordnungsparameter-Ausprägungen genügen jedoch einem einheitlichen mathematischen Muster. – Parisi hat dieses „new order parameter“ Muster eingeführt [2].

Ich will versuchen dieses Muster am Beispiel einer sozialen Gruppe, an einem Team, zu erläutern.- Für den ein oder anderen mag dies Physikalismus sein [3], also der Versuch Alles und Jedes mittels Physik zu erklären; für mich ist es das Denken in Modellen und Theorien; und Metabetrachtungen helfen das ein oder andere qualitativ und quantitativ viel besser zu verstehen: Im Management 4.0 modellieren wir zentrale menschliche Eigenschaften mit der sogenannten Dilts Pyramide. Die Dilts Pyramide integriert hierbei ca. 30 unsere Persönlichkeit bestimmende Eigenschaften (Vision, Mission, Zugehörigkeit, Temperament, Werte, Glaubenssätze, Grundannahmen und Prinzipien). Stellen wir uns für den Moment die Pyramide (sie ist ja ein Keil, eine Spitze) als eine Ausrichtung unserer Persönlichkeit vor. Bilden wir eine Gruppe aus Personen mit unterschiedlichen Dilts Pyramiden, so bildet die Gruppe nicht selten (am Anfang) eine „Diltsglas-Organisation“: Die Pyramiden zeigen alle in unterschiedliche Richtungen. Recht selten geschieht es, dass die Pyramiden eine gemeinsame Ausrichtung erfahren, das Team sich also einen Ordnungsparameter, den Collective Mind, erarbeitet. Sehr oft führt die Gruppendynamik in einem Projektteam zu unterschiedlichen Kommunikationskonfigurationen (Zuständen): Unterschiedliche Visionen, Werte oder Glaubenssätze tauchen auf, nicht selten bleiben diese nebeneinander bestehen, ohne dass dies für die Gruppenmitglieder wirklich transparent wird. Damit verbunden sind, wie wir wahrscheinlich alle wissen, auch Frustrationen. Die Kommunikationskonfigurationen sind jedoch nicht beliebig. Die verschiedenen konfigurationsspezifischen Ausrichtungen der Dilts Pyramide der einzelnen Gruppenmitglieder haben nichtverschwindende „Überlappe“, z.B. mögen bestimmte Werte oder Glaubenssätze in verschiedenen Konfigurationen auftauchen. – Sie wirken als „mikroskopische“ Ordnungsparameter, die die makroskopische (Un-) Ordnung bestimmen. Man könnte also einen neuen Ordnungsparameter einführen, der den „Überlapp“ bei allen Teammitglieder misst und aufsummiert. – Damit hat man auch ein Maß für die „Diltsglas-Organisation“ des Teams. – Dieses Vorgehen entspricht dem von Parisi eingeführten neuen Ordnungsparameter für Spingläser. – Der Ordnungsparameter der „Diltsglas-Organisation“ ist damit auch ein Maß für die „Abweichung“ von einem einfachen Ordnungsparameter, dem Collective Mind, bei dem alle Dilts Pyramiden im Rahmen der Teamaktivitäten in eine Richtung zeigen.

Man kann die Analogie noch erweitern: Physikalische Spingläser können durch äußere magnetische Felder in der Ausbildung des Parisi-Ordnungsparameters beeinflusst werden. Auch „Diltsglas-Organisationen“ zeigen ein ähnliches Verhalten, wenn eine (äußere) Beeinflussung einsetzt: Führungskräfte oder Coaches wirken auf die Dilts Pyramiden des Teams ein. – Bei kleinen Einflussnahmen bleibt das „Diltsglas“ erhalten, steigt die Einflussnahme entsteht eine Ausrichtung, die aussieht wie ein Collective Mind. In den meisten Fällen dürfte die Ausrichtung jedoch wieder verschwinden, wenn die Einflussnahme zurückgeht, falls sich bis dahin keine intrinsische Veränderung im Team ausgebildet hat.  

Alles schön und gut, könnte man sagen: Warum macht es Sinn sich mit solchen Metabetrachtungen zu beschäftigen. In der Schrift des Nobel-Komitees [1] wird die Antwort gegeben. Die Modelle zur Erklärung von Spin-Gläsern haben heute sehr viele unterschiedliche Bereich erheblich befruchtet: Verschiedene Gebiete der Physik, der Biologie, der Chemie, der Neurowissenschaften und der Künstlichen Intelligenz. Für die Verbindung von Neurowissenschaften und Systemen Künstlicher Intelligenz wird explizit die Arbeit von John J. Hopfield in [1] genannt. Neuronale Netzwerke können auch als Spinglas Systeme verstanden werden, wenn man die magnetischen Momente durch Neuronen ersetzt. Die Wechselwirkungsparameter zwischen den Spins entsprechen den Gewichten zwischen den Ausgängen einer Neuronen Schicht und den Eingängen der nächsten Neuronen Schicht. Angelegte magnetische Felder entsprechen den Bias-Einstellungen der Neuronen. – Und wie oben geschildert, kann man die Grundprinzipien auch auf soziale Gruppen übertragen.

Die GPM Fachgruppe Agile Management beschäftigt sich seit einem Jahr mit der Nutzung von KI-Systemen im Management 4.0. Insbesondere habe ich mir hierzu zwei Themen ausgesucht:

  • Die Nutzung eines Neuronalen Netzwerkes für die Ermittlung von Persönlichkeitsmerkmalen aus beobachteten Verhaltensweisen.
  • Die Ermittlung des Grades der „Diltsglas-Organisation“ (wie oben geschildert) und des Collective Minds eines Teams aus auditiven Gesprächsprotokollen.

Den technologischen Durchstich für die erste Aufgabe konnte ich inzwischen erfolgreich abschließen. Ich bin also optimistisch, dass ich meine nächsten Blogbeiträge der Ausgestaltung dieser beiden Themen widmen werde. 

           

[1] The Nobel Committee for Physics (2021) For groundbreaking contributions to our understanding of complex physical systems, Scientific background on the Nobel Prize in Physics 2021.

[2] Parisi G (2008) The physical Meaning of Replica Symmetry Breaking, arXiv

[3] Wikipedia (2021) Physikalismus, https://de.wikipedia.org/wiki/Physikalismus_(Ontologie), zugegriffen am 29.10.2021

[4] Hopfield J.J. (1982) Neural networks and physical systems with emergent collective computational abilities, Proc. Nat. Acad. Sci. USA, Vol. 79 Biophysics