AI & M 4.0: Hybride Collective Intelligence (CI)-Verarbeitungspipeline: Vom Business Plan über die Ziel-Hierarchie zum Projekt Plan

Die Ziel-Hierarchie ist im Management 4.0 der zentrale Ordnungsparameter der Selbstorganisation: Sie dient sowohl der Ausrichtung des Projektteams als auch der Kommunikation mit den Stakeholdern und deren Ausrichtung an der Projektarbeit.

Unter einer hybriden Collective Intelligence Verarbeitungspipeline (CI-Verarbeitungspipeline) verstehe ich eine Abfolge von Verarbeitungsschritten, die im Idealfall vollautomatisch abläuft und durch die hybride Collective Intelligence von Mensch und Künstlicher Intelligenz erstellt wurde.

Die CI-Verarbeitungspipeline ‚Vom Business Plan über die Ziel-Hierarchie zum Projekt Plan‘ ist ein Beispiel für die Ausgestaltung von Projektarbeit mittels hybrider Collective Intelligence. In dem gerade in Veröffentlichung befindlichen Buchbeitrag ‚Collective Intelligence von KI und Mensch in der Projektarbeit – Ein Rahmenwerk auf der Basis von ICB 4.0 und Management 4.0‘ skizzieren meine Kolleg(inn)en von der GPM Fachgruppe Agile Management und ich die hybride Collective Intelligence für alle Perspektiven der IPMA Individual Competence Baseline 4.0.  

Ich überprüfe in diesem Beitrag, ob es möglich ist, mit Hilfe von chatGPTplus eine Ziel-Hierarchie zu erstellen, die in einen Projekt Plan transformiert werden kann. – Im Idealfall soll die Ziel-Hierarchie aus einem Business Plan abgeleitet werden. – Eine Aufgabe, die ohne AI-Unterstützung recht viel menschliche Kreativität und Handarbeit erfordert.

Ich benutze zur Überprüfung der Machbarkeit wieder das schon in den vorherigen Blog-Beiträgen verwendete Beispiel der Küchenmanufaktur. Die folgende CI-Verarbeitungspipeline beruht auf mehreren vorausgegangenen Tests, in denen ich einzelne Abschnitte der CI-Verarbeitungspipeline ausprobiert habe.  Die bereinigte CI-Vereinigungspipeline startet mit dem folgenden chatGPTplus Prompt:

Ein Unternehmen, das wir KüchenManufaktur nennen, stellt sogenannte Weiße Ware, also u.a. Herde, Kühlschränke und Gefrierschränke her. Bisher hat das Unternehmen KüchenManufaktur diese Weiße Ware ohne große Digitalisierungsfunktionen hergestellt. Jetzt soll die Weiße Ware smart werden und als Life Style Produkt positioniert werden. Der Einsatz von smarter Technologie kann auch den Einsatz von AI oder ML beinhalten. Zum Beispiel könnte eine zukünftige Anforderung für einen Kühlschrank beinhalten, dass ‚er sich von alleine füllt‘. ‚Von alleine füllen‘ bedeutet, dass er über ein intelligentes Füllmanagement verfügt, das u.a. Zugriff auf Lebensmittellieferanten hat.

Es geht also um die Digitale Transformation des Unternehmens KüchenManufaktur. Die Digitale Transformation soll mittels eines Projektes durchgeführt werden. In einem ersten Schritt ist ein Business Plan für die Digitale Transformation zu erstellen.  Kannst Du mir bei der Erstellung eines Business Plans helfen? Welches Werkzeug schlägst Du für die Erstellung des Business Plans vor?

Nach Eingabe dieses Prompts liefert chatGPTplus eine Lehrbuch-Aussage, zu den Kapiteln eines Business Plans. Ich gehe hier nicht weiter auf dieses Ergebnis ein, da sich hieraus keine inhaltlichen Aussagen für die CI-Verarbeitungspipeline ableiten lassen.

Also stupse ich chatGPTplus in die von mir gewünschte Richtung und gebe in einem Prompt Business Model Canvas als Tool vor. – Damit greife ich auf die des Öfteren gemacht Erfahrung zurück, dass die Collective Intelligence aus AI und meiner Person sich nur zeigt, wenn ich als Mensch über hinreichendes Fachwissen verfüge, so dass ich in der Lage bin, der AI eine Such-Richtung mitzugeben.

Auf dieser Basis kann sich das Ergebnis meines Erachtens sehen lassen (chatGPTPlus Aussage):

Natürlich, ich kann Ihnen helfen, ein Business Model Canvas für die digitale Transformation des Unternehmens KüchenManufaktur zu erstellen. Hier sind meine Vorschläge für jedes Segment des Business Model Canvas:

  1. Kundensegmente: Haushalte und Unternehmen, die an modernen, intelligenten Küchengeräten interessiert sind. Dazu gehören umweltbewusste Kunden, Technikaffine und diejenigen, die nach Komfort und Effizienz streben.
  2. Wertangebote: Smarte Küchengeräte, die KI und ML-Technologien nutzen, um das Benutzererlebnis zu verbessern. Funktionen könnten eine automatische Nachbestellung von Lebensmitteln, Energieeffizienz, personalisierte Kochempfehlungen basierend auf den im Kühlschrank vorhandenen Lebensmitteln und Fernsteuerung der Geräte über eine App enthalten.
  3. Kanäle: Direkte Verkaufskanäle wie die firmeneigene Website und der firmeneigene Laden, sowie Drittanbieter-Einzelhändler, Online-Marktplätze und Partnerunternehmen in der Lebensmittel- und Technologieindustrie.
  4. Kundenbeziehungen: Aufbau langfristiger Beziehungen durch erstklassigen Kundenservice, regelmäßige Updates und Verbesserungen der intelligenten Funktionen, Nutzer-Communitys und personalisierte Kommunikation.
  5. Einnahmequellen: Verkauf der smarten Geräte, möglicherweise auch Abonnementdienste für erweiterte Funktionen oder Services. Kooperationen mit Lebensmittellieferanten könnten auch zu Einnahmen führen, z.B. durch die Integration von Lebensmittellieferdiensten in die intelligenten Geräte.
  6. Schlüsselressourcen: Das Forschungs- und Entwicklungsteam, das die smarten Geräte und die dazugehörige Software entwickelt. Die Marke und der Ruf von KüchenManufaktur. Beziehungen zu Lieferanten und Vertriebspartnern.
  7. Schlüsselaktivitäten: Forschung und Entwicklung von smarten Geräten und dazugehöriger Software. Aufbau und Pflege von Beziehungen zu Lieferanten und Vertriebspartnern. Marketing und Verkauf der smarten Geräte.
  8. Schlüsselpartner: Lebensmittellieferanten, Technologiepartner für die Bereitstellung von KI/ML-Funktionen, Einzelhändler und Online-Marktplätze.
  9. Kostenstruktur: Kosten für Forschung und Entwicklung, Produktion der smarten Geräte, Vertrieb, Kundenservice und allgemeine Betriebskosten.

Ich frage nach einer weiteren Ausgestaltung und einer dazugehörigen Strategie. Aufgrund des Umfanges der chatGPTplus Antwort, gebe ich hier nur einen Auszug der Ausgestaltung und der vorgeschlagenen Strategie wieder:

Kundensegmente:

  • Sie könnten untersuchen, welche Altersgruppen am wahrscheinlichsten an Ihren Produkten interessiert sein könnten. Junge Erwachsene könnten eher an technisch ausgereiften Geräten interessiert sein, während ältere Menschen Wert auf Bequemlichkeit legen könnten.
  • In welchen geografischen Märkten sind smarte Küchengeräte besonders gefragt? Dies könnte Ihnen helfen, Ihre Vertriebs- und Marketingstrategie anzupassen.

Die von chatGPTplus abgeleitete Strategie sieht dann so aus (chatGPTplus Ausgabe):

Auf der Grundlage des Kontexts, den Sie zur Verfügung gestellt haben, könnte die folgende Strategie für die digitale Transformation der KüchenManufaktur in Betracht gezogen werden:

  1. Produktentwicklung und Positionierung: Entwickeln Sie Ihre Produktpalette weiter, um smarte Funktionen einzuschließen. Fokussieren Sie sich auf KI/ML-Fähigkeiten, um einzigartige und personalisierte Benutzererfahrungen zu ermöglichen. Positionieren Sie Ihre Produkte als High-End-Lifestyle-Produkte.
  2. Marktausrichtung: Zielmarkt könnten technologieaffine junge Erwachsene und Berufstätige sein, die einen aktiven und modernen Lebensstil pflegen. Betrachten Sie sowohl städtische als auch suburban gelegene Märkte, die eine hohe Konzentration dieser Zielgruppe aufweisen.
  3. Vertriebskanäle: Nutzen Sie sowohl Online- als auch Offline-Kanäle. Online können Sie eine E-Commerce-Plattform entwickeln und auf Plattformen wie Amazon und eBay präsent sein. Offline können Sie Showrooms eröffnen, wo die Kunden die Produkte erleben können. In Betracht kommen auch Partnerschaften mit Bauunternehmen oder Immobilienentwicklern.
  4. Kundenbindung: Entwickeln Sie ein umfassendes Kundenerlebnis. Bieten Sie Installations- und Wartungsdienste an und entwickeln Sie eine digitale Plattform/App, auf der Benutzer Rezepte austauschen, Kochkurse ansehen und sogar Lebensmittel bestellen können, die direkt mit Ihrem smarten Kühlschrank synchronisiert werden.
  5. Partnerschaften: Schließen Sie Partnerschaften mit Lebensmittellieferanten, um ein integriertes Ökosystem zu schaffen. Denken Sie auch an Kooperationen mit Ernährungsberatern und Kochschulen.
  6. Operative Effizienz: Automatisieren Sie, wo es sinnvoll ist, Ihre Produktionsprozesse und nutzen Sie die durch Ihre smarten Geräte generierten Daten, um Ihre Prozesse und Angebote zu optimieren.
  7. Einnahmequellen: Generieren Sie Einnahmen durch den Verkauf von Produkten und zusätzlichen Dienstleistungen, Werbung auf Ihrer Plattform und möglicherweise durch den Wiederverkauf von renovierten Gebrauchtgeräten.

Nachdem ich chatGPTplus darum bitte, die Vision nicht in die Ziel-Hierarchie beginnend mit Nummer 1. einzubauen, erhalte ich die unten gelistete Ziel-Hierarchie. – Der nicht erwünschte Einbau der Vision als Nummer 1. in die Ziel-Hierarchie führt im Projektplan zu einer ungünstigen Struktur. Um dies zu erkennen und zu beheben, musste ich mehrere Kommunikationsrunden mit chatGPTplus durchlaufen. Außerdem habe ich für den späteren Projekt Plan Projektmitarbeiter eingeführt, die chatGPTplus nach eigener Einschätzung auf die Sub-Ziele verteilen soll. – Hier ist auch ein Hinweis notwendig, dass übergeordneten Zielen keine Ressourcen zugeordnet werden, da die Zuordnung lediglich auf Sub-Ziel-Ebene erfolgt. – Man kann an diesen notwendigen Hinweisen erkennen, dass chatGPTplus derzeit über kein wirkliches PM-Know how verfügt. Das Ergebnis ist mit diesen (kleinen) Einschränkung wieder beeindruckend (zuerst mein Prompt):

Bitte baue die einzelnen Elemente der Business Model Canvas und die dazugehörige Strategie noch etwas besser ein und liste in Klammern vielleicht hinter jedem Ziel bzw. Sub-Ziel mögliche oben schon genannte Ressourcen. Bitte nimm ‚Digitale Transformation der KüchenManufaktur‘ aus der Nummerierung raus, es ist ja der Name des Projektes und ergänze den Namen des Projektes um eine Vision, die das Projekt als Vision gut beschreibt, so dass das zukünftige Projektteam an diesem Namen und der Vision mental ausgerichtet wird.

Abbildung 1: Ein Ziel-Hierarchie Ergebnis von chatGPTplus bei vorgeschaltetem Business Model Canvas (Um zu vergrößeren: Bild mit rechter Maustaste in neuem Browser-Fenster öffnen.)

Anschließend bitte ich chatGPTplus, um die Erzeugung eines Python-Codes, der die Ziel-Hierarchie als gerichteten Graphen visualisiert. Das Ergebnis ist wieder erstaunlich gut, zumal ich weiß, dass vor einigen Wochen die Python-Code-Generierung hierzu noch keine gut lesbaren Ergebnisse lieferte. Der Python Code verwendet die folgenden Bibliotheken: NetworkX-Graph, Matplotlib und Pandas.

Abbildung 2: Visualisierung einer Ziel-Hierarchie ohne vorgeschaltetes Business Model Canvas (Um zu vergrößeren: Bild mit rechter Maustaste in neuem Browser-Fenster öffnen.)

chatGPTplus hat die Namen der fünf Teammitglieder Peter (P), Claudia (C), … selbständig als Knoten in den Hierarchie-Baum eingebaut, so dass man auch hier schon erkennen kann, welche Teammitglieder in welchem Sub-Ziel tätig sind. – Ein Wehrmutstropfen besteht noch: Leider ist es uns (AI und mir) nicht gelungen fehlerfreien Code zu erzeugen, der die vollständigen Namen enthält – jeder Namens-Buchstabe wird als Knoten interpretiert, aus diesem Grunde habe ich nur den Anfangsbuchstaben händisch in den Code eingesetzt. Man kann auch feststellen, dass die Darstellung der Nummerierung der Ziel-Hierarchie nicht stabil ist: Die Art der Nummerierung in der Abbildung 2 und 1 ist unterschiedlich.

Ein Wiederholen der Code-Generierung liefert also nicht immer das gleiche Ergebnisse: Es wurde auch eine Visualisierungen erzeugt, in der die Namen der Teammitglieder in die Ziel-Hierarchie-Knoten mitaufgenommen wurden. Weiter unten begegnet uns dieses schon aus anderen Blog-Beiträgen bekannte chatGPTplus „Vergessen“ wieder.

Die Ergebnisse bis hierhin sind trotzdem beeindruckend. Diese Einschätzung erfolgt auch auf der Erfahrung, dass Teams in meinen Management 4.0 Trainings sich mit Ziel-Hierarchien sehr schwer tun und die Collective Intelligence der Teams keine vergleichbar guten Ergebnisse lieferte.

Auf der Basis der Ziel-Hierarchie habe ich chatGPTplus gebeten eine CSV-Datei für MS-Project zu erstellen.

Hier waren wir leider nicht erfolgreich. – Selbst nach vielen versuchten Verbesserungsdurchläufen konnte chatGPTplus keinen befriedigenden Code erzeugen, der gleichzeitig alle Anforderungen für einen groben Projektplan in einer CSV-Datei ablegt: Also z.B. eine CSV-Datei mit den Spalten ‚Vorgang‘, ‚Ressource‘, ‚Vorgänger‘ und ‚Dauer‘ erzeugt.

chatGPTplus verfügt offensichtlich über keinerlei Projektplan-Muster, auf die das System zurückgreifen kann. Was allerdings schwerer wiegt, ist das schon bekannte Fehlverhalten des „Vergessens“. Wurde zum Beispiel eine Anforderung korrekt in den Code umgesetzt, führte eine weitere Anforderung oder eine Fehlerbehebung zum „Vergessen“ der bisherigen korrekten Ergebnisse. – Dies ist umso erstaunlicher als chatGPTplus die Anforderung korrekt verbal wiederholt, jedoch im Code nicht korrekt oder überhaupt nicht umsetzt. Der Code konvergierte einfach nicht zum richtigen Ergebnis.

Dies bestätigt die schon in anderen Blog-Beiträgen gemachte Erfahrung, dass chatGPTplus oft nicht in der Lage ist, mehrere Anforderungen gleichzeitig umzusetzen. Bei der Erstellung des Collective Mind Agent Based Model’s habe ich die Strategie verwendet, die Anforderungen einzeln in Code zu transformieren um anschließend durch mich die Integration vorzunehmen. Hierauf habe ich hier verzichtet. – Diese Strategie entspricht nicht der Idee der CI-Verarbeitungspipeline.   

Der MS-Project Import der nicht vollständigen CSV-Datei, also nur mit den Vorgängen, funktioniert im Prinzip, zeigt jedoch auch Fehler: U.a. werden die deutschen Umlaute nicht richtig dargestellt und was schwerer wiegt, es tauchen Zeichen in den Zellen der Spalten auf, die selbst im notepad++ nicht angezeigt werden. – Auch der Microsoft Support war hier keine Hilfe.

Die Collective Intelligence (CI)-Verarbeitungspipeline mit chatGPTplus ‚Vom Business Plan über die Ziel-Hierarchie zum Projekt Plan‘ zeigt bis zum Schritt Projekt Plan Erstellung beeindruckende Ergebnisse: Die Ergebnisse sind sehr Kontext abhängig. Mit Business Model Canvas oder ohne Business Model Canvas liefert unterschiedliche Ergebnisse. Aber auch der Zeitpunkt der Erstellung spielt eine große Rolle. Der Übergang von der Ziel-Hierarchie zum Projektplan funktioniert zur Zeit (noch) nicht: chatGPTplus ist, wie schon im Rahmen der anderen Blog-Beiträge festgestellt, nicht in der Lage gleichzeitig mehrere Anforderungen, für die wahrscheinlich keine erlernten Muster existieren, ohne „Vergessen“ erfolgreich umzusetzen.

AI & M 4.0: (Collective Intelligence)**2 – Ergänzungen erstellt mit dem Code Interpreter von GPT-4/chatGPTplus!

Dieser Blog-Beitrag ergänzt den vorherigen Beitrag zum Collective Mind Agent Based Model (CM ABM). Ich benutze den vor ein paar Tagen in der beta Version veröffentlichten Code Interpreter von chatGPTplus. Der Code Interpreter ist ein Plugin von chatGPTplus. Er lässt sich in den chatGPTplus Einstellungen vom Anwender aktivieren.

Ich möchte zwei Fragen beantworten:

Kann der Code Interpreter den von mir, mit Hilfe von chatGPTplus, erstellten CM ABM Python Code ausführen?

Welche statistischen oder ML-Auswertungen kann ich mittels des Code Interpreters vornehmen?

Zur ersten Frage:

Leider kann man den Code nicht ausführen lassen. chatGPTplus liefert auch gleich die Antwort, warum dies nicht möglich ist: Diverse verwendete ML-Bibliotheken und MESA Python in dem CM ABM Code sind (noch) nicht in dem Code Interpreter integriert.

Zur zweiten Frage:

Mittels chatGPTplus habe ich den bisherigen Code um einen csv-Export der relevanten MES-Python Daten erweitert. Der CM ABM Code mit 7 Teammitgliedern und ohne Stakeholder wurde für 100 Zeitschritte ausgeführt. – Die so erstellte csv-Datei  lässt sich problemlos im Code Interpreter importieren. Auf Wunsch zeigt chatGTPplus den hinterlegten Python-Code, den man natürlich auch wieder kopieren kann.

Der Inhalt der csv-Datei wird automatisch als Tabelle und als Graphiken angezeigt. Die Graphiken lassen sich problemlos per rechtem Mausklick kopieren:

 

Abbildung 1: CM ABM Ergebnisse nach 100 Zeitschritten, dargestellt vom chatGPTplus Code Interpreter.

ChatGPTplus liefert auch direkt Erläuterungen mit:

  1. Collective Mind Similarity over Time: This plot represents the similarity metric of the collective mind of the team members over time. It appears that the similarity increases over time, which may indicate that the team members are becoming more aligned in their goals.
  2. Team Performance over Time: This plot represents the performance of the team over time. Similar to the similarity metric, the performance also seems to increase over time, possibly indicating that the team’s performance improves as the members become more aligned.

ChatGPTplus verfällt zwischendurch immer mal wieder ins Englische, obwohl ich in Deutsch mit dem System kommuniziere. Diese Beschreibung kann einem den Eindruck von ‚Verständnis‘ aufdrängen: In jedem Fall ist nicht zu leugnen, dass chatGPTPlus meine bisherige Kommunikation zur CM ABM Erstellung kennt. – Ob ein Deep Learning vorliegt kann ich natürlich nicht beantworten.

Ich habe nach einfachen statistischen Auswertungen gefragt: Dem Glätten der Kurven, der Standardabweichung und dem entsprechenden Zeichnen von Graphen:

 

Abbildung 2: Geglättete CM ABM Ergebnisse nach 100 Zeitschritten mit Standardabweichung, berechnet und dargestellt vom chatGPTplus Code Interpreter.

Auf die Frage nach weiteren statistischen Auswertungen wurde mir die Korrelationsanalyse (zwischen Collective Mind Similarity und Collective Mind Teamperformance), die Analyse der Volatilität und die Anomalieerkennung angeboten. Die Korrelationsanalyse liefert wie erwartet eine Korrelation von 0,995, da die Teamperformance direkt aus der Similarity berechnet wurde. Die Analyse der Volatilität ergab eine zusätzliche graphische Darstellung der Volatilität über den Zeitschritten und die Anomalieerkennung mittels Z-Score ergab keine Anomalien. – Immer begleitet von Erläuterungen und der Möglichkeit den verwendeten Code zu kopieren.

Im Zusammenhang mit der Anomalieerkennung habe ich nach weiteren Analysemöglichkeiten gefragt. chatGPTplus verweist auf die ML-Algorithmen Isolation Forest, One-class SVM, local Outlier Factor und Autoencoder.

Ich bitte um die Durchführung von One-class SVM. chatGPTplus ‚bedauert‘, dass diese Analyse nicht möglich ist, da diese ML-Algorithmen wegen fehlender ML-Bibliotheken nicht ausführbar sind. – Liefert aber den notwendigen Python Code, den man wieder kopieren kann, um ihn z.B. in Colab ablaufen zu lassen.

Alles in allem eine beeindruckende Leistung, wobei mich die Beratung zu den verschiedenen Algorithmen noch fast mehr beeindruckt, als die Ausführung und die graphische Repräsentation der Ergebnisse diverser statistischer Algorithmen.   

AI & M 4.0: (Collective Intelligence)**2 – Collective Mind Agent Based Model mit GPT-4/chatGPTplus erstellt!

In diesem Blog-Beitrag beschreibe ich meine weiteren Erfahrungen zur Modellierung und Programmierung eines Collective Mind Agent Based Models (CM ABM). 

Anders als beim Blog-Beitrag vom Februar 2023 benutze ich als ‚Erweiterung‘ meiner kognitiven Fähigkeiten chatGPTplus, also die Bezahlversion von chatGPT auf der Basis von GPT-4. Außerdem soll dieses Mal ein dynamisches ABM entwickelt werden, das auf MESA Python beruht und die zeitliche Entwicklung eines Team Collective Mind‘s modelliert.

Der Titel (Collective Intelligence)**2, also Collective Intelligence zum Quadrat, weist  daraufhin, dass es in diesem Beitrag in mehrfacher Hinsicht um Collective Intelligence geht: Ich benutze zum einen unserer aller Collective Intelligence, die in GPT-4 trainiert vorliegt und zum anderen die hybride Collective Intelligence von GPT-4 und mir. Außerdem ist ein CM ABM ein Team Collective Intelligence Modell.

Vor zwei Wochen habe ich mit der Entwicklung des CM ABM begonnen, indem ich chatGPTplus eine Aufgabenstellung als Prompt eingab. Diese anspruchsvolle Aufgabenstellung ist weiter unten im Anhang dieses Beitrages zu finden. Meine Erwartung war nicht, dass chatGPTplus diese Aufgabenstellung sofort ohne Kommunikation mit mir umsetzen kann. Jedoch ist meine Erfahrung zur ‚Erweiterung‘ meiner kognitiven Fähigkeiten durch chatGPTplus derart positiv, dass diese Collective Intelligence Erfahrung, bestehend aus AI und Mensch, mehr als nur einmal bei mir Gänsehaut erzeugte. – Der Zuwachs an Geschwindigkeit sowie wissenschaftlicher Kreativität und Python Kompetenz liegt deutlich näher am Faktor 100 als am Faktor 2!

Ich fasse meine Collective Intelligence Erfahrungen mit chatGPTplus zusammen:

  • ChatGPTplus hat die unten stehende Aufgabenstellung mit ersten Ideen zur Ziel-Hierarchie und deren Ähnlichkeitsvermessung umgesetzt. Es fehlten lediglich vollständig die Projekttypisierung und die Stakeholder. – Eine Einbettung von chatGPTplus in die Agentenlogik habe ich nachträglich gestrichen, da dies zu kompliziert für mich wurde.
  • Zur Verfeinerung und Verbesserung der Aufgabenstellung war es notwendig, im Dialog mit chatGPTplus das Python-Programm weiter zu entwickeln. Die Kommunikation mit chatGPTplus entspricht hierbei der Kommunikation mit einem hochintelligenten Experten: Die chatGPTplus Expertise in den Bereichen Python, Mathematik und spezifischer Modellierungskompetenz übersteigt meine bei weitem. Hierbei habe ich die Erfahrung gemacht, dass die Verwendung von Ratgebern à la ‚Wie gestalte ich die chatGPT Prompteingabe optimal?‘ für mich keinen Sinn macht. – Meines Erachtens genügt es, die Prompts so zu erstellen, dass ein menschlicher Experte:inn sie nachvollziehen kann. – Dies genügt, um eine gelungene Kommunikation mit super Ergebnissen zu erhalten!
  • Auf der Basis der Kommunikation habe ich von chatGPTplus Pythoncode erstellen lassen. Dieser Code wurde in einer Colab-Umgebung laufen gelassen. Manchmal enthielt dieser Code einen Fehler, manchmal habe ich einen Fehler eingebaut, da ich noch Veränderungen am Code vorgenommen habe. Die Rückmeldung des vollständigen Fehlers als Prompt hat immer zum direkten Auffinden des Fehlers durch chatGPTplus geführt.
  • Die Analyse der Ergebnis-Daten zeigte den ein oder anderen Mangel in der Modellierungslogik auf. Eine textuelle Beschreibung der Ergebnis-Daten als Prompt führte immer innerhalb weniger Schritte zur Behebung dieses Mangels.
  • Es gibt eine Unzulänglichkeit in der Zusammenarbeit mit chatGPTPlus, die ich nicht beheben konnte und durch einen Workaround umgehen musste: In den ersten Tagen der Bearbeitung der Aufgabenstellung stellte ich mit fortschreitender Zeit immer häufiger fest, dass chatGPTplus vorherige gute Ergebnisse vergessen hatte. Dies führte dazu, dass an Stellen, die ich als abgeschlossen und korrekt betrachtet habe, plötzlich anderer Code und nicht selten zur Aufgabenstellung nicht passender Code auftauchte. So geschah es zum Beispiel, dass die Ziel-Hierarchie Berechnung verändert wurde oder dass das 7-köpfige Team wie Stakeholder behandelt wurde, also die MBTI Typ-Zuordnung zufällig erfolgte und nicht nach dem gewünschten Schema der Aufgabenstellung. Dieses ‚Fehlverhalten‘ tauchte umso häufiger auf, je länger die Modellierung der Aufgabenstellung dauerte. Das ‚Fehlverhalten‘ wurde noch verstärkt, wenn ich chatGPTPlus darauf hinwies, dass der Code an einer bestimmten Stelle falsch ist. Dann versuchte das System ein völlig anderes Modellverhalten zu erstellen. Am vierten Tag nach insgesamt ca. 4-5 Std. chatGPTplus Interaktion, habe ich mich zu folgendem Workaround entschlossen: Ich habe das gesamte Programm selbst immer wieder integriert und alle Änderungen selbst in das gesamte Programm eingegeben. Um erwünschte neue Modellierungs-Änderungen zu erhalten, habe ich chatGPTplus lediglich eine konkrete überschaubare aber durchaus schwierige Teilaufgabe gegeben. Wenn Änderungen größere Auswirkungen im Code hatten oder mehr als ca. 1 Std. Interaktion verstrichen war, habe ich den gesamten Code wieder als Prompt eingegeben. chatGPTplus hat sich hierfür meistens bedankt 😉: Es sei hilfreich, den gesamten Code zur Verfügung zu haben. Zusammenfassend interpretiere ich dieses Verhalten von chatGPTplus dahingehend, dass chatGPTplus über kein Kurzzeitgedächtnis verfügt.

Und nun zu den Ergebnissen. – Auf Nachfrage stelle ich gerne den CM ABM Code als Colab-Jupyter Notebook zur Verfügung. Ich beschreibe hier das Modell und diskutiere einige Ergebnisse:

Das Modell basiert auf der ABM Bibliothek MESA-Python [1]. Die Teammitglieder eines Teams und die Stakeholder werden als Agenten unterschiedlichen Typs behandelt. Die Agenten werden über eine MBTI Typologie mit Persönlichkeits-Polwahrscheinlichkeit charakterisiert (siehe Anhang). Alternativ könnte auch das Standardmodell der Psychologie, das Big Five Persönlichkeitsmodell (NEO-PI-R), verwendet werden. Das Persönlichkeitsmodell lässt sich auch um Werte/Motive oder Glaubenssätze erweitern.

Entsprechend der Aufgabenstellung haben die Teammitglieder fest vorgegebene Persönlichkeiten. Die Stakeholder erhalten ihre Persönlichkeit gemäß der globalen statistischen Verteilung der MBTI Persönlichkeiten.

Jeder Agent verfügt über eine eigene dreiteilige Ziel-Hierarchie. Die dreiteilige Ziel-Hierarchie entspricht dem einfachsten Collective Mind Schema, das wahlweise als Teil eine Dilts Pyramide angesehen werden kann oder als persönliche Story Map oder als OKR [2, 3]. Die Agenten verändern ihre Ziel-Hierarchie in Abhängigkeit ihrer individuellen MBTI Präferenzen, also der individuellen Persönlichkeits-Polwahrscheinlichkeiten. Zum Beispiel ändert ein extrovertierter NT-Typ durch Kommunikation vornehmlich die oberste Ebene der Ziel-Hierarchie – ein introvertierter NT-Typ tut dies auch, jedoch nicht so oft.

Die dreiteilige Ziel-Hierarchie besteht aus alphanumerischen Zeichenketten einer bestimmten Länge. Diese Zeichenketten werden am Anfang, wenn die Simulation beginnt, per Zufall ermittelt. Der Inhalt der Ziel-Hierarchie sollte keine entscheidende Rolle für das Auftauchen prinzipiell emergenter Systemeigenschaften haben. Dies trägt der langjährigen Erfahrung aus anderen ABM Modellen und deren Systemeigenschaften Rechnung [4]. – Die Mathematik ist vielleicht doch viel entscheidender als der Inhalt!

Die Änderung der Ziel-Hierarchien erfolgt zufällig und paarweise zwischen zufällig ausgewählten Agenten. Das Ändern der Ziel-Hierarchien durch Kommunikation ist eine Form von Lernen und wird über einen Lernparameter alphaT für Teammitglieder und alphaS für Stakeholder eingestellt. Typischerweise ist alphaS kleiner gleich alphaT, da die Interaktion im Team zu einem besseren Lernen führt.

Zusätzlich erhalten die Stakeholder weniger Möglichkeiten ihre Ziel-Hierarchie zu ändern. Dies erfolgt über eine gesondert einzustellende Zeit-Steprate: Die Stakeholder erhalten zum Beispiel eine um den Faktor 200 reduziert Möglichkeit ihre Ziel-Hierarchie zu ändern. Dies trägt der Annahme Rechnung, dass die Stakeholder untereinander weniger oft kommunizieren und auch weniger oft mit den Teammitgliedern.

In der Sprache der Theorie der Selbstorganisation ergeben sich damit folgende Parameter:

Rahmenparameter: Anzahl und Persönlichkeit der Teammitglieder, Anzahl und Persönlichkeit der Stakeholder, reduzierte Steprate für die Stakeholder

Kontrollparameter: alphaT, alphaS

Ordnungsparameter: dreiteilige Ziel-Hierarchie, am Anfang gefüllt mit zufällig ermittelten Zeichenfolgen der Länge k. Die Ziel-Hierarchien werden gemäß MBTI-Profil geändert. Die Ähnlichkeiten der Ziel-Hierarchien wird über die Ratcliff-Obershelp Funktion bestimmt [5].

Die nachfolgenden Abbildungen zeigen jeweils links das resultierende emergente Systemverhalten, gemessen über die mittlere Ähnlichkeit aller Ziel-Hierarchien getrennt nach den Teammitgliedern und den Stakeholdern.

Jeweils rechts ist die Performance des Teams bzw. der Stakeholder zu sehen. Die Performance ist keine emergente Eigenschaft sondern wird über folgende Formel aus der Ähnlichkeit ermittelt: Performance=(Anzahl der Agenten eines Typs* mittlere Ähnlichkeit der Ziel-Hierarchien des Agententyps)**2. Diese Formel basiert auf folgender Betrachtung: Es werden alle bilateralen Verbindungen innerhalb einer Gruppe (Teammitglieder, Stakeholder) aufsummiert – gewichtet mit der mittleren Ähnlichkeit der Ziel-Hierarchien innerhalb der Gruppe. Wie man weiter untern sehen kann, folgt die Performance der Ähnlichkeit, natürlich erhöht um einen Faktor, der die Anzahl der Gruppenmitglieder berücksichtigt. 

Abbildung 1:
Rahmenparameter: 7 Teammitglieder mit definierter MBTI-Persönlichkeit, keine Stakeholder
Kontrollparameter: Lernparameter Teammitglieder alphaT = 0.1
Ordnungsparameter: Ziel-Hierarchie-Ähnlichkeit mit der Ratcliff-Obershelp Funktion berechnet, ermittelt aus den dreiteiligen Ziel-Hierarchien mit jeweils am Anfang zufällig generierter Zeichenfolge von k = 100 Zeichen pro Ebene

Wie man aus Abbildung 1 sehen kann, steigt die Ähnlichkeit recht schnell auf Werte von über 0,7 und die Teamperformance damit auf Werte von 21 und mehr, bei 7 Teammitgliedern. – Der Synergieeffekt beträgt also 3 und mehr!

Selbstverständlich genügt diese Aussage, wie auch die nachfolgend abgeleiteten Aussagen, keinen wissenschaftlichen Ansprüchen. Um wissenschaftlichen Ansprüchen zu genügen, müsste ich u.a. ggf. 10.000 und mehr Durchläufe errechnen lassen, um dann auf dieser Basis eine statistische Auswertung aller errechneten Werte zu erhalten. Hierauf verzichte ich, da dies meine (derzeitigen) Möglichkeiten übersteigt. Abbildung 2 zeigt den Einfluss der Stakeholder auf das Team. Die Anzahl der Stakeholder entspricht der Anzahl der Teammitglieder, ist also 7. Die Fähigkeit der Stakeholder ein Collective Mind auszubilden, bestimmt auch die Fähigkeit des Teams ein Collective Mind auszubilden: Die Stakeholder ziehen die Leistungsfähigkeit des Teams runter, obwohl die Lernrate der Stakeholder genau so groß ist wie diejenige der Teammitglieder. – Die Interaktionsrate der Stakeholder ist jedoch um den Faktor 200 geringer als die Interaktionsrate der Teammitglieder. 

Abbildung 2:
Rahmenparameter: 7 Teammitglieder mit definierter MBTI-Persönlichkeit, 7 Stakeholder mit zufälliger MBTI-Persönlichkeit, Abschottung des Teams und zwischen den Stakeholdern durch 200-fach geringere Steprate als im Team selbst.
Kontrollparameter: Lernparameter Teammitglieder alphaT= 0.1, Lernparameter Stakeholder alphaS= 0.1
Ordnungsparameter: Ziel-Hierarchie-Ähnlichkeit mit der Ratcliff-Obershelp Funktion berechnet, ermittelt aus den dreiteiligen Ziel-Hierarchien mit jeweils am Anfang zufällig generierter Zeichenfolge von k = 100 Zeichen pro Ebene

Abbildung 3 zeigt eine Simulation mit 21 Stakeholdern und einer zehnmal geringeren Lernrate der Stakeholder (diese Simulation benötigt in der Colab Umgebung ohne spezielle Hardware ca. 3-4 Stunden elapsed time). Die Ziel-Hierarchie-Ähnlichkeit der Stakeholder sinkt weiter ab und zieht das Collective Mind des Teams mit sich weiter runter. Die Stakeholder wie das Team zeigen jetzt eine Performance die weiter unterhalb der Anzahl der Teammitglieder bzw. der Stakeholder liegt.

Abbildung 3:
Rahmenparameter: 7 Teammitglieder mit definierter MBTI-Persönlichkeit, 21 Stakeholder mit zufälliger MBTI-Persönlichkeit, Abschottung des Teams und zwischen den Stakeholdern durch 200-fach geringere Steprate als im Team selbst.
Kontrollparameter: Lernparameter Teammitglieder alphaT= 0.1, Lernparameter Stakeholder alphaS = 0.01
Ordnungsparameter: Ziel-Hierarchie-Ähnlichkeit mit der Ratcliff-Obershelp Funktion berechnet, ermittelt aus den dreiteiligen Ziel-Hierarchien mit jeweils am Anfang zufällig generierter Zeichenfolge von k = 100 Zeichen pro Ebene

Was sagt uns dies?

Es sieht so aus, als wenn die hybride Collective Intelligence von chatGPTplus und mir, ein Modell gefunden hätte, das emergentes Collective Mind Verhalten eines Teams in Interaktion mit Stakeholdern recht gut abbildet. – Dies ist ein weiterer Schritt in Richtung von Management 5.0, der Synergie von AI und Management 4.0.

Anhang: Erst-Aufgabenstellung für GPT4/ChatGPTplus

Die Aufgabenstellung zur Digitalen Transformation des Unternehmens KüchenManufaktur verwende ich in meinen Management 4.0 Trainings, um eine Scrum Simulation durchzuführen und eine Ziel-Hierarchie zu erstellen. Die zugrundeliegende Theorie hierzu ist in [2], [3] zu finden.

Erzeuge ein Agent Based Model (ABM) in der Programmiersprache Python, z. B. mittels MESA Python, für ein Team von 7 Teammitgliedern und 100 Stakeholdern. Die 7 Teammitglieder und die 100 Stakeholder sind Agenten im ABM. Die Teammitglieder und die 100 Stakeholder gehören zu dem Unternehmen KüchenManufaktur, das sogenannte Weiße Ware, also u.a. Herde, Kühlschränke und Gefrierschränke herstellt. Bisher hat das Unternehmen KüchenManufaktur diese Weiße Ware ohne große Digitalisierungsfunktionen hergestellt. Jetzt soll die Weiße Ware smart werden und als Life Style Produkt positioniert werden. Der Einsatz von smarter Technologie kann auch den Einsatz von AI oder ML beinhalten. Zum Beispiel könnte eine zukünftige Anforderung für einen Kühlschrank beinhalten, dass ‚er sich von alleine füllt‘. ‚Von alleine füllen‘ bedeutet, dass er über ein intelligentes Füllmanagement verfügt, das u.a. Zugriff auf Lebensmittellieferanten hat.

Es geht also um die Digitale Transformation des Unternehmens KüchenManufaktur. Die Digitale Transformation soll mittels eine Projektes durchgeführt werden. In einem ersten Schritt ist ein Konzept für die Digitale Transformation zu erstellen. Für diesen ersten Schritt ist das ABM mittels Python zu erstellen.

Die Aufgabe der Konzepterstellung typisieren wir als Projekt mittels des Diamantmodells: Das Projekt ist für KüchenManufaktur ein Projekt mit hohem Innovationsgrad. Nicht alle Stakeholder sind vom Sinn der Digitalen Transformation überzeugt und deshalb zeigen auch recht viele Stakeholder innere Widerstände gegen das Projekt. Deshalb sprechen wir von einem hohen Missionsgrad.- Das Team hat also viel Überzeugungsarbeit zu leisten. Der Kompliziertheitsgrad der neuen smarten Weißen Ware ist eher gering bis mittelgroß. Der Managementgrad ist mittel, da KüchenManufaktur innerhalb eines Jahres mit ersten smarten Produkten auf den Markt kommen möchte.

Die Persönlichkeiten der 7 Teammitglieder beschreiben wir mittels des MBTI, wobei die dominante Persönlichkeitsdimension des jeweiligen Teammitgliedes als Wahrscheinlichkeit angegeben wird. Wir nennen vereinfacht die jeweiligen Teammitglieder entsprechend ihrer MBTI Typologie und einer MBTI-Polwahrscheinlichkeit, also:

Teammitglied 1: ENTJ heißt: Extraversion = E = 0.8, Intuition = N = 0.8, Thinking = T = 0.6, Judging = J = 0.6

Teammitglied 2: INTJ heißt: Introversion = I = 0.8, Intuition = N = 0.7, Thinking = T = 0.7, Judging = J = 0.6

Teammitglied 3: ISFP heißt: Introversion = I = 0.6, Sensing = S = 0.7, Feeling = F = 0.7, Perceiving = P = 0.6

Teammitglied 4: ISTJ heißt: Introversion = I = 0.8, Sensing = S = 0.7, Thinking = T = 0.7, Judging = J = 0.9

Teammitglied 5: ESTJ heißt: Extraversion = E = 0.8, Sensing = S = 0.9, Thinking = T = 0.7, Judging = J = 0.6

Teammitglied 6: ISTP heißt: Introversion = I = 0.9, Sensing = S = 0.9, Thinking = T = 0.6, Perceiving = P = 0.6

Teammitglied 7: ISTJ heißt: Introversion = I = 0.7, Sensing = S = 0.6, Thinking = T = 0.6, Judging = J = 0.6

Die Stakeholder erhalten per Zufall eine Persönlichkeit gemäß MBTI.

Die Aufgabe der Konzepterstellung ist erledigt, wenn die 7 Teammitglieder, die das Konzept erstellen, eine gemeinsame Ziel-Hierarchie erstellt haben. Eine Ziel-Hierarchie besteht aus Informationseinheiten, die abstrakt oder detailliert sind. Eine Vision oder ein übergeordnetes Ziel bilden die oberste Ebene, es folgen darunter größere Informationseinheiten, die in weitere Informationseinheiten runtergebrochen werden. Im Agilen Management beginnt die Ziel-Hierarchie zum Beispiel mit einer Vision, gefolgt von Epics, die in Features zerlegt werden, die Features werden in User Stories zerlegt und diese wieder in Tasks und Tasks in Subtasks usw.

Für die Generierung der Informationseinheiten kann pro Teammitglied auf chatGPT zurückgegriffen werden

Um die Ziel-Hierarchie zu erstellen, tauschen die 7 Teammitglieder gemäß ihrer Persönlichkeitspräferenzen Informationseinheiten aus. Diese Informationseinheiten werden gemäß ihrer Präferenzen und der damit verbundenen Wahrscheinlichkeiten in die persönliche Ziel-Hierarchie aufgenommen.

Im ABM Model wird der Informationsaustausch in Zeitschritten durchgeführt. Wir definieren die Performance des Teams über die Ähnlichkeit der persönlichen Ziel-Hierarchien. Wenn alle persönlichen Ziel-Hierarchien identisch sind, sprechen wir von einem Collective Mind. Der Collective Mind kann durch die Kommunikation mit den Stakeholdern stabilisiert oder destabilisiert werden. Die Ähnlichkeit der Ziel-Hierarchien aller Stakeholder und der 7 Teammitglieder ist ein Maß für den Collective Mind im Team bzw. im Stakeholderkreis bzgl. der Digitalen Transformation.

Zeichne den Verlauf des Colletive Mind im Team und den Verlauf des Collective Mind für den Stakeholderkreis über die Zeit.

[1] Complexity Explorer (2023) MESA-Python Lecture, https://www.complexityexplorer.org/courses/172-agent-based-models-with-python-an-introduction-to-mesa/segments/17326, Santa Fe Institute, zugegriffen am 30.04.2023

[2] Oswald A, Köhler J, Schmitt R (2017) Projektmanagement am Rande des Chaos. 2. Auflage, Springer, Heidelberg, auch in englischer Sprache unter ‚Project Management at the Edge of Chaos‘ verfügbar.

[3] Köhler J, Oswald A. (2009) Die Collective Mind Methode, Projekterfolg durch Soft Skills, Springer Verlag

[4] Epstein J M, Axtell R (1996) Growing Artificial Societies – Social Science from the Bottom Up, The Brookings Institution, Washington D.C.

[5] Wikipedia (2023) Ratcliff-Obershelp Funktion, https://de.wikipedia.org/wiki/Gestalt_Pattern_Matching#:~:text=Gestalt%20Pattern%20Matching%2C%20auch%20Ratcliff,im%20Juli%201988%20im%20Dr.

AI & AM 4.0: Agent Based Modeling – Emergenz – Wunder geschehen!

Kürzlich erschien ein offener Brief zum Thema ‚Pausieren von gigantischen AI-Experimenten‘ à la GPT-3 oder GPT-4 [1].

Der Brief wurde inzwischen von mehr als 30.000 Personen unterschrieben. Er begründet sein Anliegen eines halbjährigen Aussetzens von AI-Groß-Entwicklungstätigkeiten mit folgendem Satz:

“This does not mean a pause on AI development in general, merely a stepping back from the dangerous race to ever-larger unpredictable black-box models with emergent capabilities.”

Es geht die Angst vor ‚emergenten Fähigkeiten‘ um. – An anderer Stelle wird von einer ‚Gottgleichen‘ KI gewarnt, die die Menschheit zerstören könnte [2].

Diese Sorgen mögen berechtigt sein, umso mehr, als man beobachten kann, wie lange sich die EU schon bemüht, den längst fälligen EU AI ACT als EU-Gesetz zu verabschieden [3].

In diesem Blog geht es jedoch nicht um diese Sorge oder Angst, sondern um das Thema Emergenz, das offensichtlich solche ‚Wunder‘ wie das der „Sparks of Artificial General Intelligence: Early experiments with GPT-4” [4] möglich macht. Die Intelligenz-Fähigkeiten von GPT-4, auch im Vergleich zu chatGPT/GPT-3.x, sind sensationell, gleichgültig, ob es um Mathematik, Musik, Bilderzeugung, Sprache und Logik und vielem mehr geht. – In nicht wenigen Fällen zeigt GPT-4 Intelligenz-Fähigkeiten, die überhaupt nicht trainiert worden sind. – Also klare Zeichen von emergenten Eigenschaften.

In Wikipedia wird Emergenz wie folgt definiert: „Emergenz (lateinisch emergere „Auftauchen“, „Herauskommen“, „Emporsteigen“) bezeichnet die Möglichkeit der Herausbildung von neuen Eigenschaften (Systemeigenschaften) oder Strukturen eines Systems infolge des Zusammenspiels seiner Elemente.“ [5]. Emergenz ist auch direkt mit dem Begriff der Selbstorganisation verbunden. Selbstorganisierte Systeme zeigen Emergenz bzw. emergente Eigenschaften. Auf der Basis dieser Definition wimmelt es in der Natur und damit in der Mathematik, den Naturwissenschaften/ Psychologie und den Sozialwissenschaften nur so von emergenten Eigenschaften, Strukturen oder Systemen.

In [6] wird auch deshalb zwischen schwacher und starker Emergenz unterschieden. Starke Emergenz liegt im Falle des Lebens vor, das aus Atomen oder Molekülen emergiert. – Oder, im Falle unseres Bewusstseins, das aus der materiellen Struktur unseres Gehirns emergiert. Die meisten anderen überraschenden Eigenschaften von Viel-Agenten Systemen wie zum Beispiel die Supraleitung, die Farbe von Gold, der Collective Mind eines Teams oder die Kultur einer Organisation werden eher der schwachen als der starken Emergenz zugeordnet. Ich halte die Unterscheidung für wenig sinnvoll.- Entscheidend für die Emergenz ist vielmehr, dass das durch die Wechselwirkung von Agenten entstehende Systeme Eigenschaften zeigt, die sich nicht aus den Eigenschaften der Agenten ableiten lassen.  In [7] wird deshalb für die Beschreibung von Large Language Model’s bezüglich Emergenz eine Definition verwendet, die die obige Definition aus [5] weiterführt:

„Emergence is when quantitative changes in a system result in qualitative changes in behavior.”

Abbildung 1: Bilder erzeugt durch die KI DALL-E [8] mit den Prompts: Create a painting in the style of Matisse: (Create a painting in the style of Gauguin:) Collective Mind as an example of social emergence which demonstrates synergies in a team

Im Falle von Large Language Models (LLM) gibt es mehrere quantitative Änderungen, die qualitative Veränderung hervorrufen: u.a. Anzahl der Parameter (Neuronen), Menge der Daten und die Trainingszeit. Aber auch die Architektur der LLM’s spielt eine entscheidende Rolle: u.a. das Transformer/Decoder Design, der Attention Mechanismus, usw.. So zeigt GPT-3 bei etwa 10 hoch 22 (10 Trilliarden) Floating Point Operations (FLOPs) als Maß für die Trainingszeit und 13 Milliarden Parametern einen sprunghaften Anstieg der sogenannten few-shoot prompting Genauigkeit.- Also nach einigen wenigen Lerndaten meistert das AI-System ähnliche Aufgabenstellungen. – Dieser Übergang entspricht einem Phasenübergang. – Ganz ähnlich zu der gesellschaftliche Resonanz für AI-System, die mit dem Erscheinen des einfach zu bedienenden chatGPT sprunghaft emergierte. 

Für die Beschreibung emergenten Systemverhaltens wurde in der Wissenschaftsgeschichte sehr oft der Nobelpreis vergeben: Es geht darum, diejenigen quantitativen Parameter ausfindig zu machen, die einen qualitativen Unterschied machen. Und dies ist meistens sehr schwierig, da man den Parametern nicht ansieht, ob sie in ihrer Zusammenstellung einen Unterschied machen. – Der qualitative Unterschied lässt sich also nicht auf die quantitativen Unterschiede in den Parametern reduzieren.

Jedoch wurde auch in der Geschichte der Wissenschaft aus dem Unverständnis der Emergenz eine unsinnige Spaltung in reduktionistische Wissenschaften und nicht-reduktionistische (holistische) Wissenschaften [9] vorgenommen. Hiernach wurde zum Beispiel die Physik als reduktionistische Wissenschaft angesehen, da angeblich alle System-Eigenschaften in der Physik auf die Eigenschaften der Agenten (z.B. Elementarteilchen, Atome) zurückgeführt werden, also reduziert werden.  Die Sozialwissenschaft mit der Soziologie à la Luhmann wurde zum Beispiel als holistische Wissenschaft wahrgenommen, da Luhmann, die Eigenschaften des sozialen Systems nicht auf die Menschen zurückführte, sondern dem System eine Eigenständigkeit zuerkannte.

Diese teilweise immer noch vorhandene naive Sicht des Gegensatzpaares Reduktionismus-Holismus wird durch das Auftauchen von GPT-4, aber auch schon durch die Erfahrungen mit chatGPT, kräftigst widerlegt: Die technischen Systeme chatGPT/GPT-3.x und chatGPTplus/GPT-4 zeigen mit ihrer Intelligenz eine für alle erfahrbare Emergenz. Diese AI-Systeme wurden auf der Basis bestimmter Daten-Parameter (u.a. Anzahl der Neuronen, Zeit des Trainings, Menge der Trainingsdaten) sowie bestimmten Architektur-Parameter (u.a. Transformer/Decoder und Attention-Mechanismus) mehr oder weniger gezielt kombiniert und es entstanden bei einer bestimmten Kombination dieser Parameter „wie durch ein Wunder“ emergente Intelligenz-Eigenschaften. – Es ist zu vermuten, dass bei Wegnahme z.B. der Attention-Eigenschaft, die emergente Eigenschaft der Intelligenz verschwindet, auch wenn die gigantische Skalierung bleibt.

Deswegen sind die emergenten AI-Eigenschaft jedoch nicht weniger wunderbar.

Dieses Beispiel belegt äußerst eindrucksvoll, dass die Natur, auch wenn sie in Form einer Technologie daherkommt, alle Ingredienzien für starke Emergenz enthält. – Wir ‚finden‘ diese Ingredienzien ‚lediglich‘.

Agent Based Modeling (ABM) spielt beim Auffinden dieser Eigenschaften eine prominente Rolle, auch wenn diese Rolle selbst in der Wissenschaft im Verhältnis zur Bedeutung nur wenigen bekannt sein dürfte. Unlängst hat das Santa Fe Institute neben Netlogo das ABM-Python-Framework MESA als Lecture aufgenommen [10]. Diese Lecture bildet mit moderner Technik das ABM des 25 Jahre alten Buches über ‚Growing Artificial Societies‘ von Epstein und Axtell nach [11]. Epstein und Axtell zeigen, wie man mit einfachen lokalen Agenten-Parametern die emergenten System-Eigenschaften von Gesellschaften erzeugen kann. – Der Überraschungseffekt ist nicht selten groß: So beeinflusst zum Beispiel die Fähigkeit des Sterbens oder der Reproduktion von Agenten ganz erheblich die emergenten Eigenschaften der ABM Ökonomie: Diese Modell-Eigenschaften sind nämlich notwendig, damit sich überhaupt sogenannte Nicht-Gleichgewichts-Handelsmärkte ausbilden können, die mit realen Märkten sehr gut übereinstimmen. – Das immer noch in der Gesellschaft vorherrschende neoklassische Verständnis der Gleichgewichts-Ökonomie kennt solche Zusammenhänge nicht.

In den folgenden Blogbeiträgen beschäftige ich mich mit der Suche nach den Parametern, die das emergente Teamverhalten Collective Mind hervorrufen. Im Management 4.0 gehen wir davon aus, dass die Parameter der Theorie der Selbstorganisation (Rahmen-Parameter, Kontroll-Parameter und Ordnungs-Parameter) die entscheidenden Parameter sind, die emergentes Teamverhalten hervorbringen. Wir kennen diese Parameter (vermutlich) auch schon, jedoch nicht in hinreichend formalisierter ABM Sprache. Die in vorhergehenden Blog-Beiträgen unter Verwendung von Natural Language Processing abgeleitete Similarity-Matrix des Collective Mind (Collective Mind Operator) ist lediglich ein phänomenologisches Modell (siehe Blog-Beitrag vom April und Juni 2022). – Der Collective Mind Operator kann in der Teampraxis sehr gut den Collective Mind messen, er sagt jedoch leider nichts darüber aus, wie der Collective Mind emergiert. Hierzu benötigen wir die formalisierten ABM-Parameter, die die Collective Mind Emergenz hervorbringen. – Die Suche nach diesen formalisierten Parametern ist kein Selbstzweck, denn die Wissenschaftsgeschichte hat gezeigt, dass die Kenntnis der formalisierten Parameter recht oft mit großen Erkenntnisgewinnen verbunden ist. – Die GPT-Geschichte ist der sichtbarste Beweis hierfür.

Der Übergang zur Python-Technologie mit MESA-Python eröffnet auch recht einfach die Möglichkeit intelligente Agenten auf der Basis von chatGPT anzubinden. Das werde ich nicht tun, jedoch hat die Entwicklung hierzu, wie in einem meiner letzten Blogs prognostiziert, schon begonnen. Die Stanford University hat zusammen mit Google eine auf dem Computerspiel ‚The Sims‘ basierendes ABM erstellt, in dem 25 Agenten ihre Intelligenz von chatGPT erhalten [12]. Die Agenten haben eine ‚Gehirn-Architektur‘ aus Langzeit- und Kurz-Zeitgedächnis, dessen kognitive Intelligenz von chatGPT kommt. Die Agenten verfügen zusätzlich über einen sogenannten ‚reflection tree‘, der der Ziel-Hierarchie bzw. der Dilts Pyramide von Management 4.0 sehr nahe kommt [13].- Die Ebenen Identität, Fähigkeiten und Verhalten sowie Kontext (Beobachtung) sind schon vorhanden. – Diese und weitere Ebenen können sicherlich noch ausgebaut werden.

Damit sind die Agenten in der Lage einen individuellen kognitiven PDCA-Zyklus durchzuführen, der ‚reflektiertes‘ Handeln erlaubt.

Es besteht auch die Möglichkeit, dass sich Menschen aktiv in dieses Handeln künstlicher Agenten einbringen können. Damit ist es zum Beispiel möglich hybride Universen aus AI und Menschen zu bilden.

Man stelle sich ein Anwendungsbeispiel von vielen vor: Ein Projektleiter soll ein Projekt durchführen. Er lässt das Projekt zum Test vorab in der künstlichen Welt durchführen und erhält so Hinweise auf seine Durchführbarkeit. –  Oder er lässt parallel zur realen Welt eine künstliche Welt mitlaufen, in die die Daten der realen Welt synchron eingespeist werden, um Forecasting zu betreiben.

In [12] wird berichtet, dass das Handeln der künstlichen Agenten von Menschen auf ‚Menschen-Ähnlichkeit‘ überprüft wurde. Das emergierende ‚believable behavior‘ der Agenten und des emergierenden sozialen Systems wird von den Evaluationspersonen, trotz einiger Fehler, als sehr hoch eingestuft.   

Das nächste Wunder geschieht schon!

    

[1] Future of Life Institute (2023) Pause giant AI Experiments, https://futureoflife.org/open-letter/pause-giant-ai-experiments/, zugegriffen am 22.04.2023

[2] Barkey S (2023) Kurz vor dem Durchbruch: „Gottgleiche“ KI könnte laut Experte Menschheit zerstörenhttps://www.berliner-zeitung.de/news/agi-kurz-vor-durchbruch-gottgleiche-ki-koennte-laut-experte-ian-hogarth-menschheit-zerstoeren-kuenstliche-allgemeine-intelligenz-li.339062, zugegriffen am 22.04.2023

[3] EU (2023) EU AI Act, https://artificialintelligenceact.eu/, zugegriffen am 22.04.2023

[4] Bubeck S et al. (2023) Sparks of Articial General Intelligence: Early experiments with GPT-4, arXiv:2303.12712v3 [cs.CL] 27 Mar 2023, zugegriffen am 22.04.2023

[5] Wikipedia (2023) Emergenz, https://de.wikipedia.org/wiki/Emergenz, zugegriffen am 25.04.2023

[6] Greve J, Schnabel A (Herausgeber) (2011) Emergenz: Zur Analyse und Erklärung komplexer Strukturen, suhrkamp taschenbuch wissenschaft

[7] Wi J et al. (2022) Emergent Abilities of Large Language Models, in Transactions on Machine Learning Research 08/2022, arXiv:2206.07682v2 [cs.CL] 26 Oct 2022

[8] DALL-E (2023) https://openai.com/product/dall-e-2, zugegriffen am 03.05.2023

[9] Wikipedia (2023) Reduktionismus, https://de.wikipedia.org/wiki/Reduktionismus, zugegriffen am 25.04.2023

[10] Complexity Explorer (2023) MESA-Python Lecture, https://www.complexityexplorer.org/courses/172-agent-based-models-with-python-an-introduction-to-mesa/segments/17326, Santa Fe Institute, zugegriffen am 30.04.2023

[11] Epstein J M, Axtell R (1996) Growing Artificial Societies – Social Science from the Bottom Up, The Brookings Institution, Washington D.C.

[12] Park J S et. al. (2023) Generative Agents: Interactive Simulacra of Human Behavior, arXiv:2304.03442v1 [cs.HC] 7 Apr 2023

[13] Oswald A, Müller W (2019) Management 4.0 – Handbook for Agile Practices, Release 3.0, Verlag BoD, kindle edition

AI & AM 4.0: Agent Based Modeling – Von Agenten Intelligenz und Kollektiver Intelligenz oder von ‚Intelligenz ist immer kollektiv‘?!

Das Thema Kollektive Intelligenz hat gerade Hochkonjunktur. Sei es in Form der mehrteiligen ZDF-Fernsehserie der Schwarm [1] und der damit verbundenen zweiteiligen Terra X Dokumentationen zur Intelligenz von Schwärmen [2], [3]. – Oder, auch in Form der AI Systeme chatGPT und des gerade veröffentlichten GPT-4 [4]. – Diese Systeme sind in zweierlei Hinsicht Systeme kollektiver Intelligenz: Die GPT-X Systeme und andere vergleichbare Systeme verwenden als Daten die Ergebnisse unserer aller Intelligenz und die Systeme selbst sind über die Neuronalen Netzwerke, auf denen sie beruhen, kollektive Systeme, die Intelligenz hervorbringen können, wenn sie mit unserer Intelligenz in Form von Daten gefüttert werden. – Dies ist gar nicht so unähnlich unserer kulturellen Entwicklung, die Produkte menschlicher Intelligenz hervorgebracht hat – nur eben viel, viel schneller!

Es ist absehbar, dass sich in Zukunft aus der Intelligenz von GPT-X eine Künstliche Allgemeine Intelligenz (Artificial General Intelligence, kurz AGI) entwickeln wird. Der CEO von openai betont in einem Blogbeitrag erst kürzlich hierzu die gesellschaftliche Verantwortung von openai [5] und im EU AI Act Newsletter wird, meines Erachtens zum ersten Mal, von der nahen Bedeutung von AGI im Kontext von GPT-X  Systemen gesprochen [6].   

In [2] und [3] wird eindrucksvoll geschildert, wie natürliche kollektive mobile Systeme, die aus ‚dummen‘ Agenten (u.a. Ameisen, Bienen, Fischen) bestehen, im Schwarm intelligentes Verhalten zeigen. Die vermeintlich ‚dummen‘ Agenten haben ihrerseits ein wenig Intelligenz auf der Basis von kleinen natürlichen neuronalen Netzwerken. – Die Natur ist also offensichtlich in der Lage mittels kollektiver Systeme (z.B. Ameisen Kollektiv) und von Subsystemen (z.B. Ameise als Agent) Intelligenz-Hierarchien aufzubauen.

Dies relativiert auch unseren Anspruch an intelligenter Einzigartigkeit: Kollektive Systeme, gleichgültig ob natürlich oder künstlich, haben das Potential, über eine geeignete Vernetzung, Intelligenz auszubilden.

Hieraus leite ich die These ab, dass Intelligenz immer kollektiv ist. Dies wird auch durch Ashby’s Law [7] gestützt, wonach ein komplexes System nur durch ein anderes komplexes System mit hinreichender Komplexität reguliert werden kann. Komplexität ist also eine Vorbedingung für Intelligenz. Deshalb sagen wir auch im Management 4.0, dass Komplexität ein Geschenk ist, das nicht reduziert werden sollte, sondern nur reguliert werden darf: Die Komplexität unseres Gehirns (und unseres gesamten Körpers) mit ca. 86 Milliarden vernetzter Neuronen ermöglicht es, dass wir uns adaptiv auf unsere Umgebung einstellen und diese ggf. regulieren. – Ich nehme an, dass niemand seiner Intelligenz, also seiner neuronalen Komplexität, beraubt werden möchte, indem diese reduziert wird.

In Konsequenz heißt dies auch, dass gut geführte soziale Organisationen, u.a. Teams, mit einer wertschaffenden Komplexität, kollektive Intelligenz zeigen, die über die Intelligenz der einzelnen Teammitglieder hinausgeht. Die einzige ! Aufgabe von Führung ist es, zu ermöglichen, dass sich diese kollektive Intelligenz ausbildet.    

Es ist vielleicht auch nicht abwegig, anzunehmen, dass Intelligenz eine Vorbedingung für Bewusstsein ist. – Und, dass Bewusstsein sich aus intelligenten kollektiven Systemen emergent entwickelt. Die Integrated Information Theory zum Bewusstsein zeigt erste Überlegungen in diese Richtung [8].

Im letzten Blog-Beitrag habe ich den Video-Vortrag des DeepMind Mitarbeiters Thore Graepel zum Thema ‚Multi-Agent Learning in Artificial Intelligence‘ erwähnt [9]. Thore Graepel referenziert dort am Anfang auf den Artikel von Legg und Hutter zum Thema ‚Universal Intelligence‘ [10]. Legg und Hutter geben einen Literatur-Überblick zum Verständnis von Intelligenz und definieren ihr Verständnis von Agent Intelligence:

Abbildung 1: Definition Universelle Intelligenz nach [10]

In [10] wird angenommen, dass die Wahrscheinlichkeit für Kontexte exponentiell (zur Basis 2) mit der Komplexität abnimmt. – Hier folgen Legg und Hutter auch dem Prinzip des Occam’schen Rasiermessers [11]: Die Natur bevorzugt Einfachheit und unsere Modelle zu Ihrer Beschreibung sollten dementsprechend auch einfach sein. – Einfache Kontexte werden also bei der Intelligenzberechnung höher gewichtet. Man kann auch jetzt verstehen, warum die melting pot Initiative von DeepMind von Bedeutung ist: Es werden möglichst viele Kontexte erstellt, um die allgemeine Intelligenz von Agenten über die obige Formel zu ermitteln.  

Legg und Hutter haben gezeigt, dass die obige Formel für Intelligenz alle bekannten Definitionen von Intelligenz subsummiert und auch auf den Intelligenzbegriff bei Menschen angewendet werden kann.- Auch wenn die konkrete Ausgestaltung von V und P in der obigen Formel für nachvollziehbare Kritik sorgt [12] und sich noch ändern dürfte. – Abbildung 2 visualisiert die Formel, in dem ich für das Mindset eines Agenten die Dilts Pyramide angenommen habe: Der Agent passt sich über die Zeit in einem PDCA-Zyklus mittels seiner Fähigkeiten und seines Verhaltens (auch policy genannt) an seine Umgebung an. Über die Funktion V wird die Performance des Agenten im Hinblick auf ein Ziel gemessen.- Der Agent erhält eine Belohnung. Die Performance des Agenten kann in zweierlei Hinsicht gemessen werden: Intern und extern. Das interne Performancemaß wird utility U genannt [13]. Agenten werden  rational genannt, wenn sie anstreben das interne Performancemaß mit dem externen in Einklang zu bringen. Einer der Kritikpunkte an [10] ist, dass (lediglich) das externe Performancemaß zur Intelligenzmessung herangezogen wird. 

    

Abbildung 2: Visualisierung der Formel zur Universellen Intelligenz nach [10]

Die Definition der Universellen Intelligenz ist sicherlich als Referenz für die Vermessung von Agenten Intelligenz sehr hilfreich. Ihre operative Ausgestaltung hat aber erst begonnen. – Und, sie ist rein phänomenlogisch, sie sagt also nichts über die Ingredienzien von Intelligenz aus, also welche Elemente wie zusammengebracht werden müssen, um intelligente Agenten bzw. Systeme zu bauen. Aus diesem Grunde versuche ich im Folgenden, einige mir wichtig erscheinende Elemente, in Form von Prinzipien, zu nennen. Ich lasse mich hierbei von der Transformer Technologie leiten, auf der die GPT-X Technologie beruht. Die aus meiner Sicht mit Abstand beste Darstellung zur Transformer-Technologie hat Ralph Krüger geschrieben – er macht keine verständnislosen Vereinfachungen, sondern beschreibt die Technologie didaktisch brillant [14]. Nicht desto weniger kann es manchmal beim Lesen helfen, die in Bing eingebundene chatGPT Bot Version als Assistenz zu benutzen ;-).

Neben [14] empfehle ich [15], eine dreiteilige sehr gute visuelle Aufbereitung des Matrizen-Flows (Tensorflows) in Transformern und für einen tieferen Blick in die Programmierung den Dreiteiler [16] sowie [17]. Als Einstieg kann der Spektrum der Wissenschaft Artikel von Manon Bischoff dienen [18]. Dieser Artikel enthält eine ganze Reihe interessanter Hinweise, u.a. auch die von mir im letzten Blog-Beitrag geäußerte Vermutung, dass chatGPT lediglich 1,5 Milliarden Parameter enthält, also mehr als 100 mal weniger als GPT-3. Manon spricht sogar von nur 1,3 Milliarden Parametern. Als Einstieg empfehle ich zusätzlich den Artikel über chatGPT [19].

Auf der Basis dieser Literatur liste ich im Folgenden die Prinzipien, die meines Erachtens das Was und das Wie der Intelligenz ausmachen:

Intelligenz ist immer kollektiv: Als Kollektiv bezeichne ich ein System von vernetzten Elementen (künstliche oder natürliche Neuronen, Ameisen, Menschen, usw.), das die Außenwelt per Transformation in eine Innenwelt abbildet. Die Transformation erfolgt im Falle der AI durch künstliche neuronale Netzwerken, die Tensor Operationen durchführen (bzw. Matrizenoperatione durchführen: Die Matrizenelemente sind die Gewichte zwischen den Neuronen). – Die Tensor Operationen sorgen also für die Abbildung. Damit diese Abbildung hinreichend viele Informationen der Außenwelt abbilden kann, benötigt sie viele Zustände, also viele Parameter, im Falle von GPT-3 175 Milliarden. Die Abbildung der Außenwelt über eine Parametrisierung in der Innenwelt, erfolgt über Selbstorganisations-Mechanismen, in denen eine Zielfunktion im AI-Training dafür sorgt, dass die niedrigsten energetischen Zustände in dem hochdimensionalen Parameterraum gefunden werden. – Diese repräsentieren nach dem Training die Daten der Außenwelt.

Ich habe die Bing AI gefragt, ‚Gibt es eine Zielfunktion für das Lernen im Gehirn‘. Bing AI wandelt dies in eine Frage nach ‚Zielfunktion Lernen Gehirn‘ um und generiert folgende Antwort:

Ja, das Gehirn hat eine Zielfunktion für das Lernen. Das Lernen ist im Grunde genommen eine Reaktion unseres Gehirns auf neue Erfahrungen. Wenn eine solche Erfahrung eine nachhaltige Änderung im Gehirn hervorruft, dann kann man von Lernen sprechen. Das Gehirn bereitet sich dadurch auf die Zukunft vor. Natürlich kann man sein Gehirn anregen und unterstützen, neue Dinge schneller zu lernen oder die synaptischen Verbindung zu bilden, die man möchte. Dazu brauchen wir nur unsere Aufmerksamkeit genau auf die zu lernenden Themen zu richten und sie entsprechend oft wiederholen.

Diese Definition der Zielfunktion entspricht nicht ganz meinem obigen Verständnis einer Zielfunktion: Außer, man versteht die neuronalen Mechanismen, die sich hinter der Aufmerksamkeit verbergen, als solche.

Die Außenwelt wird über Aufmerksamkeit kontextualisiert: Im Falle der Transformer-Technologie ist der Aufmerksamkeits-Mechanismus (Attention-Mechanismus) der Mechanismus, der die Leistungssteigerung gegenüber vorherigen AI Systemen wesentlich ausmacht. Hierzu werden die sprachlichen Inhalte der Außenwelt auf ihre semantischen Zusammenhänge hin analysiert: Alle Worte eines Satzes (eines Textes) werden herausgegriffen, also mit Aufmerksamkeit belegt, und es wird die Korrelation dieses herausgegriffenen Wortes zu allen anderen Worten in diesem Satz  (diesem Text) ermittelt. – Die Korrelationswahrscheinlichkeiten werden in speziellen neuronalen Netzwerken (Tensoren) trainiert. Für die Generierung von neuen Texten wird auf diese trainierten Korrelationswahrscheinlichkeiten zurückgegriffen.

Wahrscheinlichkeiten werden durch zusätzliche kollektive Maßnahmen auf verschiedenen Ebenen ausbalanciert: Die Ergebnisse, die ein Transformer nach außen liefert, sind die Ergebnisse mit der höchsten Wahrscheinlichkeit. Um die Verlässlichkeit der Wahrscheinlichkeiten zu erhöhen, werden die Wahrscheinlichkeiten pro Transformer Modul nicht nur einmal berechnet, sondern mehrmals parallel d.h. zum Beispiel mit 8 attention Mechanismen, dem sogenannten multi-head-attention. Zusätzlich werden im Falle von GPT-3 96 Transformer Module (Decoder) hintereinander geschaltet, um die Ergebnisse zu verfeinern und zu stabilisieren [18]. Der multi-head-attention Mechanismus zeigt damit die Wirkung eines Teams mit acht Teammitgliedern, in dem die potentiellen mentalen Verzerrungen der Teammitglieder ausbalanciert werden. Und, das Hintereinanderschalten der Transformer-Module lässt sich gut mit der iterativen Wirkung von 96-PDCA-Zyklen vergleichen.

… ggf. weitere Prinzipien

Ich glaube, dass Intelligenz nicht auf natürliche Systeme beschränkt ist, ja dass diese Einteilung in natürliche und künstliche Systeme künstlich ist: Intelligenz ist ein universelles Phänomen, das sich potentiell in allen Systemen ausdrücken kann, sobald hierfür die Voraussetzungen vorliegen…. Vielleicht sind die oben genannten Prinzipien tatsächlich (einige) der Voraussetzungen …Vielleicht wird die Filmreihe ‚Autobots – The Transformers‘ sogar einmal als (diesbezüglich) hellsehend bezeichnet werden [20]. 

 

[1] ZDF (2023a) Der Schwarm, https://www.zdf.de/serien/der-schwarm

[2] ZDF (2023b) Terra X – Schlaue Schwärme, Geheimnisvolle Sprachen, https://www.zdf.de/dokumentation/terra-x/schlaue-schwaerme-geheimnisvolle-sprachen-doku-102.html

[3] ZDF (2023c) Terra X – Schlaue Schwärme, Rätselhafte Kräfte, https://www.zdf.de/dokumentation/terra-x/schlaue-schwaerme-raetselhafte-kraefte-doku-100.html

[4] openai (2022) GPT-4, https://openai.com/product/gpt-4, zugegriffen am 20.03.2023

[5] Altman S (2023) Planning for AGI and beyond, https://openai.com/blog/planning-for-agi-and-beyond, zugegriffen am 15.03.2023

[6] The future of Life Institute (2023) The EU AI Act Newslettr #25 vom 01/03/23-14/03/23

[7] Wikipedia (2023) Ashby’s Law, https://de.wikipedia.org/wiki/Ashbysches_Gesetz, zugegriffen am 15.03.2023

[8] Wikipedia (2023a) IIT- Integrated Information Theory, https://en.wikipedia.org/wiki/Integrated_information_theory, zugegriffen am 15.03.2023

[9] Graepel T (2023) The role of Multi-Agent Learning in Artificial Intelligence Research at DeepMind, https://www.youtube.com/watch?v=CvL-KV3IBcM&t=619s, zugegriffen am 06.02.2023

[10] Legg S und Hutter M (2007) Universal Intelligence: A Definition of Machine Intelligence, arXiv:0712.3329v1

[11] Wikipedia (2023b) Occam’s razor, https://en.wikipedia.org/wiki/Occam%27s_razor, zugegriffen am 21.03.2023

[12] Park D (2023) Paper Summary: Universal Intelligence: A Definition of Machine Intelligence, https://crystal.uta.edu/~park/post/universal-intelligence/, zugegriffen am 06.03.2023

[13] Russel S und Norvig P (2016) Artificial Intelligence – A modern approach, Third Edition, Prentice Hall Series in Artificial Intelligence Series, Pearson Education Limited

[14] Krüger R (2021) Die Transformer-Architektur für Systeme zur neuronalen maschinellen Übersetzung – eine popularisierende Darstellung, in trans-kom 14 [2], Seite 278-324

[15] Doshi K (2022) Transformers Explained Visually: How it works, step-by-step published January 2, 2021, towardsdatascience.com, zugegriffen am 10.05.2022,  (Part 1, 2, 3, 4), https://towardsdatascience.com/transformers-explained-visually-part-1-overview-of-functionality-95a6dd460452, https://towardsdatascience.com/transformers-explained-visually-part-2-how-it-works-step-by-step-b49fa4a64f34, https://towardsdatascience.com/transformers-explained-visually-part-3-multi-head-attention-deep-dive-1c1ff1024853, https://towardsdatascience.com/transformers-explained-visually-not-just-how-but-why-they-work-so-well-d840bd61a9d3

[16] Gosthipaty A R und Raha R (2022) A Deep Dive into Transformers with Tensorflow and Keras, Part 1-3, PyImagesearch.com, published November 2022, zugegriffen am 06.12.2022, https://pyimagesearch.com/2022/09/05/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-1/, https://pyimagesearch.com/2022/09/26/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-2/, https://pyimagesearch.com/2022/11/07/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-3/

[17] Cristina S (2023) Training the Transformer Model, https://machinelearningmastery.com/training-the-transformer-model/, updated am 06.01.2023, zugegriffen am 20.03.2023

[18] Bischoff M (2023) Wie man einem Computer das Sprechen beibringt, https://www.spektrum.de/news/wie-funktionieren-sprachmodelle-wie-chatgpt/2115924, veröffentlicht am 09.03.2023, zugegriffen am 20.03.2023

[19] Ruby M (2023) How ChatGPT Works: The Model Behind the Bot, https://towardsdatascience.com/how-chatgpt-works-the-models-behind-the-bot-1ce5fca96286, veröffentlicht am 30.01.2023, zugegriffen am 20.03.2023

[20] Wikipedia(2023) Autobot, https://en.wikipedia.org/wiki/Autobot, zugegriffen am 20.03.2023

Transformatives Bogenschießen: Von ‚agilen‘ Überzeugungen oder „von den Türen, die wir heute aufmachen, durch die wir morgen gehen [1]“

Im letzten Blogbeitrag habe ich mein neues Seminar Transformatives Bogenschießen erstmalig vorgestellt.

In diesem Blog-Beitrag skizziere ich die Wirkweise von Transformativem Bogenschießen.

Transformatives Bogenschießen (TB) kann eine Ressource sein oder als Katalysator für die individuelle Veränderungsarbeit, d.h. für die mentale Problembehandlung, eingesetzt werden.

TB als Ressource bedeutet, dass dem Menschen wichtige Aspekte, wie die Gesundheit, die Kraft, die Ruhe oder die Intuition, gestärkt werden. Ich skizziere hierzu zwei Beispielen aus meiner TB-Selbsterfahrung – Gesundheit sowie Ruhe und Intuition:

Gesundheit: Nach ca. zwei Stunden Bildschirmarbeit, habe ich Probleme, meine Augen auf den Bildschirm zu fokussieren. Dies wird zunehmend von einem Gefühl von Unwohlsein und Stress begleitet. – Wahrscheinlich wurde dies durch die Bildschirmarbeit, während der langen virtuellen Meetings in der Coronazeit ausgelöst oder beschleunigt. Ich nutze Bogenschießen für meine Gesundheit, indem ich in meinem Garten schieße: Beim Fokussieren auf größere Distanzen werden meine Augen entlastet und dies beseitigt schon nach kurzer Zeit das Unwohlsein.

Ruhe und Intuition: Beim intuitiven Bogenschießen wird nicht explizit gezielt, sondern man vertraut sich und den Schuss dem Körpergefühl an. Gehen dem Bogenschießen keine stressigen Stunden voraus, bin ich mit meinem Trefferbereich zufrieden. – Körpergefühl und mentale Ausrichtung sind im Einklang. Im Falle von vorausgehenden stressigen Stunden, u.a. durch zu viel Bildschirmarbeit, ist der Trefferbereich wesentlich schlechter. Die erforderliche Ruhe und die Intuition bilden sich jedoch durch TB nach einer gewissen Zeit wieder erfolgreich aus. Der Trefferbereich wird deutlich besser: Körper und Geist entspannen sich und geraten wieder in Einklang. – Sehr wesentlich ist, dass sich im Bogenschießen das Gefühl für Zeit ändert. Die Intuition verbindet in dem Zeitraum des Loslassens der Sehne die Fäden der Vergangenheit und Gegenwart zu einem Faden der Zukunft. – Insbesondere für Menschen, die unter Zeit die Uhrzeit verstehen, ist dies eine besondere Erfahrung von Zeit [1].
TB ist kein körperliches Auspowern wie bei vielen anderen Sportarten, sondern sorgt, wie in diesem Beispiel, für eine ruhige Pflege der Intuition. Transformatives Bogenschießen als Ressource für Ruhe und Intuition entspricht im Wesentlichen dem Meditativen Bogenschießen [2].

Bogenschießen als Ressource entwickelt sich nur, wenn man bereit ist, das im Seminar Gelernte regelmäßig anzuwenden. – Denn die Ressource wird sich erst nach einigen Wochen des Übens entfalten.

Nach dem Erlernen der Techniken des Bogenschießens und dem Erfahren des Bogenschießens als Ressource, ist die individuelle Veränderungsarbeit der dritte Teil des Seminars. Hierbei ist zu beachten, dass der Durchgang durch das sogenannte ‚Transformative Tor‘ in die Veränderungsarbeit nur sinnvoll ist, wenn die Teilnehmer die Technik des Bogenschießens gut (genug) beherrschen. Falls die Teilnehmer die Technik des Bogenschießens kennen, aber wiederholt nicht umsetzen können, ist dies ein starkes Indiz für ein mentales Problem, gemäß der Erfahrung „Bogenschießen wirkt wie ein Spiegel der Seele“. Die mentale Ausrichtung, erworben in der Vergangenheit, „verzerrt“ die Schieß- und Ziel-Technik. Die Teilnehmer nehmen diese „Verzerrung“ meistens selbst wahr und ziehen auch sehr oft eine Verbindung zu ihrem Alltag. Lediglich in einigen Fällen ist es angebracht, dass der Trainer „anstupsend“ hilft. Selbstverständlich sind diese Erkenntnisse zuerst einmal nur Hypothesen. Der Trainer unterstützt die Teilnehmer bei der nachfolgenden Analyse und dem Auflösen des Problems sowie dem Transfer in den jeweiligen individuellen Alltag.

In dem Video [2] kann man erkennen, dass die Technik der Teilnehmer nicht gut ausgebildet ist: Entweder wurde vom Trainer nicht auf eine gute Technik geachtet oder das erkennbare, nicht gut Ankern ist ein Indiz für ein mentales Problem. Gutes Ankern bedeutet, dass die Sehne vollständig ausgezogen wird und die Hand mit der ausgezogenen Sehne und dem Pfeil an der Wange angelegt wird, also geankert, wird. Nehmen wir zur Illustration hier an, dass das schlechte Ankern im Video ein Indiz für ein mentales Problem sei. Möglich Probleme könnten zum Beispiel sein: Berührungsangst, zu große Aggressionshemmung oder fehlende Durchsetzungskraft. Die Identifikation des Problems erfolgt im Schießen, indem die Teilnehmer:in die ‚Unsauberkeit‘ in der Technik selbst wahrnimmt und dieser eine Bedeutung zuschreibt. Dies geschieht oft durch Metaphern, z.B. für das obige Beispiel Berührungsangst könnte die Metapher heißen „Ich kann die Kluft nicht überbrücken“. Ist die Metapher da und wurde durch die Teilnehmer:in die Verbindung zum Alltag hergestellt, wird das Problem im Bogenschießen aufgelöst: Es wird zum Beispiel erfolgreich über eine Kluft geschossen. Der abschließende Transfer in den Alltag wird besiegelt. – Die Erfahrung zeigt, dass diese Form der transformativen Veränderungsarbeit sehr erfolgreich ist, d.h. die Veränderung setzt tatsächlich ein.    

Dieser Teil des TB-Seminars ist auf das Seminar beschränkt, da hierfür im Normalfall eine professionelle Begleitung durch einen Trainer oder einen Coach für Transformatives Bogenschießen notwendig ist.

Die oben geschilderten Problembeispiele aber auch die in einer Organisation vorliegenden Widerstände für die erfolgreiche Umsetzung von Transformationen, also grundlegende Veränderungen, beruhen auf Überzeugungen. Im Management 4.0 verwenden wir die Dilts Pyramide [3], um die enorme Bedeutung von Überzeugungen (Glaubenssätzen, Grundannahmen, Prinzipien) für die Veränderung sichtbar zu machen. Die Dilts Pyramide visualisiert, dass Überzeugungen Abstraktionen sind, die aus der Erfahrung in einem jeweiligen Kontext abgeleitet werden. Die individuelle Persönlichkeit stellt eine Disposition für Überzeugungen dar oder anders ausgedrückt, Überzeugungen spiegeln nicht wider, was man weiß, sondern, drücken aus, wer man ist [4].



Abbildung 1: Vier Bilder erzeugt von der Künstlichen Intelligenz DALL-E 2 [5] mit dem Prompt ‚A painting in the style of Chagall: Transformative archery opens doors‘

Kommen wir zu einer Erklärung, warum TB wirkt!

Ich verwende hierzu die Theorie des Predictive Processing wie sie von Philipp Sterzer in [4] skizziert wird. Sterzer ist Psychiater und Neurowissenschaftler. Er zeigt auf der Basis von wissenschaftlichen Fakten, dass die fundamentalen Mechanismen von Überzeugungen für sogenannte ‚normale‘ Überzeugungen, Verschwörungsüberzeugungen, wahnhafte Vorstellungen und schizophrenen Wahn gleich sind.

Nach der Predictive Processing Theorie, also der Theorie der vorhersagenden Verarbeitung, arbeitet unser Gehirn mit einem hypothetischen Modell der Welt. Dieses Modell wird im Idealfall fortwährend an die Weltdaten angepasst, um so neue Vorhersagen zu erzeugen. Überzeugungen sind Teil jenes inneren Modells der Welt, das unser Gehirn für Vorhersagen nutzt.  Überzeugungen sind „Hypothesen über allgemeine und zeitlich stabile Gesetzmäßigkeiten“, die wir in der Welt wahrgenommen haben. Unser Gehirn folgt einem Plan-Do-Check-Act Zyklus: Es werden Hypothesen gebildet, auf der Basis von Hypothesen wird gehandelt, das Handeln wird überprüft und dann ggf. angepasst. Es gibt eine Hierarchie von Vorhersagen, eine Hierarchie vom kognitiven Abstraktem zum sinnlich Konkreten, die es ermöglich Komplexität zu regulieren und Unsicherheit abzubauen. – Ich verweise auch hier auf die Zielhierarchie (vom Big Picture zum Detail) im Management 4.0, die genau diese Funktion hat [6].
Hinzu kommt, dass Vorhersage und Sinnesdaten nach ihrer Präzision, ihrer beigemessenen Wahrscheinlichkeit, gewichtet werden. Nach der Predictive Processing Theorie erzeugen wir Vorhersagen auf der Basis der Differenz von Vorhersage- und Sinnesdaten-Präzision. Die Größere der beiden Präzisionen leitet unsere Vorhersagen und unser Handeln. Der Neuromodulator Dopamin ist von großer Bedeutung für die Balance der beiden Präzisionen. Dopamin wird nicht nur bei Sport und Freude ausgeschüttet, sondern auch bei Stress. Dopamin verändert die Sinnes-Wahrnehmung und übergewichtet die Sinnesdaten-Präzision. Dies kann auch zu Halluzinationen oder Wahnvorstellungen führen: „Die empirischen Befunde …. sprechen für ein (Präzisions-) Ungleichgewicht zwischen Vorhersagen und Sinnesdaten als Grundlage für die Entstehung von Psychosen. Die Folge des Dopaminüberschusses ist somit, dass Sinnesreize, die sonst keine Beachtung fänden, als bedeutsam registriert werden. Man spricht von aberranter Salienz, was so viel heißt wie fehlgeleitete Auffälligkeit.“ Fehlgeleitete Auffälligkeiten erzeugen Angst, und erfordern eine Korrektur des Weltbildes. Und dieses Weltbild muss so konstruiert sein, dass es die fehlgeleitete Auffälligkeit erklärt, also Komplexität reguliert [4].

Das Übergewichten der Vorhersage-Präzision der Überzeugungen kann zur Irrationalität führen, die allerdings adaptiv ist und einen evolutionären Vorteil bringt. Ein Beispiel [4]:

Ein Spaziergänger identifiziert im Dunkeln eine auf dem Boden erkennbare Schlangenform als Schlange. Es gibt keine Evidenz wonach dies tatsächlich eine Schlange ist, jedoch sind die Kosten dieser Erkenntnis eventuell geringer als der Biss einer Schlange, wenn sich die Schlangenform dann wirklich leider als Schlange herausstellen sollte. – Auch wenn sich bei vorsichtigem Annähern herausstellen sollte, dass es nur ein Ast in Schlangenform ist. In diesem Sinn können irrationale Überzeugungen adaptiv sein und stellen evolutionär einen Vorteil dar.

In diesem Beispiel ist die sogenannte Sinnesdaten-Präzision gering. Der Vergleich von Vorhersage-Präzision und Sinnesdaten-Präzision fällt zu Gunsten der Vorhersage-Präzision aus: Die Überzeugung erhält Vorrang. Das Gehirn ist also genau genommen eine „Präzisionsgewichtungsmaschine“ [4].

Im ‚Idealfall‘ sollten Vorhersage-Präzision und Sinnesdaten-Präzision nahe beieinander liegen. – In diesem Fall stellt sich Agilität ein, deshalb habe ich auch im Titel des Blogs von ‚agilen‘ Überzeugungen gesprochen. Problematisch wird es, wenn eine der Präzisionen dominiert. Würde im unserem Beispiel der Schlangenform, die Vorhersage-Präzision stark dominieren, wird im schlimmsten Fall keine Überprüfung in der Wirklichkeit mehr stattfinden. Die Schlangenform wäre dann definitiv eine Schlange. Würde im Beispiel die Sinnesdaten-Präzision überwiegen, wird eine potenzielle Gefahr nicht mehr wahrgenommen, erst dann, wenn es schon zu spät ist.       

Die Wirkung von TB lässt sich auf der Basis der Predictive Processing Theorie wie folgt erklären:

  • Falls Bogenschießen mit Freude erfolgt – insbesondere, wenn Bogenschießen als Ressource empfunden wird – wird die Dopaminausschüttung angeregt.
  • Die Sinnesdaten-Präzision bekommt eine größere Bedeutung, ggf. wird sie übergewichtet.
  • Die Wahrnehmung öffnet sich für das Erkennen einer ‚(kleinen) Unsauberkeit‘ in der Ziel- und Schiesstechnik.
  • Diese Offenheit ermöglicht das Erfahren von Problem-Zusammenhängen im Schießen und im Alltag. Die bisherige Überzeugung wird hinterfragt, die blockierende Vorhersage-Präzision untergewichtet.
  • Die Ausbildung von Metaphern und das Auflösen des Problems im Schießen schlägt die Brücke zum Alltag.
  • Eine neue Überzeugung wird neben die alte Überzeugung gesetzt. Die neue Überzeugung ist im Alltag zu stabilisieren, damit die neu Vorhersage-Präzision groß genug werden kann.

Überzeugungen sichtbar zu machen, in Frage zu stellen und ggf. durch neue Überzeugungen zu ersetzen, dies ist adaptiv, ist agil! – Überzeugungen sollten immer nur Hypothesen sein, die sich ggf. als falsch herausstellen.

Man könnte annehmen, dass ähnliche Sportarten (u.a. Speerwerfen, DART, Golf, …) wie Bogenschießen transformativ eingesetzt werden können. Dies mag sein, jedoch gebe ich zwei Aspekte zu bedenken: Bogenschießen knüpft sehr stark an unsere archaischen Wurzeln an, damit könnte u.a. ein hoher Dopamin-Ausstoß verbunden sein. Was aber viel wichtiger ist, dass die archaischen Wurzeln durch sehr viele Metaphern – wie ‚keinen Pfeil mehr im Köcher haben‘ oder ‚ins Schwarze getroffen haben‘ – in unserem Denken verwurzelt sind und diese Verbindungen mittels Jahrzehnten kreativer therapeutischer Veränderungsarbeit [7] gehoben worden sind.

Transformatives Bogenschießen dient dazu, zu lernen, Überzeugungen in Frage zu stellen. Damit werden Überzeugungen adaptiv und öffnen uns die Türen, durch die wir gehen (können).

Weitere Informationen zu den TB-Seminaren finden Sie unter https://www.socialtechnologies.de/training.

 

[1] Lesch H und Forstner U (202119) Zeit – Ein Physiker und eine Philosophin spielen mit der Zeit, Patmos Verlag, kindle Ausgabe

[2] Bayrischer Rundfunk (2022) Meditatives Bogenschießen https://www.youtube.com/watch?v=wY1NF3zguKc

[3] Oswald A, Müller W (2019) Management 4.0 – Handbook for Agile Practices, Release 3, BoD Verlag, Norderstedt Management 4.0

[4] Sterzer P (2022) Die Illusion der Vernunft – Warum wir von unseren Überzeugungen nicht zu überzeugt sein sollten, Ullstein Buchverlage GmbH, Berlin, kindle Ausgabe

[5] DALL-E 2 (2023) https://openai.com/dall-e-2/, zugegriffen am 04.01.2023

[6] Oswald A, Köhler J, Schmitt R (2016) Projektmanagement am Rande des Chaos, Springer, Heidelberg

[7] Schäfer K-H (2018) Therapeutisches Bogenschießen, 2. Auflage, Ernst Reinhardt Verlag München

Transformatives Bogenschießen – Erfahrungsorientierte Veränderungsarbeit für Projektleiter und Projektteams – Ein Seminar Angebot

Im September diesen Jahres habe ich an der psychosomatischen Klinik Wollmarshöhe [1] meine Prüfung zum Therapeutischen Bogenschießen abgelegt und bin damit für Therapeutisches Bogenschießen zertifiziert:

„Durch eine Prüfung wurde der Nachweis der Befähigung zur selbständigen Durchführung des Therapeutischen Bogenschießens erbracht. Die notwendigen technischen, sicherheitsrelevanten und kommunikations- bzw. beziehungsrelevanten Kenntnisse und Fähigkeiten zum Einsatz des Bogenschießens im therapeutischen Zusammenhang und mit therapeutischer Zielsetzung sind vorhanden.“ [2]

Mein Trainer und Prüfer war Karl-Heinz Schäfer, einer der profiliertesten Psychotherapeuten für Erfahrungsorientierte Therapie [3] und im deutschsprachigen Raum die erste Adresse für Therapeutisches Bogenschießen. Er hat seine Erfahrungen zum Therapeutischen Bogenschießen in seinem Buch mit gleichem Titel festgehalten [4].   

Da ich seit vielen Jahren im Projekt-Coaching und der organisationalen Veränderungsarbeit tätig bin und die Wirkung des Bogenschießens als Werkzeug der erfahrungsorientierten Veränderungsarbeit kennenlernte, biete ich ab 2023 das Seminar Transformatives Bogenschießen (TB) an. Dieses zweitägige TB-Seminar, mit maximal drei Teilnehmern, richtet sich vor allem an Projektleiter und andere agile Führungskräfte, die sich selbst erfahren möchten und lernen möchten, sich selbst (besser) zu führen. Gemäß Management 4.0 ist Selbstführung die Basis einer guten Führung.
Projektteams mit bis zu 6 Teilnehmern können auch in der Teambildung und in der Festigung des Teamgeistes von dem TB-Seminar profitieren. 

Was ist Transformatives Bogenschießen (TB)?

Transformatives Bogenschießen beruht auf den Prinzipien und Verfahren des Therapeutischen Bogenschießens, verändert und ergänzt diese soweit notwendig für den beruflichen Kontext des Projektmanagements und der Projektarbeit.

Das zweitägige TB-Seminar besteht aus drei Teilen:

  • dem Erlernen und Erfahren des Intuitiven Bogenschießens als Quelle für Achtsamkeit
  • dem Erfahren des Intuitiven Bogenschießens als Ressource für individuelle Resilienz
  • dem Erfahren des Intuitiven Bogenschießens als Katalysator für Veränderungsarbeit

Im Transformativen Bogenschießen „geht es nicht um (sportliche) Leistung, Perfektion, Erfolg, sondern um Erleben, Selbsterfahrung, Selbstausdruck und persönliche Entwicklung“ [4]. Im ersten Teil des Seminars werden alle Grundlagen des Guten Bogenschießens erlernt, also die Schuss- und die Ziel-Technik. Hierzu gehört die Standtechnik, das richtige Spannen und Ankern verbundenen mit einem guten Öffnen und Atmen. Einem entspannten Anspannen des gesamten Körpers, insbesondere der Rückenmuskulatur, verbunden mit einer ruhigen Lockerheit. Es geht um das Erlernen und Erleben einer ruhigen, kraftvollen Zielorientierung. Zielen heißt im Therapeutischen Bogenschießen Intuitives Zielen. Das Zielen erfolgt, nicht wie beim Schießen mit einem Gewehr, in dem über Kimme und Korn zum Ziel eine gedachte Linie gebildet wird, sondern in dem der Blick geweitet auf das Ziel gerichtet wird und dem Körper völlig vertraut wird. Dies gelingt nur, wenn der Schütze ganz bei sich ist, im Hier und Jetzt ist, also achtsam ist. Mit dem Fördern der Intuition ist ein ganzheitliches Entwickeln des Vertrauens in Sich verbunden. Intuitives Bogenschießen gehört zum traditionellen Bogenschießen. Es wird mit einem traditionellen Bogen ohne Zielvorrichtung und ohne weitere technische Hilfsmittel geschossen.

Abbildung 1: Intuitives Bogenschießen, erzeugt von der Künstlichen Intelligenz DALL-E 2 [5] mit dem Prompt ‚A painting in the van Gogh style with a beautiful landscape in which an archer with a wide view calmly and powerfully aims at a target.‘

Bogenschießen erzeugt bei den meisten Menschen eine positive Resonanz. Transformatives Bogenschießen knüpft bewusst an archaische Gefühle der Jagd an. Das positive Erleben der Kraft und die damit erlebte Selbstwirksamkeit, die achtsame Ruhe und die intuitive Zielorientierung, dies sind Ressourcen, die die mentale und körperliche Selbstheilung fördern. Das Erleben von Resilienz und Gesundheit ist oft verbunden mit einer aufrechteren Körperhaltung, einem lockeren körperlichen und mentalen Spannen und Entspannen, einem Sich-größer-Fühlen oder einem Fühlen von Befreiung. Bei regelmäßiger Anwendung hilft Transformatives Bogenschießen bei Rückenschmerzen, bei Bluthochdruck, Atembeschwerden und chronischen Schmerzen.

Transformatives Bogenschießen ist also in erster Linie kein Erlebnis, sondern eine Erfahrung: „Ein Erlebnis intensiviert das Leben. Eine Erfahrung verändert die Person.“ und „Jeder Pfeil ist eine Erfahrung.“ [4]
Transformatives Bogenschießen wirkt wie „ein Spiegel der Seele“ [4], der die mit der innere Haltung verbundenen Probleme sichtbar macht. Da die TeilnehmerInnen diese Probleme im Bogenschießen selbst erfahren, wirkt das TB wie ein Katalysator für die Veränderungsarbeit. Zum Beispiel werden Probleme – in der Zielorientierung, im Loslassen, einer fehlenden Gelassenheit, im Sich-Öffnen oder im Standpunkt einnehmen – für die TeilnehmerInnen direkt oder indirekt über Metaphern sichtbar und erfahrbar. Das Auflösen dieser Probleme im Bogenschießen, ermöglicht und beschleunigt die Veränderungsarbeit und führt zu einer Transformation im alltäglichen Leben.

Ziel dieses Seminars ist es, über Selbsterfahrung, die Selbstführung zu stärken und damit die Führungsqualität.

Das Seminar findet bei nahezu jedem Wetter in der Natur statt. Entsprechende Kleidung und Schuhe sind erforderlich. Weitere Informationen wie Termine, Ort und Teilnahmegebühren finden Sie auf der IFST-Internetseite unter Training [6]. 

  

[1] Klinik Wollmarshöhe (2022) https://www.wollmarshoehe.de, zugegriffen am 20.11.2022

[2] infer (2022), Institut für Erfahrungslernen, https://www.infer-institut.de/, zugegriffen am 20.11.2022

[3] Mehl K (2017) Erfahrungsorientierte Therapie, Integrative Psychotherapie und moderne Psychosomatik, Springer

[4] Schäfer K-H (2018) Therapeutisches Bogenschießen, 2. Auflage, Ernst Reinhardt Verlag München

[5] DALL-E 2 (2022) https://openai.com/dall-e-2/, zugegriffen am 26.11.2022

[6] Seminar Transformatives Bogenschießen (2022) https://www.socialtechnologies.de/training, zugegriffen am 26.11.2022

Vom „Grundrecht auf eine analoge Existenz“ oder von der Digitalität

Vor Kurzem bin ich auf den Spiegelartikel „Wir brauchen das Grundrecht auf eine analoge Existenz“ von Alexander Grau gestoßen [1], [2]. Dieser Artikel hat diesem Blog-Beitrag einen Teil des Titels gegeben.

Alexander Grau geht von folgender Grundannahme aus: „Digitalisierung ist längst keine Technologie mehr, sondern eine Ideologie…. Die Digitalisierung ist der Fetisch unserer Zeit… Allenfalls von ein paar Datenschützern oder Entwicklungspsychologen sind hin und wieder kritische Töne zu hören.“

Ist das so?

Andererseits gibt es AutorInnen wie Andrea Gadeib, die zwar eine optimistische Zukunft auf der Basis der Digitalen Transformation haben, gleichzeitig titelt ihr Buch „Die Zukunft ist menschlich: Manifest für einen intelligenten Umgang mit dem digitalen Wandel in unserer Gesellschaft.“ Der Titel manifestiert ihre statistische Erhebung, wonach im Jahre 2018 80% der deutschen Bevölkerung Angst vor der (unmenschlichen) Digitalisierung haben.

Das Recht auf eine analog Existenz – wie darf man dies verstehen? Heißt dies, dass das Recht auf eine analoge Existenz im Grundgesetz festgeschrieben wird und dass im Jahre 2050 jeder noch das Recht hat, mit Bargeld zu bezahlen, oder dass die Steuererklärung auch dann noch per Papier abgegeben werden darf, oder dass die Deutsche Bahn auch dann noch Schalter zur Verfügung stellen muss, an denen der Verkauf eines Papiertickets möglich ist, …oder, dass wir dann noch Autos oder Waschmaschinen haben werden bzw. haben müssen, die keine Chips enthalten, …oder…oder…oder…

Die Digitalisierung kann sicherlich Angst machen: Wenn sie einen überfordert oder wenn man glaubt, dass sie einem die Arbeit wegnimmt und man verarmt. Oder wenn man glaubt, dass Künstliche Intelligenzen uns beherrschen werden, oder dass Roboter die menschliche Interaktion ersetzen …oder…oder…, oder dass KI uns eines Tages auslöschen wird.

Alexander Grau zitiert den Politologe Patrick J. Deneen „Wir seien, so der Wissenschaftler, »autonom und frei, und doch genau den Technologien unterworfen, die uns das Gefühl von Unabhängigkeit vermitteln«.“.

Genau diese Aussage kann ich sehr gut nachvollziehen.- Sie ist vielleicht eine neue Erkenntnis, die Basis, auf der sie beruht, ist jedoch keineswegs so neu.

Wir ‚entscheiden uns ständig‘, Facebock, Twitter, LinkedIn und wie sie alle heißen zu nutzen, Influencern oder auch besonders rührigen Kollegen zu folgen und entsprechende Like‘s einzugeben. – Wir verlassen uns auf die Kaufempfehlungen von Amazon und Co., die wir selbst erzeugen. – Wir like‘n die ideologischen Empfehlungen verschiedener Politiker und trage damit zu deren Popularität bei….

Oder wir machen es mal ganz anders: Wir reagieren einfach mal mehrere Stunden oder Tage auf keine eMail oder Whats App Nachricht. Wir like‘n nicht jede Nachricht, die uns angeboten wird, und lesen mal ein Buch, das zwar mehr Fokus erfordert, statt den Kurzinfos diverser Kollegen oder Politiker zu folgen.

Diese letzte Form von Freiheit hat viel mit Bildung und Kompetenz, insbesondere Digitaler Bildung, und einer entsprechenden selbstreflektierenden Kompetenz zu tun. – Diese selbstreflektierende Kompetenz, die ich schon des Öfteren als Metakompetenz bezeichnet habe, wird umso wichtiger, je komplexer unser Leben wird. Digitale Kompetenz ist der Schlüssel, damit wir unsere Freiheit in der Digitalität (Digitalität = Digitale Realität) wahrnehmen können.

Mehrere Schritte zurück in die rein analoge Welt auf der Basis eines Grundrechtes nach einer analogen Existenz macht keinen Sinn. Diese Forderung ist naiv und mutet mich sogar dumm an. Es zeigt meines Erachtens auch ein Fehlen von Metakompetenz an. So schreibt Alexander Grau:

„Natürlich griffen schon Dampfmaschine, Elektrizität oder Verbrennungsmotor massiv in die Gesellschaft, unsere Arbeitswelt und unser Wertesystem ein. …Aber sie manipulierten nicht unser Denken. Anders die digitalen Technologien. Sie steuern unsere Gedanken und entwerfen unsere Träume. … Diese Entwicklung unterminiert die Basis liberaler Demokratien. … Nur der Mensch, der die Möglichkeit hat, ein analoges Leben zu führen, ist im eigentlichen Sinne frei. …Diese Freiheit zu schützen wäre die wichtigste und dringlichste Aufgabe des Staates. Doch der Staat schützt sie nicht. Stattdessen opfert er sie lieber wirtschaftlichen und technologischen Interessen, die als Notwendigkeiten deklariert werden. …“

Wer sich mit Auto-Enthusiasten unterhält, wird schnell feststellen, wie das Auto mit oder ohne Verbrennungsmotor und seine emotionale Aufladung als Freiheitssymbol über Jahrzehnte unser Denken manipuliert hat. Oder wie möge man erklären, dass über Jahrzehnte Landschaften auf dieser Basis gestaltet wurden und gerade heute die sogenannten nachhaltigen E-Autos immer dicker und umweltschädlicher werden. Unser individuelles und gesellschaftliches Denken ist massiv und großflächig von dieser Technologie manipuliert. – Es wird nicht so gesehen, weil es längst zum allgemeinen Gedankengut geworden ist.

Die Degrowth Bewegung [4] steht für eine Abkehr von jeglicher Technologie, da die ständige Weiterentwicklung der Technologie die Basis eines Wachstums ist, das uns mehr schädigt als es uns nützt.

Technologie ist per se nicht gut oder böse oder ideologisch, wir sind es. Was wir benötigen, ist ein Umgang mit der Technologie, der unser individuelles und gesellschaftliches Handeln in seinen örtlichen und zeitlichen Konsequenzen mit einpreist. Und genau das haben wir meines Wissens bei keiner Technologie bisher getan, beim Auto nicht und bei der Digitalisierung bisher auch nicht.

Man möge sich die Frage stellen, was gewesen wäre, wenn ehemals zu Gutenbergs Zeiten gefordert worden wäre ‚Jeder hat das Recht sich Schrift und Buch zu entziehen, das ist eine Technologie, die in unsere Freiheit eingreift, weil sie uns die Gedanken anderer, die uns manipulieren, dauerhaft zum Nach-Denken gibt.‘

Vor ein paar Wochen wurde mir das Buch ‚Walden‘ von Henry David Thoreau geschenkt [5], [6], [7]. Thoreau beschreibt in diesem Buch aus dem Jahre 1854 (!) seinen zweijährigen Aufenthalt in einer Waldhütte in Nordamerika. Ein Buch voller Metakompetenz. Mahatma Gandhi und Martin Luther King sollen von ihm beeinflusst worden sein, sowie die Naturbewegung und die Degrowth Bewegung. Ich möchte nur ein Zitat hier anführen, das viel mit unserer digitalen Like-Kultur zu tun hat: „Macht einer nach dem Essen ein halbstündiges Schläfchen. So reckt er, kaum ist er erwacht, den Hals und fragt: „Was gibt’s Neues?“ – als hätten die anderen unterdessen für ihn Posten gestanden. Manch einer lässt sich zu diesem Zweck alle dreißig Minuten wecken und erzählt einem dann zum Entgelt, wovon er geträumt hat. Am Morgen sind ihm die Nachrichten so unentbehrlich wie das Frühstück…Für den Philosophen sind alle sogenannten Nachrichten nur Klatsch, und wer dergleichen druckt oder liest, ist eine Klatschbase. Dabei sind nicht wenige auf diesen Klatsch versessen.“

Für mich liest sich dies wie eine Vorwegnahme unserer Like-Kultur, es zeigt aber auch, dass dazugehörige Muster schon sehr lange existieren!

Wer möchte schon in einer zukünftigen Welt leben, in der, mit Hilfe unseres eigenen unreflektierten Handelns, Bedeutungszuweisungen durch Like‘s zu gigantischen Bedeutungsattraktoren in sozialen Medien werden, denen sich dann nur noch wenige entziehen können. Und hier hat Alexander Grau sicherlich recht: Wir sind auf dem besten Weg, dass wir unsere Unfreiheit in einem Maße global und dynamisch selbst erschaffen, wie es in der Zeit vor der Jahrtausendwende nicht möglich gewesen ist. – Einige wenige analoge Enthusiasten werden dies jedoch keinesfalls aufhalten, selbst wenn die analoge Existenz im Grundrecht verbrieft sein sollte.

Es gibt derzeit (noch) keine ganzheitliche Ethik, die u.a. der Digitalisierung Zügel anlegt. – Die Zügel einer ganzheitlichen vorausschauenden Ethik hätten wir in der Vergangenheit schon des Öftern benötigt, ob es die extensive, noch anhaltende Nutzung des Autos ist, die rein betriebswirtschaftliche Ausrichtung von Landwirtschaft und Tierhaltung, die nicht-nachhaltige Ausrichtung der Energiewirtschaft …oder …oder …

In Kombination mit den damit verbundenen heraufdämmernden Katastrophen kann die unreflektierte Digitalisierung wie ein Brandbeschleuniger wirken. So könnten Millionen oder Milliarden armer Menschen ihre Digitalität dazu verwenden, um sich zusammen zu tun, um sich gegen die reichen Nationen des Nordens zu wenden. Populisten könnten die Digitalität dazu verwenden, um rechte oder linke Ideologien oder Verschwörungsideologien als Bedeutungsattraktoren einzuführen.

Deshalb ist es um so wichtiger, dass man die Digitale Realität in ihren grundlegenden Mustern versteht.

Felix Stalder definiert Digitalität als „jenes Set von Relationen, das heute auf der Basis der Infrastruktur digitaler Netzwerke in Produktion, Nutzung und Transformation materieller und immaterieller Güter sowie in der Konstitution und Koordination persönlichen und kollektiven Handelns realisiert wird“ [8].

Diese Relationen erzeugen zusätzliche Verbindungen in unserem Leben, die „drei Formen des Ordnens“ hervorrufen, „die dieser Kultur ihren spezifischen, einheitlichen Charakter verleihen: Referentialität, Gemeinschaftlichkeit und Algorithmizität“ [9], [10], [11].

Referentialität bedeutet die Menge an Bedeutungszuweisungen, die wir mit unseren Klicks, Likes oder anderen Formen der Bedeutungszuweisungen Dingen, Meinungen, Nachrichten und Ähnlichem zuschreiben.

Gemeinschaftlichkeit bedeutet, dass diese Bedeutungszuweisungen in einer gemeinschaftlichen Formation erfolgt, d.h. in einer Gruppe, einem digitalen Mopp, einer wissenschaftlichen, politischen, modischen, oder anderen Interessensgruppe.

Algorithmizität bezeichnet jene Aspekte der kulturellen Prozesse, die von Maschinen (vor-) geordnet werden.

Aus meiner Sicht sind diese drei Dimensionen wichtig und vorhanden, sie treffen jedoch auch für eine Dorfgemeinschaft zu. – Man siehe die zitierte Aussage von Thoreau weiter oben. –  Auch dort schreiben Menschen u.a. über Smalltalk Dingen, Meinungen und Nachrichten Bedeutung zu. Auch dort bildet sich über eine gemeinschaftliche Formation eine gemeinschaftliche Ordnung heraus. In der Sprache von Komplexität und Selbstorganisation sind dies Attraktoren, Bedeutungsattraktoren, die sich auf einem Bedeutungsmarkt ausbilden. Selbst die Algorithmizität gibt es meines Erachtens schon recht lange.- Es sind dann vielleicht keine Maschinen im eigentlichen Sinne, jedoch folgt man Kafka, dann übernehmen Bürokratien die Rolle intransparenter Algorithmen.

Meines Erachtens gibt es lediglich einen entscheidenden Unterschied, die Skalierung, die den Bedeutungsmärkten in der Digitalität eine neue Qualität verleiht:

Die Bedeutungszuweisungen werden von einzelnen Menschen in digitalen Plattformen vorgenommen. Diese Plattformen sind „beliebig“ skalierbar, d.h. „unendlich“ viele Menschen können hier ihre Bedeutungszuweisungen vornehmen. D.h. es können über individuelle Referenzialität auf sehr dynamische Weise gigantisch große gemeinschaftlich Bedeutungszuweisungen entstehen. Diese gemeinschaftlichen Bedeutungszuweisungen erzeugen ihre eigne Sogwirkung, sie werden zu Bedeutungsattraktoren, sie entziehen uns unsere Freiheit. – Leider haben wir sie selbst erzeugt. Digitale Algorithmen können die Ausbildung von Bedeutungsattraktoren dämpfen, verstärken oder beschleunigen.   

Auf den skalierbaren Plattformen bilden sich unter Umständen viele Bedeutungsmärkte (Bedeutungsmarktplätze) aus: Diese Bedeutungsmärkte können sich auf materielle und immaterielle Objekte beziehen. Bedeutungsattraktoren können Moderichtungen sein, politische Meinungen, Ideologien, Verschwörungsideologien, Hasstiraden, aber (auch ideologisch verbrämte) wissenschaftliche Ansichten. Diese Bedeutungsmärkte überschneiden sich recht oft auch mit den wirtschaftlichen Märkten, nämlich dann, wenn zum Beispiel bei Amazon zu einem Produkt Bewertungen abgegeben werden und diese Bewertungen das Kaufverhalten beeinflussen.

Skalierbarkeit und Bedeutungsmärkte können enormen räumlichen und zeitlichen Dynamiken unterliegen: Die Zusammensetzung der Agenten (Personen, Algorithmen) kann sich dynamisch in Qualität und Quantität ändern, so dass in kurzer Zeit Bedeutungen auf oder abgebaut werden. Diese Formen des Ordnens können auch zu exponentiellem organisationalem Wachstumsformen führen. Amazon, google und Co. sind Ergebnisse dieser neuen Dynamiken.     

Skalierbarkeit und Bedeutungsmärkte zeigen dann ihr ganzes negatives Potential, wenn die Agenten (Menschen oder Algorithmen) intransparent und ohne digitale Metakompetenz wirken.

Deshalb benötigen wir, wie im Blog-Beitrag vom August 2022 angesprochen, eine ganzheitliche Ethik und eine Veränderung des Bildungssystems, das eine ganzheitliche Kultur der Digitalisierung vermittelt.

[1] Grau A (2022) Alexander Grau, http://alexandergrau.de/index.html, zugegriffen am 17.09.2022

[2] Grau A (2022) Wir brauchen das Grundrecht auf eine analoge Existenz, https://www.spiegel.de/netzwelt/web/totaldigitalisierung-wir-brauchen-das-grundrecht-auf-eine-analoge-existenz-a-8db3e557-144d-490f-8570-5c3980392a0b?context=issue&sara_ecid=soci_upd_KsBF0AFjflf0DZCxpPYDCQgO1dEMph, zugegriffen am 17.09.2022

[3] Gadeib A (2019) Die Zukunft ist menschlich: Manifest für einen intelligenten Umgang mit dem digitalen Wandel in unserer Gesellschaft (Dein Business), GABAL Verlag GmbH, Kindle Ausgabe

[4] Wikipedia (2022) Degrowth, https://en.wikipedia.org/wiki/Degrowth

[5] Thoreau H D (1847) Walden, Reclam Taschenbuch, Deutsche Übersetzung aus dem Jahre 1972

[6] Wikipedia (2022), Henry David Thoreau, https://de.wikipedia.org/wiki/Henry_David_Thoreau, zugegriffen am 18.09.2022

[7] Wikipedia (2022), Transzendentialismus, https://de.wikipedia.org/wiki/Transzendentalismus, zugegriffen am 18.09.2022

[8] Stalder F (2016) Kultur der Digitalität, edition suhrkamp, Kindle Ausgabe

[9] Stalder F (2022) Grundformen der Digitalität, https://agora42.de/grundformen-der-digitalitaet-felix-stalder/

[10] Wikipedia (2022), Digitalität, https://de.wikipedia.org/wiki/Digitalit%C3%A4t#:~:text=Digitalit%C3%A4t%20bezeichnet%20die%20auf%20digital%20codierten%20Medien%20und,Menschen%2C%20zwischen%20Menschen%20und%20Objekten%20und%20zwischen%20Objekten, zugegriffen am 17.09.2022

[11] Hauck-Thum U, Noller J (Herausgeber) Was ist Digitalität?: Philosophische und pädagogische Perspektiven, Verlag J.B. Metzler, Kindle Ausgabe

AI & M 4.0: „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“ – Oder: Auf dem Weg zur Künstlichen Allgemeinen Intelligenz?

Im diesem Blogartikel beschäftige ich mich mit der Erstellung von Text-Zusammenfassungen und Bild-Metaphern. Dies sind wichtige Bereiche jeglicher Informations- und Wissens-Verarbeitung, insbesondere auch im Management und Projektmanagement. – Man siehe hierzu auch meinen Blog-Beitrag vom Dezember 2021.

Ich beschreibe im Folgenden die Benutzung der verwendeten AI-Werkzeuge etwas genauer. – Vielleicht mag der ein oder andere meine Erfahrungen weiterentwickeln.

Da die verwendeten AI-Werkzeuge mehrere Abstraktionsebenen über den in den letzten Blog-Beiträgen verwendeten AI-Werkzeugen liegen und jene über eine recht einfache Benutzerschnittstelle angesprochen werden können, spreche ich von Black-Box AI-Werkzeugen

Für die Erzeugungen von Bild-Metaphern verwende ich die KI midjourney und für die Erzeugung von Text-Zusammenfassungen die KI GPT-3.

Auf die KI midjourney wurde ich über den Artikel „Kunst per Künstlicher Intelligenz“ von Patrick Hannemann aufmerksam [1]. Er stellt dort die Kommunikationsplattform discord.com [2] vor, die die KI midjourney über einen Bot integriert enthält [3].

Ich widme mich zuerst den Bild-Metaphern: Bild-Metaphern können zum Beispiel bei der Ausbildung eines Collective Minds in Teams eine sehr große Rolle spielen. – Sie dienen u.a. der Teamausrichtung und -fokussierung.

Also habe ich ausprobiert, inwieweit sich midjourney für die Kreation von Bild-Metaphern eignet. – Ich starte mit einem Thema zu meinem Bogenschieß-Hobby und gebe dem Bot über den Prompt ‚/imagine…‘ folgende Aufgabe: Kreiere ein Bild zu der Aussage „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“.

Der Bot liefert mehrere Bilder als Vorschläge zurück. Abbildung 1 zeigt das von mir ausgewählte Bild:

Abbildung 1: Erzeugt von der AI midjourney mit der Aussage „Ein Bogenschütze mit einem fantastisch schönen Bogen und goldenen Pfeilen“ [3].

Für mich ist das Ergebnis beeindruckend kreativ und schön!

Ich habe daraufhin getestet, welche Bilder die AI aus der Kurzdefinition von Management 4.0 erzeugt. Abbildung 2 zeigt einen Screenshot-Auszug der vier generierten Bildvorschläge:

Abbildung 2: Screenshot-Auszug der vier Bildvorschläge zur Management 4.0 Definition (im Screenshot enthalten) [3].

Das war wohl etwas abstrakt, die generierten Bilder sind recht nichtssagend 😉.

Eine Kürzung auf die wesentlichen, in der Definition enthaltenen Themen erzeugt jedoch innerhalb von wenigen Sekunden vier recht gute Bild-Metapher Vorschläge:

Abbildung 3: Screenshot-Auszug der vier Bildvorschläge zur Aussage „leader, organization, mindset, self-organization“ (siehe obigen Screenshot) [3].

Ich habe das erste Bild für die weitere Generierung von Versionen ausgewählt und mich schließlich für folgende Bild-Metapher entschieden:

Abbildung 4: Von mir ausgewähltes Bild zur Aussage „leader, organization, mindset, self-organization“ [3].

Dies ist ein Ergebnis, generiert nach ca. 5 Minuten Interaktion mit dem AI-Bot. Wie ich finde: beeindruckend!

Für den Bereich Bild-Metaphern fasse ich zusammen: Selbst öffentlich verfügbare AI-Systeme liefern beeindruckende Bild-Metaphern auf der Basis von Themen (Topics). Topics können aus von AI-Systemen generierten Wissens-Netzwerken (man siehe den Juni 2022 Blog-Beitrag) entnommen werden oder über spezifische Topic AI-Systeme [4], [5] generiert werden.

Legt man folgende Definition für eine Künstliche Allgemeine Intelligenz zugrunde, “Artificial general intelligence (AGI) is the ability of an intelligent agent to understand or learn any intellectual task that a human being can.“ [6], so ist der AI-Bot midjourney vermutlich noch weit von einer AGI entfernt.

Gleichwohl stelle ich für mich selbst fest, dass ich wohl kaum in der Lage bin, mit ähnlicher Kreativität wie diese AI, die oben gezeigten Bilder zu erzeugen.

Überträgt man die Messung des Intelligenzquotienten für Menschen auf AI-Systeme, so dürfte eine Zusammenschaltung von mehreren AI-Systemen schon heute fantastisch hohe Intelligenzquotienten ergeben. Die AI-Systeme, die im Jahre 2019 verfügbar waren, liefern IQ-Werte die bei ca. 25%-50% eines mittleren menschlichen IQ von 100 liegen. – Ein IQ von 50 entspricht in etwa dem IQ eines 6-jährigen Kindes [7], [8], [9]. Sehr große AI-Systeme wie GPT-3, das ich weiter unten verwende, waren in diesen Untersuchungen noch nicht berücksichtigt. – Für GPT-3 dürfte der IQ schon deutlich näher bei 100 liegen.   

Sollte die AGI eines Tages Realität sein, so nehme ich an, dass keine 9 Milliarden AI-Systeme erforderlich sind, um das (kognitive) Intelligenzspektrum von 9 Milliarden Menschen abzubilden. – Wahrscheinlicher ist, dass einige wenige AI-Systeme das kognitive Intelligenzspektrum von Milliarden von Menschen abdecken werden, und dies mit wesentlich höheren IQ-Werten als wir Menschen im besten Fall haben.

Die Ergebnisse der Forschungsarbeit der GPM Fachgruppe Agile Management zum Thema NLP-Verarbeitung (Natural Language Processing Verarbeitung) von Projektmanagement Fragestellungen mittels AI-Systemen zeigen in diese Richtung.

Wir haben verschiedenen AI-Systemen PM Know-How Fragen gestellt, wie sie in einer Prüfung für das IPMA Level D vorkommen könnten. Das Ergebnis ist ziemlich beeindruckend: „Kleinere“ AI-Systeme liefern keine befriedigenden Ergebnisse, meistens sogar mangelhafte Ergebnisse. Jedoch liefert das große System GPT-3 von openai.com in allen! Fragen sehr gute oder gute Ergebnisse: GPT-3 hat hiernach das IPMA Level D Zertifikat mit gut bestanden! – Diese Ergebnisse haben wir auf der diesjährigen IPMA Research Konferenz vorgestellt [10], [11].

Ich widme mich jetzt den Text-Zusammenfassungen mittels GPT-3 [12], [13].

Ich nehme das Gesamtergebnis vorweg: Mein! Versuch mittels GPT-3 sinnvolle Zusammenfassungen von Texten zu erzeugen liefert (bisher) keine wirklich überzeugenden Ergebnisse. Es gibt also aktuell auch noch Wermutstropfen in dieser „schönen neuen AI-Welt“😉.

Ich habe dem AI-System GPT-3 die Aufgabe gestellt, für einen meiner Blog-Artikel eine Zusammenfassung zu erstellen. Ich habe den Beitrag vom September 2021 „Metabetrachtungen: Zur Schnittmenge von Intuitivem Bogenschießen, Künstlicher Intelligenz und Management 4.0“ ausgewählt. Er hat einen Bezug zur obigen Bild-Metapher Abbildung 1 und stellt verschiedene Themen (Bogenschießen, AI und M 4.0) in einen eventuell ungewöhnlichen Zusammenhang und ist damit ein Text, den man wahrscheinlich sonst nirgendwo im Internet finden kann. Die AI kennt also mit ziemlicher Sicherheit keine ähnlichen Texte.

Ich greife auf GPT-3 als Black-Box AI-System zu und nicht wie für andere AI & M 4.0 Blog-Beiträge auf verschiedene AI/ML Bibliotheken. Wie bei der Unterhaltung mit dem AI-Bot midjourney ist auch hier das Abstraktionsniveau der „Ansprache“ sehr hoch.

Um Zugriff auf GPT-3 zu erhalten [13], ist es notwendig, sich bei openai.com zu registrieren. Solange man GPT-3 nicht für produktive Zwecke nutzen will, wird ein budgetierter Zugang von $18 als Geschenk freigegeben. Openai.com orientiert sich für die Freigabe an einer Risiko-Bewertung: Forschungsaktivitäten, wie ich sie hier durchgeführt habe, werden als sandbox-Aktivitäten behandelt und unterliegen keinen Restriktionen. – Dies ist sehr ähnlich den Anforderungen, die im EU AI Act zu finden sind. – Man siehe hierzu meinen Blogbeitrag vom August 2022.

Eine Möglichkeit auf GPT-3 zuzugreifen, ist der Zugriff über das User Interface ‚Playground‘ (man siehe Abbildung 5).

In ersten Versuchen habe ich die sogenannten Presets verwendet (man siehe Abbildung 5, und dort die rot eingefassten Bereiche). – Dies sind vorkonfektionierte Aufgabentypen, u.a. auch für die Erstellung von Zusammenfassungen. Die Ergebnisse waren richtig schlecht und recht oft unsinnig: Teilweise wurden Texte abgerufen, in denen wohl ein Bogenschütze auf die Jagd geht oder der deutsche Text, der zusammenzufassen war (man kann also auch nicht-englischen Text eingeben), wurde „einfach“ übersetzt.

Abbildung 5: GPT-3 playground [14]

Wie ich heute weiss, habe ich mit den presets das Potential von GPT-3 überhaupt nicht angesprochen. – Man kann nämlich über die Prompteingabe mit GPT-3 „reden“, d.h. der AI in Satzform sagen, was sie machen soll. Die Aufgabe „Write a summary in English for the following text using the following topics, Management 4.0, self-organization, instance-based learning, model-based learning:” (siehe Abbildung 5 erster Satz im Eingabefeld) brachte bisher das beste Zusammenfassungs-Ergebnis:

“The article discusses the intersection of intuitive archery, artificial intelligence, and management 4.0. It argues that learning is the key element to align the human system, the technical system neural network, and the social system team or organization to the environment. The article distinguishes between instance-based learning and model-based learning. It argues that learning in management 4.0 is model-based learning, and that instance-based learning is insufficient for learning in a complex context.”

An diesem Ergebnis kann man erkennen, dass GPT-3 in der Lage ist, explorative und abstrahierende Zusammenfassungen zu erstellen. Explorative Zusammenfassungen enthalten lediglich Sätze aus dem Original, die als wichtig erkannt werden. Abstrahierende Zusammenfassungen enthalten neue Sätze, die so nicht im Original enthalten sind.- Die abstrahierende Zusammenfassung ist u.a. an Sätzen wie „The article distinguishes…“ zu erkennen.

Ich habe dieses Ergebnis als bestes ausgewählt, weil dies das einzige Beispiel ist, in dem der Satz „It argues that learning in management 4.0 is model-based learning, and that instance-based learning is insufficient for learning in a complex context.” enthalten ist. Dieser Satz ist eine zentrale Erkenntnis des Blog-Beitrages. Leider sind nicht alle Erkenntnisse enthalten; z.B. wird das Thema Selbstorganisation als zentrales verbindendes Element der drei Bereich, Management 4.0, AI und Bogenschießen, nicht erkannt. Deshalb gebe ich GPT-3 in diesem Fall auch nur die Schulnote ausreichend.

Im Playground können nur Texte eingegeben werden, deren Anzahl an Tokens (ungefähr gleich der Anzahl an Worten), addiert mit der Anzahl an Tokens für die Zusammenfassung, 4000 Tokens nicht überschreiten. Ich habe für die Zusammenfassung 507 Tokens vorgegeben und habe damit noch ca. 3500 Tokens für den eigentlichen zusammenzufassenden Text zur Verfügung. Falls der Text in einer Fremdsprache eingegeben wird, halbiert sich der verfügbare Raum für den Text auf etwa die Hälfte an Tokens: GPT-3 benötigt Raum für die Übersetzung. – Die „Muttersprache“ von GPT-3 ist Englisch! Aus diesem Grund konnte ich auch nur einen Auszug des Blogs verwenden. Aus Gründen der Vergleichbarkeit habe ich für die deutschen und die englischen Texte den Auszug gleich beibehalten und jeweils ca. 1400 Wörtern verwendet. In allen Tests habe ich die von opneai.com empfohlene Stop sequence <|endoftext|> am Ende des Textes eingesetzt.  – Das Verwenden einer Stop sequence zum Anzeigen des Textendes hat einen recht großen Einfluss auf das Zusammenfassungsergebnis.

Statt GPT-3, verwende ich den google-Übersetzer [15] und den Übersetzer deepl.com [17], um einen englischen Text für meinen Blog-Beitrag zu erzeugen. Die Übersetzungen sind sehr ähnlich, wobei meines Erachtens bei genauerer Betrachtung doch manchmal recht große Unterschiede auffallen. So übersetzt zum Beispiel deepl.com „Meta-Betrachtungen“ mit „Meta-observations“ und der google-Übersetzer mit „Meta considerations“. – Dies scheint mir ein nicht unerheblicher Unterschied zu sein.

Google verändert auch in erheblichem Maße die Syntax. So wurde wie hier zu sehen, u.a. der Bindestrich zwischen Meta und consideration einfach entfernt. Groß- und Kleinschreibung und Satzzeichen wurden verändert, so dass selten – aber immerhin geschah es – sich ein vollständig anderer Sinn ergeben hat. Mehrmals wurden ganze Satzteile einfach weggelassen. – Ein schwerwiegender Fehler.

Bei deepl.com ist dies im vorliegenden Beispiel einmal vorgekommen bei google dreimal. Der google-Übersetzer liefert auch leicht andere Ergebnisse, je nachdem, ob man ihn mit einer zu übersetzenden Internetseite füttert oder einer Worddatei, die den Inhalt der Internetseite enthält.

Ich betone dies, weil beide Übersetzer mit AI betrieben werden. Es ist nicht auszuschließen, dass die AI sauber funktioniert, jedoch die Aufbereitung der Daten, also der Texte, nicht fehlerfrei ist. – Versteckte Satzzeichen oder Abschnittszeichen werden unterschiedlich interpretiert. Die AI-Systeme benötigen trotz ihrer „Intelligenz“ Daten in einer wohldefinierten Form. – Es gibt keinen Spielraum für „intelligentes Ausbessern“ wie in der menschlichen Kommunikation. Das macht das Arbeiten mit AI-Systemen nicht selten zu einem Geduldsspiel. Die korrekte Dateneingabe wurde, nach meiner bisherigen Erfahrung, von AI-Erstellern nicht gut dokumentiert.

Um die Restriktion bezüglich des Textumfanges zu umgehen, kann man GPT-3 auch über ein Jupyter Notebook [17] in der Colab-Umgebung [18] ansprechen. – Man beachte, GPT-3 ist in der Colab-Umgebung aufrufbar, obwohl google und openai im Wettbewerb stehen. – Bemerkenswert erfreulich!

Ich habe den Code von [19] verwendet und für meine Aufgabenstellung angepasst. Für den vollständigen Text in Deutsch erzeugt GPT-3 eine deutlich größere explorative Zusammenfassung in Englisch, obwohl ich GPT-3 um eine deutsche Zusammenfassung gebeten habe.

Den mittels deepl.com ins Englische übersetzten Blog-Artikel habe ich einmal als .pdf Datei Seite für Seite eingelesen und alternativ direkt als Text in die Colab-Umgebung eingebracht. In beiden Fällen wurde eine abstrahierende Zusammenfassung erstellt. Die erste Zusammenfassung entspricht der schon bekannten besten Zusammenfassung, die zweite Zusammenfassung ist eine andere:

“The article discusses the intersections of intuitive archery, artificial intelligence, and Management 4.0. Intuitive archery is a form of archery that does not rely on aiming technique, and is used for therapeutic archery in clinics. The author argues that the ability to focus, adapt, and intuition are central elements of Intuitive Archery, which are also important for Management 4.0. The author describes their experience with a Deep Learning course using Tensorflow, and how it has helped them understand the potential for artificial intelligence in project management.”

Ich konnte also an meiner Aufgabenstellung nicht erkennen, dass GPT-3 mit jedem Aufgabendurchlauf dazu lernt. – Eine Aussage, die andere schon getroffen haben [12].

Zusammenfassung: Meine Untersuchungen zu Text-Zusammenfassungen mittels GPT-3 und Bild-Metaphern mittels midjourney zeigen schon recht gute Ergebnisse, jedoch ist Vorsicht geboten, wenn man die Werkzeuge (schon) im produktiven Betrieb benutzen möchte. Jedoch ist schon heute auf einfachen Wegen selbst erfahrbar, dass der Weg in Richtung einer Künstlichen Allgemeinen Intelligenz eingeschlagen wurde.     

 

[1] Hannemann P (2022) Kunst per künstlicher Intelligenz: Mit diesen Tools können Sie das selbst ausprobieren, https://www.chip.de/news/Kunst-per-kuenstlicher-Intelligenz-Mit-diesen-Tools-koennen-Sie-das-selbst-ausprobieren_184386657.html, zugegriffen am 06.09.2022

[2] Discord (2022) Discord.com, Innovative Kommunikationsplattform, zugegriffen am 06.09.2022

[3] midjourney(2022) Forschungsprojekt zu AI, https://www.midjourney.com/home/, zugegriffen am 06.09.2022, zugegriffen am 06.09.2022

[4] Keita Z (2022) Meet BERTopic— BERT’s Cousin For Advanced Topic Modeling, https://towardsdatascience.com/meet-bertopic-berts-cousin-for-advanced-topic-modeling-ea5bf0b7faa3, zugegriffen am 09.04.2022

[5] Dwivedi P (2022) NLP: Extracting the main topics from your dataset using LDA in minutes, https://towardsdatascience.com/nlp-extracting-the-main-topics-from-your-dataset-using-lda-in-minutes-21486f5aa925, zugegriffen am 09.04.2022

[6] Wikipedia (2022) Artificial General Intelligence, https://en.wikipedia.org/wiki/Artificial_general_intelligence, zugegriffen am 06.09.2022

[7] Liu Y, He F, Zhang H, Rao G, Feng Z and Zhou Y (2019) How Well Do Machines Perform on IQ tests: a Comparison Study on a Large-Scale Dataset, Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI-19)

[8] Tschopp M, Ruef M (2019) An Interdisciplinary Approach to Artificial Intelligence Testing: Developing an Artificial Intelligence Quotient (A-IQ) for Conversational AI, siehe researchgate.net

[9] Liu F, Liu Y, Shi Y (2020) Three IQs of AI systems and their testing methods, https://ietresearch.onlinelibrary.wiley.com/doi/10.1049/joe.2019.1135, zugegriffen am 05.09.2022

[10] Nuhn H, Oswald A, Flore A, Lang R, (2022) AI-supported Natural Language Processing in project management – capabilities and research agenda, IPMA Research Conference 2022, www.ipma-research-conference.world

[11] Lang R (2022) Kann Künstliche Intelligenz (KI) das Projektmanagement unterstützen? https://www.linkedin.com/feed/update/urn:li:activity:6970285127754997760/,  zugegriffen am 09.09.2022

[12] Romero A (2022) A Complete Overview of GPT-3 — The Largest Neural Network Ever Created, https://towardsdatascience.com/gpt-3-a-complete-overview-190232eb25fd, zugegriffen am 09.08.2022

[13] Willison S (2022) How to play with the GPT-3 language model, https://simonwillison.net/2022/Jun/5/play-with-gpt3/, zugegriffen am 09.08.2022

[14] GPT-3 playground (2022) openai.com, zugegriffen am 09.09.2022

[15] google Übersetzer (2022) https://translate.google.de/?hl=de&tab=rT, zugegriffen am 09.09.2022

[16] Deepl (2022) https://www.deepl.com/translator, zugegriffen am 09.09.2022, verwendet für diesen Blog-Beitrag in der kostenpflichtigen Version deepl Pro

[17] Jupyter Notebooks (2021) https://jupyter.org/, zugegriffen am 02.12.2022

[18] Colab (2021) https://colab.research.google.com/

[19] Soares L (2022) Summarizing Papers With Python and GPT-3, https://medium.com/p/2c718bc3bc88, zugegriffen am 22.07.2022