Das letzte Gefecht – digitale Abschlussprüfung heute und morgen

Auf der Suche nach den vermutlich „wahren“ und zu testierenden Zuständen der von ihnen betrachteten Prüffelder steht Abschlussprüfern regelmäßig ein sehr überschaubarer Werkzeugkasten zur Verfügung. 

Digitalen Audit-Techniken kommt hierbei eine vergleichsweise hohe Bedeutung zu und die prüferische Auseinandersetzung mit den geschäftlichen Daten der Mandanten folgt unterschiedlichsten Konzepten. Die Bandbreite reicht von einfachen Saldenvergleichen über Journalauswertungen bis zur Zusammenstellung und zum Vergleich komplexer statistischer Muster. Hiermit beschäftigen sich wahlweise IT-Spezialisten, Daten-Scientisten, automatisierte Apps und – in seltenen Fällen – die unmittelbar verantwortlichen bilanziellen Prüferinnen und Prüfer. Während die Branche mit Blick auf Effizienzgesichtspunkte innerhalb der hier dargestellten Konstellationen noch heftig um vermeintliche Königswege ringt, zeichnen sich am nahen Horizont bereits KI-basierte Analyseszenarien ab, die mit disruptiver Wirkung auf viele prüferische Prozesse wirken werden. Was ist hier zu erwarten?

KI ist nicht gleich KI

Artifizielle Intelligenz wird IT-Anwendungen bereits seit Mitte der 90er Jahre in vielfältiger Form zugeschrieben. Die Spannbreite reicht von Programmen mit singulärer Inselbegabung (z. B. Schachcomputern) bis zu lernfähiger Software, die eigenständige Datenanalysen ohne einen vorgegebenen Regelkanon durchführt (diskriminante KI-Verfahren). Beispiele hierfür finden sich innerhalb des Prüfungsbereichs in verschiedensten Variationen. Sie haben einen eher evolutionären Charakter mit überschaubarer Wirkung auf operative Prüfungsprozesse. Die heute im Mittelpunkt öffentlicher Diskussionen stehenden generativen KI-Verfahren, die insbesondere in Form von Sprachmodellen das prüferische Portfolio bereichern, sind demgegenüber von einem völlig anderen Kaliber. Um sich ihre Wirkung zu vergegenwärtigen, lohnt es sich, einen Blick auf humane Informationsverarbeitung zu werfen.

Hier werden sämtliche empfangenen Umweltreize unterschiedslos in schwache Stromimpulse umgewandelt, die innerhalb hermetisch abgeschlossener Hirnareale komplexe Erregungsmuster erzeugen. Auf deren Grundlage werden anschließend mithilfe von Erfahrung sowie unter Einbeziehung von Nützlichkeits- und Effizienzgesichtspunkten wahrscheinliche „Realitätspräsentationen“ erzeugt. Die exakte Wiedergabe sogenannter „objektiver Realität“ ist hingegen kein herausragendes Kriterium dieser neuronalen Informationsverarbeitung. Gleichwohl erzeugt sie Bewusstsein einschließlich zugehöriger Begleitumstände (Neugier, Mangelempfinden, Furcht, Lust, Emergenz etc.) mit der Möglichkeit, hierüber zu reflektieren und sich auszutauschen.

Letzteres erfolgt in Form von „Sprache“. Darauf basierende Sprachmodelle können insoweit als nachgeordnete Repräsentation unserer gedanklichen und kommunikativen Auseinandersetzung mit der Welt eingeordnet werden. Zwar arbeiten sie ohne Bewusstsein oder sonstige humane Attribute, aber mit einer im Vergleich zu menschlichem Denken millionenfach höheren Arbeitsgeschwindigkeit, die für die bekannte „Intelligenzanmutung“ sorgt.

Einsatzspektrum von Sprachmodellen in der Prüfung

Sprache und Sprachbedeutungen erschließen sich primär aus einem situativen Kontext und folgen selten einer logisch determinierten Symbolik. Dies gilt in gleicher Form für abgeleitete Sprachmodelle, die bei ihrem Einsatz zahlreiche Stärken und Schwächen menschlicher Denk- und Kommunikationsvorgänge widerspiegeln. So sind sie in der Lage, selbst ungenaue Anweisungen und Fragen sachgerecht zu interpretieren, stolpern bei deren „Verarbeitung“ jedoch gleichzeitig über alle humanen Schwächen (Unlust, Ausweichen, Lügen, Hinzudichten, Überschlagen, Halluzinieren etc.), die sich ausnahmslos in sprachlichen Äußerungen niederschlagen.

Dies führt unmittelbar zu der Frage, für welche Prozesse prüferischer Arbeit KI-basierte Sprachmodelle einsetzbar sind. Die Antwort ist einfach: für alle! Das gesamte Spektrum der gedanklichen sowie operativen Auseinandersetzung mit unseren Prüffeldern, von Risikoanalysen über diverse Prüfungshandlungen und die Führung von Arbeitspapieren bis hin zu Beurteilungen und der Berichterstellung, ist prinzipiell (auch) für den Einsatz von Sprachmodellen geeignet. Man sollte daher eher von neuen prüferischen „Mitspielern“ als von „Werkzeugen“ ausgehen.

Diese neuen Mitspieler arbeiten weder exakt noch fehlerfrei noch so zuverlässig wie Maschinen, weisen aber, falls wir es verstehen, mit ihnen zu interagieren, aufgrund ihrer Schnelligkeit und Dynamik ein Effizienzpotenzial auf, das alle Schwächen in den Schatten stellt. Hierin liegt die disruptive Wirkung dieser neuen Technik. Sie ist bereits heute bei Wägung aller Vor- und Nachteile zu leistungsfähig, um ignoriert zu werden.

Ausblick und Handlungsoptionen

Man muss kein Guru sein, um die Perspektiven des prüferischen KI-Einsatzes zu entwickeln. Im Vordergrund werden interaktive sprachliche Dialoge mit Sprachmodellen prüfereigener Rechner oder von Mandanten-Systemen stehen. Maus und Tastatur mutieren zu ähnlich belächelten Relikten wie heute Telefonzellen. Spezielle Programme für die Aufbereitung von Prüfungsdokumenten, prüferische Datenanalysen oder die Berichterstellung sind entbehrlich, da Sprachmodelle eigenständig entscheiden können, ob gewünschte Ergebnisse auf der Grundlage spezieller Apps, in der Cloud oder mittels temporär erstellter Software bereitgestellt werden.

Dieses alles funktioniert bereits heute mit guter Qualität und entwickelt sich überdies mit ungeheurer Dynamik. Selbst die Lösung komplexer Aufgaben lässt sich hierbei an Sprachmodelle delegieren, vorausgesetzt, Prüferinnen und Prüfer beherrschen die hierfür erforderlichen, fehlerminimierenden Dialogformen und sind weiterhin in der Lage, die Qualität der digital bereitgestellten Ergebnisse zu beurteilen.

Werfen wir einen letzten Blick auf nachvollziehbare Einwendungen, beginnend bei den dargelegten Unzulänglichkeiten der sprachlichen Verarbeitung, Datenschutzaspekten und der weitgehenden Intransparenz prüferischer Beurteilungen auf der Basis von KI-Verfahren. Mit Ersteren haben wir uns bereits beschäftigt. Die Fehlerquellen und die Fehlerintensität werden mit fortschreitender Entwicklung und Anwendung der KI-Modelle sinken. Die weiter aufgeführten Datenschutzaspekte sind ein technisch zu lösendes Problem. Nicht umsonst konzipiert Microsoft im Rechtsraum der EU riesige Rechnerfarmen, die innerhalb geschützter Cloud-Anwendungen Vertraulichkeits- und Datenschutzanforderungen ausreichend berücksichtigen. Die Möglichkeiten, Sprachmodelle auf lokalen Serverinstallationen einzusetzen, gesellen sich künftig hinzu.

Der letzte Aspekt (Intransparenz) stellt tatsächlich ein Problem dar, an dem es noch zu forschen gilt. Schließlich weisen lernfähige neuronale Netzwerke, mit deren Hilfe Sprachmodelle trainiert und betrieben werden, einen Grad nichtlinearer Dynamik und Komplexität auf, der selbst von Wissenschaftlern kaum mehr nachvollziehbar ist. Für alle aufgeführten und hier nicht weiter benannten Problembereiche werden sich jedoch bereits deswegen Lösungen finden, weil diese digitale Entwicklungsrichtung überwiegend funktioniert. Da sich die hiermit unzweifelhaft verbundenen Wirkungen nicht mehr eindämmen, sondern nur noch regulieren oder beherrschen lassen, empfiehlt es sich, zeitnah einen Umgang damit zu finden, um auch in überschaubarer Zukunft noch wettbewerbsfähige Prüfungsleistungen anbieten zu können.

Mehr über die digitale Prüfungstechnik für innovative Prüferinnen und Prüfer im Fachbuch Digitale Prüfung mit ActiveData von Roger Odenthal, Kay Odenthal und Ute Seeber

 

NWB Buch ActiveData

Cookies erforderlich

Um fortfahren zu können, müssen Sie die dafür zwingend erforderlichen Cookies zulassen. Diese gewährleisten den vollen Funktionsumfang unserer Seite, ermöglichen die Personalisierung von Inhalten und können für die Ausspielung von Werbung oder zu Analysezwecken genutzt werden. Lesen Sie auch unsere Datenschutzerklärung.