Beobachtertrainings gehören von den Durchführungszahlen her zu den häufigsten Trainingsveranstaltungen überhaupt. Im Vorfeld von nahezu allen Assessment- oder Development-Centern finden Trainings für Beobachter statt, in denen ein kompetenterer Umgang mit der Rolle nahe gebracht werden soll. Helfen die in diesen Trainings häufig vermittelten psychologischen Inhalte („Wahrnehmungs- und Beurteilungsfehler“, „Trennung Beobachtung und Beurteilung“) wirklich dabei, Beurteilungskompetenz zu stärken? Dieser Artikel zeigt auf, warum es bei der letztlichen Beurteilungsqualität häufig um ganz andere Dinge geht, als um Beobachtungsfehler.
Beobachtertrainings im Vorfeld von ACs und DCs folgen meist einem klassischen Ablauf. Beobachtern wird zunächst die Organisation des Verfahrens vorgestellt, Übungsmodule gezeigt, der Umgang mit den Beobachtungsbögen vermittelt sowie relevante Prozessfragen geklärt und bestimmte Standards geteilt. Alle diese Aspekte sind ausgesprochen wichtig und unverzichtbar. Aber auch Beurteilungs- und Wahrnehmungsfehler spielen eine große Rolle und gehören zum „Common Wisdom“ der Beobachterqualifizierung. Die Beobachter sollen dafür sensibilisiert werden, wie fragil und fehlerhaft unser Wahrnehmungssystem ist und lernen daher etwas über „Haloeffekte“ (eine besonders dominante Eigenschaft „überstrahlt“ andere Charakteristika), Stimmungs- und Umgebungsabhängigkeit von Beobachtung und Beurteilung, Milde- und Strenge-Tendenzen oder auch subjektive Persönlichkeitstheorien („Brillenträger sind schlauer“) und Stereotype („Der kühle Norde oder der gemütliche Bayer“).
Die Darstellung dieser Beobachterfehler ist oft ganz unterhaltsam. Allerdings fällt es oft schwer, klare Botschaften daraus abzuleiten, was gute Beurteilung eigentlich ausmacht und wie der Beurteilungsprozess gut funktionieren müsste. Die gute Absicht ist meistens ja, Beobachter zu mehr „Demut“ zu erziehen und sie dazu zu bringen, ihre Rolle sehr ernst zu nehmen und bestimmten ersten Eindrücken nicht zu vertrauen. Allerdings sind die psychologischen Wahrnehmungseffekte gerade dadurch charakterisiert, dass sie die Funktionsweise unserer Wahrnehmung selbst beschreiben. Daher ist es schwer zu erklären, wie man sich durch eine besondere Willensanstrengung quasi darüber hinaufschwingen könnte und das eigene Wahrnehmungssystem zu weniger „Fehleranfälligkeit“ hinsteuern zu können. Milde- oder Strenge-Tendenzen sind vermutlich die relevantesten Effekte, aber diese sind ja im engeren Sinne keine Beurteilungsfehler, sondern die reale und ausgelebte Beurteilungsrealität einer Führungskraft, die natürlich aus der allgemeinen Lebenserfahrung auch in ein Development-Center hineingetragen wird. Es gibt eben in der wirklichen Welt strengere und großzügigere Führungskräfte. Die einen machen ihren Erfolg vielleicht durch ihr nachdrückliches Fordern, die anderen durch Freiheitsgewährung und eine fehlerfreundliche Kultur. Aber was ist eigentlich besser und welcher der Beobachter unterliegt nun einem „Beurteilungsfehler“? Wenn Fritz die Marie beurteilt und uns davon erzählt, dann erfahren wir eben einfach mindestens so viel über Fritz wie über Marie! Meistens wird den Beobachtern als „Lösung“ beigebracht, dass „Beobachten“ und „Beurteilen“ voneinander getrennt werden müssen. Aber auch hier muss man kritisch fragen: Geht das eigentlich wirklich? „Objektives“ Beobachten geht doch nur in der reinen „Datenerfassung“ („Herr Meier hat sieben Mal gehustet“). Sobald die Beobachtung kognitiv verarbeitet wird, enthält sie bereits Interpretation. Schon während der Beobachtung werden wir zur Interpretation gedrängt und fühlen bereits, ob wir eine Beobachtung gut, schlecht oder neutral finden. Wir sind eben keine objektiven Beurteilungsroboter mit technischen Messfühlern. Übrigens ist die Subjektivität der Beobachter, ihr Benchmark, Erfahrungswissen und ihre Intuition, auch der Grund, warum man sie dabei haben will. Objektives Beobachten können wir Menschen im engeren Sinne gar nicht, denn unser individuelles und subjektives Gehirn betreibt von Anfang an Datenverarbeitung!
Wenn man Beobachter dafür sensibilisieren will, was sie in einem Beurteilungsprozess eigentlich wirklich machen, dann gibt es durchaus bestimmte Inhalte, von denen Beobachter vermutlich besser profitieren können. Hierbei geht es z. B. um das psychologische Verständnis der Konzepte von Kompetenz und Potenzial. Man ist in der Beurteilung auf jeden Fall genauer, wenn man versteht, wie bestimmte psychologische Merkmale tatsächlich „funktionieren“. Es verhält sich im Grunde, wie bei einem Weinkenner. Wer wenig Ahnung vom Wein hat, für den schmeckt jeder Wein süß oder sauer. Je mehr man vom Wein versteht, umso mehr schmeckt und diversifiziert man. Je mehr man von Führung versteht, umso mehr und besser kann man Führungsqualität beurteilen. Beurteilungsqualität hat also viel mehr mit dem inhaltlichen Verständnis der zu beurteilenden Konstrukte zu tun als Wahrnehmungsfehler (siehe Paschen & Fritz: Die Psychologie von Potenzial und Kompetenz). Wenn man sich den Prozess von Beurteilung außerdem mal genauer anschaut, stellt man nämlich fest, dass viele Beurteilungsunsicherheiten oder Beurteilungsungenauigkeiten der Beobachter nicht mit deren fehlerhaftem oder fragilem Wahrnehmungssystem zu tun haben, sondern durch ganz andere Aspekte des Beurteilungsprozesses begründet sind.
Wie geht psychologische Diagnostik?
In der Psychologie verwendet man statt des Begriffs „Beurteilung“ viel häufiger den Begriff Diagnostik. Diagnostik kam zuerst in der Medizin vor und erfasste vorerst Symptome. Wenn Sie zum Arzt gehen, dann werden Sie den Arzt zunächst auf offensichtliche Symptome hinlenken, die Sie selbst als unangenehm erleben, wie z.B. Kopfschmerzen oder Ohrensausen. Der Mediziner wird weiterhin nach „benachbarten Symptomen“ suchen, denn Symptomgruppen werden in der Medizin oft zu Syndromen zusammengefasst. Für die Zuschreibung einer Krankheit müssen oft nicht alle Symptome vorhanden sein, sondern Ihr Arzt könnte beispielsweise in seinem diagnostischen Manual nachlesen, dass von den zehn Symptomen, die zu einem bestimmten Syndrom gehören, mindestens sieben vorliegen müssen, auf jeden Fall aber die Symptome 1 bis 3, um die Diagnose zu vergeben. Es könnte also sein, dass ihr Arzt einen „grippalen Infekt“ diagnostiziert, wobei man nun grippalen Infekt nie direkt sehen kann, sondern nur die Symptome. Krankheiten sind die erschlossene Größe und im gewissen Sinne zunächst einmal Konstrukte. Wir sehen in der Diagnostik auch immer nur bestimmte Symptome. Diese Symptome werden zu bestimmten Gruppen zusammengefasst und erhalten dann die Überschrift eines ganz bestimmten Konstrukts (meistens nennt man dieses Konstrukt im Unternehmen Kompetenz).
Kompetenzen und ihre „Symptome“
Anders als in der Medizin, hat sich nun die psychologische Diagnostik (zumindest im Wirtschaftskontext) nicht auf ein einheitliches Diagnosesystem geeinigt. Vielmehr erstellen Unternehmen sich ein eigenes Diagnosesystem (welche sich oftmals nicht stark unterscheiden). Oftmals werden die Symptome nur anders strukturiert, gruppiert und mit einer politischen Botschaft versehen, dann ist ein unternehmensspezifisches Kompetenzmodell entstanden. Wenn dann z. B. „Teamfähigkeit“ beurteilt werden muss, steht man als Beurteiler vor einer ganz bestimmten Symptomliste (Beispielsweise: Arbeitet gerne mit anderen zusammen, denkt sich konstruktiv in eine Gruppe ein, verhält sich anderen gegenüber hilfsbereit, integriert andere aktiv in einen gemeinsamen Gruppenprozess etc.). Der Beurteiler ist dann gefragt, das Vorliegen dieser Symptome zu beurteilen, und er wird unter Umständen zu dem Ergebnis kommen, dass vielleicht vier der sechs genannten Symptome stark ausgeprägt (meistens relativ zu anderen gemessen) vorliegen und Teamfähigkeit damit überdurchschnittlich ausgeprägt ist.
Leider gibt es keine überschneidungsfreien Kompetenzmodelle
Unternehmen suchen häufig nach „überschneidungsfreien“ Kompetenzen. Diese Suche ist jedoch von vorneherein zum Scheitern verurteilt. Auch in der Medizin ist dies kaum möglich. Wenn Sie Kopfschmerzen haben, kann das für unzählige Krankheiten sprechen und erst im Kontext mit anderen Symptomen wird dieses eine Symptom dann interpretierbar werden. Das Symptom „Hört anderen aufmerksam zu“ kann darum als Indikator für Empathie, Kommunikationsfähigkeit oder Teamorientierung gesehen werden. Auch in der Medizin lebt die Zusammenfassung bestimmter Symptome zu einem Syndrom und ist kein abgeschlossenes und in sich final stimmiges Kategoriensystem. Mediziner streiten häufig darüber, ob bestimmte Symptomgruppen den Wert einer eigenen Krankheitsdiagnose erhalten müssen oder z. B. nur eine Subkategorie einer anderen Krankheit sind. Wenn daraus unterschiedliche Behandlungen erfolgen, ist diese Frage hoch relevant. Ansonsten geht es zunächst um die Schlüssigkeit und Schärfe eines Kategoriensystems.
Wodurch werden Beobachtungen ungenau?
Die Beobachtungsbögen im Assessment-Center sind das „diagnostische Manual“, mit dem Beobachter umgehen müssen. Sie erhalten eine Liste von Kompetenzen und müssen nun feststellen, ob die Symptome vorliegen und daraus auf das Vorliegen der Kompetenz (analog zur Krankheit) geschlossen werden kann. Nun kann man behaupten (wie anfangs beschrieben auch in vielen Beobachtertrainings impliziert wird), dass die Fragilität unseres Wahrnehmungssystems einer der wesentlichen Gründe dafür ist, warum Beobachter bei der Beurteilung unsicher oder ungenau werden. Bei genauerer Betrachtung sieht man aber, dass die eigentlichen Gründe auch mit Problematiken zu tun haben, die dem Beurteilungsprozess und dem zugrundeliegenden Kategoriensystem inhärent sind und nicht mit der fehlerhaften Kontrolle des eigenen Wahrnehmungssystems der Beobachter zu tun haben. Es gibt z.B. sehr eindimensionale Kompetenzen mit wenig innerer Aspekt-Vielfalt („Apfelkorbkompetenzen“, wie z.B. Analytisches Denken), aber auch mehrdimensionale Kompetenzen („Obstkorbkompetenzen“, mit sehr vielen Aspekten, wie z.B. Unternehmerisches Denken und Handeln). So gibt es sehr „preiswerte Kompetenzen“ (z.B. Überzeugungskraft, das sieht man in einem AC immer, auch ohne, dass man es besonders „wachrufen“ muss) und aufwändige Kompetenzen, die ich sehr spezifisch sichtbar machen muss (z.B. Change-Management-Kompetenz). Manche Kompetenzen haben oft sehr ungünstige Symptomlisten oder beschreiben schwer interpretierbare Kunstbegriffe. Manche Kompetenzen kann man in einem AC durch eine „Punktmessung“ sichtbar machen, andere sind streng genommen nur im Längsschnitt messbar (z.B. Lernfähigkeit). Dann gibt es Kompetenzen mit einem eher einstellungsmäßigen Schwerpunkt (z.B. Leistungsorientierung) oder eher fähigkeitsorientierten Schwerpunkt (Projektmanagement-Kompetenz). Nur, wer ein wirklich gutes Verständnis davon hat, was gemessen werden soll und welche Besonderheiten bei der Einschätzung in einer spezifischen Kompetenz zu berücksichtigen sind, kann auch präzise beurteilen.
Was können Beobachtertrainings leisten?
Wenn man Beobachter in einem gut gemachten Beobachtertraining nun auf ein Assessment- oder Development-Center vorbereiten möchte, dann müssen Beobachter ein Verständnis für den Beurteilungsprozess gewinnen, ein gutes Verständnis für die Konstrukte, die sie einschätzen müssen, und für die Symptome, die in bestimmten Bausteinen sichtbar gemacht werden können oder aber eben auch nicht sichtbar gemacht werden können. Nur wer eine Kompetenz wirklich für sich verstanden hat, kann sie beurteilen und dann auch flexibel mit bestimmten Symptomen oder Symptomgruppen umgehen und sich manchmal von Operationalisierungen lösen, die eben in einer ganz bestimmten AC-Übung nicht aufgetreten sind, um aber dann andere und situativ passendere Indikatoren heranziehen zu können.
Letztlich bleibt damit eigentlich vor allem das Fazit, dass Beurteilungsungenauigkeiten im Assessment- oder Development-Center in den allermeisten Fällen nicht so stark durch die Psychologie der Beobachter verursacht werden, sondern vor allen Dingen auf unglückliche Konzeptionen zurückgehen. Die Übungen sind beispielsweise nicht in der Lage, die gewollten Kompetenzen wirklich „wachzurufen“. Die Symptomlisten enthalten Aspekte, die nicht sinnvoll sichtbar werden. Das Kategoriensystem der Symptome ist so unglücklich formuliert, dass keine profilierten Bilder entstehen. Durch zu viel große „Obstkorbkompetenzen“ entstehen „Mittelwertsbildungen“ von solchen Facetten, die eigentlich selbst den Status einer eigenen Kompetenz bräuchten, um präzise zu bleiben. Wenn Assessment- oder Development-Center-Übungen so gemacht sind, dass sie eine klare, gut strukturierte Kompetenz, die die Beobachter wirklich für sich erfasst haben, relativ eindeutig wachrufen können, dann spielen Beobachtungs- und Beurteilungsfehler nur noch eine untergeordnete Rolle.