Minne fra Testdagen 2010: Personlighetstesting fra varierende perspektiver

I år var det nok en gang testdagen, som blir avholdt én gang i året som en slags møte- og faglig påfyll-arena for mennesker som på en eller annen måte forholder seg til personlighetstesting. Denne gangen prøvde jeg liveblogging via Twitter, men fikk litt for mye #netcomfail. Så her er inntrykk i stedet.

Det var 150 fremmøtte, noe som er rimelig sensasjonelt tatt i betraktning den spede begynnelsen. Det er 150 DNV-sertifiserte testbrukere nå, og fire sertifiserte personlighetester samt et sertifisert testbatteri – OPQ32i, Shapes & Scales, Hogans Personlighets Inventorium, Master Person Analyse og B5-Plus.

Det ble poengtert at sertifisering er i ferd med å spre seg til Europa og USA, men viktig å understreke at selv om en standard eksisterer er ingen land forpliktet til å implementere den og ingen forpliktet til å bruke den, så det gjenstår fortsatt mye. Det ble også understreket en god del om interessante forskjeller mellom USA og Europa i hvordan man tenker rundt testing. I USA spiller juss en stor rolle.

Jan Kjetil Arnulfs presentasjon var ganske fantastisk. Vi vet at personlighetstesting ikke predikerer evne til lederskap veldig godt. Noe av det kommer av at vi ikke vet så mye om hva slags personlighet en god leder bør ha, eller sagt på en annen måte: Finnes det personlighetstrekk som er ønskelige eller til stede hos de fleste gode ledere (og, må vi anta, fraværende hos de dårlige)?

Arnulf foreslo at at problem er at psykologiske tester prøver å finne ting som er statiske, mens lederskap kanskje handler om evne til fleksibilitet eller tilpasning. Det er i hvert fall helt sikkert slik at det ikke er sånn at jo høyere man skårer på de egenskapene man vet er positive, jo bedre – en leder skal f.eks. være energisk, men en leder som alltid er energisk får ikke tilpasset seg situasjoner hvor det å være energisk ikke er bra – og blir f.eks. overkjærende og lite mottagelig for innspill.

Et annet problemer at i den testtradisjonen som er mest brukt for tida er begrepene hentet fra dagligtale. Kanskje må vi utvikle et teknisk språk for å beskrive, finne og måle de egenskapene som trengs. At det er noe som må måles er Arnulf enig med oss andre i, men han utfordret oss på om vi leter der vi bør lete.

Testtilbakemelding er en vikig del av testing, mener noen, fordi den kan korrigere inntrykket fra testen. Dag Øyvind Engen Nilsen er uenig, det bare tåkelegger, mener han. Dette var faktisk en aha-opplevelse for meg, for det forklarte noe jeg har lurt på i femten år og vel så det: Harald Engviks påstand om at når man kombinerer personlighetstesting med ustrukturert intervju, blir økningsvaliditeten negativ. Hvorfor i all verden?

Vel, ei testtilbakemelding er et intervju, men i hvert fall ikke et strukturert et. Og mens testen sammenligner kandidaten med et utvalg som er representativt, har verken testtilbakemelderen eller kandidaten tilgang til det. Så hvordan sjekker man om en kandidat som skårer som introvert, faktisk er det? Hvis både den som gir testtilbakemelding og den som skal testes begge kommer fra miljøer hvor det er overrepresentasjon av introverte, vil ikke de nødvendigvis ha noen god intuitiv forståelse av hva som er vanlig – og en korreksjon vil trekke i feil retning. Så nå vet jeg det: Problemet er at i testtilbakemeldingssituasjonen er sammenligningsgrunnlaget diffust. 20 år gammelt problem løst. Wheeeeeee!

Lunsjen var lang, og det var lurt: Det var høy nerdefaktor på alle presentasjonene, men under lunsjen fikk deltakerne mingle og fulgt opp mennesker de ikke hadde truffet på ei stund, og sånt er alltid et incentiv for å dra på arrangemenger som dette, men det bør jo ikke være det eneste incentivet, da.

Deretter fulgte en debatt om normativ vs. ipsativ skalering. Dette er måter å konstruere spørreskjemaer på. Her er debatten het blant testnerdene. Alle andre gir blaffen. Kandidater pleier å foretrekke normativ skalering fordi det gir skjemaer som er lettest å fylle ut. Hensikten med alternativet, ipsativ skalering, er å redusere muligheten for å bevisst eller ubevisst stille seg selv i for positivt lys når man fyller ut testen. Debatten går på om man ikke mister mer enn man tjener på denne metoden, fordi matematikken bak den gjør endel ting som kanskje ikke er så heldig. Jeg skjønte for første gang hva ipsativ skalering er (i matematisk forstand). Det var veldig oppklarende for meg og åpenbart totalt uforståelig for de fleste.

Etterpå var alle enige om at det hadde vært en fin tur.

8 thoughts on “Minne fra Testdagen 2010: Personlighetstesting fra varierende perspektiver

 1. Har ofte lurt på akkurat dette, virker på meg som om det normalt sett må være rimelig enkelt for et oppegående menneske å tilpasse svarende sine på en slik måte at resultatet blir nermere det man ønsker.

  Det er ikke vanskelig å tippe hvilke svar som vil føre til at jeg blir evaluert som mer utadvent, for eksempel.

  Dersom du spør en gruppe unge menn om hvordan man bør kjøre; med en fart tilpasset forholdene og en defensiv kjørestil, eller 130 på hålkeføre etter et par øl, så vet alle sammen det riktige svaret. Men en del av dem kommer likevel til å velge alternativ 2 i praksis i løpet av de neste få årene.

  Ipsative tester har den fordelen at du må velge. Du kan ikke velge "jeg er god på alt jeg", på den andre side er ipsative tester helt ubrukelige til å skille mellom dem som er rimelig gode på det meste, og dem som er temmelig dårlige på det meste.

 2. Nå er det vel slik når tester lages at det blir gjort en ganske stor jobb for å plukke vekk items som er for åpenbare, og innen item response theory er det vel også gjort endel for å finne latente trekk som ikke er så åpenbare. En annen ting er at det er lett å lyve, men ikke så lett å lyve konsekvent, så det finnes matematikk som kan brukes på responsstilen for å avsløre om svarene dine er upålitelige.

 3. Les denne: Meade, A.W. (2004). Psychometric problems and issues involved with creating and using ipsative measures for selection. Journal of Occupational and Organizational Psychology (2004), 77, 531–552.

  Jeg har snakket med gutten, og han ble så pepret av kommers aktører (som begynner på S og slutter på L) at han ikke trodde det skulle være mulig.

  Kort sagt, det er mange avhengigheter, både statistiske og kognitive, ved ipsert testing, og det løser et marginalt problem (hvis noe).

  A.

 4. Betyr dette at jeg med min introverte personlighet kan glemme å sikte mot næringslivets høyder (eller bare mellomleder-stillingene)? Hvordan skiller man mellom reel introvert personlighet og sjenanse osv, som jeg (uten noen faglig innsikt) ser mer på karakterbrister eller hvertfall hvertfall karaktertrekk som kan endres? Vil ikke svarene man avgir være ganske sammenfallende, uavhengig av om det er det ene eller andre som er årsaken?

 5. Vi vet at det finnes dyktige introverte ledere, så jeg tviler på at noen kan fradømmes lederskap pga. dét. Vi vet i det hele tatt ikke så mye om hva slags egenskaper ledere helt sikkert må ha som vi skulle ønske.

  Det er ikke engang sikkert at ekstraversjon er en ønskelig egenskap hos ledere. Ledere er høyere enn gjennomsnittet, men det er ingen grunn til å tro at høyde gir godt lederskap. Antagelig bidrar det indirekte, ved at det gir selvtillit og at det fører til at man blir lagt merke til. Det kan godt være det samme med ekstraversjon.

 6. Takk for kjapp tilbakemelding! Setter for øvrig stor pris på bloggen din, når den nå og da oppdateres.

 7. Det forutsetter likevel at det FINNES spørsmål som ikke åpenbart har en tendens til å besvares på en gitt måte av en gitt type mennesker, men som like fullt er gode indikatorer på at man er et slikt menneske.

  Det er sant at det er vanskelig å lyve konsistent, men det er så mye "støy" i svarene på subjektive personlighetsspørsmål at man neppe kan ta det at noen svarer inkonsistent som et tegn på at de har løyet.

  Vet du om det har vert gjort noe forskning på hvor lett det er å score som man måtte ønske ? Virker jo som et åpenbart prosjekt, og det burde greit la seg gjøre å dele en gruppe i to med en halvpart som kontroll, og en halvpart som får beskjed om å prøve å jukse i en gitt retning.

 8. Tester inneholder mål på om kandidaten prøver å jukse, blant annet ved å måle konsitens i besvarelsene. Folk som prøver å jukse, har en plan med hvordan de skal fylle ut, og får (for) høy skår på konsistens. Når tester lages, blir spørsmål som det er lett å svare strategisk på luket ut.

  Men forskning som går direkte på å skåre som man måtte ønske – du skal kunne ganske mye om testen for å klare dét. Én ting er MBTI som er kategorisk og lett å få oversikt over, men i tester med mange dimensjoner som OPQ og Shapes er laget sånn at prøver du å skåre på bestemte måter, blir resultatet veldig rart.

Leave a Reply

Your email address will not be published. Required fields are marked *