Should we pursue inter-rater reliability or diversity? An empirical study of pilot perfor-mance assessment

Authors

  • David Emanuel Weber Griffith University
  • Wolff-Michael Roth University of Victoria
  • Timothy J. Mavin Griffith University
  • Sidney W. A. Dekker Griffith University

Keywords:

performance assessment, pilots’ performance, non-technical skills, nonlinearity, reliability.

Abstract

Reliably and equitably assessing the performance of commercial pilots has not always proven easy. It is thus necessary to take a closer look on how performance is assessed in practice. This study explores the reasoning behind this process as stated by experienced pilots who assess safe-ty-critical pilot performance. Using a theoretical model of performance, three pairs of airline captains assessed a captain and a first officer in two video scenarios. The results show that assessors apply the same or similar reasons to arrive at different assessments or use different reasons to arrive at the same assessment. In addition, conclusions about inter-rater reliability and efforts intended to increase it are drawn.

 

**************************************************

 

Avaliar o desempenho dos pilotos comerciais com imparcialidade e confiabilidade nem sempre é tarefa fácil. Assim, é preciso examinar mais de perto como tal desempenho é avaliado na prática. O presente estudo explora o raciocínio por trás deste processo de acordo com pilotos experi-entes que avaliam questões fundamentais para a segurança no desempenho de pilotos. Utilizando-se de um modelo teórico de desempenho, três pares de comandantes de linhas aéreas avaliaram um co-mandante e um copiloto em dois vídeos. Os resultados demonstram que avaliadores fazem uso de ra-zões iguais ou similares para chegarem a avaliações diferentes ou de razões diferentes para chegarem à mesma avaliação. Conclusões sobre a confiabilidade inter-avaliadores e os esforços intentos em aumentá-la são formuladas também neste estudo.

PALAVRAS-CHAVE: avaliação de desempenho; desempenho de pilotos; habilidades não-técnicas; não-linearidade; confiabilidade.

Author Biographies

David Emanuel Weber, Griffith University

Safety Science Innovation Lab, Griffith University, Brisbane, Australia. 

Wolff-Michael Roth, University of Victoria

Applied Cognitive Science, University of Victoria, Victoria, Canada. 

Timothy J. Mavin, Griffith University

Griffith Institute for Educational Research, Griffith University, Brisbane, Australia.

Sidney W. A. Dekker, Griffith University

Safety Science Innovation Lab, Griffith University, Brisbane, Australia.

Downloads

Published

2014-01-09

Issue

Section

Aviation and Safety/Security