La inflación de la reputación o por qué los sistemas de valoración de 5 estrellas no son realmente útiles

Pavel Ramírez
un usuario de Uber en smartphone

Cuando las aplicaciones y webs especializadas comenzaron a incluir un mecanismo para puntuar sus servicios, a nadie se le ocurrió pensar que la gente no sería del todo honesta.

Sucede en todos los campos: los teleoperadores que te conminan para que les des una buena puntuación tras su atención telefónica, las plataformas como Google Play o App Store en las que los primeros veinte comentarios y puntuaciones son exclusivamente de quienes trabajan en un proyecto y sus allegados, o en los restaurantes u hoteles que tienen puntuaciones demasiado altas o demasiado bajas sin que nadie sepa muy bien por qué.

Algo parecido a lo que sucede, por ejemplo, con aplicaciones del estilo de Uber. Su política de contratar a conductores independientes, que trabajan realmente como autónomos, hace que las cinco estrellas que la app permite otorgar como puntuación máxima se conviertan literalmente en el sustento de los trabajadores.

Si un conductor de Uber acumula una serie de puntuaciones bajas corre el serio riesgo de ser despedido. Quizás por eso se produce un fenómeno que podría parecer extraño: la mayoría de la gente da cinco estrellas, incluso cuando el viaje o el conductor en sí no merece esa puntuación.

Los usuarios no saben muy bien cuál es la puntuación mínima que deben dar a un conductor para no perjudicarle. ¿He llegado al destino? ¿Con las dos piernas y los dos brazos? ¿En hora? Si la respuesta es sí, la mayoría puntúa con cinco estrellas al trabajador, independientemente de que no haya respetado las señales de tráfico o haya hecho un comentario racista absolutamente gratuito.

De hecho, la propia Uber implantó una nueva política el pasado verano por la que todos aquellos conductores que reciban una puntuación menor a cinco estrellas deben dar explicaciones ante la compañía. Los estándares de calidad que miden un servicio prestado en este tipo de aplicaciones a menudo son tan severos para con los subcontratados que, si lo trasladásemos por un minuto al sistema educativo, sacar menos de un ocho sería un suspenso.

La inflación de la reputación

“Inflación de la reputación”. Así denominan el fenómeno John Horton y Apostolos Filippas, de la Universidad de Nueva York, y Joseph Golden, CEO de Collage.com en un estudio publicado el pasado mes de marzo: desde enero de 2014 a mayo de 2016, la puntuación pública media otorgada por los usuarios de eBay fue de 4,77 sobre 5.

Es más, en el mismo estudio se analiza otra empresa ─sin desvelar su identidad─ en la que los clientes puntúan el servicio de quienes les atienden, el 82% de todas las puntuaciones se situaba por encima del 4.75. Lo más curioso es que, en los últimos diez años, la puntuación media ha pasado del 3,74 al 4,85 actual. Un ejemplo más de las estrictas políticas de control de calidad atemorizan a los empleados tanto como coaccionan a los clientes para que den una buena puntuación.

Leer más: Estas son las estrategias que utilizan Facebook, Instagram o Tinder para generar adicción a las redes sociales

En España sucede algo parecido. Algunas compañías telefónicas que subcontratan a empresas para realizar las instalaciones en los domicilios de los clientes suelen llamar al propio usuario para que valore el servicio recibido.

Un empleado de una de estas empresas —que prefiere no facilitar su identidad— explica a Business Insider que si no llegan a un mínimo, que es el nueve sobre diez, no sólo corre peligro el puesto del empleado, sino que la propia subcontrata puede perder el contrato con la compañía telefónica.

De hecho, este empleado admite que siempre que acude a una instalación le pide al cliente que marque el nueve cuando la grabación para evaluar el servicio se lo requiera durante la llamada. ¿Por qué no un diez? "Porque a veces el sistema falla y lo cuenta como un uno o un cero. Y ahí tenemos un problema".

Un 'expediente profesional' que determina el sueldo

Pero el problema va más allá. Tal y como señala el Financial Times, las valoraciones de los trabajadores autónomos de este tipo de empresas sirven para algo más que para buscar una excusa para despedirles: son una suerte de expediente profesional que les permite ─o les restringe─ acceder a otros puestos de trabajo o ganar un extra por variables en su salario mensual.

Los cambios en la Regulación Europea para la Protección de Datos, que entrarán en vigor en mayo, suponen un paso más en el control del trabajador autónomo por parte de estas empresas. Así, las puntuaciones de un empleado se portarán cuando cambien de compañía y, de este modo, servirán como filtro a la hora de contratar. Es más, la valoración media que arrastre una persona determinará su sueldo. Y, por supuesto, quienes más cinco estrellas acumulen, cobrarán más.

El dilema es saber hasta qué punto una valoración de un usuario es lo suficientemente objetiva como para tomarse como referencia a la hora de contratar, despedir o subirle el sueldo a un trabajador. "Si tu jefe da una mala referencia de ti, hay maneras de darle la vuelta a la situación. Pero un autónomo está desprotegido. Existe el peligro de que, al hacer que tu puntuación sea portable, perpetúes y legitimes datos que puedan estar contaminados por los prejuicios injustos de los usuarios", reflexiona el Financial Times.

Una escala del 1 al 5 no sirve

Pero el problema se extiende hasta la misma concepción del sistema de evaluación de calidad utilizado por este tipo de compañías. Tal y como cuenta Mark Murphy, CEO de Leadership IQ, en su informe titulado Por qué las escalas de 5 puntos no funcionan (y otros problemas de las encuestas sobre empleados), "algunas personas odian el naranja mientras que otras lo adoran. Lo mismo ocurre con el verde. Y hay quienes son indiferentes a ambos. Puedes preguntarles una serie de cuestiones, por ejemplo, si los Yankees son el mejor equipo de béisbol, si el mejor ingrediente para los perritos es la mostaza, si el rojo en un buen color para los coches, si se sienten felices... y, en todas esas situaciones, una escala de cincos puntos funciona porque las respuestas variarán".

"Pero en una organización, la escala de cinco puntos pierde su efectividad. Los resultados de una encuesta con preguntas para valorar del 1 al 5 tienden a estar sesgados y son menos variados. […]. Si le preguntas a un grupo de empleados de ACME que puntúen la afirmación “ACME es un buen lugar para trabajar”, no vas a obtener muchas puntuaciones bajas (unos y doses). Eso es porque si realmente pensaras que ACME es un sitio horrible para trabajar, probablemente ya te habrías marchado", añade el informe.

Leer más: UberEats se come a su hermana mayor Uber en ciudades como Madrid

Es decir, que el propio sistema de puntuación del 1 al 5 puede estar sesgado y, desde luego, no representar la opinión real de los usuarios. Una situación de la que ya advertía hace casi una década Youtube tras analizar los datos de valoración de los vídeos de la plataforma por parte de los usuarios: "Parece como si algunos estuvieran forzados a puntuar los vídeos cuando les gustan, pero la abrumadora mayoría de los vídeos tienen una estelar puntuación de cinco estrellas. Parece que cuando se trata de puntuar, es o todo o nada. Los vídeos geniales incitan a la acción [de votar]; todo lo inferior provoca indiferencia".

“Todo ello nos lleva a la pregunta: ¿si la mayoría de los vídeos obtienen cinco estrellas, cómo de útil es en realidad este sistema? ¿Sería más efectivo un sistema de dedo hacia arriba y dedo hacia abajo?”, se cuestionaban desde Youtube en 2009. Un año después, el mayor proveedor de vídeos online del planeta decidía eliminar el método de las cinco estrellas por resultar totalmente inefectivo. 

Lo mismo sucedió con Netflix, que en marzo de 2017 abandonó el sistema de valoración por estrellas y lo sustituyó por pulgares hacia arriba y hacia abajo.

Conoce cómo trabajamos en Business Insider.