Las limitaciones de la práctica del análisis de supervivencia

Las técnicas de data mining tradicional predicen la ocurrencia de sucesos específicos en un cierto intervalo (relativamente breve) de tiempo futuro, no cuándo ocurrirán. Es decir, predicen, por ejemplo, qué clientes probablemente desertarán el mes que viene, pero NO cuándo desertarán durante los próximos dos años.

 Como alternativa, el data mining basado en el análisis de supervivencia agrega el elemento de cuándo ocurren las cosas. La supervivencia es particularmente valiosa para ganar en comprensión de los clientes y cuantificar esa comprensión. Una estimación de cuánto durarán los clientes es útil para cálculos de valor, además de comparaciones directas entre diversos grupos. La estimación de la duración de la relación con el cliente puede refinarse en base a las características del periodo inicial de análisis, además de con los sucesos que ocurren durante su ciclo de vida.

 El análisis de supervivencia consiste en el análisis del tiempo transcurrido hasta un suceso o hasta la repetición n-ésima de un suceso. Sus conceptos, herramientas y terminología provienen de la medicina, donde se intenta estimar, por ejemplo, cuánto tiempo sobrevivirán los pacientes en base a alguna intervención médica. Puede medir los efectos de variables (covariables iniciales o covariables dependientes del tiempo) sobre el tiempo de supervivencia y es una herramienta natural para comprender la relación con los clientes

El enfoque tradicional y el de supervivencia son complementarios. Uno u otro es más apropiado para diferentes problemas. Por ejemplo, para una campaña específica de marketing basada en el ROI, el enfoque tradicional usualmente funciona mejor que el enfoque de supervivencia, porque la campaña ocurre durante un periodo particular de tiempo. Para la comprensión de las relaciones con los clientes y cuantificar resultados en el tiempo, el análisis de supervivencia es preferible.
 
 En términos generales, el análisis de supervivencia busca comprender:

  • Cuándo ocurren sucesos particulares
  • Comprender qué factores afectan el cuándo
  • Cuantificar qué ocurre a lo largo del tiempo

El análisis de supervivencia plantea al data mining tradicional novedades a nivel de los conceptos y herramientas involucrados. En cuanto a los conceptos, los siguientes son esenciales: “tenure” (antigüedad o permanencia), riesgo y su estimación no sesgada, supervivencia, censura, truncado a izquierda, efecto y tipos de covariables, predicción por tipo de cliente. En cuanto a las herramientas, las siguientes son las más utilizadas: gráficos de función de riesgo, gráficos de función de supervivencia, estratificación, regresión de Cox y tiempo mediano residual.

Figura 3 – Ejemplo de función empírica de riesgo. Clientes suscriptos a un servicio particular (por ejemplo, telefonía celular).

Figura 3 – Ejemplo de función empírica de riesgo. Clientes suscriptos a un servicio particular (por ejemplo, telefonía celular).

Fuente: Por José Alvarez - SAS Argentina | Educación