Análisis de datos, ejemplos de Data Science y sesgos. Obsolescencia desprogramada.

DataScience


Actualidad.

Mercado de productos.

Hoy en día tenemos aplicación de Data Science (DS) todo el tiempo interactuando con nosotros en nuestra vida cotidiana en los que se está constantemente juntando y analizando la información en base a nuestra interacción. Algunos ejemplos claros que tenemos es en la venta de productos, por ejemplo Amazon tiene un desarrollado algoritmo para crear modelos que le permite anticiparse a las necesidades de los clientes en base a las características de los mismos y así realizar una oferta personalizada para cada persona. 

Consultoría política-empresarial.

Por otro lado tenemos áreas en las cuales el debate ético de cómo se aplica la tecnología cumple un rol fundamental, el cual apenas está comenzando, por ejemplo en el área de consultoría política-empresarial, tal vez algunos de los casos que han suscitado más controversia con el uso de data science es en las campañas presidenciales como las de Trump y Obama que con distintos enfoques desarrollo un rol destacado para el éxito de la misma, basándose en dirigir anuncios según las características de cada votante. El problema es que se generaba un anuncio con un momento particular del candidato en cuestión, en el cual ese momento tenía una connotación negativa o positiva para la persona que iba a recibir el anuncio y se dirigía según se quisiera reforzar para que se vote a un candidato o intentar que no. Todo esto dio lugar hasta a una película, “Nada es privado”, sobre la empresa Cambridge Analytic.

Deportes.

Siguiendo con las películas, tenemos Moneyball que desde otra perspectiva aborda esta área de conocimiento, al igual que la película anterior también está basada en hechos reales. En este film se ve como utilizando técnicas de DS y cambiando la forma de interpretar los datos potencian a un equipo de baseball. En este caso un diferencial fue empezar a ponderar predictores en base a dinámicas sociales en relación a la forma en que se venía haciendo. Luego de eso, ese tipo de algoritmos son comúnmente utilizados en los deportes. No obstante, es fundamental tener claro que esto es una herramienta y las decisiones deben ser tomadas por las personas no por algoritmos, sino tenemos casos como el de la eurocopa de este año en el cual es asombroso cómo el técnico de Inglaterra al parecer delegó la toma de decisiones de quienes tenían las mejores probabilidades al patear penales, en lugar de ser considerar esta información como una herramienta. Esta información estaba sesgada porque el algoritmo no tenía en cuenta lo que sucedió en el partido. Además, para la ponderación se analizaron partidos de entrenamiento, los cuales, lejos están del aspecto emocional que se desarrolla en partidos de relevancia. En este caso el análisis pareciera que se hizo a máquinas y no a personas. Hay casos en los que parece forzada la herramienta y se aplica para todo.

Aplicación.

Esto deja en evidencia que el análisis de datos como la informática son herramientas en donde los modelos son una reducción de la realidad para poder aproximarse a algo cuantificable. Para la resolución de los problemas la clave es la persona, siempre que esta tenga capacidad crítico reflexiva y pueda analizar en base al contexto y desde un pensamiento que no se quede en las características de las partes y que ahonde más allá para una comprensión profunda, considerando las redes de vínculos que interactúan y el devenir en el tiempo de influencia sobre la temática en cuestión para que se traduzca en generación de conocimiento de valor.

Por ejemplo: un error puede ser el sobreajuste que en base a los resultados puede darse una predicción excelente y al aplicar datos desconocidos no se logre predecir con precisión.

Sesgos (bias en inglés)

Qué es un sesgo?

Sesgo es un valor o peso que se sale del contexto que se considera correcto para la apreciación del conjunto de datos en cuestión. Es un peso desproporcionado que puede ser un reforzador positivo o negativo, entonces los sesgos deben estudiarse para identificarlos y eliminarlos a fin de optimizar los datos que se van a tener en cuenta para la producción de información y con ella poder tomar desiciones de la mejor forma posible.

De los casos anteriores tenemos modelos, aplicaciones o proyectos que fallaron (o tuvieron problemas) por cometer errores o no realizar un correcto manejo de los sesgos.

Al empezar a buscar modelos, aplicaciones o proyectos que tuvieron problemas con sesgos lo primero que me surgen son las diferentes interpretaciones que se tiene según el área de aplicación: estadística, redes neuronales, recopilación de datos, psicología cognitiva, etc. Sobre todo cuando trabajan equipos multidisciplinarios para tener consensos en que todos manejen los mismos criterios para una misma información.

Abordando nuevamente el caso de Inglaterra en la Eurocopa 2021 es un ejemplo de un manejo incorrecto de los sesgos, en el cual se quiere conocer información a partir de datos que como punto de partida ya tiene una característica común que determina no son correctos para el análisis en cuestión. Por ejemplo: si queremos saber la apreciación de cómo perciben los clientes una marca y tomamos los datos de soporte va a estar sesgado ya que aquí los contactos van a estar relacionados a problemas por la razón de ser que origina la interacción desde donde sacamos los datos.

Hoy en día Data Science una de las herramientas que potencio su aplicación es la computación en la nube ya que además de proveer mayor capacidad de computo para que esta no sea un cuello de botella, ofrece modelos de despliegue que se adaptan a las distintas realidades y también permite la integración en tiempo real con bases de datos para que se vayan retroalimentando. En suma a todo esto, destaca la sencillez con la que permite poder trabajar en equipo, acelerando el desarrollo de distintas comunidades para compartir conocimiento.

En resumen.

Data Science ofrece una gran cantidad de herramientas para poder realizar mejores análisis de datos en forma eficiente pero no deja de ser una herramienta que debe ser interpretada en forma correcta en base al contexto que se está aplicando y debe ser la persona quien toma la desición y no el algoritmo, identificando sesgos y formas de mejora para establecer un proceso de mejora continua.

Publicar un comentario

0 Comentarios