KDnuggets

Según Lucas Biewald, de CrowdFlower existe un reto en Machine Learning al que todavía no se ha llegado a dar una solución satisfactoria. Resulta que su compañía lanzó una competición en kaggle, a raíz de la cual el autor pudo darse cuenta de que la exactitud de los resultados en los modelos que los data scientists presentan a estas competiciones tienen un carácter asintótico, tal y como aparece en la gráfica de debajo.

imagen: KDnuggets.com

De tal manera que el modelo ganador en cada fecha va mejorando su exactitud, pero existe una barrera más allá del 70% que va resultando muy dificil de superar aún cuando pasa más tiempo y los equipos que concursan en esta plataforma de crowdsourcing tienen mayor margen para mejorar sus modelos.

¿Cuál es el gran reto? Conseguir modelos al 80%

Nota: recordar aquí que la precisión y la exactitud no son sinónimos, a pesar de que en el lenguaje común se les suele utilizar como un mismo concepto indistintamente. Releyendo el artículo original, que podéis ver aquí me entra la duda sobre si con accuracy se están refiriendo a la precisión del modelo, lo cual creo que es muy probable. ¿Qué opináis?