Tools: 💡 🔄 CRISP-DM en la práctica: cuando comienzas un proyecto de datos

Tools: 💡 🔄 CRISP-DM en la práctica: cuando comienzas un proyecto de datos

Source: Dev.to

CRISP-DM aparece en casi todos los cursos de ciencia de datos.
Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, Deployment. Suena lineal y ordenado, pero en la práctica no lo es.
CRISP no es un flujo, es un ciclo de fricción constante. En teoría, el proyecto empieza entendiendo el problema de negocio. En la práctica, el “problema” suele venir formulado como: Eso no es un problema, es una solución disfrazada. La fase de Business Understanding real implica: Si esta fase se hace mal, el resto del proyecto será técnicamente correcto y estratégicamente irrelevante. Aquí es donde CRISP deja de ser teoría. En la práctica, Data Understanding y Data Preparation se mezclan constantemente.
Y muchas veces regresan a Business Understanding porque descubres que el problema planteado no es viable con los datos existentes.
CRISP no es lineal. Es iterativo. Uno de los mayores mitos es que el modelado es “la parte importante”. En proyectos reales, modelar suele representar una fracción del esfuerzo total. Lo que consume tiempo es: En libros, Evaluation significa revisar métricas. En la práctica, significa responder preguntas incómodas: Aquí es donde muchos proyectos “técnicamente buenos” se caen. CRISP termina en Deployment, pero en proyectos reales ese es el inicio de otra etapa: Un modelo sin monitoreo es un experimento en producción. Y si lo conectas con gobierno de modelos, Deployment no es sólo poner en producción, es hacerlo observable y controlable. Lo que he aprendido usando CRISP en la práctica Cuando se usa bien, no estructura sólo el proyecto.
Estructura la conversación entre datos y negocio. Templates let you quickly answer FAQs or store snippets for re-use. Are you sure you want to hide this comment? It will become hidden in your post, but will still be visible via the comment's permalink. Hide child comments as well For further actions, you may consider blocking this person and/or reporting abuse - Business Understanding no es una reunión inicial - “Necesitamos un modelo predictivo”
- “Queremos usar IA”
- “Queremos algo con GenAI” - redefinir el problema en términos medibles,
- entender qué decisión se quiere mejorar,
- y algo clave: entender qué pasa si el modelo falla. - Data Understanding es donde empiezan las sorpresas - no están completos,
- no están documentados,
- no representan exactamente el proceso de negocio,
- o cambian sin aviso. - Modeling no es el centro del proyecto - redefinir métricas
- alinear expectativas
- ajustar supuestos
- explicar resultados - Evaluation no es sólo performance - ¿Este modelo realmente mejora la decisión?
- ¿Qué pasa en escenarios extremos?
- ¿Es estable en el tiempo?
- ¿Qué riesgos regulatorios existen? - Deployment no es el final - detección de drift
- reentrenamiento - Es más iterativo de lo que parece.
- La mayor parte del valor se define antes de modelar.
- El éxito depende más de claridad de negocio que de sofisticación algorítmica.
- Sin gobierno y monitoreo, CRISP se queda incompleto.
CRISP-DM sigue siendo uno de los marcos más sólidos para proyectos de datos, pero su poder no está en seguir las fases como checklist, sino en entender que cada fase conversa con las demás.