El software: pieza clave para la implementación de Machine Learning e Inteligencia Artificial

by / Saturday, 28 March 2020 / Published in

El proceso de Machine Learning involucra las siguientes etapas:

El proceso para implementar machine learning e IA puede tomar mucho tiempo, recursos y suponer muchos errores y altos costos si no se lleva de manera adecuada.

  • Definición del problema de negocio: Definir el objetivo de negocio, lo que se quiere predecir, optimizar o clasificar y cuáles son las preguntas de negocio que se necesitan responder.
  • Recolectar la data: Determinar cuánta data se requiere, tipos de datos, donde obtener la data, los accesos requeridos, convertir la data al formato requerido, y crear las tablas de desarrollo, validación y prueba.
  • Explorar la data: Visualizar, interpretar y analizar las correlaciones entre los datos y verificar los supuestos sobre la data, para identificar patrones que ayuden a explicar ciertos comportamientos.
  • Preparar la data: Limpieza y transformaciones, creación de nuevas variables, y seleccionar un grupo de variables que puedan ayudar a explicar o predecir mejor a la variable objetivo previamente definida.
  • Desarrollo del modelo: Tomar muestras representativas y probar con diferentes modelos, midiendo su performance con diferentes métricas estadísticas. De todos los modelos probados se debe crear una lista de los modelos más precisos.
  • Mejorar y refinar los modelos: Se mejoran y combinan los modelos anteriores, y se hacen validación y pruebas de los modelos antes obtenidos, para seleccionar el mejor.
  • Presentar la solución: Presentación de resultados de manera visual y con enfoque en el el negocio para que sean entendidos por la alta gerencia y justificación del modelo seleccionado respecto al potencial logro de objetivos de negocio.
  • Desplegar el sistema de Machine Learning: El modelo seleccionado debe ser puesto en producción incorporandolo al sistema de producción de la organización, para que pueda ser utilizado por los analistas y funcionarios, y sea probado, monitoreado y re entrenado cada vez que fuera necesario.
  • Monitorear los modelos de Machine Learning: El modelo desplegado en producción debe ser monitoreado para identificar errores e identificar si el modelo sigue vigente y sigue siendo el mejor modelos con los cambios en el mercado y los nuevos datos que se recopilen en el futuro.

Las tecnologías de open source ayudan en este proceso, pero para su aplicación exitosa se requiere tener varios expertos en análisis de datos y modelos analíticos llamados “Data Scientists”, que deben tener mucha experiencia y conocimientos en las diferentes etapas del proceso de Machine Learning. Estos requieren ser capacitados permanentemente para ir acorde a los cambios en la tecnología y modelos.

Lamentablemente, hay un déficit de Data Scientists en el mundo, lo cual dificulta la implementación exitosa de Machine Learning y IA en las diferentes organizaciones e incrementa mucho los costos.

Es por ello que algunas empresas de software han desarrollado plataformas y herramientas que automatizan varias etapas del proceso de Machine Learning mencionado, lo cual reduce la dependencia en los Data Scientists, requiriendo menor número de estos expertos y permitiendo que se enfoquen en actividades más creativas que generen mayor valor para el negocio.

De esta forma, en vez de requerir Data Scientists con un perfil muy técnico, podría requerirse Data Scientists con menor perfil técnico y mayor conocimiento del negocio, como los llamados “Citizen Data Scientists”, que pueden ser captados de las diferentes áreas funcionales de una empresa y capacitados para asumir este rol.

Estas plataformas, permiten incluso que profesionales de negocio sin formación en estadística avanzada, ni programación, como analistas comerciales, analistas de marketing, analistas de crédito, o analistas financieros puedan desarrollar y desplegar modelos de machine learning con una capacitación relativamente breve que permita combinar su conocimiento del negocio con las recomendaciones de los modelos, para mejorar sus decisiones a todo nivel.

Por ejemplo, nuestro partner SAS ofrece la plataforma VIYA que incluye una serie de herramientas visuales interactivas drag & drop como SAS Visual Statistics y SAS Visual Data Mining & Machine Learning.

Contáctenos para más información sobre esta plataforma:


Gustavo Hidalgo
Gerente de Unidad BI
BCTS Consulting
Email: gustavo.hidalgo@bctsconsulting.com
LinkedIn

Leave a Reply

TOP