Video Summary and Transcription
AutoML simplifica la complejidad de construir modelos de aprendizaje automático, permitiendo a los ingenieros enfocarse en los problemas y aplicaciones difíciles. Permite resolver problemas que de otra manera no serían factibles. El enfoque de AutoML de tres pasos de MathWorks incluye scattering wavelet para la extracción de características. AutoML también permite la selección de características y la optimización del modelo para sistemas integrados con limitaciones de memoria y energía. MATLAB puede traducir a código de bajo nivel para implementación.
1. Introduction to AutomL and its Benefits
Hola a todos, mi nombre es Bernhard Suhm, soy gerente de producto de aprendizaje automático con MathWorks. Hoy me enfocaré en AutomL, una automatización que elimina el esfuerzo iterativo rutinario y la mayor parte de la ciencia en la construcción de modelos de aprendizaje automático. El objetivo de AutomL es simplificar la complejidad de construir modelos de aprendizaje automático, liberando a los ingenieros para que se centren en los problemas difíciles de aprendizaje automático y en sus aplicaciones. AutomL te permite resolver problemas que de otra manera no serían factibles, como casos de uso en los que necesitas construir muchos modelos diferentes que representen diferentes variaciones o etapas ambientales diferentes. En MathWorks hemos desarrollado un enfoque de AutomL de tres pasos que incluye el scattering de wavelets para extraer buenas características de datos de señales e imágenes.
Hola a todos, mi nombre es Bernhard Suhm, soy gerente de producto de aprendizaje automático con MathWorks. Permítanme motivar mi tema con algunas preguntas para ustedes. ¿Dónde desean aplicar IA? ¿Están preocupados por la falta de experiencia en IA o por los modelos de caja negra? La comunidad reconoce ampliamente estos desafíos y barreras para una adopción más amplia de la IA en muchas industrias. Hoy me enfocaré en AutomL, una automatización que elimina el esfuerzo iterativo rutinario y la mayor parte de la ciencia en la construcción de modelos de aprendizaje automático. Entonces, ¿qué es exactamente AutomL? Para entender eso, necesitan conocer un poco sobre el flujo de trabajo típico para construir modelos de aprendizaje automático, el enfoque de esta charla, pero construir redes neuronales profundas no es muy diferente. Primero, necesitan procesar sus datos crudos, lidiar con su desorden y darle una forma adecuada para etapas posteriores, como lidiar con datos faltantes y valores atípicos. Luego, necesitan diseñar características, extraer algunas variables de sus datos que sirvan como entrada para su modelo y capturar la mayoría de la variabilidad. Eso es bastante fácil para datos numéricos, pero mucho más difícil para señales. Luego, se enfrentan a la elección de diferentes modelos de aprendizaje automático. Incluso para los expertos, no está claro qué modelo funciona mejor en cualquier problema dado. Por lo tanto, deben probar múltiples modelos, lo que conduce a la etapa de ajuste del modelo, donde evalúan el rendimiento de algunos modelos iniciales, optimizan sus hiperparámetros y tal vez seleccionan un subconjunto de características para evitar el sobreajuste. Pero eso puede no ser suficiente para obtener un rendimiento realmente bueno. Es posible que deban retroceder, reemplazar algunas características por otras y hacer todo esto nuevamente. Si están familiarizados con el aprendizaje automático, sabrán que las etapas más difíciles y que consumen más tiempo son la ingeniería de características y la optimización. Si ahora tienen la cabeza dando vueltas, no se desesperen porque no necesitan conocer toda esta complejidad. El objetivo de AutomL es simplificarla. Idealmente, pasar directamente de sus datos iniciales y su problema de aprendizaje automático a un modelo que puedan implementar. Sin embargo, tomarlo en serio, eso no es una expectativa realista. El aprendizaje automático en un solo paso no es posible. Sin embargo, lo que es realista es liberar a ingenieros como ustedes para que se centren en los problemas difíciles de aprendizaje automático y en su aplicación. De lo contrario, sin AutomL, tendrán que buscar esa experiencia en IA dentro de su equipo y organización o externamente. Esos científicos de datos son difíciles de encontrar y costosos. Como la primera barrera que AutomL elimina, supera la falta de experiencia en aprendizaje automático. Pero incluso si tienen esa experiencia, aumentarán su productividad porque AutomL elimina esos pasos que consumen mucho tiempo y son iterativos. Finalmente, AutomL les permite resolver problemas que de otra manera no serían factibles, como casos de uso en los que necesitan construir muchos modelos diferentes que representen diferentes variaciones o etapas ambientales diferentes. Entonces, ¿cómo aplican AutomL en la ingeniería? La mayoría de esas aplicaciones de ingeniería se basan en datos de señales e imágenes, y ahí es donde la ingeniería de características se vuelve crítica para un buen rendimiento, y eso es notoriamente difícil. En MathWorks hemos aplicado nuestros conocimientos en procesamiento de señales y hemos desarrollado el siguiente enfoque de AutomL de tres pasos. Primero, aplican scattering de wavelets. Estos wavelets son muy adecuados en su forma limitada en el tiempo para representar picos y
2. Automated Feature Selection and Model Optimization
Muchas aplicaciones de ingeniería requieren implementación en sistemas integrados con limitaciones de memoria y energía. Aplicamos selección automática de características para reducir las características de wavelet y el tamaño del modelo. AutoML capacita a los ingenieros para construir modelos optimizados sin experiencia. AutoML se puede aplicar a aplicaciones de señales con generación automática de características, selección y ajuste de modelos. MATLAB puede traducir a código de bajo nivel para implementación. Únete a la sesión más larga sobre interpretabilidad automática y al taller práctico sobre aprendizaje automático y profundo utilizando MATLAB en línea.
irregularidades en su señal. Por lo tanto, obtienes características muy buenas. Sin embargo, muchas aplicaciones de ingeniería requieren implementación en sistemas integrados con limitaciones de memoria y energía. Para esos casos, no puedes implementar modelos grandes. Entonces, en segundo lugar, aplicamos selección automática de características para reducir las posiblemente cientos de características de wavelet a solo unas pocas características muy eficientes y reducir el tamaño del modelo. Finalmente, y lo más importante, está el paso de selección de modelo y ajuste de hiperparámetros. Tienes diferentes modelos para elegir, y para que el modelo funcione bien, los hiperparámetros deben ajustarse correctamente. Veamos esa etapa con un poco más de detalle.
¿Cómo funciona esa optimización simultánea del modelo y los hiperparámetros? Bueno, puedes realizar una búsqueda aleatoria, pero eso tampoco es eficiente porque el espacio de búsqueda es muy grande. Utilizamos optimización bayesiana que construye un modelo del espacio de búsqueda. Y aquí puedes ver cómo esa optimización bayesiana cambia entre diferentes tipos de modelos y optimiza el error a lo largo de las iteraciones.
¿Cómo sabemos que AutoML funciona? Comparamos AutoML con el proceso manual tradicional en dos problemas de clasificación. Primero, analizamos el reconocimiento de actividad humana, donde se utilizan datos auxiliares de medidores de teléfonos móviles. Tenemos alrededor de 7K observaciones en el conjunto que recopilamos y creamos manualmente 66 características utilizando diversas funciones de procesamiento de señales. En segundo lugar, analizamos la clasificación de sonidos cardíacos. Imagina estar en el consultorio de tu médico con un estetoscopio y escuchar el sonido de tu corazón. Para esos fonogramas, podríamos tener un conjunto de 10K observaciones disponibles públicamente y crear menos de 30 características.
¿Qué resultados obtuvimos? Puedes ver aquí que con el proceso manual, logramos precisión en los altos 90, como se desearía para una aplicación tan importante. Para AutoML, en una aplicación ligeramente menor, pero el punto es que, sin toda esa experiencia y proceso iterativo que consume mucho tiempo, obtienes muy buenos modelos en pocos pasos. Entonces, AutoML capacita a los ingenieros sin experiencia en IA para construir modelos optimizados, incluso para aplicaciones de señales donde la extracción de características es notoriamente difícil. Podemos aplicar AutoML a aplicaciones de señales en pocos pasos. Generación automática de características con wavelets. Selección automática de características para reducir el tamaño del modelo y hacer que se ajuste a tu hardware. Y selección de modelo junto con ajuste de hiperparámetros de manera eficiente utilizando optimización bayesiana. Finalmente, para implementar tu modelo de IA en sistemas integrados y en el borde, necesitas código de bajo nivel como C. MATLAB puede traducir automáticamente a código C, C++ que se puede implementar directamente y así eliminar otra barrera para una adopción más amplia de la IA.
Gracias por su atención y si desean saber más, el lunes por la tarde o por la noche, tendré una sesión más larga sobre interpretabilidad automática, un seminario sobre esos dos temas de una hora y un taller práctico de dos horas sobre aprendizaje automático y profundo utilizando MATLAB en línea. Y ahora regresaré al moderador para preguntas.
Comments