Genial. Ahora que hemos aclarado todas las técnicas básicas, pasemos directamente a pensar en qué es el aprendizaje por transferencia. Esta es una gran cita de Andrew Engie, por supuesto, es una figura importante en el espacio de IA y ML. Y en 2016, mencionó que el aprendizaje por transferencia sería el próximo gran impulsor del éxito del ML. Y ahora estamos en 2020. Y creo que, y verás que se han desarrollado muchos problemas o modelos para resolver diferentes tipos de modelos a través del aprendizaje por transferencia.
Entonces, ¿qué es? Una comprensión rápida es simplemente una técnica de aprendizaje automático en la que un modelo se entrena en una tarea y se reutiliza para una segunda tarea. Ahora veremos qué significa eso. Digamos que tienes un conjunto de datos, ¿verdad? Tienes un conjunto de datos uno, que es como, digamos, un conjunto de datos de imágenes generales y la variable objetivo es un objeto clasificado. Ese objeto podría ser, ya sabes, un gato o un perro, un árbol, un autobús o un camión, cualquier cosa, cualquier objeto del mundo que ya esté en el conjunto de datos de imágenes. Un ejemplo de esto es ImageNet. Estoy seguro de que todos ustedes han trabajado un poco o han probado con este conjunto de datos en su trabajo. Ahora, esto, en una vista general, es como una estructura de red neuronal con algunas capas ocultas y capas de entrada y una capa de salida. Entonces, la capa de salida para el problema del conjunto de datos uno sería, ya sabes, si la clasificación entre si es un gato o un perro u otro objeto en particular del conjunto de datos de entrenamiento.
Ahora, piensa en el segundo caso. Ahora, el segundo caso es que tienes un conjunto de datos dos y es un conjunto de datos muy pequeño. No tienes muchos casos de entrenamiento, pero tienes algunos. Y el conjunto de datos objetivo es si es una imagen urbana o una imagen rural. Entonces, ¿qué crees que es la conexión común entre estos dos conjuntos de datos? Los conjuntos de datos son como ambos tratan con imágenes, ambos tienen, ya sabes, muchos objetos del mundo capturados en ellos. Pero el objetivo final no es exactamente el mismo. Aquí es donde entra en acción el aprendizaje por transferencia, donde puedes utilizar el conocimiento del conjunto de datos uno que has creado en tu primera fase de modelado y simplemente, ya sabes, volver a entrenar la última capa. Aquí, es la capa cuatro si puedes ver, mencioné que es la última capa, la capa densa, volver a entrenar los pesos de la última capa utilizando softmax y clase y, ya sabes, crear o cambiar esa capa de salida final para clasificarla como urbana o rural basándose en el nuevo conjunto de datos que hemos entrelazado con el nivel cuatro. Ahora esto puede parecer, ¿vale, por qué estamos haciendo esto? Antes de eso, veamos, ¿dónde estamos haciendo esto? Entonces, digamos, incluso en el reconocimiento de voz, si estás extrayendo o voz data de diferentes fuentes como YouTube, y eso es en inglés o hindi, que es, ya sabes, uno de los idiomas que hablamos en India. Y luego preentrenas tu red. Ahora, digamos que tienes un conjunto de datos muy pequeño en bengalí y quieres, ya sabes, traducir o entender qué dice el discurso. Entonces puedes utilizar el modelo que has entrenado con un conjunto de datos más grande en inglés y luego usar, ya sabes, traducción. Y luego utilizar eso para el reconocimiento de voz, que está en bengalí. El segundo ejemplo es de lo que acabamos de hablar.
Comments