Entonces, ¿cómo funciona esto? Y un pequeño aviso, no es necesario que lo sepas, pero creo que es bastante interesante. Te resultará interesante, y tengo una explicación muy buena que no necesitas un doctorado para entender. Tal vez no sea una explicación de cuatro o cinco años, es más bien una explicación de hace unos 10 años, así que ten paciencia.
Primero que nada, en el mundo del aprendizaje automático, tenemos esta cosa llamada modelos de aprendizaje automático. Son como cajas negras que se construyen de tal manera que si les pasas cierta información, generarán lo que llamamos una incrustación de vector. Una incrustación de vector es básicamente una matriz de números. Es como un montón de números, y en realidad, es como las computadoras ven los datos y lo ven como binario, y las computadoras entienden, oh, esto es una pieza de información. Así es como piensa el aprendizaje automático. Si el aprendizaje automático ve la incrustación de vector, así es como entiende la información y los datos.
Así que si tomamos nuestros dos ejemplos anteriores y los pasamos por el modelo de aprendizaje automático, obtendremos una incrustación de vector. Si tomamos otro párrafo y lo pasamos nuevamente por el modelo de aprendizaje automático, obtendremos otra incrustación de vector. Y lo que estas cosas son, puedes imaginarlas como coordenadas en un espacio multidimensional. Imagínalo como si vieras en este espacio multidimensional un perro y un lobo justo en el lado izquierdo. Están muy cerca uno del otro, ¿verdad? Y un gato no está muy lejos, mientras que los plátanos y las manzanas están en lugares completamente diferentes. Y, por supuesto, nuestros cerebros están entrenados para pensar en tres dimensiones. Pero esos modelos de aprendizaje automático pueden ir a 300 dimensiones, miles o 10,000 dimensiones, por lo que pueden entender la información de una manera muy detallada.
Lo interesante ahora es que si quiero hacer una búsqueda, puedo tomar nuestra consulta original, pasarla por el modelo de aprendizaje automático y obtener un vector. Con ese vector, visualmente, para imaginarlo, podríamos decir, como, hey, mi información está en algún lugar aquí. Entonces, cualquier objeto que esté cerca de esa nueva posición del vector indicaría aquí están los artículos donde podría estar tu respuesta. Es realmente genial, ¿verdad? Al mirar allí, podemos encontrar, como, oh, sí, el artículo de la NASA estaba justo allí, y luego podemos pasarlo de vuelta. Todo es matemáticas. Todo es simplemente, como, agarrar y calcular esos vectores, lo cual es realmente, realmente genial. ¿Ves? Así que creo que incluso los niños de 10 años y las personas que no están en el aprendizaje automático pueden entender que no se necesita un doctorado. Creo que esto es bastante sencillo.
Así que hay una cosa adicional. Algunos de esos modelos de aprendizaje automático, y probablemente viste que había algunas imágenes, había algo de texto. Algunos de ellos pueden entender tanto texto como imágenes. También pueden entender muchas otras cosas. Pero en particular, hay uno llamado clip, y si le paso un párrafo que describe un vestido maxi de verano y una imagen del mismo vestido por separado, obtendría dos vectores que son muy similares, lo que básicamente significa que también podría usarlo para buscar a través de imágenes y texto de la manera que queramos hacerlo. Así que podría tener una base de datos de imágenes y podría escribir en inglés o en cualquier otro idioma, como, oh sí, muéstrame una imagen con una casa y un perro y un tornado en el fondo, ¿verdad? Y el vector nos ayudaría a encontrar esa imagen más tarde.
Comments