¿Puedes Cantar con Todas las Voces de las Características?

Rate this content
Bookmark

Después de esta charla, sabrás cómo escribir la canción perfecta para tu cantante favorito/a. Esto no es un retiro de composición de canciones, sino una charla sobre algunas de las características líricas, estructurales, armónicas y melódicas que incluye el análisis de canciones. Discutiremos la extracción de estructuras de canciones utilizando herramientas de procesamiento de lenguaje natural y análisis de repetición, características musicales y cómo utilizar todas esas características para predecir qué canciones se adaptan mejor a qué artista. Asiste a esta charla para descubrir cuál es el futuro que la industria musical puede lograr con el aprendizaje automático.

This talk has been presented at ML conf EU 2020, check out the latest edition of this Tech Conference.

FAQ

Max Martin es un productor y compositor sueco que ha ganado el premio de Compositor del Año en múltiples ocasiones durante la última década.

MyPart actúa como un casamentero inteligente entre compositores independientes y cantantes profesionales, creando un conjunto de canciones de referencia para cada cantante y utilizando modelos para priorizar las canciones enviadas según las características buscadas por cada artista.

Colin Morris mide la repetitividad de las canciones comprimiendo el archivo de letras y observando la relación entre el tamaño del archivo antes y después de la compresión, lo que refleja las secuencias repetidas y el orden de las palabras.

La distancia de Levenstein es una métrica que mide los cambios necesarios para transformar una cadena de texto en otra. En la música, se utiliza para determinar la similitud entre dos segmentos o frases, considerando un umbral del 70% de similitud para reconocerlos como similares.

El análisis de la estructura de las canciones muestra que la mayoría se construyen de manera similar, con una distribución en la que más de la mitad de las canciones siguen un patrón específico, y el 70% tiene un estribillo que es la frase más repetida.

Para analizar la música, se separa la canción en melodía y armonía mediante análisis de frecuencia y amplitud, transcribiendo luego la armonía y la melodía en datos que incluyen tiempo, acordes y frecuencia de notas.

Las características consideradas incluyen el rango melódico de la canción, el porcentaje de acordes únicos y otras cualidades estructurales y armónicas, que ayudan a predecir cuán bien se adaptará una canción al estilo y preferencias de un cantante específico.

Un compositor puede aumentar sus posibilidades de éxito enviando su música a través de MyPart, que luego utiliza herramientas científicas para emparejar la canción con el cantante adecuado, teniendo en cuenta características como la repetición y la estructura de la canción.

Yama Anin Aminof
Yama Anin Aminof
8 min
02 Jul, 2021

Comments

Sign in or register to post your comment.
Video Summary and Transcription
Esta charla analiza el papel de la repetición en la composición de canciones y cómo se ha vuelto más prevalente a lo largo de los años. El uso de métricas de cadenas, como la distancia de Levenstein, permite analizar la similitud entre segmentos de canciones. Se utiliza un umbral de similitud del 70% para determinar si los segmentos se consideran similares. En general, la charla explora la importancia de la repetición en la creación de canciones exitosas y el uso de herramientas analíticas para medir la similitud.

1. Introducción a la Repetición en la Composición de Canciones

Short description:

Bienvenidos todos. Conozcan a Max Martin, un productor y compositor sueco. Somos el casamentero inteligente entre compositores y cantantes. Hablemos de la repetición. Las canciones se están volviendo más repetitivas con el paso de los años. Las mejores canciones son más repetitivas que las demás. Analizamos segmentos y encontramos similitudes entre cadenas de texto.

Hay alguien que me gustaría que conozcan. Este es Max Martin, un productor y compositor sueco que ganó el premio de Compositor del Año. De hecho, ganó el premio de Compositor del Año casi todos los años en la última década. Escribió éxitos para todos, desde Snoop Dogg hasta Ariana Grande. Aparentemente, es difícil encontrar buenos compositores por ahí. Ahí es donde entramos nosotros.

Mi nombre es Yamaa. Soy músico y científico de datos, y formo parte del equipo principal de MyPart. Somos el casamentero inteligente entre compositores independientes y cantantes profesionales. Para cada cantante, creamos un conjunto de canciones de referencia que representan lo que el cantante está buscando. A partir de estas canciones, extraemos características líricas, estructurales, armónicas y melódicas en las que entrenamos nuestros modelos. Según las predicciones del modelo, priorizamos todas las canciones enviadas al cantante, presentándoles las canciones que son más relevantes para ellos. Mi objetivo en los próximos minutos es brindarte herramientas científicamente probadas para que tú también puedas convertirte en el próximo compositor del año.

La primera característica de la que vamos a hablar es la repetición. Este gráfico fue tomado de un ensayo escrito por Colin Morris. Morris analizó las canciones más populares de los últimos 60 años. Ese es el eje x. La línea azul representa el promedio de las 100 mejores canciones, y la naranja representa las 10 mejores. Colin midió la repetitividad comprimiendo el archivo de letras y observando la relación entre el tamaño del archivo antes y después de la compresión. Estos son los porcentajes en el eje y. La compresión es una medida interesante porque utiliza secuencias repetidas, por lo que no se trata solo de qué palabras se repiten, sino también de su orden. Podemos ver que las canciones se están volviendo más repetitivas a lo largo de los años, y es posible que hayas escuchado eso antes, generalmente como crítica, pero también podemos ver que las mejores canciones, aquellas que llegaron al top 10, fueron en promedio más repetitivas que el resto en cada año, y que la brecha se está ampliando. Entonces, ¿qué más podemos hacer con la repetición? En esta canción, Shape of You de Ed Sheeran, podemos ver seis segmentos en la letra. Dos de ellos se repiten dos veces. En ese caso, llamamos al primero fricos, y al segundo cos. Consideraremos al resto como versos. En esta canción, hay una frase que se repite más, y esa es `Estoy enamorado de tu cuerpo`. Así que la llamamos el estribillo. Pero, ¿qué sucede si el estribillo en una de sus apariciones termina con unos oi adicionales? ¿Todavía debería reconocerse como estribillo, verdad? Entonces necesitamos encontrar un algoritmo que verifique la similitud de dos cadenas y un umbral que determine cuándo consideramos que dos cadenas son similares.

2. Métrica de Cadenas y Umbral de Similitud

Short description:

La distancia de Levenstein mide los cambios necesarios para transformar una cadena en otra. Por ejemplo, transformar Justin Timberlake en Justin Bieber requiere reemplazar letras y eliminar otras. La distancia Timberlake Bieber es 8, lo que los hace 73% similares. Consideramos que los segmentos son similares si tienen un 70% de similitud.

Terminamos con la distancia de Levenstein, que es una métrica de cadenas que mide los cambios que necesitas hacer para transformar una cadena en otra. Por ejemplo, si quieres transformar Justin Timberlake en Justin Bieber, todo lo que tienes que hacer es reemplazar la T por una B para obtener Justin Bimberlake, reemplazar la M por una E para obtener Justin Bieber Lake, y luego eliminar las letras L, A, K y E para obtener Justin Bieber. Si contamos todos esos reemplazos y eliminaciones, obtenemos que la distancia Timberlake Bieber es 8, y en relación con la longitud de la cadena, Justin Bieber y Justin Timberlake son 73% similares. El umbral que hemos establecido es del 70%, lo que significa que si dos segmentos o frases son 70% similares, los consideramos similares. Por lo tanto, consideramos los ajustes relacionados. Como vimos en el ejemplo de Shape-of-U, podemos extraer la estructura de una canción mediante el análisis de la repetición. Aparentemente, desde el punto de vista lírico y musical, la mayoría de las canciones se construyen de la misma manera. Este gráfico circular muestra las estructuras de unas cientos de canciones. Como puedes ver, la parte azul representa más de la mitad de las canciones. Se construyen de la misma manera que Shape-of-U, vers, trico, skos. Las estructuras más comunes, segunda y tercera más comunes, que puedes ver en rojo y amarillo, son vers, skos, vers, skos, con una pequeña diferencia entre ellas. Esta distribución es la existencia de un estribillo en 10,000 canciones. El 70% de ellas tiene una sola frase con el mayor número de repeticiones. El doble estribillo es cuando tienes dos frases que se repiten más, y eso solo aparece en el 13% de las canciones. Ahora no podemos hablar de canciones sin mencionar la música. Lo primero que debemos hacer para analizar la música es separar la canción en dos componentes. La melodía y la armonía. La melodía son las notas que estás pensando, y la armonía son los acordes que tocas en tu guitarra o teclado. La separación se realiza mediante análisis de frecuencia y amplitud. Luego debemos transcribir la armonía y la melodía en data con el que podamos trabajar. En ese caso, eso significa tiempo y acordes o frecuencia de notas. Luego podemos extraer características únicas de la música. Por ejemplo, el rango melódico de la canción, que es la diferencia entre las notas más altas y más bajas. Esta es la característica principal de un artista. Cuando la gente menciona el amplio rango vocal de Freddie Mercury, están hablando de cuatro octavas, en comparación con Taylor Swift, por ejemplo, que tiene un rango de alrededor de dos octavas, que es el rango vocal promedio. Otra característica, esta vez de la armonía, es simplemente el porcentaje de acordes únicos. Puedes ver ejemplos de eso en muchos videos de YouTube que muestran cómo puedes tocar cuatro acordes. Utilizando todas esas características y muchas más, nuestros modelos predicen la durabilidad de cada canción a través del punto de referencia del cantante, lo que nos permite presentar al cantante una lista personalizada. Y si vemos que una canción se adapta mejor a otro cantante, podemos recomendar al compositor que envíe la canción a ese artista. Entonces, ¿qué hemos aprendido hoy? Para ser el próximo compositor del año, envía tu canción a través de MYPART. Recuerda que la repetición no es solo para los políticos. El pre-coro y el estribillo son tus amigos, y ten en cuenta al cantante al componer tu melodía y acordes. Y cuando seas rico y famoso, no olvides quién te ayudó a llegar allí. Mi nombre es Yamanina Minov, puedes contactarme cuando quieras, y gracias.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

TensorFlow.js 101: Aprendizaje automático en el navegador y más allá
ML conf EU 2020ML conf EU 2020
41 min
TensorFlow.js 101: Aprendizaje automático en el navegador y más allá
TensorFlow.js enables machine learning in the browser and beyond, with features like face mesh, body segmentation, and pose estimation. It offers JavaScript prototyping and transfer learning capabilities, as well as the ability to recognize custom objects using the Image Project feature. TensorFlow.js can be used with Cloud AutoML for training custom vision models and provides performance benefits in both JavaScript and Python development. It offers interactivity, reach, scale, and performance, and encourages community engagement and collaboration between the JavaScript and machine learning communities.
Uso de MediaPipe para Crear Aplicaciones de Aprendizaje Automático Multiplataforma con React
React Advanced 2021React Advanced 2021
21 min
Uso de MediaPipe para Crear Aplicaciones de Aprendizaje Automático Multiplataforma con React
Top Content
MediaPipe is a cross-platform framework that helps build perception pipelines using machine learning models. It offers ready-to-use solutions for various applications, such as selfie segmentation, face mesh, object detection, hand tracking, and more. MediaPipe can be integrated with React using NPM modules provided by the MediaPipe team. The demonstration showcases the implementation of face mesh and selfie segmentation solutions. MediaPipe enables the creation of amazing applications without needing to understand the underlying computer vision or machine learning processes.
TensorFlow.js 101: Aprendizaje automático en el navegador y más allá
JSNation Live 2021JSNation Live 2021
39 min
TensorFlow.js 101: Aprendizaje automático en el navegador y más allá
JavaScript with TensorFlow.js allows for machine learning in various environments, enabling the creation of applications like augmented reality and sentiment analysis. TensorFlow.js offers pre-trained models for object detection, body segmentation, and face landmark detection. It also allows for 3D rendering and the combination of machine learning with WebGL. The integration of WebRTC and WebXR enables teleportation and enhanced communication. TensorFlow.js supports transfer learning through Teachable Machine and Cloud AutoML, and provides flexibility and performance benefits in the browser and Node.js environments.
Observabilidad con diagnostics_channel y AsyncLocalStorage
Node Congress 2023Node Congress 2023
21 min
Observabilidad con diagnostics_channel y AsyncLocalStorage
Observability with Diagnostics Channel and async local storage allows for high-performance event tracking and propagation of values through calls, callbacks, and promise continuations. Tracing involves five events and separate channels for each event, capturing errors and return values. The span object in async local storage stores data about the current execution and is reported to the tracer when the end is triggered.
Una introducción al aprendizaje por transferencia en NLP y HuggingFace
ML conf EU 2020ML conf EU 2020
32 min
Una introducción al aprendizaje por transferencia en NLP y HuggingFace
Transfer learning in NLP allows for better performance with minimal data. BERT is commonly used for sequential transfer learning. Models like BERT can be adapted for downstream tasks such as text classification. Handling different types of inputs in NLP involves concatenating or duplicating the model. Hugging Face aims to tackle challenges in NLP through knowledge sharing and open sourcing code and libraries.

Workshops on related topic

Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript
JSNation 2024JSNation 2024
108 min
Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript
Featured Workshop
Roy Derks
Shivay Lamba
2 authors
Hoy en día, todos los desarrolladores están utilizando LLMs en diferentes formas y variantes, desde ChatGPT hasta asistentes de código como GitHub CoPilot. Siguiendo esto, muchos productos han introducido capacidades de IA integradas, y en este masterclass haremos que los LLMs sean comprensibles para los desarrolladores web. Y nos adentraremos en la codificación de tu propia aplicación impulsada por IA. No se necesita experiencia previa en trabajar con LLMs o aprendizaje automático. En su lugar, utilizaremos tecnologías web como JavaScript, React que ya conoces y amas, al mismo tiempo que aprendemos sobre algunas nuevas bibliotecas como OpenAI, Transformers.js
¿Pueden los LLM aprender? Personalicemos un LLM para chatear con tus propios datos
C3 Dev Festival 2024C3 Dev Festival 2024
48 min
¿Pueden los LLM aprender? Personalicemos un LLM para chatear con tus propios datos
WorkshopFree
Andreia Ocanoaia
Andreia Ocanoaia
Sientes las limitaciones de los LLMs? Pueden ser creativos, pero a veces carecen de precisión o se basan en información desactualizada. En esta masterclass, desglosaremos el proceso de construir y desplegar fácilmente un sistema de Generación con Recuperación Mejorada. Este enfoque te permite aprovechar el poder de los LLMs con el beneficio adicional de precisión factual e información actualizada.
Deja que la IA sea tu Documentación
JSNation 2024JSNation 2024
69 min
Deja que la IA sea tu Documentación
Workshop
Jesse Hall
Jesse Hall
Únete a nuestro masterclass dinámico para crear un portal de documentación impulsado por IA. Aprende a integrar ChatGPT de OpenAI con Next.js 14, Tailwind CSS y tecnología de vanguardia para ofrecer soluciones de código e resúmenes instantáneos. Esta sesión práctica te equipará con el conocimiento para revolucionar la forma en que los usuarios interactúan con la documentación, convirtiendo las búsquedas tediosas en descubrimientos eficientes e inteligentes.
Aspectos destacados:
- Experiencia práctica en la creación de un sitio de documentación impulsado por IA.- Comprensión de la integración de la IA en las experiencias de usuario.- Habilidades prácticas con las últimas tecnologías de desarrollo web.- Estrategias para implementar y mantener recursos de documentación inteligente.
Tabla de contenidos:- Introducción a la IA en la documentación- Configuración del entorno- Construcción de la estructura de documentación- Integración de ChatGPT para documentación interactiva
Prácticas con TensorFlow.js
ML conf EU 2020ML conf EU 2020
160 min
Prácticas con TensorFlow.js
Workshop
Jason Mayes
Jason Mayes
Ven y descubre nuestro masterclass que te guiará a través de 3 recorridos comunes al usar TensorFlow.js. Comenzaremos demostrando cómo usar uno de nuestros modelos predefinidos, clases de JS muy fáciles de usar para trabajar rápidamente con ML. Luego veremos cómo volver a entrenar uno de estos modelos en minutos utilizando el aprendizaje por transferencia en el navegador a través de Teachable Machine y cómo se puede usar en tu propio sitio web personalizado. Finalmente, terminaremos con un hola mundo escribiendo tu propio código de modelo desde cero para hacer una regresión lineal simple y predecir los precios ficticios de las casas en función de sus metros cuadrados.
La Guía del Autoestopista de la Galaxia de Ingeniería de Aprendizaje Automático
ML conf EU 2020ML conf EU 2020
112 min
La Guía del Autoestopista de la Galaxia de Ingeniería de Aprendizaje Automático
Workshop
Alyona Galyeva
Alyona Galyeva
¿Eres un Ingeniero de Software al que se le asignó la tarea de implementar un modelo de aprendizaje automático o aprendizaje profundo por primera vez en tu vida? ¿Te preguntas qué pasos seguir y cómo se diferencia el software impulsado por IA del software tradicional? Entonces este es el masterclass adecuado al que asistir.
Internet ofrece miles de artículos y cursos gratuitos que muestran lo fácil que es entrenar e implementar un modelo de IA simple. Al mismo tiempo, en la realidad es difícil integrar un modelo real en la infraestructura actual, depurarlo, probarlo, implementarlo y monitorearlo correctamente. En este masterclass, te guiaré a través de este proceso compartiendo consejos, trucos y herramientas de código abierto favoritas que te facilitarán mucho la vida. Así que al final del masterclass, sabrás por dónde empezar tu viaje de implementación, qué herramientas utilizar y qué preguntas hacer.
Introducción al Aprendizaje Automático en la Nube
ML conf EU 2020ML conf EU 2020
146 min
Introducción al Aprendizaje Automático en la Nube
Workshop
Dmitry Soshnikov
Dmitry Soshnikov
Este masterclass será tanto una introducción suave al Aprendizaje Automático, como un ejercicio práctico de uso de la nube para entrenar modelos de aprendizaje automático simples y no tan simples. Comenzaremos utilizando ML Automático para entrenar el modelo para predecir la supervivencia en el Titanic, y luego pasaremos a tareas de aprendizaje automático más complejas como la optimización de hiperparámetros y la programación de series de experimentos en el clúster de cómputo. Finalmente, mostraré cómo Azure Machine Learning se puede utilizar para generar pinturas artificiales utilizando Redes Generativas Adversarias, y cómo entrenar un modelo de preguntas y respuestas de lenguaje en documentos de COVID para responder preguntas relacionadas con COVID.