Entonces, basado en cómo se ve el conjunto de datos, es mucho más fácil tomar buenas decisiones basadas en qué tipo de modelos funcionan bien, y simplemente estás probando varios modelos muy rápidamente y decides en base a eso. Muy interesante.
Como seguimiento a eso, sé que por ahora estamos utilizando el aprendizaje meta para determinar básicamente qué tipo de modelado se puede hacer basado en lo que históricamente funciona en varios conjuntos de datos, como los 80 conjuntos de datos que mencionaste. ¿Es este el mismo tipo de lógica que también usarías para determinar qué tipo de gráficos o visualizaciones le interesarían a un usuario? Sería increíble.
El problema es que, por ahora, es en cierto sentido, muchas heurísticas, porque realmente lo que querrías es utilizar los experimentos, pero también lo que querrías es experimentos guiados por el usuario, y esto es realmente difícil de hacer. Entonces, la pregunta es qué quieres aprender sobre el conjunto de datos. Idealmente, tendrías una pregunta específica que quieres responder o quieres ver qué visualizaciones ayudaron al usuario a determinar que hay un valor atípico importante o determinaron que se olvidaron de esto y aquello o determinaron. Y así, quieres encontrar visualizaciones que permitan al usuario responder preguntas rápidamente.
Y así, si quieres hacer un enfoque real basado en datos para esto, debes tener un conjunto de preguntas de referencia. Debes mostrar a los científicos de datos y medir qué tan bien responden a estas con las visualizaciones proporcionadas, y eso es realmente difícil. Es difícil crear las preguntas y luego obtener conjuntos de datos para que un científico de datos participe en tu experimento también es muy difícil. Me preguntaba sobre eso. Sí, porque dabble aún puede ayudarte a obtener estadísticas generales y luego, utilizando eso, podemos determinar el camino en el que podemos profundizar y explorar, ya sabes, qué parte queremos explorar más a fondo y en eso me encargaría de hacer un análisis exploratorio de datos dentro de esa vertical. Entonces, en cierto sentido, nos da un buen punto de partida, ¿dirías?
Sí, pero el punto de partida no es impulsado por los datos al tener cien científicos de datos que lo analicen. Es principalmente que yo lo analice y otros usuarios de dabble. De hecho, esta es la forma en que se crean muchas visualizaciones, es decir, un experto las analiza y dice que esta es una visualización útil. Y así la vamos a utilizar. Entendido. Sí. Tengo otra pregunta que viene de nuestra audiencia. De acuerdo. ¿Dabble maneja el procesamiento de datos de señales o sensores o series de tiempo como entrada? Principalmente se realiza para datos tabulares. Siento que los datos de sensores suelen estar en un formato de datos tabulares, pero no hay soporte para series de tiempo por ahora. Entonces, lo que espero agregar a continuación es el soporte para datos de texto y luego vendrán las series de tiempo. De hecho, actualmente estoy trabajando en algunas visualizaciones de series de tiempo en un proyecto en Microsoft y espero poder incorporarlas pronto a dabble, pero no tengo modelos para series de tiempo, pero sería realmente genial tenerlos. Si tienes algo que quieras, envíame una solicitud de extracción. Este es un proyecto de código abierto.
Comments