Video Summary and Transcription
Implementar las estrategias y herramientas adecuadas, como Apache Lucene, puede mejorar el rendimiento de búsqueda y la experiencia del usuario. La elección del analizador afecta los resultados de búsqueda y los operadores de consulta proporcionan varias opciones de búsqueda. La puntuación relevante es crucial para clasificar los documentos según su relevancia. La puntuación personalizada puede priorizar criterios específicos. Considere los analizadores, los operadores de consulta y los métodos de puntuación para optimizar la experiencia de búsqueda.
1. Introducción al juego de búsqueda y Apache Lucene
Tienes datos y usuarios que necesitan acceder a ellos. El juego de búsqueda consiste en ayudar a los usuarios a encontrar lo que quieren. Implementar las estrategias y herramientas adecuadas, como una base de datos de documentos como Apache Lucene, puede mejorar el rendimiento de búsqueda y la experiencia del usuario.
¡Escuchen, gente! Tienes data y tienes usuarios y tus usuarios necesitan acceder a tus data. Ya sea Google, Amazon, Stack Overflow o Salesforce dice que el 87% de los compradores de e-commerce comienzan su viaje en la barra de búsqueda. Y Forrester dice que el 68% de esos compradores abandonarán su viaje si proporcionas una mala experiencia de usuario.
Ahora, esta barra de búsqueda parece simple, pero al otro lado de esa barra de búsqueda están tus usuarios y no son tan simples. No saben lo que quieren. No saben cómo expresar lo que quieren. No saben cómo escribirlo. Y lograr que obtengan lo que quieren es lo que yo llamo el juego de búsqueda. Y cuando juegas el juego de búsqueda correctamente, puedes tomar esta barra de búsqueda y convertirla en esta meta gigante. Una meta tan grande de hecho que tus usuarios simplemente no pueden perderse. Obtendrán todo lo que están buscando, incluyendo las cosas que ni siquiera sabían que estaban buscando. Cuando juegas el juego de búsqueda correctamente, eso significa que obtienes más participación, más clics, más usuarios, más likes, más compartidos y más ingresos. Entonces, tus competidores y todos los que no son tú son tus competidores.
Así que hoy te voy a enseñar cómo implementar las estrategias adecuadas y las herramientas adecuadas que necesitarás para lograr esto. Lo primero que necesitas para tu equipo adecuado es una base de datos de documentos. Cuando los usuarios quieren tus data, probablemente estén buscando a través de volúmenes y volúmenes de data no estructurados y semi-estructurados. Ahora, las bases de datos relacionales son fantásticas para las tablas. Todo lo que está en una columna en una fila es genial. Cuando conoces el patrón de consulta de antemano, es genial para eso. Pero para la búsqueda, el performance disminuye, por lo que querrás una base de datos de documentos.
El siguiente jugador estrella que tienes es Apache Lucene. Apache Lucene es tu jugador estrella. Todos los equipos ganadores juegan con Apache Lucene. Netflix, Walmart, Ebay, es una fuente abierta probada en batalla. Ha estado en el mercado durante 20 años. Por eso lo juegan. Y puedes construir tu propia cosa, pero ¿por qué cultivar a un jugador prometedor cuando Messi ya está calentando, listo y hambriento para jugar para ti. Así que Apache Lucene es tu jugador estrella y su gran jugada es que toma esa base de datos de documentos y ejecuta esos data a través de un proceso llamado análisis. El análisis va a tomar ese data, descomponerlo en diferentes tokens dependiendo de el analizador que uses y esos tokens se almacenan en un índice invertido. Así que Lucene utiliza un índice invertido.
2. Proceso de búsqueda y optimización
Cuando se utiliza el analizador estándar en Lucene, buscar 'Manchester United' generará dos tokens: 'Manchester' y 'United'. La elección del analizador afecta los resultados de búsqueda, como se demuestra con el analizador de palabras clave, que devuelve solo jugadores de Manchester United. Los operadores de consulta, como regex, frase, texto, facetas y autocompletado, proporcionan a los usuarios diversas opciones de búsqueda. La puntuación relevante desempeña un papel crucial en los motores de búsqueda, ya que clasifica los documentos según su relevancia para la consulta de búsqueda. La puntuación personalizada se puede utilizar para priorizar criterios específicos, como la puntuación general de la FIFA. Considera la elección de analizadores, operadores de consulta y métodos de puntuación para optimizar la experiencia de búsqueda para tus usuarios.
Entonces, repasemos este proceso en una práctica, veamos cómo se siente. Si tengo estos cuatro documentos con estos equipos de fútbol y su campo de identificación único con guión bajo ID, si buscara en esos documentos 'Manchester United', se convertiría en minúsculas todo, eliminaría toda la puntuación, me quedaría con dos tokens diferentes, Manchester y United, utilizando el analizador estándar en Lucene. Esos son mis dos tokens.
Entonces, cuando busco en estos documentos esas cosas, mis tokens o mis términos se asignarán a dos documentos, uno en dos para Manchester y otro en tres para United. Entonces, mi índice invertido contendrá mis tokens o mis términos, qué documentos y otra información útil metadatos, frecuencia, posición, etc. Ahora, tener los tokens o los términos correctos puede hacer o deshacer una buena experiencia de búsqueda para ti. Por lo tanto, es importante utilizar el analizador correcto para obtener los términos correctos.
Ahora te mostraré a qué me refiero con este ejemplo. Esta es una aplicación que escribí llamada Atlas Search Soccer. Utiliza Atlas Search. En ella, utilicé la base de datos de jugadores de la FIFA para que puedas encontrar muchas opciones de búsqueda diferentes para encontrar tu equipo de ensueño de la FIFA y puedes poner tus propios jugadores allí. También te mostrará el código de las consultas sobre cómo hacerlo. Ahora sé que se llama fútbol en todas partes del mundo excepto en los Estados Unidos, pero ya compré el nombre de dominio, así que nos quedaremos con eso. Así que en este caso, estoy buscando jugadores de Manchester United. Estoy utilizando el analizador estándar. Como recordarás, es Manchester United. Así que obtendré 697 jugadores cuando busque Manchester United porque me está dando Manchester United y West Ham United y Manchester City y cualquier otra cosa con Manchester United. Sin embargo, si cambio al analizador de palabras clave como lo estoy haciendo aquí, encuentro 33 jugadores coincidentes y todos son realmente de Manchester United porque cuando paso, esto utiliza el analizador de palabras clave que toma todo, mantiene la puntuación, mantiene las mayúsculas, todas las mayúsculas, y me da ese único token. Así que los analizadores de palabras clave son fantásticos si estás utilizando casillas de verificación.
Entonces, tus tokens importan, lo que significa que tus analizadores importan. Lo siguiente que debes considerar son tus operadores de consulta, ya sea regex, frase, texto, si estás utilizando facetas o si estás utilizando autocompletado. Esta es una forma de permitir que tus usuarios hagan su mejor intento. Cada usuario es diferente. Cada usuario tiene una preferencia diferente de cómo van a buscar cosas, así que quieres, en tu aplicación, darles tantas opciones como sea posible. Y, por supuesto, no puedo hablar de dar a tus usuarios la mejor oportunidad de encontrar tus datos sin hablar de la puntuación. La puntuación relevante es muy importante en la búsqueda. Todos los motores de búsqueda van a calificar todos tus documentos según qué tan bien coincidan con la consulta de búsqueda y eso se llama relevancia. Y te devolverá tus documentos con la puntuación en orden descendente. Así que te dará lo que cree que son las mejores coincidencias, las más relevantes primero.
En este ejemplo, por ejemplo, estoy buscando a Cristiano Ronaldo para mi equipo de ensueño de la FIFA y solo busco Ronaldo y obtengo a este encantador caballero primero, pero ese no es el Ronaldo que quiero porque busca primero la relevancia. Quiero que la puntuación general de la FIFA sea muy alta en eso. Así que en esta consulta, voy a tener en cuenta la puntuación general de la FIFA, que es el campo en cada uno de mis documentos. Lo voy a tener en cuenta en mi puntuación de relevancia y ahora obtengo a Cristiano Ronaldo primero. Es muy difícil en cuanto a su personalidad, pero es muy bueno y lo quiero en mi equipo de ensueño. Así que con eso, la puntuación importa, la puntuación personalizada porque quieres que todo esté correcto, piensa en tus datos, piensa en tu interfaz de usuario, piensa en tus tokens y no estoy haciendo clic, tenía una interacción tan agradable, oh ahí va. Piensa en tus tokens, entra, elige tu analizador en consecuencia que entra en tu índice dentro de tus consultas y todo eso se servirá a tus usuarios para que tengan su mejor oportunidad de encontrar tus datos antes de encontrarlos en tus competidores. Muchas gracias.
Comments