Entonces, repasemos este proceso en una práctica, veamos cómo se siente. Si tengo estos cuatro documentos con estos equipos de fútbol y su campo de identificación único con guión bajo ID, si buscara en esos documentos 'Manchester United', se convertiría en minúsculas todo, eliminaría toda la puntuación, me quedaría con dos tokens diferentes, Manchester y United, utilizando el analizador estándar en Lucene. Esos son mis dos tokens.
Entonces, cuando busco en estos documentos esas cosas, mis tokens o mis términos se asignarán a dos documentos, uno en dos para Manchester y otro en tres para United. Entonces, mi índice invertido contendrá mis tokens o mis términos, qué documentos y otra información útil metadatos, frecuencia, posición, etc. Ahora, tener los tokens o los términos correctos puede hacer o deshacer una buena experiencia de búsqueda para ti. Por lo tanto, es importante utilizar el analizador correcto para obtener los términos correctos.
Ahora te mostraré a qué me refiero con este ejemplo. Esta es una aplicación que escribí llamada Atlas Search Soccer. Utiliza Atlas Search. En ella, utilicé la base de datos de jugadores de la FIFA para que puedas encontrar muchas opciones de búsqueda diferentes para encontrar tu equipo de ensueño de la FIFA y puedes poner tus propios jugadores allí. También te mostrará el código de las consultas sobre cómo hacerlo. Ahora sé que se llama fútbol en todas partes del mundo excepto en los Estados Unidos, pero ya compré el nombre de dominio, así que nos quedaremos con eso. Así que en este caso, estoy buscando jugadores de Manchester United. Estoy utilizando el analizador estándar. Como recordarás, es Manchester United. Así que obtendré 697 jugadores cuando busque Manchester United porque me está dando Manchester United y West Ham United y Manchester City y cualquier otra cosa con Manchester United. Sin embargo, si cambio al analizador de palabras clave como lo estoy haciendo aquí, encuentro 33 jugadores coincidentes y todos son realmente de Manchester United porque cuando paso, esto utiliza el analizador de palabras clave que toma todo, mantiene la puntuación, mantiene las mayúsculas, todas las mayúsculas, y me da ese único token. Así que los analizadores de palabras clave son fantásticos si estás utilizando casillas de verificación.
Entonces, tus tokens importan, lo que significa que tus analizadores importan. Lo siguiente que debes considerar son tus operadores de consulta, ya sea regex, frase, texto, si estás utilizando facetas o si estás utilizando autocompletado. Esta es una forma de permitir que tus usuarios hagan su mejor intento. Cada usuario es diferente. Cada usuario tiene una preferencia diferente de cómo van a buscar cosas, así que quieres, en tu aplicación, darles tantas opciones como sea posible. Y, por supuesto, no puedo hablar de dar a tus usuarios la mejor oportunidad de encontrar tus datos sin hablar de la puntuación. La puntuación relevante es muy importante en la búsqueda. Todos los motores de búsqueda van a calificar todos tus documentos según qué tan bien coincidan con la consulta de búsqueda y eso se llama relevancia. Y te devolverá tus documentos con la puntuación en orden descendente. Así que te dará lo que cree que son las mejores coincidencias, las más relevantes primero.
En este ejemplo, por ejemplo, estoy buscando a Cristiano Ronaldo para mi equipo de ensueño de la FIFA y solo busco Ronaldo y obtengo a este encantador caballero primero, pero ese no es el Ronaldo que quiero porque busca primero la relevancia. Quiero que la puntuación general de la FIFA sea muy alta en eso. Así que en esta consulta, voy a tener en cuenta la puntuación general de la FIFA, que es el campo en cada uno de mis documentos. Lo voy a tener en cuenta en mi puntuación de relevancia y ahora obtengo a Cristiano Ronaldo primero. Es muy difícil en cuanto a su personalidad, pero es muy bueno y lo quiero en mi equipo de ensueño. Así que con eso, la puntuación importa, la puntuación personalizada porque quieres que todo esté correcto, piensa en tus datos, piensa en tu interfaz de usuario, piensa en tus tokens y no estoy haciendo clic, tenía una interacción tan agradable, oh ahí va. Piensa en tus tokens, entra, elige tu analizador en consecuencia que entra en tu índice dentro de tus consultas y todo eso se servirá a tus usuarios para que tengan su mejor oportunidad de encontrar tus datos antes de encontrarlos en tus competidores. Muchas gracias.
Comments