Buscando en la Web

Si necesitas ayuda esta disponible el siguiente video explicativo: https://www.youtube.com/watch?v=Jc3H-Gr-_uk.

1.Comportamiento de búsqueda web de expertos y principiantes de Internet

El acelerado crecimiento de la World Wide Web ha convertido Internet en un inmenso espacio de información sin ninguna organización. Este hecho ha provocado que los usuarios cuando realicen sus búsquedas se vean desbordados de información o simplemente no sepan realizarlas correctamente. Para resolver esta necesidad, se ha analizado que tipo de conocimiento es más relevante para la búsqueda en la Web y cuales estructuras y estrategias provocan mejores resultados.

Siguiendo este objetivo, una de las investigación más prestigiosa (enlace) realizo un experimento a partir de grupos de personas con diferentes conocimientos informáticos, donde cada grupo estaba compuesto por:
  • Expertos de la informática: Son personas relacionados con el mundo de la informática o Internet. En este grupo nos encontraremos personas que han trabajado estos 3 últimos años en programas de búsqueda de información o simplemente son diseñadores de paginas Web o WebMasters.
  • Diversificación de personas: El segundo experimento es utilizado con personas que cumplen las siguientes características:
    • Conocimientos de informática y economía.
    • Conocimientos de economía pero no de informática
    • Conocimientos de informática pero no de economía.
    • No poseen conocimientos de informática ni de economía

1.1 Experimento con expertos

Los sujetos seleccionados para las pruebas son preguntados por su comportamiento cuando tienen que realizar una búsqueda en Internet. El entrevistador les guía en las preguntas para obtener la información lo más precisa posible. Una vez terminada, se les pide que realicen un pequeño diagrama donde esquematicen su comportamiento en una búsqueda de forma gráfica a través de un diagrama de estados.

Una vez recopilada toda la información, los investigadores analizan los conceptos comunes , heurísticas y estrategias comunes en los sujetos analizados para establecer pautas y modelos.

1.2 Experimento usando búsquedas en Internet

Los usuarios se les ha proporcionado un dispositivo con acceso a Internet y una grabadora de audio. La finalidad del proceso es que cada sujeto realice una serie de búsquedas reales, como por ejemplo, buscar un archivo de audio o cierta información sobre un tema determinado con el dispositivo y un observador anote todos los procesos de búsqueda que realice. Además, el usuario va grabando con la grabadora sus procedimientos para evitar que no se perdiera ningún paso. Por supuesto además de los pasos se almacena las consultas realizada en cada consulta. La cantidad de búsquedas realizadas han sido 1956 consultas.

Una vez obtenidos los resultados los dividimos en dos grupos, los pasos para realizar una búsqueda y las sentencia de consultas utilizadas donde obtenemos los siguientes resultados:

Pasos para la búsqueda de información

Primero de todo de las 1956 consultas realizadas dos tercios fueron realizadas con éxito. Las respuestas de los usuarios se procesaron y se obtuvieron tareas unitarias comunes. Los resultados se pueden analizar en la figura [1] donde además vemos datos interesantes como por ejemplo:
  • 67 por ciento de los sujetos utilizan un buscador para ayudarles a obtener la información deseada
  • 41 por ciento de los usuarios que realizan una consulta en el buscador, acaban repitiendo el proceso
  • 80 por ciento de los usuarios cuando acceden a una web, es la que contiene la información buscada

1 Gráfico que nos muestra los estados obtenidos del experimento y sus porcentajes

Como hemos comentado una gran cantidad de usuarios utiliza los motores de búsqueda para realizar las consultas (67%). Del resultado de esta interacción se muestra la siguiente figura [2] :

2 Gráfico que nos muestra la interacción de los usuarios con los motores de búsqueda.

Elaboración de las consultas

Respecto a las consultas realizadas, cabe destacar una media de 3.64 palabras y el uso de elementos booleanos que permiten al buscador realizar búsquedas más precisas y obtener resultados más validos.

1.3 Experimento con diversificación de los usuarios

Como hemos comentado anteriormente, en este experimento los usuarios seleccionados poseen conocimiento muy diversos sobre el asunto a buscar y además sobre informática. En este caso ahora los datos de las búsquedas serán almacenados en un servidor para ser posteriormente analizados y los usuarios tendrán una restricción temporal de 10 minutos para realizar sus búsquedas.

Por supuesto en la primera fase del experimento los sujetos a analizar han sido clasificados en 4 grupos diferentes que son:
  • Grupo 1: Conocimientos de informática y economía.
  • Grupo 2:Conocimientos de economía pero no de informática
  • Grupo 3:Conocimientos de informática pero no de economía.
  • Grupo 4:No poseen conocimientos de informática ni de economía

Resultados

Respecto a los resultados obtenidos en el experimento han sido muy reveladores. Los resultados obtenidos han sido los siguientes:
  • Grupo 1: Han sido los más rápidos en obtener la solución de la busqueda.
  • Grupo 2: Estos usuarios no tenían conocimientos de informática pero realizaban las consultas más bien que los usuarios que si poseían conocimientos y ,por lo tanto, obtenían con facilidad una respuesta valida a su problema.
  • Grupo 3: Aunque sabían que buscadores debían utilizar o algunos métodos de búsqueda y elaboración de consultas avanzados, el desconocimiento sobre el tema les hacia reformular sus consultas hasta encontrar la información deseada.
  • Grupo 4: Este grupo es el que más problema tuvo.

2. Investigación sobre el comportamiento de búsqueda web

Otro articulo que analiza el comportamiento de los usuarios en la búsqueda por Internet es el árticulo Research on Web search behavior elaborado entre el 1995 y 2000. Este texto estudia los patrones, necesidades y métodos que utilizan dos grupos sociales muy diferenciados para realizar las búsquedas por internet. El primer grupo esta conformado por sujetos entre 8 y 18 años y el segundo por personas adulta entre 18 y 65 años de edad. La finalidad de estos estudios es analizar que tipo de información buscan, en que entorno y además como analizan.

2.1 Introducción

¿Realmente es importante estudiar los patrones de búsqueda de los usuarios? La respuesta es rotunda Si. De todos los usuarios que acceden a Internet, el 57 por ciento accede diariamente a buscar información a través de los buscadores y, por lo tanto, podemos afirmar que los buscadores ha llegado a considerarse como la mayor fuente de información para muchos millones de usuarios.

2.2 Búsqueda de Información

Una tarea de recuperación esta compuesta por tres aspectos:
  • El contenido: La información que se recupera es la interfaz con la que el usuario obtiene esta.
  • Su capacidad: En este punto estarían incluidas los diferentes algoritmos que podemos utilizar, los criterios que podemos aplicar.
  • Los usuarios: Es muy importante considerar el nivel de conocimientos que posee el usuario sobre el tema para elaborar las consultas o incluso los conocimientos de informatica que posea para utilizar el buscador.

Comportamientos en las Búsquedas Web

Según Spink, Bateman and Jansen (autores del artículo comentado anteriormente) demostraron a través de logs de un servidor Telnet que el 77 por ciento de los usuarios tienen éxito al realizar su búsqueda. Para conseguir aumentar este porcentaje en el articulo se analizan diferentes metodologías y enfoques que permiten aumentar la eficiencia del proceso o disminuir los errores como son:
  • Las consultas: De esos 23 por ciento que no lo consiguen el 80 por ciento vuelven a intentarlo reformulando su consulta. Esta demostrado a través de diversos estudios que, los profesionales del sector utilizan elementos como booleanos o consultas con palabras esenciales sin conectores que aumentan las probabilidades de éxito. De normal, la gran mayoría de las consultas fallidas han sido elaboradas utilizando peticiones con múltiples palabras en lenguaje natural.

    Desde otro punto de vista, aquellos usuarios que realizan consultas sobre temas que desconocen también actúan de forma diferente. Mientras que los usuarios más experimentados suelen realizar búsquedas con pocas palabras y analizar los documentos proporcionados para aprender sobre el tema y realizar nuevas búsquedas más especificas, los usuarios más novatos no actúan de este modo. Ellos lo que hacen es formular peticione muy largas, con muchos datos que les proporcionen en muchos casos documentos demasiado generales.
  • Los usuarios: En muchos artículos sobre este tema se analiza el tipo de usuarios de internet y como podemos subdividirlos en grupos para analizar sus diferentes interacciones, como por ejemplo:
    • Niños: A pesar de la terminología en la que nos referimos a este grupo, debemos incluir en él a todos los usuarios con una navegación muy pobre y con muchas dificultades para encontrar la información deseada. Realmente este tipo de usuarios no pretende buscar información sino navegar en paginas determinadas y analizar la información que allí aparece.
    • Adultos con experiencia: Que a su vez los podemos subdividir en:
      • profesionales de las búsquedas
      • trabajadores relacionados con las Web
      • estudiantes.
      De este grupo de adultos es interesante estudiar su comportamiento. Según los logs de los servidores, estos usuarios acceden a la web mediante un proceso de backtraking muy interesante. Busca una web que le interesa, navegan por ella y si no le gusta vuelve hacia atrás y busca una opción diferente. Además de eso también se pueden dividir el tiempo en que permanecen en un site, es decir podríamos tener:
      • Los usuarios que acceden para un corto periodo de tiempo (como paso intermedio para acceder a otra web o por error)
      • Los que acceden durante largo periodo de tiempo
      • Los que acceden para realizar una consulta.
  • La interfaz el buscador: Agrupar los resultados en tipos, utilizar un diseño amigable y fácil de entender y además diferenciar los resultados con diferentes estilos ayuda a guiar al usuario y a mejorar el porcentaje de aciertos en las búsquedas.
  • Estrategias de búsqueda: Según el articulo Shneiderman(1997) encontraron tres estrategias usadas para las búsquedas que son:
    • Top-down: El buscador empieza con el área más general y va bajando la búsqueda a un punto más especifico.
    • Bottom-up: El buscador empieza de una palabra especifica y escanea los resultados.
    • Mixed: Utiliza las dos estrategias.
    Los investigadores han conseguido definiendo estos modelos generar buscadores más sistemáticos en sus tareas y en la ejecución de búsquedas. Estos avances se han aplicado principalmente en la interfaz para ayudar a los usuarios a entender los resultados obtenidos.
  • Las herramientas utilizadas. Los usuarios más expertos utilizan siempre los mismos buscadores, las mismas técnicas con independencia de la interfaz y inclusos realizan consultas muy similares. Normalmente siempre acceden a varios documentos en sus búsquedas y además consultan su historial y visitan paginas que ya habían visitado previamente. Mientras que los usuarios nuevos es todo lo contrario: acceden a buscadores diversos, utilizan muchos elementos visuales para las búsquedas y utilizan consultas muy diversas.

2.3 Metodología del estudio Web

En este apartado analizaremos los problemas que nos encontramos para hacer estudios sobre el comportamiento de los usuarios con la Web. El articulo comentado ya expresa su preocupación sobre este tema al definir la web como un terreno de prueba para analizar comportamientos y aplicar métodos de la ciencia social. Es bastante fácil de asimilar que cualquier análisis valido tendrá que poseer entrevistas, reportes, encuestas, grabaciones de audio y de vídeo y logs de servidores para recopilar toda la información posible.

Otro aspecto muy importante es que tipo de muestra cogemos. Es muy importante en los análisis estadísticos coger grupos de personas muy variados para analizar el mayor grupo de personas diversas.

3 Comprender los objetivos del usuario en la búsqueda web

Daniel E.rose y Danny Levinson (enlace) se centran a explicar en como y que están buscando los usuarios que interactúan con Internet. Para ello, ambos científicos analizan como otros compañeros han realizado sus estudios, analizando las consultas compartidas en otros proyectos de similares características.

Entender el "porque" del comportamiento de los usuarios es esencial para satisfacer la información que necesitan. Los usuarios no piensan en las búsquedas como un fin, sino como un proceso para obtener un objetivo y, por lo tanto, el objetivo del investigador será analizar su comportamiento acorde a un fin. Siguiendo esta filosofía, cuando implementemos un buscador y sus métodos, una parte importante del desarrollo será mejorar y adaptar el software para los objetivos de los usuarios que lo utilicen. Un caso muy típico en las búsquedas es aquellas consultas muy similares o incluso idénticas, pero con objetivos distintos dependiendo el usuario que las invoque. Por ejemplo, un usuario que busque tiendas de ropa puede buscar emplazamientos online o tiendas físicas más cercanas a su barrio todo depende el usuario que realice la consulta,

Utilizando está nueva metodología se ha generado el siguiente modelo para las maquina de búsquedas Web en tres tareas que son:
  • Crear una herramienta para los objetivos del usuario
  • Crear un proceso para asociar las maquinas de búsqueda con los objetivos y las consultas del usuario
  • Modificar las maquinas para utilizar los objetivos de búsqueda.
Para acabar con esta introducción hay que remarcar un hecho muy interesante. De todos los trabajos publicados hasta el 2002 solamente el articulo de Brode's ( Taxonomy of web Search (2002)) es el único que trata este tema con este enfoque. El resto de trabajos analizados simplemente analizan el comportamiento, sin estudiar el fin.

3.1 Herramientas para buscar objetivos

Para crear esta herramientas, Levinson y Rose han decidido utilizar un espacio de objetivos actual, es decir, han buscado un conjunto de consultas de la maquina de búsquedas AltaVista y lo han mezclado en conjunto de posibles objetivos basadas en su propia experiencia. El resultado es una extensa colección de objetivos.

Utilizando esta lista hemos clasificado 200 consultas manualmente. El siguiente paso ha sido revisar la herramienta para acomodar los resultados a esa clasificación realizada. También hemos clasificados los objetivos en diferentes categorías. Un ejemplo es por ejemplo "resource" que son aquellas consultas del estilo "canción supersubmarina" que no quieren información sobre el grupo de música Supersubmarina sino escuchar sus canciones.

Otras clasificaciones de objetivos que pueden resultar muy interesantes son:
  • Navegacional: Por ejemplo acudir a la pagina principal de marca para después acceder a tu equipo.
  • Información: Obtener información sobre un tema
  • Localización: Situar un lugar en el espacio
  • Más información: Búsquedas para realizar otras búsquedas.