LAS MEDIDAS DE EVALUACIÓN de la recuperación de información

RECALL Y PRECISIÓN


Cualquier sistema de recuperación de información trabaja sobre una colección de documentos o recursos informativos disponibles, muchas veces sobre Internet. Estos sistemas de recuperación lanzan sobre dicha colección la ecuación de búsqueda, y clasifican los documentos en cuatro tipos:

  1. los relevantes recuperados, que aportan información idónea a la búsqueda realizada
  2. Los no relevantes recuperados, que no deberían aparecer en la recuperacion por cuanto que no aportan la información que se ha solicitado. Se les llama ruido por estorbar en la búsqueda de información
  3. Los relevantes no recuperados, que son documentos válidos pero que el sistema no ha considerado como idóneos para esa búsqueda. Se les llama silencio por estar ausentes cuando deberian aparecer
  4. El resto de documentos, que ni son relevantes ni se han recuperado

La suma de A y B es el resultado de la búsqueda llevada a cabo por el sistema de recuperación de información ante una necesidad informativa formulada mediante una ecuación de búsqueda concreta. Son lo documentos recuperados

La suma de A y C es el resultado idóneo que el sistema de recuperación de información debería de haber mostrado. Son los documentos relevantes.

A partir de estos resultados, las medidas que se utilizan para evaluar estos sistemas de recuperación de información son la exhaustividad o recall y la Precisión, la relación entre ambas y otras medidas complementarias



Página creada por Miguel Ángel Matías Iglesias

Valid HTML 4.01 Transitional 1