sistemas avanzados de recuperacion de informacion

Modelos de Recuperación

Loïc Pérez Renouard

sistemas avanzados de recuperacion de informacion
Definición

Modelo Vectorial

Modelo Probabilístico

Modelo Booleano

Información adicional

Esta página web es una breve exposición sobre los modelos de recuperación, con un mero fin expositivo de un área más amplia que es la recuperación de información.

Los modelos de recuperación comparan una consulta determinada con los documentos existentes en una base de datos. Debemos recordar que los documentos deben ser texto para poder hacer búsquedas en ellos.

Normalmente nos basamos en términos para indexar y también para recuperar información.

Pero existen una serie de problemas:

  • El enfoque es una simplificación
  • Sólo tenemos aspecto léxico
  • No tenemos Sintaxis, ni Semántica y ni Pragmática
  • Los 3 modelos clásicos usan esta simplificación
  • Los documentos se representan por un conjunto de términos de indexación

Los términos son palabras claves que representan al documento:

  • Manualmente (mejores, pero alguien tiene que elegirlos)
  • Automáticamente

Es importante decir que los términos no tienen porque aparecer en el documento susceptible de ser recuperado.

En cuando a los modelos de recuperación, existen tres ya clásicos y que expondremos, a saber:

Modelo booleano

  • Los documentos son un conjunto de términos
  • Las preguntas son expresiones booleanas

Modelo vectorial

Modelo probabilístico

La idea es que para cada documento recuperado se construya un índice específico que dependa del contenido del texto. De este índice deriva el índice invertido que es el conjunto de documentos que contienen un mismo término.

En los índices de los documentos se tiene en cuenta la frecuencia de aparición de los términos.

Entre los distintos modelos de recuperación de información expondré el modelo vectorial, el modelo probabilístico y el modelo booleano.

WIKI de Sistemas Avanzados de Recuperación de Información

Página web en Word
pagina web en word

Página Web en PDF
pagina web en pdf

E-mail: Loïc Pérez Renouard

accesibilidad web world wide web consorciut aplicacion RSS
1