Introducción

 

La cantidad documentos disponibles en formato electrónico hace imposible su análisis. Los sistemas de extracción de información permiten estructurar esa información para un dominio específico, lo que convierte el problema de analizar documentos en consultar una base de datos.

¿qué es el reconocimiento basado en patrones?

 

El reconocimiento basado en patrones clasifica objetos en un número determinado de clases o categorías. De esta forma un objeto X puede ser descrito con un vector de p atributos:

 

x = [ x1, x2, ..., xp]

 

Desde este punto de vita, la extracción de información se puede ver como, una tarea de clasificación según distintos patrones. La unidad de información que es candidata a ser extraída o clasificada semánticamente, es descrita por un conjunto de atributos que atienden a distintos patrones, estos son: léxicos, sintácticos, semánticos y de discurso.

Otros tipos de extracción y recuperación de la información

 

 

Extracción de información

 

Extracción de mediante clasificación no supervisada

 

Extracción de información mediante clasificación supervisada


1