LISTA WIP- EXTRACCIÓN DE INFORMACIÓN- DOCUMATICA DE TRAMULLAS

Febrero 05/2010

LISTA WIP- EXTRACCIÓN DE INFORMACIÓN- DOCUMATICA DE TRAMULLAS 

Se realiza la socialización del trabajo para presentar el primer avance.

El profesor expone temas tales como  que es y como se desenvuelven términos tales como relevancia y pertinencia, de acuerdo al contexto en el cual se utilicen.

Relevancia 

El término relevancia, según el Diccionario de la RAE, significa “cualidad o condición de relevante, importancia, significación”, y el término “relevante” es definido como “sobresaliente, destacado, importante o significativo”. Entendemos por tanto, que un documento recuperado se considera relevante cuando el contenido del mismo posee alguna significación o importancia con motivo de la pregunta realizada por el usuario, es decir, con su necesidad de información. 

PERTINENCIA

El Diccionario de la RAE define “pertinencia” como “calidad de pertinente”, entendiéndose “pertinente” como "todo lo que viene a propósito o resulta oportuno". Así, un documento pertinente es un documento que resulta oportuno, porque le proporciona al usuario final la información que a él le cumple algún propósito. 

Otros temas expuestos a lo largo de la clase serian aquellos en los cuales se despejan las dudas acerca de lo que es la lista wip, la extracción de información y la documatica de tramullas; concluyendo que:

LA LISTA WIP

Es la lista de los personajes más importantes de la web (Web Important People). lalistaWIP mide la Presencia Web de los personajes más referenciados en Internet y ofrece miles de listas ordenadas por países y categorías. 

Como Funciona?

A través de Bots (robots que recorren Internet) que leen diariamente cientos de miles de páginas y extrapolan la información mediante técnicas estadísticas. Los Bots leen todo tipo de páginas, aunque prestan especial atención a los ‘sites’ de noticias y blogs para que de esta forma la medición sea sensible a la actualidad


Los Bots utilizan Inteligencia Semántica, permitiendo documentar diariamente cientos de miles de personajes, un volumen que sería imposible realizar manualmente.


Estas técnicas permiten determinar si una página se refiere a George Bush padre o hijo o calcular la presencia de un personaje relativo a una categoría. Por ejemplo, se muestra a Ronald Reagan como un importante político pero un actor de menos relevancia.

Extracción de Información 

Es un tipo de recuperación de información, y cuyo principal obejetivo es extraer información estructurada, o semiestructurada desde documentos legibles por una computadora. 




BIBLIOGRAFIA