Febrero 05/2010
LISTA WIP- EXTRACCIÓN DE INFORMACIÓN- DOCUMATICA DE TRAMULLAS
Se realiza la socialización del trabajo para presentar el primer avance.
El profesor expone temas tales como que es y como se desenvuelven términos tales como relevancia y pertinencia, de acuerdo al contexto en el cual se utilicen.
Relevancia
El término relevancia, según el Diccionario de la RAE, significa “cualidad o condición de relevante, importancia, significación”, y el término “relevante” es definido como “sobresaliente, destacado, importante o significativo”. Entendemos por tanto, que un documento recuperado se considera relevante cuando el contenido del mismo posee alguna significación o importancia con motivo de la pregunta realizada por el usuario, es decir, con su necesidad de información.
PERTINENCIA
El Diccionario de la RAE define “pertinencia” como “calidad de pertinente”, entendiéndose “pertinente” como "todo lo que viene a propósito o resulta oportuno". Así, un documento pertinente es un documento que resulta oportuno, porque le proporciona al usuario final la información que a él le cumple algún propósito.
Otros temas expuestos a lo largo de la clase serian aquellos en los cuales se despejan las dudas acerca de lo que es la lista wip, la extracción de información y la documatica de tramullas; concluyendo que:
LA LISTA WIP
Es la lista de los personajes más importantes de la web (Web Important People). lalistaWIP mide la Presencia Web de los personajes más referenciados en Internet y ofrece miles de listas ordenadas por países y categorías.
Como Funciona?
A través de Bots (robots que recorren Internet) que leen diariamente cientos de miles de páginas y extrapolan la información mediante técnicas estadísticas. Los Bots leen todo tipo de páginas, aunque prestan especial atención a los ‘sites’ de noticias y blogs para que de esta forma la medición sea sensible a la actualidad
Los Bots utilizan Inteligencia Semántica, permitiendo documentar diariamente cientos de miles de personajes, un volumen que sería imposible realizar manualmente.
Estas técnicas permiten determinar si una página se refiere a George Bush padre o hijo o calcular la presencia de un personaje relativo a una categoría. Por ejemplo, se muestra a Ronald Reagan como un importante político pero un actor de menos relevancia.
Extracción de Información
BIBLIOGRAFIA