S.A.R.I.
Recuperación de Información en la Web |
Metadatos |
XML.
directorios
, los motores de búsqueda
y los metabuscadores.
Directorios
Es el sitio web que gestiona una base de datos que se ha creado de
forma manual , clasificando las url en categorías
Estos servicios reúnen una menor cantidad de sitios (es decir: sus bases de
datos son más selectivas) pero se destacan porque ofrecen información más detallada
sobre los documentos que indizan.
Muchas veces se redactan notas que describen con
bastante minuciosidad el contenido o características de cada sitio, gracias al trabajo de
un equipo de evaluadores, redactores o de los responsables de cada página incluida.
Casi siempre responden a una temática más acotada que puede ser un país, una
región, un tópico, etc.
Algunos de estos servicios combinan dos o tres variables haciendo difícil su
encasillamiento en una sola categoría; además se modifican constantemente
ofreciendo cada vez más facilidades.
La tendencia actual es permitir dos opciones: la
clasificación temática a través de un esquema de categorías de materia (Humanidades,
Salud, Ciencias Sociales, etc.) y la búsqueda libre a través del motor de búsqueda
(formulario que hay que completar).
.
Sus características son:
- Selección y clasificación manual de recursos.
- Poca actualización de los datos
- Poca exhaustividad
- Relevancia de los resultados y calidad
- Por lo general suelen ser temáticos.
Subir
Motores de búsqueda
Sitio web por el cual se tiene acceso a una base de datos automatizada
Se caracterizan por la potencia del motor de búsqueda que usan: suelen ser
muy sofisticados así como su capacidad de rastrear información rápidamente entre
millones de documentos.
La indización de las páginas se realiza por medio de una
categoría de software llamada spider (araña en inglés: se usa para figurar el recorrido
por la Web o telaraña) o también robot. El robot rastrea en forma automática las
páginas web (puede ser la totalidad de la página o sólo el título y las primeras frases)
y luego incorpora la información relevada a una base de datos propia. Por último, estos
sistemas agregan un motor de búsqueda que se presenta al usuario como un
formulario en blanco en el que hay que ir completando datos.
En los casilleros vacíos
pueden ingresarse una o varias palabras y una vez formulado el pedido, el sistema
recorre su base de datos para ver qué respuestas puede ofrecer.
Dado que la información se multiplica constantemente, estos buscadores
incorporan técnicas de búsqueda complejas (operadores booleanos, de proximidad,
búsqueda por frase, indicadores de relevancia, truncamiento, etc.) para contar con
elementos u opciones suficientes para afinar la recuperación de la información lo más
posible. Suelen poseer bases de datos muy grandes.
- Las url son recopiladas e indizadas automáticamente.
- Son exhaustivos y muy actualizados.
- Manipulables
- Dan problemas de calidad en los resultados y ambigüedad terminológica
Subir
Metabuscadores
Son buscadores que utilizan los motores de diversos sistemas en forma
simultánea.
Igual que los servicios individuales se valen de diferentes técnicas de
búsqueda que pueden variar de acuerdo con el metabuscador elegido.
Se presenta un
formulario que una vez completado, se ejecuta en forma simultánea en varios
buscadores individuales.
Los resultados se presentan indicando en cuál de cada
buscador utilizado fue hallado ese documento.
La ventaja reside en el hecho de que una busqueda
de este tipo ahorra el trabajo de tener que ir probando suerte con cada uno
separadamente.
Limitaciones: no se pueden hacer búsquedas demasiado
refinadas , se recuperan hasta 50 resultados de cada buscador
incluido (mucho menos de lo que podría obtenerse utilizando un buscador único), y
ciertas estrategias de búsqueda pueden no ejecutarse correctamente.
Son tres los tipos de metabuscadores que existen:
- Metabuscadores: corresponden exactamente a lo que se ha descrito como
tales.
- Multibuscadores: no realizan la combinación de los resultados,
simplemente lanzan la consulta a varios buscadores.
- Agentes de busqueda: son metabuscadores que han de instalarse
localmente.
Subir
Metadatos
"datos estructurados sobre los datos."
Los metadatos son información descriptiva sobre un objeto o recurso tanto
si éste es físico [formato tradicional tangible] como electrónico.
Las fichas de catálogo de biblioteca representan un tipo de metadatos
perfectamente establecido, que ha servio como herramientas de gestión de colecciones
y de recuperación de recursos durante décadas.
Los metadatos pueden tanto generarse a "a mano", como obtenerse automáticamente a través de un software..
Sus características son:
- Capacidad de Relación o de establecer enlaces.
- Imprescidibles en la recuperación global de la información en Internet.
- Indizar y clasificar información de diversos tipos.
- Integrar de forma heterogénea fuentes de información muy diversas, así como diferentes formatos de Bases de DatosRelevancia de los resultados y calidad
Subir
XML
Extensible Markup Language, no es más que un conjunto de reglas para
definir etiquetas semánticas que nos organizan un documento en diferentes partes.
Es un metalenguaje que define la sintaxis utilizada para definir otros lenguajes de etiquetas estructurados.
En teoría HTML es un subconjunto de XML especializado en presentación de documentos para la Web, mientras que XML es un subconjunto de SGML especializado en la gestión de información para la Web.
En la práctica XML contiene a HTML aunque no en su totalidad.
Desde su creación, XML ha despertado encontradas pasiones, y como para cualquier tema en Internet, hay gente que desde el principio se deja iluminar por sus expectativas, mientras otras muchas lo han ignorado.
Subir
Si teneis dudas o sugerencias escribirme a:
beatricheboliche@hotmail.com