S.A.R.I.


Recuperación de Información en la Web | Metadatos | XML.


directorios , los motores de búsqueda y los metabuscadores.

Directorios

Es el sitio web que gestiona una base de datos que se ha creado de forma manual , clasificando las url en categorías Estos servicios reúnen una menor cantidad de sitios (es decir: sus bases de datos son más selectivas) pero se destacan porque ofrecen información más detallada sobre los documentos que indizan.
Muchas veces se redactan notas que describen con bastante minuciosidad el contenido o características de cada sitio, gracias al trabajo de un equipo de evaluadores, redactores o de los responsables de cada página incluida.
Casi siempre responden a una temática más acotada que puede ser un país, una región, un tópico, etc.
Algunos de estos servicios combinan dos o tres variables haciendo difícil su encasillamiento en una sola categoría; además se modifican constantemente ofreciendo cada vez más facilidades.
La tendencia actual es permitir dos opciones: la clasificación temática a través de un esquema de categorías de materia (Humanidades, Salud, Ciencias Sociales, etc.) y la búsqueda libre a través del motor de búsqueda (formulario que hay que completar).

.

Sus características son:

Subir

Motores de búsqueda

Sitio web por el cual se tiene acceso a una base de datos automatizada
Se caracterizan por la potencia del motor de búsqueda que usan: suelen ser muy sofisticados así como su capacidad de rastrear información rápidamente entre millones de documentos.
La indización de las páginas se realiza por medio de una categoría de software llamada spider (araña en inglés: se usa para figurar el recorrido por la Web o telaraña) o también robot. El robot rastrea en forma automática las páginas web (puede ser la totalidad de la página o sólo el título y las primeras frases) y luego incorpora la información relevada a una base de datos propia. Por último, estos sistemas agregan un motor de búsqueda que se presenta al usuario como un formulario en blanco en el que hay que ir completando datos.
En los casilleros vacíos pueden ingresarse una o varias palabras y una vez formulado el pedido, el sistema recorre su base de datos para ver qué respuestas puede ofrecer.
Dado que la información se multiplica constantemente, estos buscadores incorporan técnicas de búsqueda complejas (operadores booleanos, de proximidad, búsqueda por frase, indicadores de relevancia, truncamiento, etc.) para contar con elementos u opciones suficientes para afinar la recuperación de la información lo más posible. Suelen poseer bases de datos muy grandes.

Subir

Metabuscadores

Son buscadores que utilizan los motores de diversos sistemas en forma simultánea.
Igual que los servicios individuales se valen de diferentes técnicas de búsqueda que pueden variar de acuerdo con el metabuscador elegido.
Se presenta un formulario que una vez completado, se ejecuta en forma simultánea en varios buscadores individuales.
Los resultados se presentan indicando en cuál de cada buscador utilizado fue hallado ese documento.
La ventaja reside en el hecho de que una busqueda de este tipo ahorra el trabajo de tener que ir probando suerte con cada uno separadamente.
Limitaciones: no se pueden hacer búsquedas demasiado refinadas , se recuperan hasta 50 resultados de cada buscador incluido (mucho menos de lo que podría obtenerse utilizando un buscador único), y ciertas estrategias de búsqueda pueden no ejecutarse correctamente.

Son tres los tipos de metabuscadores que existen:

Subir

Metadatos

"datos estructurados sobre los datos."
Los metadatos son información descriptiva sobre un objeto o recurso tanto si éste es físico [formato tradicional tangible] como electrónico.
Las fichas de catálogo de biblioteca representan un tipo de metadatos perfectamente establecido, que ha servio como herramientas de gestión de colecciones y de recuperación de recursos durante décadas.
Los metadatos pueden tanto generarse a "a mano", como obtenerse automáticamente a través de un software..
Sus características son:

Subir

XML

Extensible Markup Language, no es más que un conjunto de reglas para definir etiquetas semánticas que nos organizan un documento en diferentes partes.
Es un metalenguaje que define la sintaxis utilizada para definir otros lenguajes de etiquetas estructurados.
En teoría HTML es un subconjunto de XML especializado en presentación de documentos para la Web, mientras que XML es un subconjunto de SGML especializado en la gestión de información para la Web.
En la práctica XML contiene a HTML aunque no en su totalidad.
Desde su creación, XML ha despertado encontradas pasiones, y como para cualquier tema en Internet, hay gente que desde el principio se deja iluminar por sus expectativas, mientras otras muchas lo han ignorado.

Subir

Si teneis dudas o sugerencias escribirme a: beatricheboliche@hotmail.com