
FAQ
¿Cuál es la principal tecnología con que contamos para organizar la información?
Una base de datos, que permite gestionar grandes volúmenes de información de modo eficiente, constituyendo el núcleo central de un sistema de información.
El término 'base de datos' suele emplearse para referirse a dos conceptos íntimamente relacionados pero diferenciados: base de datos y sistema de gestión de base de datos. Una base de datos propiamente dicha consiste en una colección de datos relativos a un dominio del conocimiento; un sistema de gestión de base de datos, el programa informático que manipula dichos datos como un conjunto de registros. Como ejemplo de estos programas encontramos los siguientes: Access (Microsoft), Inmagic DB/Text Works (DOC6), Knosys (Micronet), WinISIS (Unesco).
—————
¿Cuál es la estructura esencial de una base de datos?
Una base de datos está compuesta de registros, es decir zonas de información. Un registro está dividido en campos o subáreas de información (equiparables a un conjunto de entidades caracterizadas por un rango de propiedades, atributos) y estos a su vez en conjuntos de bytes.
La estructura de una base de datos se completa con un tercer componente, básico para su funcionamiento (y para cumplir con su finalidad primordial: la recuperación de información). Se trata del índice.
Consiste en un conjunto de entradas (filas) formadas por el par 'valor-puntero' (o viceversa) estructurada de modo que cada entidad (valor) esté relacionada con su localización/dirección (puntero). Ello permite al sistema acceder directamente a cada registro, de forma que las preguntas que el usuario le plantea se resuelven con una consulta del sistema al índice, sin necesidad de leer uno a uno la totalidad de los registros incluidos en la base y ofreciendo por consiguiente sus resultados en una reducida fracción de tiempo.
El índice puede ser (según el orden de dicho par sea 'puntero-valor' o 'valor-puntero'):
- directo (similar al índice usual de un libro) o
- invertido (verbigracia el índice analítico, por temas, de un libro)
La incorporación por un sistema de gestión de base de datos de un índice de un tipo u otro delimita sus prestaciones y caracterización. Hablamos así de sistemas SGBD (de propósito general, orientados a gestión de datos administrativos, comerciales, muy estructurados y cómodos de gestionar en base al modelo relacional) para el primer caso (índice directo); y de sistemas SGD (de gestión documental, especialmente diseñados por su utilidad heurística para el tratamiento de información textual, conocimiento) para el segundo (índice invertido).
—————
Para gestionar una base de datos... ¿qué debo tener en cuenta a la hora de elegir el sistema más eficaz?
Debemos tener en cuenta fundamentalmente la naturaleza de información que tratamos de gestionar incluida en la base de datos.
- Si se trata de información con datos de tipo comercial, administrativo, de carácter muy estructurado, la tecnología más idónea puede ser un sistema basado en modelo relacional (SGBD). Estos sistemas emplean (para operaciones de recuperación de información para el usuario) un índice de tipo directo, bien preparado para datos numéricos y cadenas cortas de caracteres. Estos sistemas cuentan con un índice (directo) que proporciona una localización para cada registro. Despliega una entrada para cada ocurrencia de palabra que registra e indiza la primera cadena de caracteres de cada campo (de una extensión máxima de 250 caracteres).
Pueden ser de edición offline u online. Un ejemplo de gestor de bases de datos relacionales en modalidad online es Zoho Creator.
El índice invertido proporciona una única entrada para las ocurrencias de las palabras significativas que indiza en los campos -que son de extensión variable-.
- Si consiste en información primordialmente textual es conveniente considerar la opción de un sistema que emplea un índice invertido, un sistema de gestión documental (SGD). Además de localización de los registros, proporciona ubicación de 'temas' en los registros. Estas capacidades heurísticas que permiten la indización de la totalidad de datos del campo e incorporar controles terminológicos (sistema de términos únicos, supresión de palabras 'vacías' -sin contenido semántico-) suponen una prestación especialmente útil para procesar información de tipo textual, conocimiento en definitiva.
Un ejemplo de estos sistemas es Inmagic, un programa de gestión de bases de datos documentales de texto completo, con las siguientes prestaciones:
- Indexación mediante controles terminológicos (vocabularios controlados, descriptores y ficheros de palabras vacías)
- Asociación de imágenes a los registros
- Publicación de bases de datos en internet
Una subclase de tales sistemas la encontramos en la de los sistemas de gestión de bases de datos bibliográficas (especializadas en gestionar referencias bibliográficas, apoyando la imprescindible función académica de aplicar correctamente el binomio cita-atribución, con tres grupos de datos fundamentales: Autoría/Título y datos indentificadores/Fuente). Dos ejemplos de aplicaciones de este tipo son Refworks y Connotea.
—————
Además de optar por una solución tecnológica u otra... ¿debo considerar algo más para implementar del modo más idóneo un sistema de información?
Sí, desarrollar un proyecto sobre bases metodológicas.
Esto supone reflexionar, dotar de contenido y trabajar con un modelo integrado por tres 'aparatos':
- Uno conceptual. La base de datos es un sistema que mantiene registros sobre entidades del mundo real, el 'sistema objeto' (documentos, personas, objetos o conceptos). Este es un sistema social que cuenta con una dinámica generada por un propósito y unos objetivos, y cuyas necesidades de información constituyen la situacion problemática que la base de datos trata de subsanar.
- Otro instrumental. Consiste en las herramientas con las que contamos para realizar el análisis de dicho sistema y por ende proporcionar la mejor solución a las necesidades de información (tales como un modelo 'Entidad/Relación', un Diccionario de Datos, y las posibilidades de aplicación de la norma ISBD); y por último,
- El procedimental (concebido como el proceso que nos lleva a disponer finalmente de una base de datos, desarrollado desde su inicial fase de análisis lógico -que requiere un conocimiento adecuado del sistema objeto recogido en el citado modelo 'E/R'-, pasando por la de diseño hasta la de implantación)
—————
La información a tratar en el sistema, el contenido que voy a incluir en la base de datos... ¿tiene que ajustarse a algún tipo de lenguaje o código especial?
Según la funcionalidad prevista para el sistema.
La utilización de un código (dimensión formal) y/o semántica documental (dimensión de contenido) constituye un tratamiento, transformación de la información a incluir en la base de datos. Tiene como función principal la de ejercer de puente entre la esfera del documento y el ámbito del usuario/a, codificando o traduciendo información para que pueda ser comprensible por la mayoría de las personas (y ahora también los navegadores web, atendiendo a la creciente oferta de recursos digitales).
- Por medio de un código (Ejemplo: Normas Internacionales para la Descripción Bibliográfica -ISBD-, Descripción y Acceso al Recurso -RDA) catalogamos un documento del que transferimos su información esencial a un registro en nuestra base según determinadas reglas.
- La elección de una semántica documental ha de contemplar los procesos de clasificación, indización y elaboración de resúmenes, pudiendo constituir la integración de uno o más lenguajes tradicionales y de 'nueva generación'.
Entre los primeros, los tradicionales, nos referimos al empleo de listas de encabezamientos de materia (de presentación alfabética), sistemas de clasificación (representaciones de estructuras conceptuales a modo de notaciones) y tesauros (organizadores de forma semántica de determinados campos del conocimiento -Ejemplo: Tesauro de la Educación /Unesco; principal herramienta de trabajo en centros de documentación a nivel global).
Entre los segundos, de 'nueva generación', a la utilización de metadatos (puntos de acceso en el entorno digital, especialmente en su caracterización semántica -optando por un modelo descriptivo que responda a nuestras necesidades, como por ejemplo: Dublin Core, Encoded Archival Description, ...) -sumado a la posibilidad de empleo de un lenguaje de marcado XML-; y otras herramientas documentales de dicho entorno tales como los tesauros enriquecidos -conceptuales, de verbos-, los mapas conceptuales -representación gráfica de contenidos- y las folksonomias -sistemas de clasificación colectiva, que asignan palabras clave a documentos y recursos de información de forma colaborativa y colectiva-.
[Hay que tener en cuenta que los lenguajes tradicionales (especialmente los tesauros) constituyen una 'tecnología' sólidamente asentada en los sistemas de información -modelos bien establecidos e implantados-, mientras que los de 'nueva generación', si bien de gran potencialidad, constituyen una solución aún inmadura para su aplicación a dichos sistemas.]
En caso de incluir un código/lenguaje de estas características debemos constatarlo en el Diccionario de Datos del Modelo Funcional del sistema.
—————
¿Dispongo de alguna herramienta para controlar el rendimiento y calidad del sistema de información/base de datos que estoy desarrollando?
Sí, la de contar con un Modelo Conceptual de la base de datos fruto de su planificación metodológica. Se trata de un documento en el que detallamos el dominio/tema del sistema e incluye como elemento esencial un 'Diccionario de Datos'.
En este Diccionario definimos nuestro sistema definiendo:
- la clase de información que introduce y trata,
- los procesos de tratamiento documental que automatiza, y
- los servicios y productos que genera.
El Diccionario es una lista detallada de cada uno de los campos que forman los distintos modelos de registro de la Base, aplicándose a cada uno de ellos una parrilla de análisis que contempla varios aspectos:
- Etiqueta: nombre (de no más de ocho caracteres, sin espacios ni acentos)
- Dominio: clase de contenidos que admite
- Tipo de datos: información que admite (numérica, alfanumérica, fechas...)
- Indexación
- Tratamiento documental: especificando si debemos emplear algún lenguaje documental (lista de autoridades/tesauro)
- Lengua: idioma (bien del documento, bien del centro de documentación)
El Modelo Conceptual pasa normalmente a constituirse el Libro de Estilo de la Base de Datos en su fase de implantación.
—————
¿Qué pasos de naturaleza práctica debo dar para implantar una base de datos? ¿Y si pretendo publicarla en la web?
La fase de implantación de una Base de Datos puede incluir las siguientes actuaciones:
- Analizar los costes y prever un primer calendario de actuaciones
- Seleccionar el sistema informático (software y hardware) ajustado a la naturaleza de la información a tratar, considerando sus posibilidades como sistema accesible online
- Realizar las primeras instalaciones, del administrador de la Base y las primeras pruebas con una colección de datos a modo de test
- Ajustar sobre lo implementado para refinar un modelo final
- Definir y llevar a la práctica una política de mantenimiento y explotación del sistema
- Contar con una primera versión del Libro de Estilo del mismo
- Capacitar en su uso al personal técnico y usuarios/as finales
- Llevar a cabo acciones de promoción (en su caso)
Su publicación en la web puede sustanciarse de dos modos, con resultados y prestaciones para el usuario/a que difieren según uno u otro:
- Realizando un volcado en formato HTML de la totalidad o parte de la Base de Datos creada a nivel local: el sistema está al alcance de usuarios/as remotos, aunque no cuentan con la capacidad de interactuar y de generar los contenidos dinámicos usuales de una base de datos
- Enviando la Base de Datos local a un servidor de páginas web al que se realiza periódicamente el volcado de información (la Base debe ser compatible por lo tanto con un Servidor de esas características -como, por ejemplo, Filemaker, Knosys o Inmagic): permite al usuario/a disponer online de todas las prestaciones de una base de datos.
La segunda modalidad conlleva la combinación de un programa de gestión de bases de datos (software), un ordenador y programa servidor de páginas web, una aplicación intermediaria entre este servidor y los contenidos de dicha base de datos, y un programa/cuenta de FTP. Esta combinación permite la publicación de informaciones en la web en forma de páginas HTML en respuesta a peticiones de los programas clientes (navegadores web) conteniendo consultas a la base de datos.
Esta publicación implica que el Administrador de la Base de Datos proporcione al webmaster o Administrador del servidor de páginas web lo siguiente:
- Una dirección FTP
- Un identificador de usuario de cuenta FTP
- Una contraseña de acceso a la cuenta
- Un directorio inicial del servidor remoto
- Una dirección http (URL) para poder acceder a la base de datos desde un navegador estándar una vez publicada
MySQL es el sistema de esta modalidad (de gestión de bases de datos relacionales) más empleado. Su sistema de permisos es muy potente, pudiendo facilitar a sus usuarios habilitados no sólo acceder y leer sino también crear, modificar, borrar.. sobre una base de datos concreta, una tabla o incluso sobre una columna de esa tabla. MySQL está disponible para múltiples sistemas operativos (Linux, Windows, Mac Os) y se distribuye sin ninguna interfaz de gestión específica. Es la base de muchs aplicaciones para la web como gestores de contenidos (Drupal, Joomla), sistemas de blogs (Wordpress), fórums (phpBB), etc.
—————
¿Existe algún modo de hacer más atractiva y efectiva la presentación al usuario/a de los resultados de búsqueda/consulta de la base de datos?
Sí, la Visualización aplicada a la recuperación de información.
Consiste en presentar la información de forma que sea más inteligible a las personas, facilitando una representación gráfica de los datos por medio de técnicas que los haga visibles y faciliten la interacción con el usuario/a.
Entre estas técnicas se encuentran las siguientes:
- Iconos para representar conceptos
- Colores y texturas para destacar
- Gráficos con presentaciones jerárquicas
- Mapas que presentan información agrupada
- Efectos de zoom para mostrar información con detalle
- Animación y perspectiva 3D
La Visualización se ha empleado fundamentalmente para la presentación de resultados de buscadores web. Aunque su panorama es muy cambiante, encontramos ejemplos diversos (activos):
- Reiz: cada resultado es una captura de pantalla de las páginas-resultado
- Carrot: presenta en forma de gráfico circular los subtemas para facilitar el afinamiento de las búsquedas
- SearchCube: presenta las capturas de pantalla en 3D
- Google Instant Preview: ofrece previsualizaciones de las páginas-resultado
—————