lunes, 21 de diciembre de 2015

Tercera Forma Normal (3NF)

Tercera Forma Normal (3NF)


Está en forma normal de Boyce-Codd y se eliminan las dependencias multivaluadas y se generan todas las relaciones externas con otras tablas u otras bases de datos. Esta se hace a base de claves.

La tercera forma normal (3NF) es una forma normal usada en la normalización de bases de datos. La 3NF fue definida originalmente por E.F. Codd1 en 1971. La definición de Codd indica que una tabla está en 3NF si y solo si las tres condiciones siguientes se cumplen:
  • La tabla está en la segunda forma normal (2NF)
  • Ningún atributo no-primario de la tabla es dependiente transitivamente de una clave primaria
  • Es una relación que no incluye ningún atributo clave
Un atributo no-primario es un atributo que no pertenece a ninguna clave candidata. Una dependencia transitiva es una dependencia funcional X → Z en la cual Z no es inmediatamente dependiente de X, pero sí de un tercer conjunto de atributos Y, que a su vez depende de X. Es decir, X → Z por virtud de X → Y e Y → Z.
Una formulación alternativa de la definición de Codd, dada por Carlo Zaniolo2 en 1982, es ésta: Una tabla está en 3NF si y solo si, para cada una de sus dependencias funcionales X → A, por lo menos una de las condiciones siguientes se mantiene:
  • X contiene A, ó
  • X es una superclave, ó
  • A es un atributo primario (es decir, A está contenido dentro de una clave candidata)


La definición de Zaniolo tiene la ventaja de dar un claro sentido de la diferencia entre la 3NF y la más rigurosa forma normal de Boyce-Codd (BCNF). La BCNF simplemente elimina la tercera alternativa ("A es un atributo primario").

Segunda Forma Normal (2NF)

Segunda Forma Normal (2NF)


Dependencia completa. Esta en 2NF si esta en 1NF y si sus atributos no principales dependen de forma completa de la clave principal. Toda columna que no sea clave debe depender por completo de la clave primaria. Los atributos dependen de la clave. Varia la clave y varian los atributos. Dependencia completa. Sus atributos no principales dependen de forma completa de la clave principal.

La segunda forma normal (2NF) es una forma normal usada en normalización de bases de datos. La 2NF fue definida originalmente por E.F. Codd1 en 1971. Una tabla que está en la primera forma normal (1NF) debe satisfacer criterios adicionales para calificar para la segunda forma normal. Específicamente: una tabla 1NF está en 2NF si y solo si, dada una clave primaria y cualquier atributo que no sea un constituyente de la clave primaria, el atributo no clave depende de toda la clave primaria en vez de solo de una parte de ella.
En términos levemente más formales: una tabla 1NF está en 2NF si y solo si ninguno de sus atributos no-principales son funcionalmente dependientes en una parte (subconjunto propio) de una clave primaria (Un atributo no-principal es uno que no pertenece a ninguna clave primaria).

Observe que cuando una tabla 1NF no tiene ninguna clave candidata compuesta (claves candidatas consisten en más de un atributo), la tabla está automáticamente en 2NF.

Primera Forma Normal (1NF)

Primera Forma Normal (1NF)

Una relación está en Primera Forma Normal si y sólo si todos los dominios son atómicos. Un dominio es atómico si los elementos del dominio son indivisibles.
Por ejemplo:
La Relación:
  • cursos: nombre, código, vacantes, horario, bibliografía
Queda después de aplicar la Forma Normal 1 de la siguiente manera:
  • cursos1: nombre, código, vacantes
  • horario1: código, día, módulo
  • bibliografia1: código, nombre, autor

Una columna no puede tener multiples valores. Los datos estan atomicos (Si a cada valor de X le pertenece un valor de Y, entonces a cada valor de Y le pertenece un valor de X).

La regla de la Primera Forma Normal establece que las columnas repetidas deben eliminarse y colocarse en tablas separadas

Normalización de una BD

Normalización de una base de datos

El proceso de normalización de una base de datos consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo E-R (entidad-relación) al modelo relacional.
Las bases de datos relacionales se normalizan para:
  • El proceso de normalización de bases de datos consiste en designar y aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo entidad-relación almodelo relacional.
    Las bases de datos relacionales se normalizan para:
    • Evitar la redundancia de los datos.
    • Disminuir problemas de actualización de los datos en las tablas.
    • Proteger la integridad de los datos.
    En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una tabla sea considerada como una relación tiene que cumplir con algunas restricciones:
    • Cada tabla debe tener su nombre único.
    • No puede haber dos filas iguales. No se permiten los duplicados.
    • Todos los datos en una columna deben ser del mismo tipo.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una tabla bidimensional sea considerada como una relación tiene que cumplir con algunas restricciones:

  • Cada columna debe tener su nombre único.
  • No puede haber dos filas iguales. No se permiten los duplicados.

lunes, 14 de diciembre de 2015

MODELO EN RED

MODELO EN RED
El modelo de red es un modelo de base de datos concebido como un modo flexible de representar objetos y su relación.
Ejemplo de un Modelo de red.
El inventor original del modelo de red fue Charles Bachman, y con ello fue desarrollado en una especificación estándar publicada en 1969 por la Conferencia de Lenguajes en Sistemas de Datos (CODASYL).








El argumento principal a favor del modelo de red, en comparación con el modelo jerárquico, era que permitió un modelado más natural de relaciones entre entidades. Aunque el modelo extensamente fuera puesto en práctica y usado, esto falló en hacerse dominante por dos motivos principales. En primer lugar, la IBM decidió atenerse al modelo jerárquico con extensiones de semired en sus productos establecidos como IMS Y DL/I. En segundo lugar, eventualmente fue desplazado por el modelo relacional, que ofreció un nivel más alto, la interfaz más declarativo. Hasta principios de los años 1980 las ventajas del funcionamiento de las interfaces de bajo nivel de navegación ofrecidos por jerárquico y bases de datos de red eran persuasivas para muchos usos en gran escala, pero como el hardware se hizo más rápido, la productividad suplementaria y la flexibilidad del modelo relacional condujo a la caída en desuso gradual del modelo de red en el uso corporativo de la empresa.

MODELO RELACIONAL

El modelo relacional, para el modelado y la gestión de bases de datos, es un modelo de datos basado en la lógica de predicados y en la teoría de conjuntos.
Tras ser postuladas sus bases en 1970 por Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó en consolidarse como un nuevo paradigma en los modelos de base de datos.
Su idea fundamental es el uso de relaciones. Estas relaciones podrían considerarse en forma lógica como conjuntos de datos llamados tuplas. Pese a que esta es la teoría de las bases de datos relacionales creadas por Codd, la mayoría de las veces se conceptualiza de una manera más fácil de imaginar, pensando en cada relación como si fuese una tabla que está compuesta por registros (cada fila de la tabla sería un registro o "tupla") y columnas (también llamadas "campos").
Es el modelo más utilizado en la actualidad para modelar problemas reales y administrar datos dinámicamente.

MODELOS LOGICOS GERARQUICOS

MODELOS LOGICOS GERARQUICOS

@ APARECIO A MEDIADOS DE LOS AÑOS SESENTA Y DOMINO EL MERCADO HASTA MEDIADOS DE LOS OCHENTA. @ ES UN MODELO DE DATOS ORIENTADO A REGISTRO (VE A LA BASE DE DATOS COMO UNA COLECCIÓN DE REGISTROS ORGANIZADOS JERARQUICAMENTE) @ SÓLO SE PUEDEN REPRESENTAR RELACIONES DEL TIPO.


DIFERENCIAS Y SIMILITUDES ENTRE LOS MODELOS JERARQUICO Y DE RED

■ El modelo jerárquico es similar al modelo de red en el sentido de que los datos y las relaciones entre los datos se representan mediante registros y enlaces, respectivamente.

 ■ Se diferencia del modelo de red en que los registros están organizados como colecciones de árboles en vez de grafos arbitrarios.

MODELO LOGICO DE DATOS

1.1.2. Modelos de Base de Datos.
"Un modelo de datos es básicamente una "descripción" de algo conocido como contenedor de datos (algo en donde se guarda la información), así como de los métodos para almacenar y recuperar información de esos contenedores. Los modelos de datos no son cosas físicas: son abstracciones que permiten la implementación de un sistema eficiente de base de datos; por lo general se refieren a algoritmos, y conceptosmatemáticos."[4]
"El diseño de una base de datos es un proceso complejo que abarca decisiones a muy distintos niveles. La complejidad se controla mejor si se descompone el problema en subproblemas y se resuelve cada uno de estos subproblemas independientemente, utilizando técnicas específicas. Así, el diseño de una base de datos se descompone en diseño conceptual, diseño lógico y diseño físico."[5]
Son abstracciones que permiten la implementación de un sistema de base de datos en un proceso complejo que contienen decisiones en muchos distintos niveles, si se descompone el problema en sub problemas esto se resuelve independientemente, utilizando técnicas especificas. Así serán los siguientes modelos (Conceptual, Lógico, Físico).
1.1.2.1. Modelo Conceptual.
"Se utilizan para representar la realidad a un alto nivel de abstracción. Mediante los modelos conceptuales se puede construir una descripción de la realidad fácil de entender."[6]
Se utiliza para la abstracción de la base de datos, para construir una descripción para entender en la realidad
1.1.2.2. Modelo Lógico.
"Es una descripción de la estructura de la base de datos en términos de las estructuras de datos que puede procesar un tipo de SGBD. Un༥m>modelo lógico༯em>es un lenguaje usado para especificar esquemas lógicos (modelo relacional, modelo de red, etc.). El diseño lógico depende del tipo de SGBD que se vaya a utilizar, no depende del producto concreto."[7]
Es una descripción usada para especificar el esquema lógico detallado del modelo conceptual, depende del tipo SGBD que se va a utilizar y no depende del producto concreto.
1.1.2.3. Modelo Físico.
"Es una descripción de la implementación de una base de datos en memoria secundaria: las estructuras de almacenamiento y los métodos utilizados para tener un acceso eficiente a los datos. Por ello, el diseño físico depende del SGBD concreto y el esquema físico se expresa mediante su lenguaje de definición de datos."[8]
Es una implementación de una base de datos en las estructuras de almacenamiento y los métodos eficiente a los datos. Depende del SGBD concreto, y se expresa de una manera más detallada (atributos, relaciones, etc.).
  • Sistema de gestión de Base de datos (SGBD).
(En inglés database management system, abreviado DBMS)
"Es el conjunto de programas que permiten definir, manipular y utilizar la información que contienen las bases de datos."[9]
"Debe ser capaz de aceptar definiciones de datos (esquemas externos, el esquema Conceptual, el esquema interno, y todas las correspondencias asociadas) en versión fuente y convertirlas en la versión objeto apropiada (宩[10]
"Necesitan que les demos una descripción o definición de la BD. Esta descripción recibe el nombre de esquema de la BD, y los SGBD la tendrán continuamente a su alcance."[11]
Un SGBD es un sistema que permite manipular la información ingresada, realizan las tareas administrativas para mantener en buena condición la aplicación de la base de datos. Una base de datos no se puede manipular directamente, necesita una SGBD.


Leer más: http://www.monografias.com/trabajos84/modelamiento-base-datos/modelamiento-base-datos.shtml#ixzz3uLE8pHfp

PROTECCION DE DATOS

En la Seguridad Informática se debe distinguir dos propósitos de protección, la Seguridad de la Información y la Protección de Datos.
pres_3_seguridad_informatica
Se debe distinguir entre los dos, porque forman la base y dan la razón, justificación en la selección de los elementos de información que requieren una atención especial dentro del marco de la Seguridad Informática y normalmente también dan el motivo y la obligación para su protección.
Sin embargo hay que destacar que, aunque se diferencia entre la Seguridad de la Información y la Protección de Datos como motivo o obligación de las actividades de seguridad, las medidas de protección aplicadas normalmente serán las mismas.
Para ilustrar un poco la diferencia entre los dos, se recomiendo hacer el siguienteejercicio.
pres_4_seguridad_informacion
En la Seguridad de la Información el objetivo de la protección son los datos mismos y trata de evitar su perdida y modificación non-autorizado. La protección debe garantizar en primer lugar la confidencialidadintegridad y disponibilidad de los datos, sin embargo existen más requisitos como por ejemplo la autenticidad entre otros.
El motivo o el motor para implementar medidas de protección, que responden a la Seguridad de la Información, es el propio interés de la institución o persona que maneja los datos, porque la perdida o modificación de los datos, le puede causar un daño (material o inmaterial). Entonces en referencia al ejercicio con el banco, la perdida o la modificación errónea, sea causado intencionalmente o simplemente por negligencia humana, de algún récord de una cuenta bancaria, puede resultar en perdidas económicas u otros consecuencias negativas para la institución.
pres_5_proteccion_datos
En el caso de la Protección de Datos, el objetivo de la protección no son los datos en si mismo, sino el contenido de la información sobre personas, para evitar el abuso de esta.
Esta vez, el motivo o el motor para la implementación de medidas de protección, por parte de la institución o persona que maneja los datos, es la obligación jurídica o la simple ética personal, de evitar consecuencias negativas para las personas de las cuales se trata la información.

EL ADMINISTRADOR DE B.D

Administrador de base de datos (DBA): Definición

DBA es también una abreviatura en inglés para “hacer negocios como” (doing business as), un término usado a veces en la escritura de negocios y legal. dBA es una abreviatura de decibelios con ponderación.

(SGBD) EL DICCIONARIO DE REC. INFORMACION

Introducción.
Una Base de Datos es una colección de archivos, datos, información; ordenada, organizada, y relacionada, con la finalidad de permitir el manejo de la información para su procesamiento.  Cada uno de los archivos representan una  colección de registros y cada registro está compuesto de una colección de campos.  Cada uno de los campos de cada registro permite llevar información de alguna característica o atributo de alguna entidad del mundo real.
           El DBMS es un conjunto de programas que se encargan de manejar la creación y todos los accesos a las bases de datos. Se compone de un Lenguaje de Definición de Datos (DDL: Data Definition Languaje), de un Lenguaje de Manipulación de Datos (DML: Data Manipulation Languaje), y de un Lenguaje de Consulta (SQL: Structured Query Languaje).
Sistema de Administración de Base de Datos (DBMS).
Es el nivel de software que provee el acceso a la información a un alto nivel de abstracción. En lugar de manipular archivos, registros, índices, el programa de aplicación opera en términos de clientes, cuentas, saldos, etc.
Acceso a la Base de Datos

La secuencia conceptual de operaciones que ocurren para accesar cierta información que contiene una base de datos es la siguiente:
  • El usuario solicita cierta información contenida en la base de datos.
  • El DBMS intercepta este requerimiento y lo interpreta.
  • DBMS realiza las operaciones necesarias para accesar y/o actualizar la información solicitada
Para ver el gráfico seleccione la opción "Descargar" del menú superior
Proceso para Accesar Información de Bases de Datos.
Unidad I. Funciones del Administrador de la Base de Datos.
  1. Conceptos Generales.
Administrador de la Base de Datos. Es la persona encargada de definir y controlar las bases de datos corporativas, además proporciona asesoría a los desarrolladores, usuarios y ejecutivos que la requieran. Es la persona o equipo de personas profesionales responsables del control y manejo del sistema de base de datos, generalmente tiene(n) experiencia en DBMS, diseño de bases de datos, Sistemas operativos, comunicación de datos, hardware y  programación.
           Un Administrador de Base de Datos de tiempo completo normalmente tiene aptitudes técnicas para el manejo del sistema en cuestión a demás, son cualidades deseables nociones de administración, manejo de personal e incluso un cierto grado de diplomacia. La característica más importante que debe poseer es un conocimiento profundo de las políticas y normas de la empresa, así como el criterio de la empresa para aplicarlas en un momento dado. La responsabilidad general del DBA es facilitar el desarrollo y el uso de la Base de Datos dentro de las guías de acción definidas por la administración de los datos.
El Administrador de Bases de Datos es responsable primordialmente de:
  • Administrar la estructura de la Base de Datos.
  • Administrar la actividad de los datos.
  • Administrar el Sistema Manejador de Base de Datos.
  • Establecer el Diccionario de Datos.
  • Asegurar la confiabilidad de la Base de Datos.
  • Confirmar la seguridad de la Base de Datos.
Administrar la estructura de la Base de Datos.
Esta responsabilidad incluye participar en el diseño inicial de la base de datos y su puesta en practica así como controlar, y administrar sus requerimientos, ayudando a evaluar alternativas, incluyendo los DBMS a utilizar y ayudando en el diseño general de la bases de datos. En los casos de grandes aplicaciones de tipo organizacional, el DBA es un gerente que supervisa el trabajo del personal de diseño de la BD.
          Una vez diseñada las bases de datos, es puesta en práctica utilizando productos del DBMS, procediéndose entonces a la creación de los datos (captura inicial). El DBA participa en el desarrollo de procedimientos y controles para asegurar la calidad y la alta integridad de la BD.
            Los requerimientos de los usuarios van modificándose, estos encuentran nuevas formas o métodos para lograr sus objetivos; la tecnología de la BD se va modificando y los fabricantes del DBMS actualizan sus productos. Todas las modificaciones en las estructuras o procedimientos de BD requieren de una cuidadosa administración.


Leer más: http://www.monografias.com/trabajos19/administracion-base-datos/administracion-base-datos.shtml#ixzz3uLBsl4Hs

(SGBD) BD DISTRIBUIDAS

Bases de datos distribuidas

Una base de datos distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos y geográficos (pej. un servidor corriendo 2 máquinas virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamiento autónomo, esto permite realizar operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si estos fueran accedidos de forma local.
Un sistema distribuido de bases de datos se almacenan en varias computadoras. Los principales factores que distinguen un SBDD de un sistema centralizado son los siguientes:
  • Hay múltiples computadores, llamados sitios o nodos.
  • Estos nodos deben de estar comunicados por medio de algún tipo de red de comunicaciones para transmitir datos y órdenes entre los sitios.

(SGBD) LENGUAJES

Todos los SGBD ofrecen lenguajes e interfaces apropiadas para cada tipo de usuario: administradores,diseñadores, programadores de aplicaciones y usuarios finales. Los lenguajes van a permitir al administrador de la BD especificar los datos que componen la BD, su estructura, las relaciones que existen entre ellos, las reglas de integridad, los controles de acceso, las características de tipo físico y las vistas externas de los usuarios. Los lenguajes del SGBD se clasifican en:
- Lenguaje de definición de datos (LDD o DDL): se utiliza para especificar el esquema de la BD, las vistas de los usuarios y las estructuras de almacenamiento. Es el que define el esquema conceptual y el esquema interno. Lo utilizan los diseñadores y los administradores de la BD.
- Lenguaje de manipulación de datos (LMD o DML): se utilizan para leer y actualizar los datos de la BD. Es el utilizado por los usuarios para realizar consultas, inserciones, eliminaciones y modificaciones. Los hay procedurales, en los que el usuario será normalmente un programador y especifica las operaciones de acceso a los datos llamando a los procedimientos necesarios. Estos lenguajes acceden a un registro y lo procesan. Las sentencias de un LMD procedural están embebidas en un lenguaje de alto nivel llamado anfitrión. Las BD jerárquicas y en red utilizan estos LMD procedurales.
No procedurales son los lenguajes declarativos. En muchos SGBD se pueden introducir interactivamente instrucciones del LMD desde un terminal, también pueden ir embebidas en un lenguaje de programación de alto nivel. Estos lenguajes permiten especificar los datos a obtener en una consulta, o los datos a modificar, mediante sentencias sencillas. Las BD relacionales utilizan lenguajes no procedurales como SQL (Structured Quero Language) o QBE (Query By Example).
- La mayoría de los SGBD comerciales incluyen lenguajes de cuarta generación (4GL) que permiten al usuario desarrollar aplicaciones de forma fácil y rápida, también se les llama herramientas de desarrollo. Ejemplos de esto son las herramientas del SGBD ORACLE: SQL Forms para la generación de formularios de pantalla y para interactuar con los datos; SQL Reports para generar informes de los datos contenidos en la BD; PL/SQL lenguaje para crear procedimientos que interractuen con los datos de la BD.

    (SGBD) FUNCIONALES

    (SGBD) FUNCIONALES
    Las variables funcionales se caracterizan por la evolución de una variable a lo largo del tiempo (proceso estocástico), de modo que los valores que toman son funciones en lugar de  vectores como en análisis multivariante clásico. La imposibilidad de medir la mayoría de estas variables continuamente en el tiempo, unida a la complejidad teórica de muchos de los métodos estadísticos disponibles para su análisis llevan a que se manejen resúmenes periódicos que constituyen las series temporales contenidas normalmente en los anuarios estadísticos. Aunque existen muchas técnicas para la modelización y predicción de datos temporales discretos, la mayoría de ellas, como por ejemplo la teoría clásica de Box-Jenkins, imponen que se verifiquen hipótesis bastante restrictivas como estacionariedad, observaciones igualmente espaciadas o pertenencia a una clase de procesos específica. 


    Estos problemas han planteado la necesidad de desarrollar metodologías potentes que permitan, en la práctica, la modelización y predicción a partir de datos funcionales dando lugar a una especialidad estadística muy reciente conocida con el nombre de Análisis de Datos Funcionales (FDA), que en la actualidad está siendo objeto de un estudio intensivo por parte de los investigadores. Los primeros trabajos en FDA estuvieron dedicados a la generalización de la técnica de reducción de dimensión Análisis en Componentes Principales (ACP) al caso funcional. Posteriormente las investigaciones en FDA se han centrado en el desarrollo de modelos de regresión funcional  y sus aplicaciones en diferentes campos como la economía, el medioambiente o las ciencias de la salud.

    • Conocer las nociones básicas sobre variables funcionales (procesos estocásticos) de segundo orden.
    • Manejar los métodos matemáticos de aproximación de funciones de cuadrado integrable (interpolación, aproximación mínimo cuadrática, …) a partir de bases de funciones (trigonométricas, splines, wavelets, ..).
    • Estudiar la técnica de reducción de dimensión Análisis en Componentes Principales Funcional (ACPF) y métodos de estimación a partir de observaciones en tiempo discreto de las funciones muestrales.
    • Conocer la formulación, estimación muestral e implementación computacional, así como la aplicación con datos reales e interpretación de resultados, de modelos de predicción en componentes principales (PCP) de una variable funcional.
    • Relacionar los modelos PCP con los modelos más generales de regresión lineal funcional.
    • Conocer la formulación, estimación muestral e implementación computacional, así como la aplicación con datos reales e interpretación de resultados, de modelos de regresión logística para estimar una variable binaria a partir de un predictor funcional relacionado.

    Sistema de Gestión de Bases de Datos

    Sistema de Gestión de Bases de Datos

    Un sistema gestor de base de datos (SGBD) es un conjunto de programas que permiten el almacenamiento, modificación y extracción de la información en una base de datos, además de proporcionar herramientas para añadir, borrar, modificar y analizar los datos. Los usuarios pueden acceder a la información usando herramientas específicas de interrogación y de generación de informes, o bien mediante aplicaciones al efecto.
    Estos sistemas también proporcionan métodos para mantener la integridad de los datos, para administrar el acceso de usuarios a los datos y para recuperar la información si el sistema se corrompe. Permiten presentar la información de la base de datos en variados formatos. La mayoría incluyen un generador de informes. También pueden incluir un módulo gráfico que permita presentar la información con gráficos y tablas.
    Hay muchos tipos distintos según cómo manejen los datos y muchos tamaños distintos de acuerdo a si operan en computadoras personales y con poca memoria o grandes sistemas que funcionan en mainframes con sistemas de almacenamiento especiales.
    Generalmente se accede a los datos mediante lenguajes de interrogación, lenguajes de alto nivel que simplifican la tarea de construir las aplicaciones. También simplifican la interrogación y la presentación de la información. Un SGBD permite controlar el acceso a los datos, asegurar su integridad, gestionar el acceso concurrente a ellos, recuperar los datos tras un fallo del sistema y hacer copias de seguridad. Las bases de datos y los sistemas para su gestión son esenciales para cualquier área de negocio, y deben ser gestionados con esmero.

    Sistema de ficheros de base de datos

    Sistema de ficheros de base de datos

    El sistema de ficheros guarda de forma persistente la información que necesita el sistema informático. En los sistemas operativos tipo Unix, el árbol de ficheros es una metáfora que permite acceder a todos los elementos del sistema. Los datos, los programas, los procesos y los dispositivos están representados en el árbol de ficheros.
    Como se explicó en la introducción al sistema de ficheros, en el SO coexisten distintas visiones del sistema de ficheros. La de más alto nivel es la que se expresa mediante el árbol de ficheros y directorios (que en Unix tiene una sola raiz, / ) y la de más bajo nivel concreta cómo se guardan la información físicamente en el dispositivo que contiene el sistema de ficheros.

    Tipos de sistemas de ficheros

    La función básica de un sistema de ficheros (en inglés file system) es preservar la información en un dispositivo de almacenamiento como un disco duro, o un DVD. Esta tarea se puede realizar de diferentes modos en función de la información que se va a guardar, las características del medio y el tipo de accesos que se van a realizar.
    No obstante, existen sistemas de ficheros especializados que pueden tener otras funciones, como servir de interfaz entre el administrador y el núcleo del sistema informático, u otras funciones.
    Tipos de sistemas de archivos:
    De disco:
    Tienen por función guardar ficheros en un dispositivo de almacenamiento. Algunos FS pueden soportar Journaling, una técnica que utiliza un diario para guardar los datos necesarios para restablecer un estado consistente del sistema de archivos tras un fallo. 
    Algunos FS de disco son:  EXTFATISO9660NTFSJFSReiserFS y XFS
    De red: 
    Permiten compartir ficheros entre diferentes dispositivos conectados a una red. 
    Algunos FS de red son: CIFS y NFS.
    De base de datos:
    En lugar de guardar los ficheros de forma jerárquica, se utiliza una base de datos para guardar los ficheros indexados por su metainformación (nombre, permisos, tipo de fichero, etc..). Es posible realizar búsquedas de ficheros en SQL o un lenguaje natural.
    Algunos FS de base de datos son: BFSGnome VFS y WinFS.
    De propósito específico:
    Sistemas de ficheros que, por ejemplo, tienen por función mostrar ficheros de dispositivo (Udev), permitir que el núcleo muestre los procesos que controla (procfs) o permitir que núcleo utilice un espacio de almacenamiento secundario para la gestión de la memoria virtual (swap).

    Administración de sistemas de ficheros

    Desde el punto de vista del administrador, las operaciones a realizar con los sistemas de ficheros incluyen:
    • Creación
    • Montado/Desmontado
    • Copias de seguridad
    • Comprobaciones/reparaciones

    Creación de un sistema de ficheros

    Antes de utilizar un dispositivo de almacenamiento debe crearse un sistema de ficheros en su interior. Por ejemplo, un disco duro puede dividirse en 2 particiones, cada partición es un dispositivo de almacenamiento, en cada una de ellas se debe crear un sistema de archivos antes de poder escribir/ficheros.
    En GNU/Linux se utiliza la herramienta mkfs para crear sistemas de ficheros. mkfs es símplemente una interfaz para llamar a la herramienta encargada de crear el tipo de sistema de ficheros especificado (mkfs.bfsmkfs.ext2mkfs.ext3mkfs.minixmkfs.msdosmkfs.vfatmkfs.xfs, ...). Para cada sistema de ficheros se pueden especificar diferentes opciones durante su creación, las páginas de manual del comando mkfs.* correspondiente enumeran los detalles.