Cuando es necesario salvaguardar grandes cantidades de información, las empresas deben entender cómo hacerlo. Al conocer los conceptos comunes de las bases de datos, como la integridad de los datos y la integridad referencial, puede mejorar su comprensión de la protección de datos.
En este artículo, definimos la integridad de los datos y la integridad referencial y enumeramos algunas similitudes y diferencias entre ambos conceptos.
Relacionado: ¿Cuáles son los diferentes tipos de bases de datos?
¿Qué es la integridad de los datos?
La exactitud general de los datos de una base de datos se denomina integridad de los datos. Las reglas y los procedimientos de introducción de datos se establecen en el diseño de una base de datos. Una fuerza externa que intente acceder a los datos almacenados en una base de datos o modificarlos está protegida por la integridad de los datos. La integridad de los datos garantiza que los datos sean completos y precisos, independientemente del tiempo que se conserven o de la frecuencia con la que se utilicen. Además de mantener la integridad de los datos, una base de datos también puede protegerse de fuerzas externas.
Un ejemplo de proceso que garantiza la integridad de los datos es una regla en el diseño de la tabla o base de datos que requiere que todos los números sean enteros positivos. Esto puede evitar la confusión y garantizar la uniformidad de todos los datos. Sin embargo, hay una variedad de tipos de integridad de datos que puede tener una base de datos. A continuación se presentan dos tipos diferentes de integridad de datos:
Integridad física
La integridad física es la protección de los datos almacenados contra cualquier evento que impida su recuperación. Algunos ejemplos de eventos que comprometen la integridad física son las catástrofes naturales, los cortes de energía o la piratería informática. Estos eventos comprometen la integridad física porque ya no se puede acceder a los datos. Los errores humanos o la erosión del almacenamiento también pueden impedir que se pueda acceder a la base de datos y recuperar los datos, lo que los convierte en un desafío para la integridad física a pesar de no ser eventos físicos específicos.
Integridad lógica
La integridad lógica se refiere a la necesidad de que los datos tengan sentido dado su contexto dentro de la base de datos. La integridad lógica requiere que los datos sean precisos, completos e inalterables. También se basa en las protecciones contra los errores humanos y los hackers para preservar la lógica de los datos, en lugar de su accesibilidad. La integridad referencial es un tipo de integridad lógica, pero también hay otros tres tipos:
- Integridad de la entidad: La integridad de la entidad es la creación de valores únicos que se asignan a piezas de datos para evitar que se dupliquen los datos. Permite vincular datos de distintas tablas en una base de datos, lo que significa que la información de una tabla puede aparecer automáticamente en otra.
- Integridad del dominio: Un dominio es un conjunto de valores que puede tener dentro de una columna, según los criterios de la base de datos. El dominio puede tener limitaciones basadas en el valor, el formato o la cantidad de datos. La integridad del dominio se refiere a los procesos dentro de una base de datos que aseguran que los datos dentro de la tabla están dentro del dominio.
- Integridad definida por el usuario: La integridad definida por el usuario se refiere a las reglas y restricciones que el usuario sigue para adaptarse a sus necesidades particulares. Una base de datos puede requerir este tipo de integridad si la empresa que utiliza la base de datos tiene sus propias reglas y restricciones a las que se adhiere dentro de su base de datos.
Relacionado: 15 Funciones Básicas de SQL y Cómo Utilizarlas
¿Qué es la integridad referencial?
La integridad referencial es un concepto que insiste en que cada referencia de una tabla a otra es legítima para que cualquier cambio en una tabla afecte a los datos relevantes vinculados a ella. Esto se consigue mediante una serie de procesos que confirman que se están almacenando y manipulando los datos de manera uniforme en todas las tablas. Estos procesos están dentro de la estructura de la base de datos para garantizar que cuando se produzcan cambios, adiciones o eliminaciones de datos, no comprometan los datos de otras partes de la base de datos. Estas reglas evitan que se dupliquen datos accidentalmente y ayudan a garantizar que los datos sean precisos y relevantes.
La integridad referencial de una base de datos muestra la fiabilidad de los datos. Un ejemplo de esto sería si hay dos tablas, una con información de contacto de clientes y otra con informes de ventas. En una base de datos con integridad referencial, cada vez que usted actualice la información de un cliente en la tabla de información de contacto, la base de datos actualizará los mismos datos en la tabla de informes de ventas. Esto elimina los errores que se pueden cometer al introducir los mismos datos varias veces en diferentes lugares.
Relacionado: Tipos de lenguajes de bases de datos y sus usos (con ejemplos)
Similitudes entre la integridad referencial y la integridad de los datos
La integridad referencial es una parte de la integridad de los datos, por lo que existen algunas similitudes entre ambos conceptos:
Precisión
Tanto la integridad referencial como la integridad de los datos se refieren a la exactitud de los datos que se almacenan. Ambas tienen procesos en el diseño del software que mantienen la exactitud de los datos, para que sigan siendo completos y manipulables dentro de la base de datos. La exactitud de los datos es esencial para que una base de datos funcione, ya que sin ella, la base de datos no puede almacenar datos de forma fiable.
Relacionado: Preguntas y respuestas sobre la entrevista con la base de datos para ayudarle a prepararse
Riesgo
Dado que la integridad referencial es una parte de la integridad de los datos, ambas conllevan algunos de los mismos riesgos. Uno de los mayores riesgos es el error humano. Si una persona introduce información y no sigue los protocolos adecuados, puede comprometer la integridad de los datos. Si comprometen alguna de las referencias entre tablas, pueden perder específicamente la integridad referencial.
Otros tipos de errores también pueden afectar a la integridad de los datos de su base de datos:
- Errores de transferencia: Los errores de transferencia se producen cuando los datos de una tabla no pueden transferirse a otra. Estos errores pueden producirse cuando se introduce un dato erróneo o falta en la tabla principal, o cuando la tabla original alberga el primer conjunto de datos que se intenta vincular a la segunda tabla.
- Bichos y virus: Los errores y los virus son piezas de software que pueden corromper sus datos, comprometiendo la integridad de los mismos.
- Hardware comprometido: El hardware comprometido puede incluir fallos en el ordenador o en el servidor, y puede hacer que tus datos se guarden incorrectamente, que se borren partes de tus datos o que sea imposible acceder a la base de datos.
Restricciones
Para crear procedimientos que garanticen la exactitud de los datos, tiene restricciones sobre cómo almacenar los datos. Por ejemplo, puede crear una tabla con los nombres de las personas invitadas a una fiesta y una segunda tabla que haga referencia a esos nombres para mostrar lo que le va a regalar a cada persona. Si su base de datos tiene integridad referencial, no puede registrar en la segunda tabla un regalo que piensa hacer a alguien que no ha invitado a la fiesta. La lista de personas invitadas a la fiesta en la primera tabla restringe la lista de personas que reciben un regalo.
La integridad de los datos puede requerir restricciones similares que limiten la forma de introducirlos. Normalmente, los datos tienen que introducirse en el mismo formato y estilo para permitir las referencias y evitar la duplicación o corrupción de datos. Aunque estas restricciones pueden complicar las bases de datos, en última instancia protegen los datos y se puede trabajar en torno a ellas para mantener la integridad de la base de datos.
Relacionado: 14 tipos de documentación para el desarrollo de software (más consejos)
Diferencias en la integridad de los datos y la integridad referencial
Estas son algunas de las diferencias entre la integridad de los datos y la integridad referencial:
Amplitud
La integridad referencial es sólo una parte de la integridad de los datos. Además de los otros tipos de integridad enumerados anteriormente, la integridad de los datos también abarca los siguientes conceptos:
- Seguridad de los datos: La seguridad de los datos es el conjunto de medidas que toma un usuario para evitar que los datos se corrompan por ataques externos. Un ejemplo de ello es cambiar frecuentemente la contraseña.
- Calidad de los datos: La calidad de los datos son los estándares establecidos por las necesidades de su empresa. La antigüedad, relevancia, precisión y fiabilidad de los datos pueden afectar a su calidad. Por ejemplo, los datos recogidos más recientemente son de mayor calidad.
Enfoque
Los procedimientos de integridad referencial se centran específicamente en la relación entre tablas y en asegurarse de que los datos son coherentes. Las reglas de integridad de los datos se centran en la entrada y recuperación de los datos. Ambas son necesarias para el correcto funcionamiento de la base de datos, pero ocurren en momentos diferentes. Las reglas comunes de integridad de datos, como la que dice que todos los datos deben ser un número entero positivo, se producen al introducir los datos. Las comprobaciones de integridad referencial se producen cuando se construyen las relaciones entre las tablas.
Cumplimiento
La integridad de los datos es clave para cumplir con la normativa que protege a las empresas de las sanciones causadas por ser imprudentes con los datos personales de sus clientes. Por ejemplo, en EE.UU. existen diversas normativas de protección de datos en función del estado, además de la Ley de la Comisión Federal de Comercio, que hace referencia a la protección de datos a nivel federal. La integridad referencial es una parte de la integridad de los datos, pero no afecta a la seguridad de la información personal.