Programme Officiel

Contenus

Capacités attendues

Commentaires

Base de données relationnelle.

Savoir distinguer la structure d’une base de données de son contenu.

Repérer des anomalies dans le schéma d’une base de données.

La structure est un ensemble de schémas relationnels qui respecte les contraintes du modèle relationnel.

Les anomalies peuvent être des redondances de données ou des anomalies d’insertion, de suppression, de mise à jour.

On privilégie la manipulation de données nombreuses et réalistes.

Lien vers le programme complet

Nous allons voir plus en détail ce que sont les bases de données relationnelles, et mettre en évidence quelques anomalies qui peuvent être rencontrées.

Vocabulaire

Nous allons définir le vocabulaire de l'algèbre relationnelle inventée en 1970 par Edgar Frank Codd, et le mettre en relation avec le vocabulaire plus abordable des tableaux.

Table relationnel

Relation

Dans le modèle relationnel, les données sont stockées dans des tables, aussi appelées relations.

L'illustration ci-dessus présente une relation appelée voiture.

Attribut

Le nom d'une colonne d'une relation est appelé attribut.

La relation voiture possède trois attributs: marque, couleur et plaque.

n-uplet

Un enregistrement (ligne) d'une relation est appelé n-uplet.

  • ID voiture, marque de la table voiture.
  • ID carburant, type de la table carburant.
Domaine

Le domaine d'un attribut est l'ensemble des valeurs qui peuvent être prises par cet attribut.

Une base de donnée sqlite il n'y a que cinq domaines de valeurs possibles:

  • NULL. La valeur est une valeur NULL.
  • INTEGER. La valeur est un entier signé, stocké dans 1, 2, 3, 4, 6 ou 8 octets en fonction de l'amplitude de la valeur.
  • REAL. La valeur est une valeur à virgule flottante, stockée sous forme de nombre à virgule flottante IEEE de 8 octets.
  • TEXT. La valeur est une chaîne de texte, stockée à l'aide du codage de la base de données (UTF-8, UTF-16BE ou UTF-16LE).
  • BLOB. La valeur est une donnée binaire brute, stocké exactement comme elle a été entrée.

En MariaDb il y a beaucoup plus de types avec notamment des formats pour les dates (voir doc).

Pour résumer, le tableau suivant montre celui, rigoureux, issu de l'algèbre relationnelle et celui, plus vague, correspondant à la représentation par table. Les termes de chaque ligne seront considérés comme équivalents, mais on privilégiera les premiers qui sont plus précis.

Terme de l'algèbre relationnelle

Terme de la représentation par table

Relation

Table

n-uplet

ligne

Nom d’attribut

Nom de colonne

Valeur d’attribut

Cellule

Domaine

Type

Philippe Rigaux sur sql.dbpedia.fr CC-BY-NC-SA

Clés primaire et secondaire

Chaque ligne de la table doit comporter un attribut qui l'identifie de façon unique, on l'appelle la clé primaire.

  • Dans la table voiture l'attribut plaque pourrait constituer la clé primaire.
  • En s'inscrivant sur un site, on vous impose d'utiliser un identifiant unique pour créer votre ligne dans la base de données.
  • L'email d'un utilisateur peut servir de clé primaire, mais ce n'est pas conseillé.
 

On préférera utiliser une clé primaire complètement indépendante des données métier, afin de s'assurer que le champ est toujours rempli et n'évolue pas dans le temps.

Toutes les bases de données proposent des mécanismes prenant en charge une numérotation utilisable pour les clés primaires.

Une clé secondaire ou clé étrangère est une clé utilisée dans une table pour faire référence à un enregistrement d'une autre table.

Relation.png
By Puerto01 at French Wikipedia, CC BY 2.5, Link

Dans la table voiture l'attribut ID carburant fait référence à la table de carburants: c'est une clé étrangère de la table voiture.

L'ensemble constitué d'une clé primaire et d'une clé étrangère sert à établir des relations entre tables.

Contraintes d'intégrité

Les SGBD modernes permettent de garder les données conformes au modèle relationnel. Trois types de contraintes d'intégrité font partie intégrante du modèle de données relationnel:

  • L'intégrité de clé primaire: cette règle stipule que chaque table doit avoir une clé primaire et que la ou les colonnes choisies pour être la clé primaire doivent être uniques et non nulles.

Dans la table voiture l'ID voiture ne pourrait pas être choisi comme clé primaire car deux enregistrements ont la valeur 1.

  • L'intégrité référentielle est une situation dans laquelle pour chaque information d'une table A qui fait référence à une information d'une table B, l'information référencée existe dans la table B.

Si vous tentez de supprimer la ligne 2 de la table carburant, le SGBD vous le refusera en raison de sa présence dans la table des voitures à la ligne de la BMW.

  • L'intégrité du domaine spécifie que toutes les colonnes d'une base de données relationnelle doivent être déclarées sur un domaine défini.

S'assurer qu'une valeur est bien un email, un numéro de téléphone ou un code postal.

Une fois la contrainte déclarée, le SGBD refusera toute modification du contenu de la base de données qui violerait une de ces règles et casserait l'intégrité.

Exemples d'anomalies

Nous allons montrer sur un l'exemple d'une base de donnée de DVD mal construite quels types d'anomalies peuvent apparaitre.

exemple de table de DVDs

Mirian Halfeld-Ferrari Université d'Orléans

Comme vous le voyez cette table est mal construite:

  • Les données sont redondantes: À chaque fois qu’un film apparaît, les valeurs pour le genre, length et rating apparaissent aussi.
  • Les attributs concernent à la fois le DVD et le film, il faudrait créer des tables séparées.

Maintenant intéressons-nous aux anomalies qui pourraient se présenter:

  • Anomalie de mise à jour: Que se passe-t-il si le film Elisabeth est renommé Élisabeth pour satisfaire les clients francophones?
  • Anomalie d’insertion: Que se passe-t-il avec l’insertion du n-uplet : 〈102,1/1/99, Elisabeth, drama,110, PG13〉
  • Anomalie de suppression: Que se passe-t-il lors de la suppression du DVD numéro 123?
Comment concevoir une base de données bien structurée?

Une base de données bien structurée:

  • Économise de l'espace disque en éliminant les données redondantes.
  • Maintient l'exactitude et l'intégrité des données.
  • Fournit un accès facile aux données utiles.

Le processus de conception peut-être scindé comme suit:

  1. Analyse des besoins, ou identification de l'objectif de votre base de données.
  2. Organisation des données en tableaux.
  3. Spécification des clés primaires et analyse des relations.