Bases de Données Avancées (BDA)

Description

Ce module aborde un thème qui fait actuellement l'objet de nombreux travaux en bases de données et qui vise à étendre les langages d'interrogation pour les rendre capables de traduire plus fidèlement les besoins (préférences) de l'utilisateur. Dans le cours, différentes approches et outils pour l’interrogation flexible (à l'aide de requêtes à préférences) sont présentés. Après avoir motivé l'utilisation de préférences, nous catégorisons les approches existantes en deux familles : quantitatives d'une part (fondées sur un calcul de score) et qualitatives d'autre part (fondées sur des relations de préférence binaires). La première famille est ensuite particulièrement détaillée, au travers de son représentant le plus notoire, i.e., l'approche fondée sur la théorie des ensembles flous. La deuxième famille est présentée plus brièvement dans la dernière partie du cours, au travers de l'approche appelée Skyline, fondée sur l'ordre de Pareto. Un projet de 10h complète le cours, qui a pour objet la construction un système d'exploration personnalisée de données.

Mots-clés

Requêtes à préférences, logique floue, ordre de pareto, requêtes Skyline.

Contenu

  1. Cours (20h) : Requêtes à préférences
    1. Introduction
    2. Notions de base relatives aux ensembles flous
    3. Expression de requêtes floues simples
    4. Evaluation de requêtes floues simples
    5. Une approche qualitative de requêtes à préférences : Skyline
  2. Projet (10h) : Exploration personnalisée de données
    1. Représentation d'un vocabulaire linguistique personnalisé composé de descripteurs modélisés par des sous-ensembles flous
    2. Réécriture les données brutes (numériques et catégorielles) selon les descripteurs du vocabulaire utilisateur
    3. Quantification du caractère informatif de chaque terme au sein du résumé linguistique

Compétences acquises

  • Savoir
    • Théorie des ensembles flous
    • Langage de requête flou (SQLf)
    • Expression et évaluation de requêtes Skyline
    • Interrogation floue de données (PostgreSQLf)
    • Résumé linguistique et personnalisé de données
    • Visualisation de données
  • Savoir-faire
    • Formuler un besoin d'information à l'aide de préférences complexes
    • Comprendre les différentes étapes de l'évaluation d'une requête à préférences
    • Programmer rapidement un prototype de recherche (manipulation de données et visualisation)

Enseignants

Olivier Pivert (responsable), Grégory Smits