REZIA (IRIT – Université Paul Sabatier – Institut Polytechnique de Toulouse) – Février 2021
Le projet s’intéresse à étudier la possibilité de générer des données réseaux en utilisant les techniques d’apprentissage profond. En effet, la génération de données réseaux permet d’effectuer des tests d’intrusions, des tests de performance, de compression…etc. L’objectif est de voir s’il est possible de générer des flux réseaux réalistes avec les méthodes d’apprentissage profond et d’étudier les limites de cette génération.
Le projet consiste à faire “apprendre” des modèles génératifs d’apprentissage profond sur des données réseaux collectées en laboratoire. Le modèle génératif jugé comme pertinent parmis ceux entrainées devra permettre de générer des flux réseaux le plus fidèlement possible (en-têtes et payloads). Dans un premier temps deux catégories d’architectures seront étudiées : les modèles génératifs à variables latentes et les modèles génératifs auto-regressifs. Pour les modèles à variables latentes les “VAEs” (modèles à variable latente explicite) et les “GANs” (modèles à variable latente implicite) seront abordés. Pour les modèles auto-regressifs deux architectures seront étudiées : Wavenet et Transformer. Wavenet utilise une architecture convolutive et Transformer une architecture basée sur des couches d’attention. Comparer ces deux catégories d’architecture permettra de voir s’il est possible de faire face à la limite principale de cette génération qui est la présence de données multimodales en réseaux (texte, voix, image).