Méthodes régularisées pour l’analyse de données multivariées en grande dimension : théorie et applications

Dans cette présentations nous nous intéressons au modèle linéaire général
(modèle linéaire multivarié) en grande dimension. Nous proposons un nouvel estimateur parcimonieux des coefficients de ce modèle qui prend en compte la dépendance
qui peut exister entre les différentes réponses. Cet estimateur est obtenu en estimant dans un premier temps la matrice de covariance des réponses puis en incluant cette matrice de covariance dans un critère Lasso. Les propriétés théoriques de cet
estimateur sont étudiées lorsque le nombre de réponses peut tendre vers l’infini plus
vite que la taille de l’échantillon. Plus précisément, nous proposons des conditions
générales que doivent satisfaire les estimateurs de la matrice de covariance et de son
inverse pour obtenir la consistance en signe des coefficients. Nous avons ensuite mis
en place des méthodes, adaptées à la grande dimension, pour l’estimation de matrices
de covariance qui sont supposées être des matrices de Toeplitz ou des matrices avec
une structure par blocs, pas nécessairement diagonaux. Ces différentes méthodes
ont enfin été appliquées à des problématiques de métabolomique, de protéomique et
d’immunologie.