U-statistiques

Propriétés asymptotiques de U-processus en longue mémoire

C. Lévy-Leduc, H. Boistard, E. Moulines, M. S. Taqqu and V. A. Reisen.

Article paru dans Annals of Statistics, vol. 39, n. 3, p. 1399-1426, 2011. Télécharger une version.

Soit $$(X_i)_{i\geq1}$$ un processus gaussien centré de covariance $$\rho(k) = E(X_1X_{k+1})$$ qui satisfait :
$$\rho(0=1$$ et $$\rho(k)=k^{-D}L(k)$$ où D appartient à (0,1) et L est une fonction à variations lentes à l’infini. Considérons le U-processus $$\{U_n(r), r \in I\}$$ défini par
$$U_n(r)=\frac{1}{n(n-1)}\sum_{1\leq i\neq j \leq n}\mathbb{1}_{\{G(X_i,X_j\leq r\}},$$
où I est un intervalle de $$\mathbb{R}$$ et G est une fonction symétrique. Dans cet article, nous donnons des théorèmes de la limite centrale de la limite non centrale pour $$U_n$$. Ils sont utilisés pour déduire dans le cadre de la longue mémoire, de nouvelles propriétés de nombreux estimateurs connus comme l’estimateur de localisation robuste de Hodges-Lehmann, la statistique de rang de Wilcoxon, l’intégrale de corrélation empirique et un estimateur d’échelle associé. On observe que ces estimateurs robustes ont la même distribution asymptotique que les estimateurs de localisation et d’échelle classiques. Les distributions limites sont exprimées en termes d’intégrales de Wiener-Itô multiples.

Théorème de la limite centrale pour des intégrales multiples par rapport au processus empirique

Travail en collaboration avec Eustasio del Barrio.

Article paru dans Statistics and Probability Letters, vol. 79(2), p. 188-195, 2009. Télécharger une version de l’article.

Dans cet article, nous donnons des résultats de convergence faible d’intégrales multiples par rapport au processus empirique. Nous considérons des objets du type
$$J_{n,m}(h)=\int’h(x_1, \dots, x_m)d\mathbb{G}_n(x_1)\dots \mathbb{G}_n(x_m),$$
où h est une fonction réelle symétrique de carré intégrable de m variables, l’échantillon $$X_1, \dots, X_n$$ est supposé i.i.d. de loi P, $$\mathbb{P}_n=\frac{1}{n}\sum_{i=1}^n\delta_{X_i}$$ et $$\mathbb{G}_n=\sqrt{n}(\mathbb{P}_n-P)$$ sont respectivement la mesure empirique et le processus empirique. $$\int’$$ est l’intégrale en dehors de la diagonale. Nous incluons le cas de noyaux non dégénérés par rapport à la distribution sous-jacente. Nos résultats sont reliés à des résultats antérieurs sur les U-statistiques. Nous introduisons une intégrale stochastique par rapport au pont brownien qui nous permet d’exprimer la limite de manière unifiée dans les cas dégénéré et non dégénéré. L’utilisation de l’intégrale multiple par rapport au processus empirique présente un avantage par rapport aux U-statistiques : le Théorème de la Limite Centrale que nous obtenons est plus simple. Il ne met pas en jeu la dégénération du noyau et la limite est exprimée de façon précise.

Thèse : efficacité asymptotique de tests liés à la statistique de Wasserstein

Thèse sous la direction de Eustasio del Barrio et Fabrice Gamboa, soutenue le 16 juillet 2007 à Valladolid, devant le jury composé de MM. Jean-Marc Azaïs, Bernard Bercu, Eustasio del Barrio, Fabrice Gamboa et Carlos Matrán.
Cette thèse comporte trois parties. Dans une première partie, nous étudions certaines propriétés asymptotiques des intégrales multiples par rapport au processus empirique. La seconde partie est consacrée à l’étude de l’efficacité asymptotique du test de Wasserstein. L’équivalence de la statistique de Wasserstein avec une intégrale double par rapport au processus empirique permet d’appliquer les résultats asymptotiques de la première partie. Une étude de simulation complète l’étude de la puissance asymptotique. La troisième partie aborde les grandes déviations des L-statistiques. Un théorème de grandes déviations est obtenu en utilisant la topologie de la distance de Wasserstein sur l’espace des mesures, sous des conditions d’extrêmes.