Un nouvel outil améliore la recherche de gènes responsables de maladies

Un nouvel outil améliore la recherche de gènes responsables de maladies

Accueil » Santé » Maladies » Un nouvel outil améliore la recherche de gènes responsables de maladies

Un nouvel outil statistique développé par des chercheurs de l’Université de Chicago améliore la capacité de trouver des variantes génétiques responsables de maladies. L’outil, décrit dans un nouvel article publié le 26 janvier 2024 dans Génétique naturellecombine les données des études d’association pangénomique (GWAS) et les prédictions de l’expression génétique pour limiter le nombre de faux positifs et identifier plus précisément les gènes responsables et les variantes d’une maladie.

GWAS est une approche couramment utilisée pour identifier les gènes associés à une gamme de traits humains, y compris les maladies les plus courantes. Les chercheurs comparent les séquences du génome d’un grand groupe de personnes atteintes d’une maladie spécifique, par exemple, avec un autre ensemble de séquences provenant d’individus en bonne santé. Les différences identifiées dans le groupe de maladies pourraient indiquer des variantes génétiques qui augmentent le risque de cette maladie et justifieraient une étude plus approfondie.

Toutefois, la plupart des maladies humaines ne sont pas causées par une seule variation génétique. Au lieu de cela, ils sont le résultat d’une interaction complexe de plusieurs gènes, de facteurs environnementaux et d’une multitude d’autres variables. En conséquence, GWAS identifie souvent de nombreuses variantes dans de nombreuses régions du génome associées à une maladie.

La limite de GWAS, cependant, est qu’elle identifie uniquement l’association, et non la causalité. Dans une région génomique typique, de nombreuses variantes sont fortement corrélées les unes aux autres, en raison d’un phénomène appelé déséquilibre de liaison. En effet, l’ADN est transmis d’une génération à l’autre par blocs entiers et non par gènes individuels, de sorte que les variantes proches ont tendance à être corrélées.

“Vous pouvez avoir de nombreuses variantes génétiques dans un bloc qui sont toutes corrélées au risque de maladie, mais vous ne savez pas laquelle est réellement la variante causale”, a déclaré Xin He, Ph.D., professeur agrégé de génétique humaine et directeur principal. auteur de la nouvelle étude. “C’est le défi fondamental de GWAS, c’est-à-dire comment passer de l’association à la causalité.”

Pour rendre le problème encore plus difficile, la plupart des variantes génétiques se trouvent dans des génomes non codants, ce qui rend leurs effets difficiles à interpréter. Une stratégie courante pour relever ces défis consiste à utiliser les niveaux d’expression des gènes. Les loci de traits quantitatifs d’expression, ou eQTL, sont des variantes génétiques associées à l’expression des gènes.

La raison d’être de l’utilisation des données eQTL est que si un variant associé à une maladie est un eQTL d’un gène X, alors X est probablement le lien entre le variant et la maladie. Le problème avec ce raisonnement, cependant, est que des variantes proches et des eQTL d’autres gènes peuvent être corrélés avec l’eQTL du gène X tout en affectant directement la maladie, conduisant à un faux positif.

De nombreuses méthodes ont été développées pour désigner les gènes à risque de GWAS à l’aide des données eQTL, mais elles souffrent toutes de ce problème fondamental de confusion par les associations proches. En fait, les méthodes existantes peuvent générer des gènes faussement positifs dans plus de 50 % du temps.

Dans la nouvelle étude, le professeur He et Matthew Stephens, Ph.D., professeur Ralph W. Gerard et directeur des départements de statistique et professeur de génétique humaine, ont développé une nouvelle méthode appelée études d’association causales à l’échelle du transcriptome, ou cTWAS, qui utilise des techniques statistiques avancées pour réduire les taux de faux positifs. Au lieu de se concentrer sur un seul gène à la fois, le nouveau modèle cTWAS prend en compte plusieurs gènes et variantes. À l’aide d’un modèle de régression multiple bayésien, il peut éliminer les gènes et les variantes confondants.

“Si vous regardez un à la fois, vous obtiendrez des faux positifs, mais si vous regardez ensemble tous les gènes et variantes proches, vous avez beaucoup plus de chances de trouver le gène causal”, a-t-il déclaré.

L’article démontre l’utilité de cette nouvelle technique en étudiant la génétique des taux de cholestérol LDL. À titre d’exemple, les méthodes eQTL existantes ont désigné un gène impliqué dans la réparation de l’ADN, mais la nouvelle approche cTWAS a mis en évidence une variante différente du gène cible de la statine, un médicament couramment utilisé pour traiter l’hypercholestérolémie. Au total, cTWAS a identifié 35 gènes causals putatifs du LDL, dont plus de la moitié n’ont pas été signalés auparavant. Ces résultats indiquent de nouvelles voies biologiques et des cibles potentielles de traitement pour les LDL.

Le logiciel cTWAS est désormais disponible en téléchargement sur le site Web du laboratoire He. Il espère continuer à travailler dessus pour étendre ses capacités afin d’incorporer d’autres types de données « omiques », telles que l’épissage et l’épigénétique, ainsi que d’utiliser des eQTL provenant de plusieurs types de tissus.

“Le logiciel permettra aux gens d’effectuer des analyses reliant les variations génétiques aux phénotypes. C’est vraiment le principal défi auquel est confronté l’ensemble du domaine”, a-t-il déclaré. “Nous disposons désormais d’un bien meilleur outil pour établir ces liens.”

Parmi les autres auteurs de l’étude, « L’ajustement des facteurs de confusion génétiques dans les études d’association à l’échelle du transcriptome conduit à une détection fiable des gènes causals », figurent Siming Zhao, Wesley Crouse, Sheng Qian et Kaixuan Luo de l’Université de Chicago.

Publications similaires