
Νέο μοντέλο AI ιεραρχεί γενετικές παραλλαγές από σοβαρές σε ήπιες μεταλλάξεις
Σύμφωνα με μια πρόσφατη μελέτη που δημοσιεύθηκε στο περιοδικό Nature Genetics, ερευνητές ανέπτυξαν ένα καινοτόμο μοντέλο που συνδυάζει βαθιά εξελικτικά σήματα με δεδομένα ανθρώπινων πληθυσμών, επιτρέποντας την ιεράρχηση των μεταλλάξεων που σχετίζονται με ασθένειες. Αυτή η προσέγγιση αναδεικνύει γενετικά γονίδια που προηγουμένως παρέμεναν κρυμμένα, προσφέροντας στους κλινικούς ιατρούς ένα ισχυρό εργαλείο για την προτεραιοποίηση παραλλαγών σε περιπτώσεις που δεν έχουν ακόμα επιλυθεί.
Η σημασία της ιεράρχησης των μεταλλάξεων
Περίπου το 25% των ατόμων με σπάνιες ασθένειες καταφέρνουν να λάβουν μια γενετική διάγνωση, ακόμα και μετά από πλήρη αλληλούχιση εξωσωμάτων (WES), αφήνοντας πολλές οικογένειες χωρίς απαντήσεις ή κατεύθυνση θεραπείας. Οι κλινικοί ιατροί πρέπει να εξετάσουν εκατομμύρια παραλλαγές σε κάθε γονιδίωμα, ωστόσο, οι περισσότερες υπολογιστικές εργαλεία επικεντρώνονται σε αλλαγές εντός ενός μόνο γονιδίου, δυσχεραίνοντας την κατανόηση της σοβαρότητας μιας παραλλαγής.
Η καινοτομία του μοντέλου popEVE
Το μοντέλο που αναπτύχθηκε, γνωστό ως popEVE, είναι ένα πρωτοποριακό εργαλείο που συνδυάζει πληροφορίες από την εξελικτική διαδικασία και περιορισμούς του ανθρώπινου πληθυσμού για να ιεραρχήσει τις παραλλαγές missense σε όλο το γονιδίωμα. Η εξελικτική πληροφορία προήλθε από δύο μη επιβλεπόμενα μοντέλα πρωτεϊνών, το Evolutionary Model of Variant Effect (EVE) και το Evolutionary Scale Modeling 1 variant (ESM-1v), τα οποία εκπαιδεύτηκαν με βάση τις αλληλουχίες πρωτεϊνών.
Ένας περιορισμός πληθυσμού εισήχθη μέσω μιας λανθάνουσας γκαουσιανής διαδικασίας, η οποία κατέγραψε τη σχέση μεταξύ των εξελικτικών βαθμολογιών και της αντοχής στις παραλλαγές από τη βάση δεδομένων του Ηνωμένου Βασιλείου (UKBB) και τη Γενετική Συγκέντρωση Δεδομένων (gnomAD). Για να μειωθεί η προκατάληψη της καταγωγής, το μοντέλο χρησιμοποίησε έναν απλό δείκτη παρουσίας/απουσίας.
Αξιολόγηση και αποτελέσματα
Η απόδοση του popEVE αξιολογήθηκε σε σύγκριση με κορυφαίους προγνωστικούς αλγόριθμους, όπως οι AlphaMissense και Bayesian Deleteriousness (BayesDel), χρησιμοποιώντας ετικέτες ClinVar και βαθιές μεταλλαξιακές σαρώσεις. Τα αποτελέσματα έδειξαν ότι το popEVE ήταν πιο αποτελεσματικό στην καταγραφή της σοβαρότητας των ασθενειών. Οι παθογενείς παραλλαγές που σχετίζονται με παιδικούς θανάτους παρουσίασαν υψηλότερους βαθμούς επιβλαβούς φύσης σε σύγκριση με αυτές που σχετίζονται με θανάτους στην ενήλικη ζωή.
Στην ομάδα με σοβαρές αναπτυξιακές διαταραχές, οι βαθμοί DNM μετατοπίστηκαν προς μεγαλύτερη επιβλαβότητα σε σχέση με τους μάρτυρες, με την αύξηση της συγκέντρωσης να παρατηρείται σε αυστηρές κατηγορίες. Ένας γκαουσιανός μίγμα καθόρισε ένα σοβαρό όριο, το οποίο επιβεβαίωσε την αξιοπιστία του μοντέλου στην κατηγοριοποίηση των παραλλαγών.
Οι ερευνητές επισημαίνουν ότι απαιτείται περαιτέρω έρευνα για την ανάπτυξη βαθμολόγησης που θα διακρίνει τις καλοήθεις από τις πραγματικά επιβλαβείς παραλλαγές, με στόχο την επιτάχυνση της διάγνωσης σπάνιων ασθενειών παγκοσμίως.














