Software die revolutionair is, is gemaakt door onderzoekers van de National University of Singapore en het Agency for Science, Technology and Research. Dit programma heeft een hoge mate van nauwkeurigheid bij het voorspellen van chemische veranderingen in RNA-moleculen. De aanpak van het team, bekend als m6Anet, werd gepubliceerd in het gerenommeerde academische tijdschrift Nature Methods.
RNA-moleculen bevatten veel chemische verbindingen die bepalen hoe ze werken. Veelgebruikte methoden die door wetenschappers worden gebruikt om RNA te lezen, slagen er echter meestal niet in om deze RNA-modificaties te detecteren. De meest voorkomende RNA-modificatie is N6-Methylladenosine (m6A). Het vinden van RNA-modificaties heeft historisch gezien lang geduurd en is moeilijk gebleken omdat ze verband houden met menselijke ziekten zoals kanker.
Door gebruik te maken van directe Nanopore RNA-sequencing, konden de onderzoekers deze beperkingen overstijgen. Deze geavanceerde methode sequenteert niet-gemodificeerde RNA-moleculen samen met hun veranderingen. Ze produceerden m6Anet. Door gebruik te maken van een Multiple-Instance Learning (MIL)-techniek en directe Nanopore RNA-sequencinggegevens, traint de software diepe neurale netwerken om m6A nauwkeurig te detecteren.
Elk voorbeeld in traditionele machine learning krijgt één label toegewezen. Het vinden van m6A vraagt echter om een enorme hoeveelheid data met onduidelijke labels. Om dit probleem op te lossen, paste het team de MIL-methode toe. De MIL-kwestie houdt in dat je een omvangrijk fotoalbum hebt met een foto van een kat, begraven tussen miljoenen andere afbeeldingen. Probeer vervolgens, zonder labels als leidraad, die specifieke afbeelding te identificeren.
De wetenschappers toonden aan dat m6Anet de aanwezigheid van m6A van een enkel monster over soorten met hoge precisie kan voorspellen met een resolutie van één molecuul. Het vermogen om RNA-veranderingen in verschillende biologische monsters te herkennen, kan worden gebruikt om hun betekenis in een verscheidenheid aan toepassingen te begrijpen, zoals kankeronderzoek of plantengenomica. Dit is volgens Dr. Jonathan Goke, groepsleider van het Laboratorium voor Computational Transcriptomics bij ASTAR’s GIS.
Het AI-model is alleen gegevens tegengekomen van een menselijke steekproef. Zelfs monsters van soorten die het model nog nooit eerder is tegengekomen, kunnen worden gebruikt om RNA-modificaties nauwkeurig te identificeren. “De MIL-methode biedt een geavanceerd antwoord op deze moeilijke kwestie. Een beloning voor ons werk is dat het programma zo snel door de wetenschappelijke gemeenschap wordt overgenomen!” bevestigde co-leider van de studie Universitair hoofddocent Alexandre Thiery, Afdeling Statistiek en Data Science, NUS Faculteit Wetenschappen.
De wetenschappelijke gemeenschap heeft nu toegang tot en gebruik van de software en bevindingen van de studie. Het al lang bestaande probleem van het nauwkeurig en effectief identificeren van RNA-veranderingen wordt aangepakt door m6Anet, volgens professor Patrick Tan, uitvoerend directeur van ASTAR’s GIS. Met deze baanbrekende technologie kunnen onderzoekers in verschillende sectoren hun werk voortzetten. Ze zullen ook de functie van RNA-modificaties in plantengenomica en menselijke ziekten zoals kanker kunnen begrijpen.