Miten mikrobien ja suurempien eliöiden kokonaisuuksia voidaan tutkia?

Perinteisesti mikrobeja ja niiden isäntäeliöitä, kuten eläimiä tai kasveja, on tutkittu erikseen. Todellisuudessa ne kuitenkin muodostavat biologisen kokonaisuuden, jossa eliöt vuorovaikuttavat monin tavoin. Tämä katsausartikkeli esittelee käsitteitä ja menetelmiä, jotka liittyvät kokonaisvaltaisempaan lähestymistapaan.

Johdanto

Jokainen meistä kantaa mukanaan valtavaa kokoelmaa erilaisia mikrobeja: bakteereja, arkeoneja, mikroskooppisia sieniä sekä alkueläimiä. Tämä pätee useimpiin muihinkin eläinlajeihin, ovat ne sitten nisäkkäitä tai hyönteisiä. Myös monilla kasveilla on omat mikrobinsa. Joissakin tapauksissa eliöt eivät kykene selviytymään ilman tätä yhteiseloa eli symbioosia. Esimerkiksi jäkälät eivät ole yksittäisiä eliöitä, vaan sienten ja syanobakteerien tai viherlevien muodostamia kokonaisuuksia. Myös nisäkkäiden joukosta löytyy tiiviitä symbiooseja, tuttuna esimerkkinä lehmät, joiden pötsissä elävät mikrobit ovat olennaisen tärkeitä eläimen kuitupitoisen kasviravinnon ruoansulatukselle. Mikrobien ja isäntäeliön muodostamaa kokonaisuutta voidaan kutsua holobiontiksi, ja holobiontin tutkimista puolestaan holo-omiikaksi.

Holo-omiikka vaatii kattavia menetelmiä, koska sen tavoite on monimutkaisten biologisten kokonaisuuksien kuvailu. Menetelmien lähtökohta on molekyylibiologian keskeinen opinkappale: eliöiden perimä on DNA:ta, josta niiden solut tuottavat lähetti-RNA-välivaiheen kautta proteiineja. Proteiinit puolestaan ovat solujen tärkeimpiä rakennuspalikoita sekä työkaluja. Jokaiselle näistä kolmesta molekyylistä on oma mittausmenetelmänsä: DNA:lle genomiikka, RNA:lle transkriptomiikka, ja proteiineille proteomiikka. Kun mittauksia tehdään mikrobiyhteisöihin liittyen, jolloin pyritään mittaamaan kaikki tietyn tyyppiset molekyylit riippumatta niiden alkuperästä, menetelmien nimiin lisätään “meta-” etuliite. Neljäs yleinen menetelmä on metabolomiikka. Sen kohde ovat erilaiset aineenvaihdunnan tuottamat pienet molekyylit, jotka eivät sisälly kolmeen jo mainittuun luokkaan. Kun useita omiikoita yhdistellään samassa tutkimusprojektissa, voidaan puhua multiomiikasta. Holo-omiikka on usein myös multiomiikkaa, eli sisältää erilaisten molekyylien mittauksia sekä isäntäeliöstä että mikrobeista.

Eräs tunnetuimmista genomiikan projekteista, ihmisen perimää 1990-luvulta lähtien selvittänyt Human Genome Project, vaati yli kymmenen vuotta ja useamman miljardin euron verran rahaa. Nykyään yksittäisen ihmisgenomin mittaus on arkipäivää ja hinta liikkuu tuhansissa euroissa. Molekyylibiologian tutkimusprojektit ovat toki edelleen kalliita, jos mittauksia tehdään monista näytteistä ja useilla menetelmillä sekä mikrobit että isäntäeliö huomioiden. Suurimmat haasteet eivät kuitenkaan ole laboratorion menetelmiin liittyviä. Sen sijaan holo-omiikan hankalin vaihe on mittauksista saatavien valtavien tietomäärien tulkinta. Lisäksi mitattuihin molekyyleihin voivat vaikuttaa lukemattomat erilaiset tekijät, esimerkiksi ihmisiä tai muita eläimiä tutkittaessa elinympäristö, ruokavalio ja terveydentila. Biologisesti merkityksellisten tulosten löytäminen tällaisista aineistoista vaatii edistyneitä tilastollisia menetelmiä.

Kuvassa on esitetty kaaviolla erilaisia omiikoita.
Mittausmenetelmiä mikrobiomin ja isäntäeliön tutkimiseen. Kuva tehty BioRender.com-palvelussa.

Miten tutkimus tehtiin?

Artikkelimme ei ole tutkimusartikkeli, jossa esitellään yksittäisen tutkimusprojektin tuloksia, vaan katsausartikkeli. Katsausartikkelit kokoavat yhteen aiempia julkaisuja, ja kertovat siitä, minkälaista tutkimusta tietystä aihepiiristä on toistaiseksi tehty ja millaisin menetelmin. Meidän artikkelimme tavoitteena oli muun muassa tarjota lähestymistavasta kiinnostuneille tutkijoille lähtökohta siihen perehtymistä varten sekä pohjustaa keskustelua parhaista tilastollisista menetelmistä, koska tästä ei alalla vielä ole yksimielisyyttä. Artikkeli perustuu kirjoittajien omaan asiantuntemukseen ja laajoihin kirjallisuushakuihin — lähdeviitteitä on yli sata. Lisäksi työstimme kirjallisuuden pohjalta havainnollisia kuvia sekä taulukoita.

Mitä tutkimuksessa löydettiin?

Artikkelissa esittelemme erilaisia holo-omiikkaan sopivia tilastollisia menetelmiä. Tilastollisessa tutkimuksessa vertailtavia, tutkimuskohteesta mitattuja ominaisuuksia nimitetään yleisesti muuttujiksi. Perinteisessä tilastotieteessä mitattujen muuttujien määrä on pieni (esimerkiksi lehmän paino tai metaanintuotto grammoina vuorokaudessa), näytteiden määrä puolestaan suurempi (esimerkiksi kymmeniä tai satoja eläimiä). Holo-omiikkamittauksissa tilanne on poikkeuksetta päinvastainen: näytteiden määrä on aina pienempi kuin muuttujien, joita voi olla satojatuhansia tai miljoonia riippuen siitä, mitä mittauksia on tehty. Tämä hankaloittaa tilastovertailujen tekemistä.

Eräs tapa ratkaista holo-omiikkavertailujen haasteet ovat tilastolliset menetelmät, joissa pyritään tiivistämään yhteen mitattuja arvoja. Jos vaikkapa bakteerigeenin X ja lehmän proteiinin Y määrä ovat aina molemmat korkeita samoissa näytteissä, näiden voidaan ajatella kuuluvan yhteen. Yhdistelmien perusteella saadaan pienempi määrä uusia muuttujia, joita voidaan käyttää tilastovertailuissa. Tällaisia menetelmiä kutsutaan ulottuvuuksien vähentämiseksi. Niistä tunnetuin on 1900-luvun alussa kehitetty pääkomponenttianalyysi. Siinä aineisto ikään kuin siirretään uuteen koordinaatistoon, jonka ensimmäiset akselit sisältävät suurimman osan vaihtelusta. Uusimmasta päästä puolestaan on viime vuonna julkaistu MCFA (multiset correlation and factor analysis). Se voisi olla erityisen hyödyllinen holo-omiikkavertailuihin, koska sen päämääränä on selvittää, mikä osuus samasta näytteestä mitattujen muuttujien vaihtelusta on yhteistä, mikä puolestaan on ominaista tietylle mittaustyypille (vaikkapa isäntäorganismin transkriptomiikalle tai mikrobien metaproteomiikalle). Toistaiseksi MCFA:ta käyttäviä tutkimusraportteja ei vielä ole, mutta meidän kirjoittajaryhmästämme useampi aikoo hyödyntää sitä lähitulevaisuudessa.

Toinen holo-omiikkavertailuihin hyvin soveltuvien menetelmien luokka perustuu verkkoteoriaan, jossa mitattuja muuttujia ja niiden välisiä suhteita käsitellään verkkoina eli graafeina. Verkkoteorialla on lukemattomia sovelluksia eri tieteissä, ja se sopii hyvin biologisten aineistojen käsittelyyn. Eräs tämän tyyppinen menetelmä on alun perin genetiikkaan kehitetty WGCNA (weighted gene co-expression network analysis). Siinä yksittäisten mittaustulosten parittaisten vertailujen pohjalta rakennetaan “moduuleja”, jotka yhdistävät samankaltaisia mittauksia — tämän menetelmän voidaankin myös katsoa edustavan ulottuvuuksien vähentämistä. Menetelmää on jo käytetty useissa holo-omiikkajulkaisuissa, muun muassa loheen liittyvässä tutkimuksessa, jossa osa kirjoittajaryhmästämme oli mukana.

Näiden kahden esimerkin lisäksi esittelemme artikkelissamme useita muita menetelmiä, ja uusia julkaistaan jatkuvasti lisää. Osa menetelmistä on yleisluontoisia ja sopii minkä tahansa biologisen aineiston tutkimiseen, osa puolestaan on esimerkiksi erityisesti suunnattu käytettäväksi aineistoihin, joissa käsitellään mikrobeihin liittyviä mittaustuloksia. Koska holo-omiikka on molekyylibiologian erityisalana hyvin tuore, ei ole olemassa vakiintunutta käytäntöä siihen, mitkä tilastolliset menetelmät ovat parhaita.

Lopuksi

Molekyylibiologian mittausmenetelmien edistysaskeleet ovat mahdollistaneet entistä kattavamman tutkimuksen tekemisen. Näitä omiikoiksi kutsuttuja työkaluja sekä erilaisia tilastollisia menetelmiä käyttäen on mahdollista tarkastella kokonaista holobionttia, eli suurempaa isäntäeliötä sekä sitä asuttavia mikrobeja. Tämä on tärkeää, koska holobiontin osapuolien välillä voi olla monenlaisia vuorovaikutuksia. Emme voi koskaan täysin ymmärtää isäntäeliön biologiaa, jos emme ota huomioon myös sen mikroskooppisia kumppaneita.