Googles søkealgoritmer kan modellere kreftspredning

De ligningene som Google bruker for å forutsi hvilke nettsider deres brukere besøker, en såkalt stokastisk Markov-kjedemodell (stochastic Markov chain model på engelsk), har inspirert til en ny måte å spore spredningen av kreftceller rundt omkring i kroppen, på.

«Hvert enkelt sted der en sekundærsvulst eller metastase kan dukke opp, kan betraktes som websider,» sier Paul Newton, en matematiker ved University of Southern California, som har jobbet sammen med kreftspesialister ved Scripps Research Institute.

Markov-kjede forutsier spredning fra lungekreft — Slik, som en sirkulær, bi-direksjonal vektet graf, viser forskerne det nettverket de laget over spredningsområdene fra lungesvulstene. Nr. 23 på toppen er lungene selv, og de 27 sirklene som er forbundet med hverandre med de lange pilene er de ulike spredningsområdene som lungekreftcellene spres til.

Google rangerer websider etter sannsynligheten for at en person tilfeldigvis vil havne på akkurat den siden. Disse sannsynlighetene er basert på trender hos millioner av brukere over hele Internett. Google bruker noe som kalles «steady state distribusjon» for å beregne sannsynligheten for at noen besøker en bestemt side.

«Du har millioner av mennesker vandrende rundt i nettet, og Google ønsker å vite hvor stor andel som er inne på enhver webside på et gitt tidspunkt,» forklarer Newton.
«Det slo meg at steady state distribusjon tilsvarer metastatisk tumor-spredning som dukker opp i våre datasett fra obduksjoner.»

Datasettet han refererer til inneholder informasjon om obduserte pasienter fra 1920-tallet til 1940-tallet, som døde før kjemoterapi var tilgjengelig. Ved å fokusere på denne gruppen av pasienter kunne forskerne spore den naturlige progresjonen av kreft, i dette tilfellet lungekreft, uten at ulike behandlinger forstyrrer dataene.

Av femti metastaseringssteder beskrevet i obduksjonsrapporter, fant forskerne at tjuesju inneholdt kreft som syntes å ha spredt seg fra lungene. Videre, i likhet med en individuell surfer på nettet, hadde celler som løsnet fra den opprinnelige lungesvulsten og gått i blodet, en viss sannsynlighet for å vandre til forskjellige steder.

Så, etter Googles eksempel med søkeresultatene, delte forskerne spredningsområdene for lungekreft i to grupper: første ordens og andre ordens områder. Første ordens områder var steder der kreftceller mest sannsynlig ville havne ved å reise med blodstrømmen direkte fra lungene. Svulstene på andre ordens spredningssteder hadde mest sannsynlig kommet dit ved først å kolonisere et første ordens område og derifra sprer seg til et andre ordens område.

Ved hjelp av denne tilnærmingen var forskerne i stand til å anslå hvor lang tid det tar for kreften å spre seg til ulike deler av kroppen. Lymfeknutene var det første stedet hvor metastaserende lungekreftceller ble funnet, med binyrene og leveren tett bak.
I den andre enden av spekteret lå urinblære og livmor: lungekreftceller bruker så lang tid på å spre seg til disse organene at en person med lungekreft vil trolig dø før disse stedene rekker å bli kolonisert.

Dessverre inkluderte ikke forskernes datasett notater fra hver av de gangene legene oppdaget en ny svulst. Men forskerne kunne se hvor mange svulster som fantes i hvert nye område, legge det inn i modellen og beregne hver spredningsbølge.

Lurer du på hva slags smykke et Markov-kjede er? På wiki står det på dansk at «En Markov-kæde er inden for matematikken en tidsdiskret stokastisk proces med Markovegenskaben. Det vil sige, at processens forløb kan bestemmes ud fra dens nuværende tilstand uden kendskab til tidligere tilstande.”

Fagartikkelen ligger her.

Legg igjen en kommentar Avbryt svar