Galton-Watson processen

Från testwiki
Hoppa till navigering Hoppa till sök

Galton-Watson-processen är en stokastisk förgreningsprocesses som ursprungligen användes av Francis Galton och Henry William Watson under den andra halvan av 1800-talet för att undersöka hur familjenamn sprider sig genom generationer, och med vilka sannolikheter olika efternamn eventuellt dör ut[1]. I modellen så sprids efternamn från fader till son, där spridningen beror på hur många söner mannen får under en generation. Om mannen inte får några söner alls så har efternamnet dött ut.

Galton-Watson-processen kan användas för att beskriva många andra slags företeelser där det sker förgreningar mellan individer, exempelvis inom populationsforskning och sjukdomsspridning.

Matematisk beskrivning

Galton-Watson-processen är en Markovkedja, där storleken av en viss generation bara beror på storleken av den föregående generationen samt hur många barn som föds[2]. Låt

Zn

beteckna antalet individer vid generation

n

, med

Z0=1

, det vill säga, populationen startar med en individ. Processen kan då beskrivas efter rekursionsformeln

Zn+1=i=1ZnXi,
Ett exempel på en Galton-Watson-process som börjar med en startindivid.

där

Xi

är en stokastisk variabel som betecknar antalet barn som individ

i

födde i generation

n

, och som för alla

i

är fördelad efter den så kallade reproduktionsfördelningen:

X={0,med sannolikhet p0,1,med sannolikhet p1,2,med sannolikhet p2,

Varje individ ger alltså upphov till

k

barn med samma sannolikhet

pk

.Följden

Z0,Z1,Z2,

beskriver då populationens storlek efter varje generation.

Förväntad generationsstorlek efter n generationer

Låt

μ=k=0kpk

beteckna reproduktionsfördelningens väntevärde, det vill säga det genomsnittliga antalet avkommor som varje individ ger upphov till. Väntevärdet av

Zn

ges då av

𝔼[Zn]=μn

. Långsiktigt, då

n

, kan vi se att det finns tre fall för den förväntade generationsstorleken:

limn𝔼[Zn]=limnμn={0,μ<1,1,μ=1,,μ>1.

De tre fallen

μ<1

,

μ=1

och

μ>1

benämns de subkritiska, kritiska respektive superkritiska fallen för processen[1]. Väntevärdet

μ

är alltså helt avgörande för populationens tillväxt och långsiktiga utseende. Som ett exempel, antag en Galton-Watson-process vars reproduktionsfördelning är

X={0,med sannolikhet 1p,2,med sannolikhet p,

det vill säga att varje individ dör ut med sannolikhet

1p

eller förgrenas till två delar med sannolikhet

p

. Denna fördelning är en uppskalad Bernoullifördelning. Då blir

μ=2p

, och processen är subkritisk om

p<0.5

, kritisk om

p=0.5

samt superkritisk om

p>0.5

. Vidare ges variansen av generationsstorlekar av

limnVar[Zn]={0,μ<1,,μ1.

[1]

Som kan ses så är variansen oändlig det i kritiska och superkritiska fallet.

Utrotningssannolikhet

Det är möjligt att beräkna en Galton-Watson-process utrotningssannolikhet,

q=P(n:Zn=0)

, genom att använda sig av sannolikhetsgenererande funktioner[1]. Låt

G(s)

beteckna reproduktionsfördelningens sannolikhetsgenererande funktion, det vill säga

G(s)=k=0skP(X=k).

Då är

q

lika med den minsta icke-negativa lösningen till ekvationen

s=G(s)

[1]. I det kritiska och subkritiska fallet så gäller det oavsett reproduktionsfördelningen att

q=1

, det vill säga att populationen är garanterad att eventuellt dö ut. Däremot i det superkritiska fallet så kommer vi generellt att ha

q<1

, så att processen fortsätter i all evighet. Tag åter reproduktionsfördelningen

X={0,med sannolikhet 1p,2,med sannolikhet p,

som ett exempel. Denna fördelningens sannolikhetgenererande funktion är

G(s)=(1p)+ps2

, vilket ger ekvationen

s=(1p)+ps2

, som har lösningarna

s=1

och

s=1p1, p0

. Mycket riktigt så är

1p1<1

endast när

p>0.5

, vilket är ekvivalent med att

μ=2p>1

.

För att betrakta långsiktigt beteende av Galton-Watson-processen kan det också vara relevant att betrakta upprepad applicering av sannolikhetsgenererande funktionen G[1]. Här är LF-fördelningen användbar för att få den genererande funktionen på en enklare form, särskilt efter upprepad applikation av funktionen[3].

Totala antalet individer W

Det totala antalet individer ges av W=k=0Zk, där Zk alltså betecknar antal individer i generation k. För en godtycklig Galton-Watson-process så är 𝔼[W]={11μ,μ<1,,μ1,

där

μ

är reproduktionsfördelningens väntevärde[4]. Om

μ=0.9

, till exempel, så är

𝔼[W]=10

. Notera att utrotningssannolikheten i kritiska fallet 100% men väntevärdet av totalt antal individer i kritiska fallet är oändligt. För variansen gäller följande:[4]

Var[W]={σ2(1μ)3,μ<1,,μ1.

I det kritiska fallet är alltså både väntevärdet och variansen oändliga. Fortsättningsvis kan ett förhållande mellan den sannolikhetsgenererande funktionen

GW

för

W

och reproduktionsfördelningens sannolikhetsgenererande funktionen

G

härledas[4]. Vi får

GW(s)=sG(GW(s)).

Genom att sätta

x=GW(s)

får vi ekvationen

x=sG(x)

att lösa för att bestämma

GW

.

Referenser