Das Gesetz von Hardy und Weinberg

Hardy-Weinberg-Gleichgewicht
[Genfrequenz | Idealpopulation | HW-Gleichgewicht | Erweiterung]

Die simpelste Rechnung geht von 2 Allelen aus, deren Häufigkeit im Folgenden untersucht werden soll. Das erste Allel sei A und das zweite a. Gehen wir einmal davon aus, dass die Population, in der diese Allele vorkommen, aus diploiden Individuen besteht. Dann trägt jedes Individuum zwei Allelenpaare. A und a können somit in drei genotypischen Kombinationen auftreten: A+A, A+a, a+a. A+a ist "doppelt" vorhanden wegen der zwei möglichen Kombinationen Aa und aA, die aber den gleichen Phänotyp darstellen.
Um auf die jeweiligen Allelhäufigkeiten zu schliessen, muss man die Zahl der Individuen mit AA, aa und 2xAa bestimmen. D sei die Anzahl der AA-homozygoten Individuen, H die Anzahl der Aa-heterozygoten und R die Anzahl der aa-homozygoten Individuen.

Insgesamt hat die Population N Individuen, also:
D + H + R = N

Wenn z.B. bei Kaninchen die Haarfarbe bestimmt wird durch die Allele A für schwarze Haare und a für weisse Haare, und die Allele kodominant sind, ist D die Anzahl der schwarzhaarigen, R die Anzahl der weisshaarigen und H die Anzahl der grauhaarigen Kaninchen in der Population der Grösse N. (Wenn A dominant und a rezessiv ist, ist R weiterhin die Anzahl der weisshaarigen Kaninchen. Bei den schwarzhaarigen Kaninchen dagegen ist, nach den Mendelschen Gesetzen zur dominant-rezessiven Vererbung, D 1/3 und H 2/3 der Anzahl der schwarzen Kaninchen.)

In der diploiden Population kommt das Allel A genau 2D+H mal (wegen AA+Aa; D+0,5H) vor, a wiederum 2R+H mal (wegen Aa+aa; R+0,5H). Die Gesamtzahl aller Allele ist die doppelte Populationsgrösse, also 2N. Deshalb erhält man die Häufigkeiten:

p[A] = Anz. A / Gesamtanz.Allele = (2D+H) / 2N = (D+.5H) / N
q[a] = Anz. a / Gesamtanz.Allele = (H+2R) / 2N = (.5H+R) / N

Wenn p schon berechnet ist, kann man auch mit q = 1 - p die Häufigkeit des a-Allels berechnen.

Die Idealpopulation

Die Idealpopulation ist ein künstliches und stark einschränkendes Populationsmodell das in den HW-Berechnungen verwendet wird. Die Idealpopulation erfüllt folgende Bedingungen:

die Population ist sehr (besser: unendlich) gross
es herrscht Panmixie, d.h. die Individuen können sich uneingeschränkt und mit gleicher Wahrscheinlichkeit paaren
der Selektionsdruck ändert sich nicht
es kommen keine Mutationen vor
es tritt kein Gendrift, keine Populationsabspaltung und keine Genmigration ein

Eine reelle Population erfüllt nicht alle dieser Voraussetzungen. Deshalb liefern die folgenden Gesetze auf eine normale Population angewandt keine exakten Ergebnisse.

Hardy-Weinberg-Gleichgewicht

G.H. Hardy, W. Weinberg und S. Tschetverikov entwickelten zufällig zur gleichen Zeit, im Jahr 1908, Theorien zur Häufigkeit eines gewählten Allels in den Filialgenerationen. Die nach den gefundenen Gesetzmässigkeiten aufgestellten Formeln sind zusammengefasst unter dem Namen "Hardy-Weinberg-Gleichgewicht". Tschetverikov wurde vergessen - "Hardy-Weinberg-Tschetverikov-Gleichgewicht" als Benennung wäre wohl zu lang gewesen.

Das HW-Gleichgewicht lässt sich folgendermassen berechnen: Wir nehmen eine Idealpopulation, in der das Allel A mit der Frequenz p=P(A) und das Allel a mit der Frequenz q=P(a) vorkommt. Aus D+H+R=N erhalten wir nach Teilen durch N den relativen Anteil der drei Phänotypen in der Population.

(D + H + R) / N = 1
(Anz_AA+Anz_Aa+
Anz_aA+Anz_aa)/N = 1
also "AA + 2Aa + aa = 1".

mit "A"=P(A) und "a"=P(a)
=> P(A)² + 2*P(A)*P(a) + P(a)² = 1

oder mit P(a)=p und P(a)=q
=> p² + 2pq + q² = (p+q)² = 1

Wenn die Voraussetzungen der Idealpopulation gelten, stellt die oben genannte Formel den Gleichgewichtszustand da. Die Häufigkeiten p und q ändern sich nicht.

Wenn eine Population anfänglich nicht im Gleichgewichtszustand ist, stellt sich dieser durch Einsetzen der Anfangswerte ein.

Zum Beispiel: eine sich nicht im Gleichgewicht befindende Population mit den relativen Individuenhäufigkeiten
D₁/N = 0,10 ; H₁/N = 0,20 ; R₁/N = 0,70 und p = 0,20 ; q = 0,80
sieht in der F1-Generation folgendermassen aus
D₂/N = p² = 0,04 ; H₂/N = 2pq = 0,32 ; R₂/N = q² = 0,64

Es ist D₂/N + H₂/N + R₂/N = 1, also befindet sich die Population in der F1-Generation im Gleichgewicht.

Mathematisch auffallend ist bei der Formel für den Gleichgewichtszustand auch, dass die Häufigkeit der Heterozygoten nicht grösser als 0,5 sein kann. Die maximale Anzahl an Heterozygoten wird erreicht bei p = q = 0,5

p² + 2pq + q² = (0,5)² + 2*0,5*0,5 + (0,5)² = 1
0,25 + 0,50 + 0,25 = 1

2pq = 2p(1-p) ; p<1 wird maximal, wenn 1-p=p also p=0,5

Um festzustellen, ob sich eine Population im Gleichgewichtszustand befindet, kann man das folgende Gesetz anwenden:

=> 4*D*R = H²
z.B. 4 * 0,25 * 0,25 = 0,50²

Weiterführung des HW-Gesetzes

In dem erweiterten Modell von Hardy und Weinberg wird die Häufigkeit eines Allelenpaars (z.B. von aa) über mehrere Generationen hinweg untersucht. Bei dem Generationswechsel wirkt auf aa ein konstanter Selektionsdruck, der mathematisch
dargestellt wird als Selektionsfaktor s. Der Selektionsfaktor liegt im Bereich von -1 bis +1. Wenn s negativ ist, ist die Selektion für das untersuchte Allel günstig. Wenn s positiv ist, hat das Allel einen Selektionsnachteil und die Häufigkeit des Allels in der Population geht im Laufe der Generationen zurück.
Der Faktor s hängt von der relativen Fitness, d.h. von der relativen Anzahl der von aa weitergegebenen Gene ab. Wenn die aa- und Aa-Genotypen 100% ihrer Allele, der AA-Genotyp aber nur 20% weitergeben kann, entspricht das einer Fitness von w_AA=0,2 und einem Selektionsnachteil s=1-0,2=+0,8. Die Häufigkeit des A-Allels nimmt also ab, während a zunimmt. (Graph unten).

hwges1.gif (5204 bytes) Die Formel für die relative Häufigkeit des A-Allels ist rekursiv und etwas komplizierter als die bisherigen Formeln:

q₁ = (q₀ - s * q₀² ) / (1 - s * q₀² )
...
q_n = (q_n-1 - s * q_n-1² ) / (1 - s * q_n-1² )

Dabei ist q_n-1 die relative Häufigkeit des a-Allels in der untersuchten Generation. Die Formel gibt die Häufigkeit q_n für die nächste Generation an.
Wenn man die relative Häufigkeit von A nach zwei Generationen wissen will (q₀ und s werden als bekannt vorausgesetzt), berechnet man q₁, setzt das Ergebnis erneut in die Formel ein und erhält das gesuchte q₂. Die Häufigkeiten berechnet man am besten mit einem Simulationsprogramm.

hwges2.gif (7291 bytes) Wenn man q bestimmt hat, kann man p leicht erhalten mit p=1-q. Mit diesen Werten kann man die relative Häufigkeit der drei Phänotypen mit AA, Aa, aa bestimmen.

Da p und q die Gleichung p² + 2pq + q² erfüllen, ist D / N =p² ; H / N =2pq ; R / N = q². Ein Graph, in dem die Rekursionsformel für einige Generationen durchgerechnet und mit p und q die Frequenz der Phänotypen bestimmt wurde, könnte ähnlich aussehen wie oben. Die 50%-Grenze von den Aa-Genotypen ist hier gut erkennbar.

Wie vielleicht schon aus der rekursiven Formel zu erkennen ist, hat dieses Modell die weitere Eigenschaft, dass keines der Allele je die Häufigkeit von 100% bzw. 0% erreicht. Diese Häufigkeiten sind Grenzwerte der Formel und werden innerhalb des Modells nie erreicht. In der Natur dagegen kann, weil die Population endlich gross ist, ein Allel 100% erreichen.

Zuletzt noch eine kleine Anmerkung: Das Grundmodell ist nicht auf zwei Allele beschränkt, sondern kann auf beliebig viele Allele erweitert werden. Für drei Allele gilt (p+q+r)²=1 und für vier Allele entsprechend (p+q+r+s)²=1. Weitere Informationen sind zu finden auf der Linkseite.
Die oben gezeigte Rekursionsformel lässt ausser Betracht, dass die aa- und Aa-Gentypen auch eine unterschiedliche Fitness w haben können. Wenn die Fitness mitgerechnet wird, erhält man als Grundgesetz w_AAp² + w_Aa2pq + w_aaq² = 1.