Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met...

103
Lineaire Algebra 2 Jan Brandts 11 april 2017

Transcript of Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met...

Page 1: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

Lineaire Algebra 2

Jan Brandts

11 april 2017

Page 2: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2

Page 3: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

Inhoudsopgave

0.1 Inleiding en opzet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1 Canonieke vormen 7

1.1 Lineaire transformaties en gelijkvormige matrices . . . . . . . . . . . . . . . . 7

1.1.1 Gelijkvormigheid en gelijkvormigheidsklassen . . . . . . . . . . . . . . 8

1.1.2 Elementaire gelijkvormigheidstransformaties . . . . . . . . . . . . . . . 9

1.1.3 Gelijkvormige matrices horen bij dezelfde lineaire transformatie . . . . 11

1.1.4 Voorbeeld: de gelijkvormigheidsklassen van de vectorruimte F2×22 . . . 13

1.2 Triangulatiestellingen voor lineaire transformaties . . . . . . . . . . . . . . . . 14

1.2.1 Geschiedenis en motivatie . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.2.2 Triangulatie van 2× 2 matrices . . . . . . . . . . . . . . . . . . . . . . 16

1.2.3 Blokvermenigvuldiging en triangulatie van 3× 3 matrices . . . . . . . 18

1.2.4 Inductiebewijs van de triangulatiestelling van Jacobi . . . . . . . . . . 20

1.2.5 Invariante deelruimtes en complete vlaggen . . . . . . . . . . . . . . . 21

1.2.6 De triangulatiestelling van Schur . . . . . . . . . . . . . . . . . . . . . 23

1.2.7 Toepassing: Schur decompositie en Google’s PageRank . . . . . . . . . 25

1.2.8 Spectraalstellingen voor normale, Hermietse, en unitaire matrices . . . 26

1.3 De Jordannormaalvorm van een lineaire transformatie . . . . . . . . . . . . . 30

1.3.1 Gerichte gelijkvormigheidstransformaties met Enij(h) . . . . . . . . . . 32

1.3.2 Gerichte gelijkvormigheidstransformaties met Πk` . . . . . . . . . . . . 35

1.3.3 De klasse van nilpotente Jordanvormen . . . . . . . . . . . . . . . . . 37

1.3.4 Gelijkvormigheidstransformaties van stricte bovendriehoeksmatrices . 41

1.3.5 Jordanvormen en de Jordannormaalvorm van een matrix . . . . . . . 46

1.4 Opgaven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2 Dualiteit 53

2.1 De duale vectorruimte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2.1.1 Voorbeelden en eerste orientatie . . . . . . . . . . . . . . . . . . . . . 54

2.1.2 De duale basis β∗ van V ∗ behorende bij een basis β van V . . . . . . . 56

2.1.3 De dubbelduale vectorruimte V ∗∗ en het natuurlijke isomorfisme . . . 59

2.1.4 Het isomorfisme van Riesz . . . . . . . . . . . . . . . . . . . . . . . . . 60

2.1.5 De duale L∗ van een lineaire afbeelding L . . . . . . . . . . . . . . . . 65

2.1.6 De annihilator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.1.7 Quotientruimtes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

2.2 Opgaven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3

Page 4: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

4 INHOUDSOPGAVE

3 Niet-negatieve lineaire algebra 773.1 Perron-Frobeniustheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.1.1 De Neumannrij en de Neumannreeks . . . . . . . . . . . . . . . . . . . 783.1.2 Perron-Frobeniustheorie voor positieve matrices . . . . . . . . . . . . . 803.1.3 Von Mises-iteratie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 833.1.4 Een analytische aanpak van Perron-Frobeniustheorie . . . . . . . . . . 843.1.5 Niet-negatieve matrices als limiet van positieve matrices . . . . . . . . 853.1.6 Reducibele en irreducibele niet-negatieve matrices . . . . . . . . . . . 873.1.7 Perron-Frobeniustheorie voor irreducibele niet-negatieve matrices . . . 90

3.2 Dubbelstochastische matrices en de permanent . . . . . . . . . . . . . . . . . 913.2.1 De stelling van Birkhoff-Van Neumann . . . . . . . . . . . . . . . . . . 933.2.2 De permanent van een matrix . . . . . . . . . . . . . . . . . . . . . . . 973.2.3 De permanent versus de determinant . . . . . . . . . . . . . . . . . . . 983.2.4 De determinantale complexiteit van de permanent . . . . . . . . . . . 1003.2.5 Het algoritme van Ryser voor het berekenen van de permanent . . . . 1013.2.6 Een formule van Glynn . . . . . . . . . . . . . . . . . . . . . . . . . . 103

Page 5: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

0.1. INLEIDING EN OPZET 5

0.1 Inleiding en opzet

Deze tekst is bedoeld voor wiskundestudenten die reeds een gedegen eerste kennismaking heb-ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes overeen lichaam K, zoals ruimtes van matrices Kn×k, polynomen K[X]≤n, oneindige rijtjes KN,en nog algemener functies KK. We veronderstellen daarom kennis van begrippen als basis,coordinaten, dimensie, lineaire transformaties en hun matrices, determinanten, eigenwaardenen eigenvectoren, evenals van de axiomatische opbouw van inproductruimtes over R en C.

Wiskundestudenten aan de Universiteit van Amsterdam bezitten deze kennis nadat ze in huneerste semester het 6 EC vak Lineaire Algebra hebben gevolgd (en gehaald), gegeven uit hetgelijknamige boek van Paul Igodt en Wim Veys (Universtaire Pers Leuven, tweede editie).

Het doel van deze tekst is primair om te voorkomen dat de in het eerste semester opgedanekennis te snel verwatert doordat er niet direct mee wordt doorgewerkt, en studenten bij logi-sche vervolgvakken zoals Representatietheorie en Numerieke Lineaire Algebra, die vaak meerdan een jaar later pas gevolgd worden, niet thuis geven. Natuurlijk bestaat de inhoud uitnieuwe onderwerpen, die doorgaans te geavanceerd zijn (misschien ook te exotisch) om in eeneerste kennismaking op te nemen. Over deze onderwerpen nu meer.

In het eerste hoofdstuk over canonieke vormen herhalen we dat matrices in Kn×n gelijkvor-mig zijn als en alleen als ze dezelfde lineaire afbeelding voorstellen. Als voorbeeld bepalenwe alle gelijkvormigheidsklassen van de eindige matrixruimte F2×2

2 . Vervolgens bewijzen wede stelling van C. Jacobi, die zegt dat als K algebraısch afgesloten is, iedere gelijkvormig-heidsklasse van Kn×n een bovendriehoeksmatrix bevat. We scherpen dit resultaat aan tot deobservatie van I. Schur dat er zelfs een orthonormale basis bestaat ten opzichte waarvan eengegeven lineaire transformatie bovendriehoeksvorm aanneemt. Weer als speciaal geval vanhet laatste bewijzen we de spectraalstellingen voor zelfgeadjungeerde, voor normale, en voorunitaire transformaties van een eindigdimensionale vectorruimte V over K.

Tot slot van het eerste hoofdstuk geven we een ongebruikelijk bewijs van de existentie en uni-citeit van de Jordannormaalvorm van een bovendriehoeksmatrix R, gebaseerd op R. Brualdi’sThe Jordan Canonical Form: An Old Proof. The American Mathematical Monthly 49(3) uit1987. Voordeel van dit bewijs is, dat het en volledig is, en zeer elementair: er wordt eenalgoritme gegeven dat slechts bestaat uit het opeenvolgend toepassen van elementaire gelijk-vormigheidstransformaties. Dit zijn transformaties van de vorm R 7→ E−1RE waarbij E−1

een elementaire rij-operatie is, die studenten al kennen uit de context van het oplossen vanstelsels vergelijkingen. Zo wordt duidelijk hoe een gegeven basis stapsgewijs aangepast kanworden tot het een Jordanbasis is, waarbij iedere stap ten hoogste twee basisvectoren veran-dert. Dit kan vervolgens zelfs als programmeer-opgave aan de studenten worden voorgelegd.Keerzijde van de gevolgde aanpak is dat concepten als gegeneraliseerde eigenvectoren, mini-miumpolynomen, en Jordanketens onderbelicht blijven. Bestaande bewijzen van de existentieen uniciteit van de Jordannormaalvorm op grond van deze geavanceerdere concepten zijnechter veel minder triviaal, beginnen vaak met een willekeurige matrix A in plaats van eenbovendriehoeksmatrix, en leiden vaak ook af van de uiteindelijke eenvoud van de berekeningzodra een bovendriehoeksvorm bereikt is. Het achteraf introduceren van de geavanceerdereconcepten nadat existentie en uniciteit al bewezen is, lijkt daarom een goede oplossing.

In het tweede hoofdstuk behandelen we de duale vectorruimte van een doorgaans eindigdimen-

Page 6: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

6 INHOUDSOPGAVE

sionale vectorruimte V over K. We geven de definitie van V ∗, beschrijven de duale basis vanV ∗ gegeven een basis van V , en leggen het verband met individuele coordinaten. Vervolgensdoen we een poging om het natuurlijke isomorfisme V ∼= V ∗∗ inzichtelijk te maken door tebenadrukken dat v ∈ V niet alleen een passieve rol heeft als argument van v∗(v), met v∗ ∈ V ∗een functionaal op V , maar ook een actieve rol ten aanzien van diezelfde v∗ waarin v∗ gezienwordt als het argument van v. Ervaring leert dat studenten hier in eerste instantie veel moeitemee hebben. Weinig verwonderlijk, gezien hun (school)achtergrond waarin de notatie f(x)frequenteert en een abusievelijk x(f) hoogstwaarschijnlijk slechts een reprimande opleverde.Verdere onderwerpen in Hoofdstuk 2 zijn het isomorfisme van Riesz, de duale van een lineaireafbeelding, de annihilator, en kort de quotientruimte. Alles blijft eindigdimensionaal, alhoe-wel we wel hinten naar de problematiek die optreedt bij vectorruimtes van dimensie oneindig.

Hoofdstuk 3 behandelt enkele onderwerpen uit de context van de niet-negatieve lineaire al-gebra. Uiteraard de Perron-Frobeniustheorie, eerst voor positieve, later voor niet-negatievematrices. Deze ligt onder andere aan de basis van discrete Markovprocessen. Hierin komenop elegante wijze een aantal eerdere concepten bijeen, die daardoor extra oefening krijgen.Zo wordt convergentie van de Neumannrij (Ak)k∈N bewezen door toepassing van canoniekevormen, en maakt het convergentiebewijs van de Von Mises-iteratie gebruik van zowel deNeumannrij als de Neumannreeks, alsmede van de Schurvorm van een matrix. Zodra niet-negativiteit aan bod komt, wordt de tekst combinatorisch van aard. We definieren reducibeleen irreducibele matrices aan de hand van hun onderliggende gerichte grafen en destilleren dePerron-Frobeniusstellingen in deze context. Vervolgens bekijken we het Birkhoff-polytoop Ωn

van dubbelstochastische n×n matrices als belangrijke deelverzameling van niet-negatieve ma-trices. We bewijzen de stelling van Birkhoff-Von Neumann nadat we de stelling van Frobenius-Konig hebben bewezen die het mogelijk maakt te concluderen dat iedere M ∈ Ωn een positievediagonaal heeft. Positieve diagonalen vormen een duidelijke motivatie voor de permanent vaneen matrix. We besteden aandacht aan de verhouding determinant-permanent, en de com-plexiteit van hun berekening. Tot slot leiden we het Algoritme van Ryser af en de Formulevan Glynn, twee methodes die de permanent in orde 2n arithmetische operaties berekenen.Ook hier kunnen programmeer-opgaven worden uitgeschreven die het een en ander illustreren.

Ieder hoofdstuk eindigt met een klein aantal opgaven, die ook niet de hele stof dekken. Docen-ten worden van harte aangemoedigd om naar eigen inzicht passende opgaven toe te voegen.

Verantwoording

Met aan zekerheid grenzende waarschijnlijkheid bevat deze tekst onnauwkeurigheden en zelfsfouten, echter geen pertinente opzettelijke leugens (althans, niet veel). Hij is meegegroeid metde cursus waar hij onderdeel van uitmaakt, en moet dan ook worden gezien als een projectin aanbouw. Ik stel het zeer op prijs als fouten en/of opmerkingen worden gemeld.

Jan Brandts

Amsterdam, 21 maart 2017

Page 7: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

Hoofdstuk 1

Canonieke vormen

In dit hoofdstuk onderzoeken we hoe de keuze van een basis β voor een eindig dimensionalevectorruimte V over een getallenlichaam K doorwerkt in de matrix Lββ van een lineaire trans-formatie van V . Dit zal leiden tot de triangulatiestellingen van Jacobi en Schur. De laatste zalals speciale gevallen de spectraalstellingen voor zelfgedjungeerde, normale, en unitaire trans-formaties impliceren. Tot slot leiden we middels elementaire gelijkvormigheidstransformaties,toegepast op bovendriehoeksmatrices, de Jordannormaalvorm van een matrix af.

1.1 Lineaire transformaties en gelijkvormige matrices

Laat (V,K) een vectorruimte zijn over K met basis β = 〈v1, . . . , vn〉 voor zekere n ∈ N. Schrijfcoβ : V → Kn voor de coordinaatafbeelding

V 3 α1v1 + · · ·+ αnvn = vcoβ7→

α1...αn

∈ Kn (1.1)

die aan ieder element v ∈ V zijn geordende vector van coordinaten ten opzichte van β toevoegt,en schrijf homK(V, V ) voor de verzameling van alle lineaire transformaties L : V → V .

Gegeven een lineaire transformatie L ∈ homK(V, V ) is Lββ ∈ Kn×n de unieke matrix zo, dat

∀v ∈ V : coβ(L(v)) = Lββcoβ(v). (1.2)

Schrijf ε = 〈e1, . . . , en〉 voor de standaardbasis van Kn. De matrix Lββ is als volgt te bepalen.

Propositie 1.1.1 Voor iedere j ∈ 1, . . . , n is de j-de kolom van Lββ gelijk aan coβ(L(vj)).

Bewijs. Laat j ∈ 1, . . . , n. Uit (1.1) volgt dat coβ(vj) = ej . Dus, substitutie van v = vj in

(1.2) laat zien dat coβ(L(vj) = Lββej . Merk tot slot op dat Lββej de j-de kolom van Lββ is.

Als γ een basis van V is ongelijk aan β, dan zal Lγγ in het algemeen ongelijk zijn aan Lββ. Ditroept de vraag op welke matrices op kunnen treden als de matrix van L ten opzichte van eengegeven basis van V . De verzameling van al deze matrices noteren we met

M(L) = A ∈ Kn×n | A = Lββ voor zekere basis β van V . (1.3)

7

Page 8: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

8 HOOFDSTUK 1. CANONIEKE VORMEN

Voor elke L ∈ homK(V, V ) zalM(L) een gelijkvormigheidklasse van matrices in Kn×n blijken.We brengen daarom nu eerst het begrip gelijkvormigheid in de herinnering.

1.1.1 Gelijkvormigheid en gelijkvormigheidsklassen

We schrijven GLn(K) voor de deelverzameling van alle inverteerbare matrices in Kn×n.

Definitie 1.1.2 (Gelijkvormigheid) Een matrix B ∈ Kn×n heet gelijkvormig met A ∈Kn×n als er een X ∈ GLn(K) bestaat zodanig dat B = X−1AX.

Opmerking 1.1.3 Het is niet moeilijk na te gaan dat de relatie ∼ op Kn×n ×Kn×n gedefi-nieerd door

A ∼ B ⇔ A is gelijkvormig met B (1.4)

een equivalentierelatie is. Deze relatie deelt Kn×n op in disjuncte equivalentieklassen, die weook wel gelijkvormigheidsklassen noemen.

Veel gemeenschappelijke eigenschappen van gelijkvormige matrices worden geımpliceerd doorde resultaten geformuleerd in het komende lemma en het erna geformuleerde gevolg.

Lemma 1.1.4 Veronderstel dat A,B ∈ Kn×n gelijkvormige matrices zijn. Dan geldt:

• voor ieder polynoom p ∈ K[Y ] is p(A) gelijkvormig is met p(B);

• det(A) = det(B);

• dim(ker(A)) = dim(ker(B)).

Bewijs. Veronderstel dat B = X−1AX voor zekere X ∈ GLn(K). Laat p(Y ) = Y ` met` ∈ N willekeurig. Dan geldt

p(B) = B` = (X−1AX)` = X−1A`X = X−1p(A)X.

Dit bewijst de eerste bewering voor monomen. De generalisatie naar polynomen is nu een-voudig. De tweede bewering volgt uit de productformule voor determinanten, en de derde uitde equivalentie X−1w = 0⇔ w = 0. Immers,

Bv = 0 ⇔ X−1AXv = 0 ⇔ AXv = 0.

Hieruit volgt dat b1, . . . , bp een basis is van ker(B) als en alleen als Xb1, . . . , Xbp een basis isvan ker(A) en dus zijn de dimensies van beide nulruimtes gelijk.

Gevolg 1.1.5 Als A,B ∈ Kn×n gelijkvormig zijn dan geldt voor iedere ` ∈ N ∪ 0:

• voor alle λ ∈ K zijn (A− λI)` en (B − λI)` gelijkvormig;

• de karakteristieke polynomen van A` en B` zijn gelijk;

• de algebraısche multipliciteiten van de eigenwaarde λ van A` en van B` zijn gelijk;

• de meetkundige multipliciteiten van de eigenwaarde λ van A` en van B` zijn gelijk.

Het nut van de observaties over machten van gelijkvormige matrices blijkt uit het volgende.

Page 9: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.1. LINEAIRE TRANSFORMATIES EN GELIJKVORMIGE MATRICES 9

Voorbeeld 1.1.6 Onderstaande 4×4 matrices A en B hebben beide 0 als enige eigenwaarde,

A =

0 1 0 00 0 0 00 0 0 10 0 0 0

en

0 1 0 00 0 1 00 0 0 00 0 0 0

= B,

met algebraısche multipliciteit 4 en meetkundige multipliciteit 2. Toch zijn A en B nietgelijkvormig: voor A2 = 0 is de meetkundige multipliciteit van 0 vier, maar voor B2 6= 0 drie.

1.1.2 Elementaire gelijkvormigheidstransformaties

Om te laten zien dat gelijkvormigheid in relatief kleine, overzichtelijke stappen kan wordenbestudeerd, brengen we elementaire rij-operaties en elementaire matrices in de herinnering.

Definitie 1.1.7 (Elementaire rij-operaties) De elementaire rij-operaties toegepast op derijen R1, . . . , Rn van een matrix zijn:

• Rj → λRj , (λ 6= 0): het vermenigvuldigen van een rij met λ 6= 0;

• Rj ↔ Ri: het verwisselen van twee rijen;

• Rj → Rj + λRi, (i 6= j): het optellen van een veelvoud van een rij bij een andere rij.

De restrictie i 6= j in de derde operatie sluit de onomkeerbare operatie Rj → Rj − 1 ·Rj uit.

Ieder van deze elementaire rij-operaties correspondeert met vermenigvuldiging van links meteen zogeheten elementaire matrix.

Definitie 1.1.8 (Elementaire matrices) Voor alle gehele k, ` ∈ 1, . . . , n met k 6= ` enh ∈ K definieren we de elementaire matrices

Dnk (h) = In + (h− 1)eke

>k en Enk`(h) = In + heke

>` , (1.5)

die mogelijk alleen op positie (k, k), respectievelijk (k, `), afwijken van de identiteit In ∈ Kn×n,en de elementaire matrices

Πk` = In − (ek − e`)(ek − e`)>, (1.6)

dus Πk` is de identiteit In met kolommen k en ` verwisseld.

Opmerking 1.1.9 De matrix Dnk (h) is een diagonaalmatrix met inverse Dn

k (h−1) als h 6= 0,en Enk`(h) is een driehoeksmatrix met inverse Enk`(−h) voor alle h ∈ K, en Π−1

k` = Πk`.

Voorbeeld 1.1.10 Voorbeelden van ieder van deze elementaire matrixtypes zijn

D42(

1

2) =

1 0 0 00 1

2 0 00 0 1 00 0 0 1

, E424(−3) =

1 0 0 00 1 0 −30 0 1 00 0 0 1

en Π423 =

1 0 0 00 0 1 00 1 0 00 0 0 1

.Linksvermenigvuldiging met D2

2(12) geeft de rij-operatie R2 → 1

2R2. Linksvermenigvuldigingmet E4

24(−3) geeft R2 → R2 − 3R4, en Π423 correspondeert met R2 ↔ R3.

Page 10: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

10 HOOFDSTUK 1. CANONIEKE VORMEN

Rechtsvermenigvuldiging van een matrix met een elementaire matrix resulteert op voorspel-bare wijze in drie overeenkomstige types elementaire kolomoperaties.

Definitie 1.1.11 (Elementaire kolom-operaties) De elementaire kolom-operaties toege-past op de kolommen K1, . . . ,Kn van een matrix zijn:

• Kj → λKj , (λ 6= 0): het vermenigvuldigen van een kolom met λ 6= 0;

• Kj ↔ Ki: het verwisselen van twee kolommen;

• Kj → Kj +λKi, (i 6= j): het optellen van een veelvoud van een kolom bij een andere kolom.

De restrictie i 6= j in de derde operatie sluit de onomkeerbare operatie Kj → Kj − 1 ·Kj uit.

Voorbeeld 1.1.12 Het product XD42(2) correspondeert met de elementaire kolomoperatie

K2 → 2K2 op X, het product XE424(3) met K4 → K4 + 3K2, en XΠ23 met K2 ↔ K3.

Definitie 1.1.13 (Elementaire gelijkvormigheidstransformaties) Laat A ∈ Kn×n enX ∈ GLn(K). De omzetting

A→ B = X−1AX (1.7)

heet een gelijkvormigheidstransformatie van A met X. Deze zullen we vaak kortweg noterenals

AX→ B (1.8)

Als de matrix X elementair is, spreken we van een elementaire gelijkvormigheidstransformatie.

Opmerking 1.1.14 Omdat iedere X ∈ GLn(K) een product X1 · . . . ·X` is van elementaire

matrices, is AX→ B een opeenvolging van elementaire gelijkvormigheidstransformaties:

AX1→ X−1

1 AX1X2→ . . .

X`→ X−1` · . . . ·X

−11 AX1 · . . . ·X` = X−1AX = B.

Zo wordt een gelijkvormigheidstransformatie dus in inzichtelijke kleine stappen onderverdeeld.

De effecten van elementaire gelijkvormigheidstransformaties leggen we uit met voorbeelden.

Voorbeeld 1.1.15 Beschouw de gelijkvormigheidstransformatie van een matrix met D422(2),

D42(2)−1

∗ 2 ∗ ∗2 3 2 2∗ 2 ∗ ∗∗ 1 ∗ ∗

D42(2) =

∗ 4 ∗ ∗1 3 1 1∗ 4 ∗ ∗∗ 2 ∗ ∗

.Deze correspondeert met de twee operaties K2 → 2K2 en R2 → 1

2R2. Bekijk vervolgens

E424(3)−1

∗ 1 ∗ 11 1 1 1∗ 1 ∗ 11 1 1 1

E424(3) =

∗ 1 ∗ 4−2 −2 −2 −8∗ 1 ∗ 41 1 1 4

,wat overeenkomt met R2 → R2− 3R4 en K4 → K4 + 3K2. Dus, alleen rij twee en kolom vierveranderen, en rij vier en kolom twee bepalen die verandering. Tot slot, laat

(Π423)−1

∗ 2 1 ∗2 2 1 13 3 4 4∗ 3 4 ∗

Π423 =

∗ 1 2 ∗3 4 3 42 1 2 1∗ 4 3 ∗

dan zien we dat R2 ↔ R3 en K2 ↔ K3. In alle gevallen zijn de bewerkingen associatief.

Page 11: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.1. LINEAIRE TRANSFORMATIES EN GELIJKVORMIGE MATRICES 11

Opmerking 1.1.16 Het is duidelijk dat gelijkvormigheidstranformaties met matrices vantype Dn

k en Πnk` het aantal nullen in een matrix niet veranderen.

Voorbeeld 1.1.17 Gelijkvormigheidstransformaties van het type Enk` zijn in staat is om hetaantal nullen in een matrix te laten toenemen, zoals blijkt uit

E212(1)−1

[1 10 2

]E2

12(1) =

[1 00 2

]. (1.9)

Merk op dat de kolommen van E212(1) kennelijk onafhankelijke eigenvectoren zijn horende bij

de eigenwaarden 1 en 2 van de gegeven matrix.

We keren nu terug naar de vraag welke matrices optreden als matrix van een L ∈ homK(V, V ).

1.1.3 Gelijkvormige matrices horen bij dezelfde lineaire transformatie

Laat V een vectorruimte zijn over K van dimensie n. In deze sectie bewijzen we eerst datiedere matrix uit Kn×n optreedt als matrix van een lineaire transformatie L ∈ homK(V, V ), envervolgens dat matrices A,B ∈ Kn×n gelijkvormig zijn als en alleen als er een L ∈ homK(V, V )

en basissen β en γ van V bestaat zo, dat A = Lββ en B = Lγγ .

Lemma 1.1.18 Laat β = 〈v1, . . . , vn〉 een basis zijn van een vectorruimte V over K. Voor

iedere A ∈ Kn×n bestaat er een L ∈ homK(V, V ) zo, dat A = Lββ.

Bewijs. Schrijf (aij) = A voor de entries van A. Iedere lineaire afbeelding L wordt uniekbepaald door de beelden L(v1), . . . , L(vn). Laat in dit geval L bepaald worden door

L(vj) = a1jv1 + · · ·+ anjvn,

voor iedere j ∈ 1, . . . , n. Dan geldt per definitie dat

coβ(L(vj)) =

a1j...anj

= Aej = Acoβ(vj)

en vergelijken we dit met (1.2) dan zien we dat blijkbaar A = Lββ.

Lemma 1.1.19 Laat L ∈ homK(V, V ). Alle matrices in M(L) zijn gelijkvormig.

Bewijs. Laat β en γ basissen zijn van V en coβ en coγ de coordinaatafbeeldingen. De

matrices Lββ en Lγγ uit M(L) zijn de unieke matrices waarvoor

coβ(L(v)) = Lββcoβ(v) en coγ(L(v)) = Lγγcoγ(v) (1.10)

voor alle v ∈ V . Beschouw de identieke afbeelding id : V → V : v 7→ v. Omdat id een bijectieis, is de matrix idγβ van id inverteerbaar, en heeft de eigenschap dat

coγ(v) = coγ(id(v)) = idγβcoβ(v) en coβ(v) = (idγβ)−1coγ(v) (1.11)

Page 12: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

12 HOOFDSTUK 1. CANONIEKE VORMEN

voor alle v. Combineren we (1.10) met (1.11) dan zien we dat

coβ(L(v)) = (idγβ)−1coγ(L(v)) = (idγβ)−1Lγγcoγ(v) = (idγβ)−1Lγγidγβcoβ(v) (1.12)

voor alle v ∈ V . Kennelijk geldt Lββ = (idγβ)−1Lγγidγβ en dus zijn Lββ en Lγγ gelijkvormig.

We tonen nu aan dat M(L) zelfs een complete equivalentieklasse onder gelijkvormigheid is.

Lemma 1.1.20 Laat β = 〈v1, . . . , vn〉 een basis zijn van een vectorruimte V over K. Danbestaat er voor iedere X ∈ GLn(K) een basis γ van V zo dat X = idγβ.

Bewijs. Laat X ∈ GLn(K) gegeven zijn, met inverse Y = (yij). Definieer voor iederej ∈ 1, . . . , n een element wj ∈ V door

wj = y1jv1 + · · ·+ ynjvn. (1.13)

Schrijf γ = 〈w1, . . . , wn〉. Het is eenvoudig na te gaan dat γ een basis is voor V . Merk op dat(1.13) laat zien dat

coβ(wj) =

y1j...ynj

= Y ej = Y coγ(wj).

Kennelijk geldt dat Y = idβγ en dus is X = Y −1 = (idβγ )−1 = idγβ.

Voor we onze laatste conclusie trekken, onderzoeken we welke basisveranderingen overeenko-men met de elementaire gelijkvormigheidstransformaties uit de vorige sectie.

Gevolg 1.1.21 Laat β = 〈v1, . . . , vn〉. Dan geldt:

• als γ gelijk is aan β met vk vervangen door h−1vk, dan is idγβ = Dnk (h);

• als γ gelijk is aan β met v` vervangen door v` − hvk, dan is idγβ = Enk`(h);

• als γ gelijk is aan β met vk en v` verwisseld, dan is idγβ = Πnk`.

Deze kunnen met goed recht de drie types elementaire basisveranderingen genoemd worden.

Gevolg 1.1.22 Laat L ∈ homK(V, V ). Als B gelijkvormig is met A ∈M(L), is B ∈M(L).

Bewijs. Laat A ∈ M(L). Dan is A = Lββ voor zekere basis β = 〈v1, . . . , vn〉 van V . Laat nu

B = X−1AX voor zekere X ∈ GLn(K). Volgens Lemma 1.1.20 bestaat er een basis γ van Vwaarvoor idγβ = X. Dus geldt

B = X−1AX = (idγβ)−1Lββidγβ

en dus is B = Lγγ . Dit bewijst de bewering.

Samengevat hebben we nu aangetoond dat de verzameling Kn×n bestaat uit equivalentieklas-sen van gelijkvormige matrices, en dat iedere klasse bestaat uit alle mogelijke matrices vaneen lineaire transformatie L ∈ homK(V, V ) ten opzichte van alle basiskeuzes voor V .

Page 13: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.1. LINEAIRE TRANSFORMATIES EN GELIJKVORMIGE MATRICES 13

1.1.4 Voorbeeld: de gelijkvormigheidsklassen van de vectorruimte F2×22

We illustreren het voorgaande in de meest eenvoudige setting mogelijk. Beschouw het eindigelichaam F2 = 0, 1 met optelling en vermenigvuldiging als in de volgende tabellen,

+ 0 1

0 0 1

1 1 0

en

× 0 1

0 0 0

1 0 1

De tweedimensionale vectorruimte F22 over F2 bestaat uit de volgende vier elementen,

F22 =

[00

],

[10

],

[01

],

[11

].

Opmerking 1.1.23 Er zijn 44 = 256 verschillende manieren om aan iedere v ∈ F22 een

element K(v) ∈ F22 toe te kennen. Er bestaan dus 256 verschillende afbeeldingen K van F2

2

naar F22, waarvan zal blijken dat slechts een klein deel lineair is.

De drie elementen uit F22 ongelijk aan nul zijn paarsgewijs lineair onafhankelijk. Hieruit volgt

dat er zes verschillende basissen bestaan van F22, namelijk de drie basissen⟨[

10

],

[01

]⟩,

⟨[10

],

[11

]⟩,

⟨[01

],

[11

]⟩,

en de drie basissen waarin de volgorde van ieder bovenstaand paar van vectoren is omgedraaid.

De vectorruimte F2×22 van 2× 2 matrices met entries uit F2 bevat de volgende 16 elementen,[

0 00 0

],

[1 00 0

],

[0 01 0

],

[0 10 0

],

[0 00 1

],

[1 01 0

],

[1 10 0

],

[1 00 1

],

[1 11 1

],

[0 11 1

],

[1 10 1

],

[1 01 1

],

[1 11 0

],

[0 10 1

],

[0 01 1

],

[0 11 0

].

Hiervan zijn er slechts zes inverteerbaar,

GL2(F2) =

[1 00 1

],

[0 11 0

],

[0 11 1

],

[1 10 1

],

[1 01 1

],

[1 11 0

].

De derde matrix is de inverse van de zesde, de overige vier zijn inverse van zichzelf. Merk decorrespondentie op tussen de matrices uit GL2(F2) en de bovengegeven zes basissen van F2

2.

Opmerking 1.1.24 De elementaire matrices in GL2(F2) zijn I = D21(1) = D2

2(1) en

Π212 =

[0 11 0

], E2

12(1) =

[1 10 1

], E2

21(1) =

[1 01 1

].

De overige twee elementen van F2×22 zijn hiervan een product:[

0 11 1

]= Π2

12E221(1) en

[1 11 0

]= Π2

12E212(1).

Dit laat zien dat iedere X ∈ GL2(F2) een product is van elementaire matrices.

Page 14: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

14 HOOFDSTUK 1. CANONIEKE VORMEN

Volgens Lemma 1.1.18 is iedere A ∈ F2×22 de matrix van een lineaire transformatie L van

F22 ten opzichte van een gegeven basis van F2

2, dus bevat homF2(F22,F2

2) zestien elementen.Sommige van de matrices in F2×2

2 zijn gelijkvormig, zoals bijvoorbeeld[0 11 1

]= (Π2

12)−1

[1 11 0

]Π2

12,

en zijn dus matrices van dezelfde lineaire transformatie ten opzichte van verschillende basissen.

Opmerking 1.1.25 Gelijkvormigheid kan vaak al ontkracht worden door het berekenen vaneigenwaarden en eigenvectoren. Dat laatste is hier zeer eenvoudig: voor A ∈ F2×2

2 , berekenAv voor de drie niet-nul elementen uit F2

2 en controleer of Av een veelvoud van v is. Omdat[0 11 1

] [10

]=

[01

],

[0 11 1

] [01

]=

[11

],

[0 11 1

] [11

]=

[10

]heeft de hier figurerende matrix uit F2×2

2 helemaal geen eigenwaarden in F2, en is dus bij-voorbeeld niet gelijkvormig met de volgende matrix die een eigenwaarde nul heeft:[

1 11 1

] [11

]=

[00

].

De overige twee vectoren in F22 zijn geen eigenvectoren voor deze laatste matrix.

Enig rekenwerk verdeelt de 16 elementen van F2×22 onder in de volgende zes equivalentieklassen

C1, . . . , C6 onder gelijkvormigheid:

C1 =

[0 00 0

], C2 =

[1 00 1

], C3 =

[0 11 1

],

[1 11 0

],

C4 =

[1 11 1

],

[0 10 0

],

[0 01 0

], C5 =

[0 11 0

],

[1 10 1

],

[1 01 1

],

C6 =

[1 00 0

],

[0 00 1

],

[1 10 0

],

[0 01 1

],

[1 01 0

],

[0 10 1

].

Kennelijk bestaat er niet voor iedere lineaire transformatie L van een vectorruimte V eenbasis β zo, dat Lββ bovendriehoeksmatrix is. We onderzoeken nu wanneer dit wel zo is.

1.2 Triangulatiestellingen voor lineaire transformaties

We memoreren de definitie van diagonaliseerbaarheid van lineaire transformaties en matrices.

Definitie 1.2.1 (Diagonaliseerbaar) Een lineaire transformatie L ∈ homK(V, V ) heet dia-

gonaliseerbaar als er een basis β van V bestaat waarvoor Lββ een diagonaalmatrix is. Een

matrix A ∈ Kn×n heet diagonaliseerbaar als A gelijkvormig is met een diagonaalmatrix.

Opmerking 1.2.2 Sectie 1.1 laat zien dat L diagonaliseerbaar is als en alleen als iederematrix Lγγ van L gelijkvormig is met een diagonaalmatrix.

Page 15: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 15

Niet iedere lineaire transformatie L van een vectorruimte V over K is diagonaliseerbaar. Alshet lichaam K echter algebraısch afgesloten is, dan zal het wel altijd mogelijk blijken om Lop bovendriehoeksvorm te brengen.

Definitie 1.2.3 Een lichaam K heet algebraısch afgesloten als ieder niet-constant polynoomp ∈ K[X] met coefficienten in K een nulpunt heeft in K.

Stelling 1.2.4 (Hoofdstelling van de Algebra) Het lichaam C is algebraısch afgesloten.

Naast dit bekende voorbeeld van een algebraısch afgesloten lichaam geven we nog een tweedevoorbeeld, met als doel te laten zien dat de komende stellingen niet uitsluitend over C gaan.

Definitie 1.2.5 (Algebraısche en transcendente getallen) Een getal a ∈ C heet alge-braısch als a een nulpunt is van een polynoom p ∈ Z[X]. We schrijven Q voor de verzamelingvan algebraısche getallen. De getallen in C \Q heten transcendent.

Bekende voorbeelden van transcedente getallen zijn π en e.

Stelling 1.2.6 De deelverzameling Q ⊂ C is een algebraısch afgesloten en aftelbaar lichaam.Het is de doorsnede van alle algebraısch afgesloten lichamen die Q bevatten.

In navolging van het voorgaande geven we nu ook een bekend en een minder bekend voorbeeldvan lichamen die niet algebraısch afgesloten zijn.

Voorbeeld 1.2.7 Het lichaam R is niet algebraısch afgesloten. Immers, het niet-constantepolynoom p(X) = 1 +X2 uit R[X] heeft geen nulpunt in R.

Voorbeeld 1.2.8 Beschouw het lichaam F2 uit Sectie 1.1.4. Het polynoom p(X) = 1 + X2

uit F2[X] heeft wel een nulpunt in F2. Desondanks is F2 niet algebraısch afgesloten: hetniet-constante polynoom p(X) = X2 +X + 1 heeft namelijk geen nulpunt in F2.

In Stelling 1.2.9 en Stelling 1.2.10 geven we nu twee formuleringen van hetzelfde resultaat,dat we vervolgens in een aantal stappen, geıllustreerd met voorbeelden, gaan bewijzen.

Stelling 1.2.9 (Triangulatiestelling van Jacobi) Zij (V,K) een vectorruimte over een al-gebraısch afgesloten lichaam K. Voor iedere lineaire transformatie L : V → V bestaat er eenbasis γ van V waarvoor de matrix Lγγ van L een bovendriehoeksmatrix in Kn×n is.

Een equivalente (zie Sectie 1.1) matrix-formulering van Stelling 1.2.9 is de volgende.

Stelling 1.2.10 (Matrixtriangulatie) Als K algebraısch afgesloten is, dan is iedere A ∈Kn×n gelijkvormig met een bovendriehoeksmatrix in Kn×n.

Opmerking 1.2.11 In Sectie 1.1.4 zagen we dat de volgende twee matrices een gelijkvor-migheidklasse vormen in F2×2

2 , [0 11 1

],

[1 11 0

].

Geen van beide is dus gelijkvormig met een bovendriehoeksmatrix in F2×22 . Dit laat zien dat

de veronderstelling in Stelling 1.2.10 dat K algebraısch afgesloten is kan niet gemist worden.

Page 16: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

16 HOOFDSTUK 1. CANONIEKE VORMEN

1.2.1 Geschiedenis en motivatie

Stelling 1.2.10 is vernoemd naar Carl Jacobi (1804-1851), die hem in 1837 publiceerde.

Carl Jacobi (1804-1851) en Issai Schur (1875-1941)

Issai Schur (1875-1941) liet zien dat er onder dezelfde voorwaarden zelfs altijd een ortho-

normale basis β van V bestaat zodanig dat de matrix Lββ van de lineaire transformatie Lbovendriehoeks is. Dit sterkere resultaat staat te boek als de Schurdecompositie. We bewij-zen het in Sectie 1.2.6. Vervolgens illustreren we het belang van de Schurdecompositie. InSectie 1.2.7 zien we hoe de Schurdecompositie kan worden ingezet om een kort bewijs te gevenin de context van Google’s PageRank. In Sectie 1.2.8 leiden we er de diverse spectraalstellingenmee af voor normale, voor zelfgeadjungeerde, en voor unitaire transformaties.

We beginnen echter in Secties 1.2.2 en 1.2.3 met het bestuderen van twee eenvoudige gevallenvan Stelling 1.2.10, te weten A ∈ K2×2 en A ∈ K3×3, en geven enkele voorbeelden. Daarnazal een inductieargument in Sectie 1.2.4 de stelling bewijzen voor A ∈ Kn×n voor alle n ∈ N.

1.2.2 Triangulatie van 2× 2 matrices

De volgende relatief eenvoudige observatie staat aan de basis van alle triangulatiestellingen.

Lemma 1.2.12 Gegeven een matrix A ∈ Kn×n met K algebraısch afgesloten. Laat λ ∈ K en0 6= x ∈ Kn met Ax = λx. Laat X ∈ GLn(K) zijn, met eerste kolom gelijk aan x. Dan is

X−1AX =

λ ∗ . . . ∗0 ∗ . . . ∗...

......

0 ∗ . . . ∗

. (1.14)

Oftewel, de eerste kolom van X−1AX is gelijk aan λe1.

Bewijs. Omdat Xe1 gelijk is aan de eerste kolom x van X, geldt

Ax = λx⇔ AXe1 = λXe1 ⇔ X−1AXe1 = λe1.

Omdat X−1AXe1 de eerste kolom is van de matrix X−1AX, bewijst dit de bewering.

Page 17: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 17

Opmerking 1.2.13 Als A ∈ Kn×n en K is algebraısch afgesloten, dan heeft het karakteris-tieke polynoom p(A) ∈ K[X]≤n van A tenminste een nulpunt in K en dus bestaan λ ∈ K enx ∈ Kn, x 6= 0 zodanig dat Ax = λx. Daarnaast kan x ook altijd uitgebreid worden toteen basis γ = 〈x, x2, . . . , xn〉 van Kn, en dus bestaat er een X ∈ GLn(K) met eerste kolomXe1 = x. Dus voor alle A ∈ Kn×n is voldaan aan de voorwaarden van Lemma 1.2.12.

Opmerking 1.2.14 Beschouw de reele vectorruimte (R2,R). Het lichaam R is niet alge-braısch afgesloten: het niet-constante polynoom p(X) = 1+X2 heeft immers geen nulpunt inR. De rotatie om de oorsprong van R2 over 90 graden is een lineaire transformatie L : R2 → R2

zonder reele eigenwaarden. Er bestaat daarom geen basis β van R2 zodanig dat Lββ een bo-vendriehoeksmatrix is.

Lemma 1.2.12 geeft onmiddellijk het bewijs van Stelling 1.2.10 voor n = 2, en ook eenrekenrecept om X ∈ GL2(K) te bepalen zodanig dat X−1AX = R bovendriehoeks is.

Gevolg 1.2.15 Laat A ∈ K2×2 en Ax = λx met λ ∈ K en 0 6= x ∈ K2. Laat X ∈ GL2(K)een matrix zijn met eerste kolom gelijk aan x. Dan is

X−1AX =

[λ ∗0 ∗

](1.15)

en dit is dus een bovendriehoeksmatrix die gelijkvormig is met de matrix A.

Bewijs. De matrix X−1AX in (1.14) is nu 2× 2 en dus triviaal bovendriehoeks.

Voorbeeld 1.2.16 We beschouwen de matrix A ∈ C2×2 met als enige eigenwaarde λ = 1,

A =

[7 4−9 −5

], ker(A− I) = spanx met x =

[−2

3

]. (1.16)

Omdat A geen twee lineair onafhankelijke eigenvectoren heeft, is A niet diagonaliseerbaar. Wegaan daarom A op bovendriehoeksvorm brengen. Kies hiertoe, als een van de vele mogelijkekeuzes (zie ook Opmerking 1.2.17) voor X ∈ GL2(C) de matrix

X =

[−2 1

3 −2

], dan is X−1 =

[−2 3

1 −2

](1.17)

en vinden we

X−1AX =

[−2 3

1 −2

] [7 4−9 −5

] [−2 1

3 −2

]=

[1 10 1

]= R. (1.18)

En dus is R een bovendriehoeksmatrix gelijkvormig met A.

Opmerking 1.2.17 De keuze van X in (1.17) is verre van uniek; de eerste kolom kan iedereeigenvector van A zijn, de tweede kolom iedere vector die geen veelvoud is van de eerste. Hierkozen we de tweede kolom zo, dat det(X) = 1. Hierdoor bevat de inverse X−1 geen breuken.Verschillende keuzes resulteren doorgaans in verschillende bovendriehoeksvormen van A, dienatuurlijk wel dezelfde diagonaal-elementen hebben (mogelijk in een andere volgorde).

Page 18: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

18 HOOFDSTUK 1. CANONIEKE VORMEN

Opmerking 1.2.18 De matrix X kan zelfs zo worden gekozen, dat de kolommen orthonor-maal zijn, door de gevonden eigenvector op lengte een te schalen, en er een tweede kolom metlengte een loodrecht op de eerste naast te zetten. In Sectie 1.2.6 komen we hier op terug.

Het volgende voorbeeld illustreert Stelling 1.2.9 ingeval n = 2.

Voorbeeld 1.2.19 Beschouw de complexe vectorruimte (C[X]≤1,C) van polynomen van graadten hoogste een in X met complexe coefficienten, met daarop de lineaire transformatie

L : C[X]≤1 → C[X]≤1 : p 7→ p+ p(0)X. (1.19)

Het polynoom p1 met voorschrift p1(X) = X is een eigenvector van L bij eigenwaarde 1,immmers, L(p1) = p1 + 0 · p1 = p1. Samen met het constante polynoom p2(X) = 1 geeft diteen basis β = 〈p1, p2〉 van C[X]≤1. Het is vervolgens eenvoudig om na te gaan dat

Lββ =

[1 10 1

], (1.20)

dus de matrix van L ten opzichte van β is een bovendriehoeksmatrix.

Opmerking 1.2.20 De algemene werkwijze bij een lineaire transformatie L van een twee-dimensionale vectorruimte V is, om eerst de matrix Lγγ ∈ K2×2 horend bij een willekeurigebasis γ = 〈γ1, γ2〉 van V te bepalen. Immers, als vervolgens x = (x1, x2)> een eigenvectoris van Lγγ in K2, dan is u = x1γ1 + x2γ2 een eigenvector van L in V . Vul vervolgens 〈u〉 op

willekeurige wijze aan tot een basis β = 〈u, v〉 van V , dan is Lββ bovendriehoeks.

1.2.3 Blokvermenigvuldiging en triangulatie van 3× 3 matrices

We laten nu middels een voorbeeld zien hoe we een matrix A ∈ K3×3 op bovendriehoeksvormkunnen brengen, gebruik makend van het feit dat we dit voor 2× 2 matrices al kunnen.

Eerst een nuttig lemma over het rekenen met matrices die in blokvorm zijn gepartitioneerd.

Lemma 1.2.21 (Blokvermenigvuldiging) Laat X,Y ∈ Kn×n en laat k, ` ∈ N met k+` =n. Partitioneer

X =

[A B

C D

]en Y =

[E F

G H

], (1.21)

waarbij A,E ∈ Kk×k en D,H ∈ K`×`. Dan geldt

XY =

[AE +BG AF +BH

CE +DG CF +DH

]. (1.22)

Bewijs. Volgt door geduldig uitschrijven.

De blokvermenigvuldiging in (1.22) is dus volstrekt analoog aan die van twee 2× 2 matrices.

Gevolg 1.2.22 Veronderstel dat X ∈ Kn×n gepartitioneerd wordt als

X =

[A B

0 D

], (1.23)

Page 19: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 19

waarbij A ∈ Kk×k en D ∈ K`×` met k, ` ∈ N, k + ` = n. Laat H ∈ GL`(K), dan geldt[I 0

0 H

]−1

X

[I 0

0 H

]=

[A BH

0 H−1DH

], (1.24)

waarbij I ∈ Kk×k de identiteitsmatrix is.

De blokvermenigvuldiging in Gevolg 1.2.22 zullen we gebruiken in het volgende voorbeeld.

Voorbeeld 1.2.23 De volgende matrix A heeft als enige eigenwaarde λ = 1,

A =

−1 −1 3−2 −2 5−2 −3 6

en ker(A− I) = spanx met x =

111

. (1.25)

Er zijn dus geen drie lineair onafhankelijke eigenvectoren, en dus is A niet diagonaliseerbaar.We laten zien hoe we A op bovendriehoeksvorm kunnen brengen. Hiertoe construeren we eersteen eenvoudig inverteerbare matrix X ∈ GL3(K) waarvoor Xe1 = x, bijvoorbeeld,

X =

1 0 01 1 01 0 1

, waarvoor X−1 =

1 0 0−1 1 0−1 0 1

, (1.26)

en vinden we in overeenstemming met Lemma 1.2.12 dat

X−1AX =

1 −1 3

0 −1 20 −2 3

= B (1.27)

een matrix is met als eerste kolom λe1 = e1. Beschouw vervolgens de 2× 2 matrix

C =

[−1 2−2 3

]met eigenvector

[11

]. (1.28)

Deze 2× 2 matrix kan, net als in Voorbeeld 1.2.16, op bovendriehoeksvorm worden gebracht,bijvoorbeeld middels de matrix Y ∈ GL2(C)

Y −1CY =

[1 0−1 1

] [−1 2−2 3

] [1 01 1

]=

[1 20 1

]. (1.29)

En dus, met behulp van Gevolg 1.2.22 vinden we dat[1 0

0 Y

]−1

B

[1 0

0 Y

]=

1 2 3

0 1 20 0 1

= R. (1.30)

Combineren we (1.27) en (1.30) dan zien we dat we met

Z = X

[1 0

0 Y

]=

1 0 01 1 01 0 1

1 0 00 1 00 1 1

=

1 0 01 1 01 1 1

(1.31)

een matrix Z ∈ GL3(C) hebben gecontrueerd waarvoor Z−1AZ = R bovendriehoeks is.

Page 20: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

20 HOOFDSTUK 1. CANONIEKE VORMEN

Opmerking 1.2.24 Ondanks dat in (1.26) iedere inverteerbare matrix X met een niet-triviaal veelvoud van x als eerste kolom volstaat, is het plezierig als X zonder al te veelrekenwerk geınverteerd kan worden. Merk hiertoe op dat X altijd van de vorm 1 0 0

a 1 0b 0 1

of

0 0 11 0 0a 1 0

of

0 0 10 1 01 0 0

, (a, b ∈ K) (1.32)

kan worden gekozen, en dat de inverses hiervan vrijwel onmiddellijk op te schijven zijn.

Opmerking 1.2.25 Ook de 2×2 matrix Y in (1.29) is op soortgelijke wijze gekozen om zijneenvoudige inverse: het is altijd mogelijk om voor Y een marix van de vorm

Y =

[1 0a 1

]of Y =

[0 11 0

](1.33)

te kiezen, en ook hiervan zijn de inverse direct op te schrijven.

Opmerking 1.2.26 Ook in dit voorbeeld kan zowel de matrix X als de matrix Y zo wordengekozen, dat de kolommen orthonormaal zijn. De matrix X zal echter doorgaans niet meervan de vorm (1.32) zijn, noch zal Y van de vorm (1.33) zijn. Dit resulteert dan in een matrixZ met orthonormale kolommen zodanig dat Z−1AZ bovendriehoeks is. Zie weer Sectie 1.2.6.

Het zal nu duidelijk zijn hoe een matrix A ∈ Kn×n op bovendriehoeksvorm kan wordengebracht, ervanuitgaande dat we weten hoe dat moet voor een matrix B ∈ K(n−1)×(n−1).

1.2.4 Inductiebewijs van de triangulatiestelling van Jacobi

We bewijzen nu Stelling 1.2.10 met behulp van volledige inductie. We veronderstellen dat Keen algebraısch afgesloten lichaam is.

Inductiebasis: In Gevolg 1.2.15 in Sectie 1.2.2 zagen we reeds dat Stelling 1.2.10 geldt voorn = 2. De stelling geldt overigens natuurlijk ook voor n = 1.

Inductiehypothese: Voor iedere matrix B ∈ K(n−1)×(n−1) bestaat er een Y ∈ GLn−1(K)zodanig dat Y −1BY = T een bovendriehoeksmatrix is.

Inductiestap: Laat A ∈ Kn×n. Dan bestaat er volgens Lemma 1.2.12 een matrix X ∈GLn(K) zodanig dat

X−1AX =

[λ b

0 B

]. (1.34)

Hierbij is b ∈ K1×(n−1) en B ∈ K(n−1)×(n−1) en is λ ∈ K een eigenwaarde van A. Volgens deinductiehypothese bestaat er een Y ∈ GLn−1(K) zodanig, dat Y −1BY = T bovendriehoeksis. Met behulp van Gevolg 1.2.22 geldt nu dat[

1 0

0 Y

]−1

X−1AX

[1 0

0 Y

]=

[1 0

0 Y

]−1 [λ b

0 B

] [1 0

0 Y

]=

[λ bY

0 T

]= R,

en omdat T bovendriehoeks is, is R dat ook. Merk tot slot op dat de matrix

Z = X

[1 0

0 Y

]∈ GLn(K), (1.35)

Page 21: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 21

als product van twee inverteerbare matrices. We concluderen dat Z−1AZ = R bovendriehoeksis. Dit bewijst Stelling 1.2.10.

Opmerking 1.2.27 De triangulatieconstructie van Jacobi kan al worden ingezet zodra eeneigenwaarde van A bekend is. Daarna moet steeds een eigenwaarde van een kleinere matrixgevonden worden om het proces te kunnen continueren. Mocht A diagonaliseerbaar zijn, danleidt dit proces in het algemeen echter niet automatisch tot een diagonalisatie van A.

Voorbeeld 1.2.28 Gegeven de matrix

A =

1 −1 −1−2 1 −2

2 1 4

met Ax = x voor x =

11−1

. (1.36)

Een eenvoudig inverteerbare matrix X ∈ GL3(C) met x als eerste kolom is

X =

1 0 01 1 0−1 0 1

met X−1 =

1 0 0−1 1 0

1 0 1

. (1.37)

We vinden nu dat

X−1AX =

1 −1 −10 2 −10 0 3

= R, (1.38)

en R is bij toeval al bovendriehoeks. De eigenwaarden van A staan op de diagonaal van R.Indien gewenst kan A nu gediagonaliseerd worden door een basis van eigenvectoren te bepalen.

1.2.5 Invariante deelruimtes en complete vlaggen

Om de meetkundige betekenis van de triangulatiestelling van Jacobi te duiden, introducerenwe twee nieuwe meetkundige begrippen.

Definitie 1.2.29 (Invariante deelruimte) Zij L ∈ homK(V, V ). Een deelruimte U van Vheet invariant onder L, of, indien de context duidelijk is kortweg invariant, als geldt datL(u) ∈ U voor alle u ∈ U .

Om aan te geven dat L(u) ∈ U voor alle u ∈ U zullen we ook de notatie L(U) ⊂ U gebruiken.

Voorbeeld 1.2.30 Zij u een eigenvector van een lineaire transformatie L : V → V van eenvectorruimte (V,K). Dan is U = spanu een invariante deelruimte onder L.

Voorbeeld 1.2.31 Iedere deelruimte U ⊂ V van een vectorruimte (V,K) is invariant onderzowel de identieke afbeelding id : V → V : v 7→ v, als de nulafbeelding 0 : V → V : v 7→ 0.

Definitie 1.2.32 (Vlag) Zij V een vectorruimte van dimensie n. Een rij geneste deelruimtes

U1 ⊂ U2 ⊂ · · · ⊂ Uk ⊂ V met dim(U1) < dim(U2) < · · · < dim(Uk) (1.39)

met strict stijgende dimensies heet een vlag, en een complete vlag indien k = n.

Page 22: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

22 HOOFDSTUK 1. CANONIEKE VORMEN

Definitie 1.2.33 (Geınduceerde complete vlag) Zij γ = 〈c1, . . . , cn〉 een basis van eenvectorruimte (V,K). Laat voor iedere k ∈ 1, . . . , n,

Uk = spanc1, . . . , ck. (1.40)

Dan heet U1 ⊂ U2 ⊂ · · · ⊂ Un = V de door γ geınduceerde complete vlag.

Voorbeeld 1.2.34 De standaardbasis 〈e1, . . . , en〉 induceert E1 ⊂ E2 ⊂ · · · ⊂ En = Kn metEk = spane1, . . . , ek. Deze complete vlag heet de standaardvlag in Kn.

Het volgende lemma combineert de concepten van complete vlag en invariante deelruimte.

Lemma 1.2.35 Laat R ∈ Kn×n. De standaardvlag bestaat uit invariante deelruimtes onderde lineaire transformatie L : Kn → Kn : x 7→ Rx als en alleen als R bovendriehoeks is.

Bewijs. Laat k ∈ 1, . . . , n. Duidelijk is datRx ∈ Ek voor alle x ∈ Ek alsR bovendriehoeksis, en dus is Ek invariant onder L. Als R niet bovendriehoeks is, is e>i Rej 6= 0 voor zekeren ≥ i > j ≥ 1. Maar dat betekent dat Rej 6∈ Ej , en dus is Ej niet invariant.

We herformuleren nu de triangulatiestelling van Jacobi in deze nieuwe terminologie.

Stelling 1.2.36 Zij (V,K) een vectorruimte met K algebraisch afgesloten. Voor iedere L ∈homK(V, V ) bestaat er een complete vlag van invariante deelruimtes onder L.

Bewijs. Laat op grond van Stelling 1.2.10 γ = 〈c1, . . . , cn〉 een basis van V zijn waarvoorLγγ een bovendriehoeksmatrix is. We gaan aantonen dat de door γ geınduceerde completevlag U1 ⊂ U2 ⊂ . . . Un−1 ⊂ Un = V bestaat uit invariante deelruimtes Uk = spanc1, . . . , ck.Merk hiertoe op dat Lγγ de matrix is waarvoor geldt dat

coγ(L(v)) = Lγγcoγ(v) (1.41)

voor alle v ∈ V , waarbij coγ : V → Kn de coordinaatafbeelding is. Laat nu k ∈ 1, . . . , n ge-geven zijn en kies u ∈ Uk. Dan is coγ(u) ∈ Ek = spane1, . . . , ek. Omdat Lγγ bovendriehoeksis, is wegens Lemma 1.2.35 ook Lγγcoγ(u) ∈ Ek. En dus geeft (1.41) dat coγ(L(u)) ∈ Ek, watequivalent is met L(u) ∈ Uk. Dit bewijst de bewering.

We besteden nu even kort aandacht aan de omkering van de uitspraak in Stelling 1.2.36.

Stelling 1.2.37 Zij L : V → V een lineaire transformatie van een vectorruimte (V,K).Veronderstel dat U1 ⊂ U2 ⊂ . . . Un−1 ⊂ Un = V een complete vlag van invariante deelruimtesonder L is. Dan bestaat er een basis γ van V waarvoor Lγγ bovendriehoeks is.

Bewijs. Laat γ1 = c1 een basis zijn van U1. Kies nu voor iedere k ∈ 2, . . . , n achtereen-volgens γk = γk−1 ∪ ck waarbij ck ∈ Uk en ck 6∈ Uk−1. Dan is γ = γn = 〈c1, . . . , cn〉 eenbasis van V met de eigenschap dat L(ck) ∈ Uk, en dus is Lγγ een bovendriehoeksmatrix.

Page 23: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 23

1.2.6 De triangulatiestelling van Schur

In deze sectie gaan we na wat het concept inproduct kan toevoegen aan de triangulatiestellingvan Jacobi. Dit zal leiden tot de triangulatiestelling van Schur.

Lemma 1.2.38 Laat (V,K, 〈·, ·〉) een inproductruimte zijn met basis γ = 〈c1, . . . , cn〉. LaatU1 ⊂ U2 ⊂ · · · ⊂ Un de complete vlag zijn geınduceerd door de basis γ van V . Dan bestaat erook een orthonormale basis β die diezelfde vlag induceert.

Bewijs. Definieer U0 = 0. Voor iedere opeenvolgende k ∈ 1, . . . , n, kies bk ∈ Uk metbk ⊥ Uk−1 en ‖bk‖ = 1. Dan is spanb1, . . . , bk = Uk voor alle k ∈ 1, . . . , n. Dus induceert〈b1, . . . , bn〉 dezelfde comlete vlag als γ. Omdat bk loodrecht staat op b1, . . . , bk−1 en ‖bk‖ = 1voor alle k ∈ 1, . . . , n is β = 〈b1, . . . , bn〉 daarnaast ook een orthonormale basis van V .

Gevolg 1.2.39 Het Gram-Schmidt proces toegepast op γ resulteert in een orthonormale basisβ die dezelfde vlag induceert als γ. Immers, een van de karakteriserende eigenschappen vanhet Gram-Schmidt proces is dat voor alle k ∈ 1, . . . , n

spanb1, . . . , bk = spanc1, . . . , ck. (1.42)

Gram-Schmidt is dus een speciaal geval van de constructie in het bewijs van Lemma 1.2.38.

Na deze inleiding zijn we in staat om de triangulatiestelling van Schur te bewijzen.

Stelling 1.2.40 (Triangulatiestelling Schur) Zij (V,K, 〈·, ·〉) een inproductruimte over eenalgebraısch afgesloten lichaam K. Voor elke lineaire transformatie L : V → V bestaat er eenorthonormale basis β van V waarvoor de matrix Lββ van L een bovendriehoeksmatrix is.

Bewijs. Op grond van Stelling 1.2.9 bestaat er een basis γ = 〈c1, . . . , cn〉 van V zodanig,dat de matrix Lγγ een bovendriehoeksmatrix is. Laat U1 ⊂ U2 ⊂ · · · ⊂ Un = V de doorγ geınduceerde complete vlag zijn. Volgens Stelling 1.2.36 bestaat deze uit invariante deel-ruimtes onder L. Volgens Lemma 1.2.38 bestaat er een orthonormale basis β = 〈b1, . . . , bn〉zodanig dat voor alle k ∈ 1, . . . , n dat

spanb1, . . . , bk = spanc1, . . . , ck = Uk. (1.43)

Omdat Uk invariant is, geldt L(bk) ∈ spanb1, . . . , bk, en dus is Lββ bovendriehoeks.

De overeenkomstige formulering van Stelling 1.2.40 in termen van matrices is de volgende.

Stelling 1.2.41 Gegeven een matrix A ∈ Kn×n met K algebraısch afgesloten en een inproduct〈·, ·〉 op Kn. Dan bestaat er een matrix U ∈ Kn×n met 〈·, ·〉-orthonormale kolommen zodanigdat U−1AU = R een bovendriehoeksmatrix is.

Opmerking 1.2.42 Met A ∈ Cn×n en 〈·, ·〉 het standaardinproduct op Cn, zegt Stelling1.2.41 dat er een unitaire matrix U bestaat zodanig dat U∗AU = R bovendriehoeks is.

Definitie 1.2.43 (Schurvorm en Schurdecompositie) Een bovendriehoeksmatrix R alsin Stelling 1.2.40 en Stelling 1.2.41 heet een Schurvorm van L of A, en de factorisatie A =URU∗ equivalent aan Stelling 1.2.41 een Schurdecompositie of Schurfactorisatie van A.

Page 24: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

24 HOOFDSTUK 1. CANONIEKE VORMEN

Opmerking 1.2.44 Stelling 1.2.41 kan ook als volgt worden bewezen. Laat Au = λu met‖u‖ = 1. Laat U ∈ Kn×n een matrix zijn met orthonormale kolommen met Ue1 = u. Danis volgens Lemma 1.2.12 de eerste kolom van U−1AU gelijk is aan λe1. Vervolgens kan eeninductiebewijs worden gegeven, met als enige verschil met Sectie 1.2.6 dat de transforma-tiematrices niet alleen inverteerbaar zijn, maar zelfs orthonormale kolommen hebben. Ditalternatieve korte bewijs heeft twee nadelen. Ten eerste zouden we dan de triangulatiestellingvan Jacobi niet zijn tegengekomen, en die zal later zijn nut nog bewijzen. Ten tweede is hetveel minder rekenwerk eerst een basis γ te bepalen ten opzichte waarvan Lγγ bovendriehoeksis, en deze vervolgens met Gram-Schmidt te orthonormaliseren. Het boven gesuggereerdeinductiebewijs volgend hebben we voor iedere k ∈ 2, . . . , n een k × k matrix nodig metorthonormale kolommen, wat tot veel overbodige orthonormalisaties leidt.

Voorbeeld 1.2.45 In Voorbeeld 1.2.16 zagen we de matrix A ∈ C2×2,

A =

[7 4−9 −5

], ker(A− I) = spanx met x =

[−2

3

]. (1.44)

We brachten A op bovendriehoeksvorm door een X ∈ GL2(C) te construeren met x als eer-ste kolom. We willen nu een sterker resultaat, namelijk, A op bovendriehoeksvorm brengenmiddels een matrix U met orthonormale kolommen. Kies derhalve

U =1√13

[−2 3

3 2

](1.45)

dan heeft U orthonormale kolommen, geldt dus dat U−1 = U∗, en vinden we vervolgens

U∗AU =1√13

[−2 3

3 2

] [7 4−9 −5

]1√13

[−2 3

3 2

]=

[1 −130 1

]. (1.46)

De rechtermatrix is inderdaad bovendriehoeks, maar niet gelijk aan R uit Voorbeeld 1.2.16.

De Frobeniusnorm ‖A‖F van een matrix A ∈ Cn×n is de wortel van de som van de kwadratenvan de entries van A. Het is niet moelijk in te zijn dat als U unitair is,

‖U∗AU‖F = ‖A‖F . (1.47)

In het bovenstaande voorbeeld uit zich dit in de gelijkheid

42 + 52 + 72 + 92 = 12 + 12 + 132. (1.48)

We beschouwen nu nogmaals de matrix uit Voorbeeld 1.2.23.

Voorbeeld 1.2.46 In Voorbeeld 1.2.23 zagen we de matrix A ∈ C3×3 met enige eigenwaardeλ = 1 en

A =

−1 −1 3−2 −2 5−2 −3 6

en ker(A− I) = spanx met x =

111

. (1.49)

Na enig rekenwerk vonden we in (1.30) dat

Z−1AZ =

1 2 30 1 20 0 1

, waarbij Z =

1 0 01 1 01 1 1

. (1.50)

Page 25: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 25

Om een matrix U met orthonormale kolommen te vinden waarvoor U−1AU bovendriehoeksis, volstaat het volgens Gevolg 1.2.39 om het Gram-Schmidt proces (van links naar rechts) toete passen op de kolommen van Z. Dit geeft

U =

1/√

3 −2/√

6 0

1/√

3 1/√

6 1/√

2

1/√

3 1/√

6 −1/√

2

en U∗AU =

1√

18√

200/3

0 1√

16/30 0 1

. (1.51)

Deze bovendriehoeksmatrix is daarmee dus een Schurvorm van A.

Opmerking 1.2.47 Laat k ≤ n. Het toepassen van het Gram-Schmidt proces op de kolom-men b1, . . . , bk van een matrix B ∈ Kn×k resulteert in orthonormale vectoren q1, . . . , qk die dekolommen zijn van een matrix Q ∈ Kn×k zodanig dat

B = QR, Q>Q = I ∈ Kk×k, R ∈ Kk×k is bovendriehoeks. (1.52)

Immers, de `-de kolom b` van B is per constructie in het Gram-Schmidt proces een lineairecombinatie van q1, . . . , q`. De factorisatie (1.52) heet een QR-factorisatie van B. Indien nuX ∈ GLn(K) zodanig is, dat X−1AX = R bovendriehoeks is, en X = QU met Q>Q = I enU bovendriehoeks een QR-decompositie van X is, dan volgt dat

Q∗AQ = Q−1AQ = UX−1AXU−1 = URU−1

bovendriehoeks is als product van drie bovendriehoeksmatrices U,R en U−1. Dit bewijst deStelling van Schur in termen van QR-factorisatie van de matrix X in de Stelling van Jacobi.

1.2.7 Toepassing: Schur decompositie en Google’s PageRank

In het PageRank model van Page en Brin, de oprichters van Google, wordt een eigenvectorberekend van de Google matrix G ∈ Rn×n. Deze matrix G is van de vorm

G = αS + (1− α)T, met T =ee>

nen α ∈ [0, 1). (1.53)

Hierbij is e de all-ones vector, oftewel, de som van alle standaard basisvectoren, α is eengeheime parameter, en S ∈ Rn×n is een matrix die de link-structuur van het internet codeert.

Larry Page (b. 1973) en Sergey Brin (b. 1973)

Page 26: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

26 HOOFDSTUK 1. CANONIEKE VORMEN

Bekend is dat de entries in iedere kolom van S niet-negatief zijn en optellen op tot een, oftewel,

e>S = e> en dus S>e = e.

Zo’n matrix heet kolomstochastisch. Merk op dat hier niets anders staat dan dat e eeneigenvector is van S> horend bij eigenwaarde λ = 1. Dus heeft ook S een eigenwaarde 1.Omdat ook de kolommen van T optellen tot een, geldt hetzelfde voor G. Dus ook G iskolomstochastisch, en G>e = e. Dus is 1 ook een eigenwaarde van G. De volgende stelling isvan groot belang voor het efficient kunnen uitrekenen van een eigenvector horend bij λ = 1.

Stelling 1.2.48 dim ker(G− I) = 1. Als λ 6= 1 een eigenwaarde is van G, dan |λ| ≤ α.

Bewijs. Deze stelling werd in 2003 bewezen door S. Kamvar and T. Haveliwala.

Sepandar Kamvar en Taher Haveliwala

Ze publiceerden het in een onderzoeksartikel van acht bladzijden getitled The Second Eigen-value of the Google Matrix (Technical Report, Stanford University) dat inmiddels al ruimdriehonderd keer is geciteerd. Het kan veel korter met de Schurdecompositie.

Bewijs. Laat U∗S>U = R een Schurvorm van S> zijn met de eigenschap dat de eerste ko-lom u = Ue1 gelijk is aan de (genormaliseerde) eigenvector e/

√n van S>. Dan is U∗e =

√ne1,

is de linksboven entry van R aan een, en zijn alle andere diagonaalentries van R in absolutewaarde ten hoogste een. Het is niet moeilijk te zien dat ook de matrix

U∗G>U = αU∗S>U + (1− α)U∗ee∗U

n= αR+ (1− α)e1e

>1 , (1.54)

bovendriehoeks is. Immers, αR is bovendriehoeks, en (1 − α)e1e>1 is een matrix waarvan de

linksboven-entry gelijk is aan 1 − α en de overige entries zijn nul. De linksboven-entry vanU∗G>U is gelijk aan α · 1 + (1− α) = 1. De overige diagonaalentries zijn in absolute waardeten hoogste gelijk aan α. Maar deze diagnonaalentries zijn de eigenwaarden van U∗G>U , endus ook de eigenwaarden van G>, en dus de complex geconjugeerden van de eigenwaardenvan G. Omdat we al weten dat G ook een eigenwaarde λ = 1 heeft, weten we nu dat deeigenruimte behorende bij deze eigenwaarde dimensie een heeft als 0 ≤ α < 1.

1.2.8 Spectraalstellingen voor normale, Hermietse, en unitaire matrices

In deze sectie beperken we ons tot lineaire transformaties van complexe inproductruimtes enhun matrices A ∈ Cn×n. We brengen eerst de geadjungeerde transformatie in de herinnering.

Page 27: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 27

Definitie 1.2.49 ((Zelf-)geadjungeerde transformatie) Zij L : V → V een lineairetransformatie van een inproductruimte (V,C, 〈·, ·〉). Dan is de lineaire transformatie L∗ :V → V met de eigenschap dat

〈L∗(v), w〉 = 〈v, L(w)〉 voor alle v, w ∈ V (1.55)

de geadjungeerde van de transformatie L. Als L = L∗ heet L zelfgeadjungeerd.

Opmerking 1.2.50 De afbeelding L∗ is door (1.55) goedgedefinieerd: laat β = 〈b1, . . . , bn〉een orthonormale basis zijn van V , dan is L∗(v) = β1b1 + . . . βnbn waarbij βk uniek bepaaldwordt door w = bk te substitueren in (1.55). De lineariteit van L∗ is niet moeilijk.

Definitie 1.2.51 ((Zelf-)geadjungeerde matrix) De geadjungeerde A∗ van een matrix

A ∈ Cn×n is de matrix A∗ = A>

. Als A∗ = A dan heet A zelfgeadjungeerd.

Lemma 1.2.52 Zij L : V → V een lineaire transformatie van een inproductruimte (V,C, 〈·, ·〉)en K : V → V zijn geadjungeerde. Laat β = 〈b1, . . . , bn〉 een orthonormale basis zijn van V .Dan geldt

Kββ = (Lββ)∗, (1.56)

oftewel, de matrix van de geadjungeerde is gelijk aan de geadjungeerde van de matrix.

Bewijs. We passen stap voor stap bekende definities en resultaten toe,

e>i (Lββej)1= e>i coβ(L(bj))

2= 〈bi, L(bj)〉

3= 〈K(bi), bj〉

4= 〈bj ,K(bi)〉

5= e>j coβ(K(bi))

6= e>j K

ββ ei

en concluderen van de ij-de entry van Lββ de geconjugeerde is van de ji-de entry van Kββ .

Toelichtingen:

(1) coβ(L(v)) = Lββcoβ(v) voor alle v ∈ V en dus ook voor v = bj , waarmee coβ(v) = ej ;

(2) als L(bj) = α1b1 + · · ·+ αnbn dan is e>i coβ(L(bj)) = αi maar ook 〈bi, L(bj)〉 = αi;

(3) dit geldt precies wegens de definitie (1.55) van geadjungeerde afbeelding;

(4) geconjugeerde symmetrie van een complex inproduct;

(5) als K(bi) = γ1b1 + · · ·+ γnbn dan is 〈bj ,K(bj)〉 = γj maar ook e>j coβ(K(bi)) = γj ;

(6) coβ(K(v)) = Kββ coβ(v) voor alle v ∈ V en dus ook voor v = bi, waarmee coβ(v) = ei.

Gevolg 1.2.53 De matrix ten opzichte van een orthonormale basis van een zelfgeadjungeerdelineaire transformatie is zelfgeadjungeerd.

Na de geadjungeerde in de herinnering te hebben geroepen, zijn we in staat om normalelineaire transformaties te definieren.

Definitie 1.2.54 (Normale lineaire transformatie) Een lineaire transformatie L : V →V van een inproductruimte (V,C, 〈·, ·〉) heet normaal als

L∗ L = L L∗, (1.57)

waarbij staat voor de samenstelling van afbeelingen.

Page 28: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

28 HOOFDSTUK 1. CANONIEKE VORMEN

Definitie 1.2.55 (Normale matrix) Een matrix A ∈ Cn×n heet normaal als A∗A = AA∗.

De normale matrices zijn via orthonormale bases gerelateerd aan normale transformaties.

Lemma 1.2.56 Zij L : V → V een lineaire transformatie van een inproductruimte (V,C, 〈·, ·〉)en β een orthonormale basis van V . Dan is L normaal als en alleen als Lββ normaal is.

Bewijs. Als Lββ de matrix is van L, dan geeft Lemma 1.2.52 dat (Lββ)∗ de matrix is van L∗.Omdat daarnaast de matrix van een samengestelde afbeelding gelijk is aan het product vande matrices van de samenstellende afbeeldingen, volgt de bewering onmiddellijk.

We bewijzen nu nog twee belangrijke hulpresultaten, Lemma’s 1.2.57 en 1.2.58, voor normalematrices, die resulteren in de spectraalstelling voor normale matrices en transformaties.

Lemma 1.2.57 A ∈ Cn×n is normaal als en alleen als iedere Schurvorm van A normaal is.

Bewijs. Zij A = URU∗ een Schurdecompositie van A. Dan is A∗ = UR∗U∗ en dus

AA∗ = (URU∗)(UR∗U∗) = URR∗U∗ en A∗A = (UR∗U∗)(URU∗) = UR∗RU∗ (1.58)

Dus A∗A = AA∗ als en alleen als UR∗RU∗ = URR∗U∗. En omdat U inverteerbaar is, is ditzo als en alleen als R∗R = RR∗.

Lemma 1.2.58 Iedere normale bovendriehoeksmatrix R ∈ Cn×n is een diagonaalmatrix.

Bewijs. Met volledige inductie. Voor n = 1 is de uitspraak triviaal waar. Neem als induc-tiehypothese aan dat de uitspraak geldt voor iedere bovendriehoeksmatrix T ∈ C(n−1)×(n−1).Laat R ∈ Cn×n een bovendriehoeksmatrix zijn, en schrijf R∗R = RR∗ gepartitioneerd uit als[

ρ 0

r T ∗

] [ρ r∗

0 T

]=

[ρ r∗

0 T

] [ρ 0

r T ∗

](1.59)

waarbij ρ ∈ C, r ∈ Cn−1 en T ∈ C(n−1)×(n−1) bovendriehoeks. Uitvermenigvuldigen metbehulp van Lemma 1.2.21 geeft dat[

ρρ ρr∗

rρ rr∗ + T ∗T

]=

[ρρ+ r∗r r∗T ∗

Tr T ∗T

](1.60)

Dus is ρρ = ρρ+ r∗r, dus r∗r = 0 en volgt uit de inproduct-axioma’s dat r = 0. Maar dan isook rr∗ = 0, dus is T ∗T = T ∗T , en dus is T volgens de inductiehypothese diagonaal.

Stelling 1.2.59 (Spectraalstelling: normale matrices) Er is een unitaire matrix U zo-danig dat U∗AU = Λ een diagonaalmatrix is als en alleen als A ∈ Cn×n normaal is.

Bewijs. Zij A ∈ Cn×n normaal. Omdat C algebraısch afgesloten is, bestaat er een volgensStelling 1.2.41 een Schurdecompositie A = URU∗ van A met U unitair en R bovendriehoeks.Lemma 1.2.57 geeft dat R net als A normaal is, en Lemma 1.2.58 bewijst vervolgens dat R eendiagonaalmatrix is. Veronderstel omgekeerd dat A = UΛU∗ met U unitair en Λ diagonaal,dan geldt dat A∗ = UΛ∗U∗ en dus dat

A∗A = (UΛ∗U∗)(UΛU∗) = U(Λ∗Λ)U∗ = U(ΛΛ∗)U∗ = (UΛU∗)(UΛ∗U∗) = AA∗ (1.61)

Page 29: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.2. TRIANGULATIESTELLINGEN VOOR LINEAIRE TRANSFORMATIES 29

waarbij we gebruikten dat diagonaalmatrices triviaal normaal zijn. Dus is A normaal.

Spectraalstelling 1.2.59 is van centraal belang binnen de lineaire algebra. Het vertelt exactwelke lineaire transformaties L : V → V van een inproductruimte (V,C, 〈·, ·〉) ten opzichte

van een geschikt gekozen orthonormale basis β van V een diagonaalgedaante Lββ aannemen.

Stelling 1.2.60 (Spectraalstelling: normale transformaties) Laat L : V → V een li-neaire transformatie van een inproductruimte (V,C, 〈·, ·〉) zijn. Dan bestaat er een orthonor-

male basis β waarvoor Lββ een diagonaalmatrix is als en alleen als L normaal is.

Bewijs. Veronderstel dat L normaal is, en laat γ = 〈c1, . . . , cn〉 een orthonormale basisvan V zijn. Volgens Lemma 1.2.56 is Lγγ dan een normale matrix. Op grond van Stelling1.2.59 bestaat er een unitaire matrix U zodanig dat U∗LγγU diagonaal is. De kolommenvan U vormen dus een orthonormale basis van eigenvectoren van Lγγ . Zoals bekend is iedereeigenvector van Lγγ de coordinaatvector coγ(v) van een eigenvector v van L. Dus is voor iederej ∈ 1, . . . , n is de vector bj ∈ V gedefinieerd door

bj = u1jc1 + · · ·+ unjcn =

n∑i=1

uijci, voor U =

u11 . . . u1n...

...un1 . . . unn

(1.62)

een eigenvector van L. Daarnaast is ook β = 〈b1, . . . , bn〉 een orthonormale basis van V ,omdat voor alle i, j ∈ 1, . . . , n geldt

〈bi, bj〉 = 〈u1ic1 + · · ·+ unicn, u1jc1 + · · ·+ unjcn〉 = u1iu1j + · · ·+ uniunj = eiU∗Uej . (1.63)

Dus is Lββ diagonaal, en zelfs gelijk aan U∗LγγU . Dit bewijst een van beide implicaties. Deandere implicatie is een eenvoudige oefening.

De volgende spectraalstelling gaat over de deelverzameling van zelfgeadjungeerde matrices;hiervoor kan een sterker resultaat worden bewezen dan voor normale matrices, in de zin datde diagonaalmatrix reele entries heeft, welke corresponderen met reele eigenwaarden.

Stelling 1.2.61 (Spectraalstelling: zelfgeadjungeerde matrices) Er bestaat een uni-taire matrix U zodanig dat U∗AU = Λ een reele diagonaalmatrixis als en alleen als A ∈ Cn×nzelfgeadjungeerd is.

Bewijs. Laat A ∈ Cn×n met A∗ = A. Dan is A normaal en bestaat er volgens Stelling 1.2.59een unitaire matrix U en een diagonaalmatrix Λ zo, dat U∗AU = Λ. Dus is A = UΛU∗, enis A∗ = UΛ∗U∗. Maar omdat A = A∗ volgt hieruit dat Λ = Λ∗, en dus is de diagonaal reeel.Omgekeerd is triviaal A∗ = A zodra A = UΛU∗ met U unitair en Λ reeel diagonaal.

Stelling 1.2.62 (Spectraalstelling: zelfgeadjungeerde transformaties) Laat L : V →V een lineaire transformatie van een inproductruimte (V,C, 〈·, ·〉) zijn. Dan is er een ortho-

normale basis β waarvoor Lββ reel diagonaal is als en alleen als L zelfgeadjungeerd is.

Bewijs. Volledig analoog aan het bewijs van Stelling 1.2.60, met als toevoeging dat uitStelling 1.2.61 volgt dat de eigenwaarden van L reeel zijn.

Tot slot bewijzen we de spectraalstellingen voor unitaire afbeeldingen en matrices.

Page 30: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

30 HOOFDSTUK 1. CANONIEKE VORMEN

Definitie 1.2.63 (Unitaire lineaire transformatie) Een lineaire transformatie L : V →V van een inproductruimte (V,C, 〈·, ·〉) heet unitair als L∗L = id = LL∗, waarbij id : V → Vstaat voor de identieke afbeelding.

Opmerking 1.2.64 De karakterisering L∗ L = id is equivalent met

〈(L∗ L)(v), w〉 = 〈v, w〉 (1.64)

voor alle v, w ∈ V , en met behulp van de definitie van geadjungeerde transformatie met

〈L(v), L(w)〉 = 〈v, w〉 (1.65)

voor alle v, w ∈ V , wat laat zien dat L hoeken en afstanden behoudt.

Definitie 1.2.65 Een getal z ∈ C heet unimodulair als |z| = 1.

Stelling 1.2.66 (Spectraalstelling: unitaire matrices) Er bestaat een unitaire matrix Uen een diagonaalmatrix Λ met unimodulaire diagonaalentries zodanig dat A = UΛU∗ als enalleen als A ∈ Cn×n unitair is.

Bewijs. Laat A ∈ Cn×n met A∗A = I. Dan is A normaal en bestaat er volgens Stelling1.2.59 een unitaire matrix U en een diagonaalmatrix Λ zo, dat U∗AU = Λ. Dus is A = UΛU∗,en is A∗ = UΛ∗U∗. Maar omdat AA∗ = I volgt hieruit dat ΛΛ∗ = I, en dus geldt voor eendiagonaalentry λ van Λ dat λλ = 1. Dus is |λ| = 1. Omgekeerd is triviaal A∗A = I zodraA = UΛU∗ met U unitair en Λ diagonaal met unimodulaire diagonaalentries.

Stelling 1.2.67 (Spectraalstelling: unitaire transformaties) Laat L : V → V een line-aire transformatie van een inproductruimte (V,C, 〈·, ·〉) zijn. Dan is er een orthonormale basis

β waarvoor Lββ diagonaal is met unimodulaire diagonaalentries als en alleen als L unitair is.

Bewijs. Volledig analoog aan het bewijs van Stelling 1.2.60, met als toevoeging dat uitStelling 1.2.66 volgt dat de eigenwaarden van L unimodulair zijn.

1.3 De Jordannormaalvorm van een lineaire transformatie

We zagen in Sectie 1.2 dat iedere lineaire transformatie L : V → V van een vectorruimte (V,K)over een algebraısch afgesloten lichaam K op bovendriehoeksvorm kan worden gebracht. Ditbetekent dat voor iedere A ∈ Kn×n er een X ∈ GLn(K) bestaat met X−1AX = R bovendrie-hoeks. We gaan dit resultaat aanscherpen middels verdere gelijkvormigheidstransformatiestoegepast op bovendriehoeksmatrices. Eerst herinneren we aan de elementaire gelijkvormig-heidstranformaties uit Sectie 1.1.2.

Lemma 1.3.1 Gegeven een bovendriehoeksmatrix R ∈ Kn×n en h ∈ K en 1 ≤ k ≤ n. Laat

T = Dnk (h)−1RDn

k (h). (1.66)

Dan kan T = (tij) alleen afwijken van R in entries t1k, . . . , tk−1,k en entries tk,k+1, . . . , tkn.

Links in Figuur 2.1 illustreren we het effect van een gelijkvormigheidstransformatie metDnk (h).

Alleen in de donkere delen van de k-de rij en de k-de kolom kunnen entries veranderen.

Page 31: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 31

Voorbeeld 1.3.2 Beschouw de gelijkvormigheidstransformatie van een bovendriehoeksmatrixmet D4

22(2)

D422(2)−1

1 1 1 10 1 1 10 0 1 10 0 0 1

D422(2) =

1 2 1 10 1 1

212

0 0 1 10 0 0 1

.De tweede kolom en de tweede rij worden hierdoor respectievelijk vermenigvuldigd met 2 en 1

2 .Dit verandert de entries boven en rechts naast de positie (2, 2).

Lemma 1.3.3 Gegeven een bovendriehoeksmatrix R ∈ Kn×n en h ∈ K en 1 ≤ k < ` ≤ n.Laat

T = Enk`(h)−1REnk`(h). (1.67)

Dan kan T = (tij) alleen afwijken van R in entries t1`, . . . , tk,` en entries tk,`+1, . . . , tkn.

Bewijs. De vermenigvuldiging S = REnk`(h) is de kolom-operatie K` → K`+hKk. Omdat Rbovendriehoeks is, verandert dit hooguit de bovenste k entries van K`. De vermenigvuldigingEnk`(−h)S verandert evenzo hooguit de laatste n− ` entries in rij k.

Voorbeeld 1.3.4 Beschouw de gelijkvormigheidstransformatie van een bovendriehoeksmatrixmet de elementaire matrix E4

24(1),

E424(1)−1

2 1 1 10 2 1 10 0 3 10 0 0 3

E424(1) =

2 1 1 20 2 1 00 0 3 10 0 0 3

.De rechtsvermenigvuldiging correspondeert met K4 → K4+K2, de linksvermenigvuldiging metR2 → R2 −R4. Hierdoor veranderen de entries op en boven positie (2, 4).

Figuur 2.1 rechts illustreert het effect van een gelijkvormigheidstransformatie met Enk`(h).Alleen de entries in het donkere deel van de k-de rij en `-de kolom kunnen veranderen. In hetbijzonder is het effect van de transformatie op de entry rk` op positie (k, `) aangegeven.

k

k

×hDnk (h)−1

Dnk (h)

Dnk (h)−1 ·R ·Dn

k (h)

× 1h

k

k

`

`

+h

−h

Enk`(h)

Enk`(h)−1

Enk`(h)−1 ·R · Enk`(h)

rk` 7→ rk` + h(rkk − r``)

Figuur 2.1 Elementaire gelijkvormigheidstransformaties van een bovendriehoeksmatrix R.

Page 32: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

32 HOOFDSTUK 1. CANONIEKE VORMEN

Lemma 1.3.5 Gegeven een bovendriehoeksmatrix R ∈ Kn×n en 1 ≤ k < ` ≤ n. Laat

T = Π−1k` RΠk`. (1.68)

Dan kan T = (tij) alleen afwijken van R in t1m, . . . , t`m en tmk, . . . , tmn met m ∈ k, `.

Opmerking 1.3.6 Dus R en T verschillen hooguit in de entries tij in de k-de en `-de rij enkolom, maar niet als i < k of j > `. In het algemeen is T niet bovendriehoeks.

Voorbeeld 1.3.7 Beschouw de gelijkvormigheidstransformatie van een bovendriehoeksmatrixmet Π4

23 (Π4

23

)−1

1 1 1 10 2 2 20 0 3 30 0 0 4

Π423 =

1 1 1 10 3 0 30 2 2 20 0 0 1

.De tweede en derde kolom worden verwisseld, en de tweede en derde rij.

Na de gelijkvormigheidstransformatie in Voorbeeld 1.3.4 is de (2, 4)-entry gelijk is aan nul. Weonderzoeken nu wanneer we welke entries in de bovendriehoek naar nul kunnen transformerenmet behulp van de gelijkvormigheidstransformaties met matrices van type Enk`(h).

Opmerking 1.3.8 Het is niet mogelijk om het aantal nullen in een matrix te veranderenmet elementaire gelijkvormigheidstransformaties met matrices van de types Dn

k (h) en Πnk`.

1.3.1 Gerichte gelijkvormigheidstransformaties met Enij(h)

Het volgende lemma verwoordt het resultaat van Voorbeeld 1.3.4 in zijn volle algemeenheid.

Lemma 1.3.9 Gegeven een bovendriehoeksmatrix (rij) = R ∈ Kn×n, h ∈ K en 1 ≤ k < ` ≤n. Laat

T = Enk`(h)−1REnk`(h), (1.69)

en schrijf T = (tij). Dan geldt dat

tk` = rk` + hrkk − hr``. (1.70)

Als bovendien rkk 6= r`` en

h =rk`

r`` − rkk, (1.71)

dan geldt dat tk` = 0.

Bewijs. Rechtsvermenigvuldiging van R met Enk`(h) telt h maal de k-de kolom van R op bijde `-de kolom, en dus in het bijzonder hrkk op bij rk`. Linksvermenigvuldiging met Enk`(−h)trekt h maal de `-de rij af van de k-de rij, en dus in het bijzonder hr`` af van rk` + hrkk. Ditbewijst (1.70). De bewering over de keuze van h in (1.71) is vervolgens eenvoudig.

Opmerking 1.3.10 Als (rij) = R ∈ Kn×n bovendriehoeks is en rkk = r`` voor zekere k < `dan volgt uit (1.70) dat met (tij) = T = Enk`(h)−1REnk`(h) dat tk` = rk` voor alle h ∈ K.

Voorbeeld 1.3.4 was al een goede illustratie van Lemma 1.3.9, want het transformeerde de(2, 4)-entry naar nul. We proberen nu ook de (2, 3)-entry naar nul te transformeren.

Page 33: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 33

Voorbeeld 1.3.11 Beschouw de matrix die resulteerde in het rechterlid in Voorbeeld 1.3.4.De entry op positie (2, 3) is gelijk aan 1. Met h = 1/(3− 2) = 1 als in (1.71) volgt

E423(1)−1

2 1 1 20 2 1 00 0 3 10 0 0 3

E423(1) =

2 1 2 20 2 0 −10 0 3 10 0 0 3

(1.72)

en in overeenstemming met Lemma 1.3.9 is de entry op positie (2, 3) gelijk aan nul. De entryerboven en er rechts naast zijn ook veranderd. Lemma 1.3.3 gaf al aan dat dit kan gebeuren.

Opmerking 1.3.12 Merk op dat de (4, 2)-entry, die we in Voorbeeld 1.3.4 naar nul haddengetransformeerd, na de transformatie in Voorbeeld 1.3.11 weer ongelijk is aan nul!

Lemma 1.3.3 laat zien in welke volgordes de transformaties kunnen worden toegepast omnullen te creeren op alle posities (i, j) in een bovendriehoeksmatrix R waarvoor rii 6= rjj .

Stelling 1.3.13 Zij R = (rij) ∈ Kn×n een bovendriehoeksmatrix, en laat

U(R) = (i, j) ∈ 1, . . . , n × 1, . . . n, i < j | rii 6= rjj . (1.73)

Er bestaat een volgorde (i1, j1), . . . , (ip, jp) van de p elementen van U(R) en een keuze vangetallen h1, . . . , hp ∈ K zo, dat met het product

X = Eni1j1(h1) · . . . · Enipjp(hp) (1.74)

geldt dat

X−1RX = T, met T = (tij), (1.75)

een bovendriehoeksmatrix is waarvoor tij = 0 voor alle (i, j) ∈ U(R).

Bewijs. Het volstaat een volgorde (i1, j1), . . . , (ip, jp) te kiezen waarin voor ieder tweetalopeenvolgende posities (iq, jq) en (iq+1, jq+1) geldt dat jq < jq+1 of iq > iq+1. Hieruit volgtimmers dat als q < r dan jq < jr of iq > ir. In beide gevallen zal volgens Lemma 1.3.3 eengelijkvormigheidstransformatie Enirjr(h) de entry op positie (iq, jq) niet veranderen. In hetbijzonder zal dus iedere tranformatie een nul creeren, die daarna niet meer zal verdwijnen.

Het volgende algoritme illustreert een volgorde als genoemd in het bewijs van Stelling 1.3.13.

Algoritme 1.3.14 Laat R ∈ Kn×n en schrijf U = U(R). Selecteer (i, j) ∈ U met i maximaal,en als er daar meerdere van zijn, met j minimaal. Pas een transformatie toe om de (i, j)-entrynaar nul te transformeren. Verwijder (i, j) uit U en herhaal het proces tot U leeg is.

Vanaf nu zullen we vaak een gelijkvormigheidstransformatie B = X−1AX noteren met

AX−→ B

om op die manier wat meer transformaties naast elkaar op dezelfde bladzijde te krijgen.

Page 34: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

34 HOOFDSTUK 1. CANONIEKE VORMEN

Voorbeeld 1.3.15 We illustreren Stelling 1.3.13 met de matrix R uit Voorbeeld 1.3.4,

R =

2 1 1 10 2 1 10 0 3 10 0 0 3

, waarvoor U(R) = (1, 3), (1, 4), (2, 3), (2, 4) .

De door Algoritme 1.3.14 gegeven volgorde is (2, 3), (2, 4), (1, 3), (1, 4). De respectievelijkeelementaire gelijkvormigheidstransformaties geven we schematisch weer als

R =

2 1 1 10 2 1 10 0 3 10 0 0 3

E423(1)−→

2 1 2 10 2 0 00 0 3 10 0 0 3

E413(2)−→

2 1 0 −10 2 0 00 0 3 10 0 0 3

E414(−1)−→

2 1 0 00 2 0 00 0 3 10 0 0 3

= T.

Omdat de entry op positie (2, 4) toevallig al nul is na toepassing van E423(1), is de transformatie

E424(h2) = I hier weggelaten. Het product X van de transformatiematrices is

X = E423(1) · E4

24(0) · E413(2) · E4

14(−1) =

1 0 2 −10 1 1 00 0 1 00 0 0 1

(1.76)

en met deze X is X−1RX dus gelijk aan T .

Een gevolg van Stelling 1.3.13 is een bekend resultaat.

Gevolg 1.3.16 Als alle eigenwaarden van R verschillen dan geeft Algoritme 1.3.14 een Xzo, dat X−1RX = Λ een diagonaalmatrix is. Dus Algoritme 1.3.14 diagonaliseert R.

Voorbeeld 1.3.17 Laat R gegeven zijn door

R =

1 2 30 2 30 0 3

en dus U(R) = (1, 2), (1, 3), (2, 3) . (1.77)

De door Algoritme 1.3.14 gegeven volgorde voor de elementaire gelijkvormigheidstransforma-ties is (2, 3), (1, 2), (1, 3). We vinden:

R =

1 2 30 2 30 0 3

E323(3)−→

1 2 90 2 00 0 3

E312(2)−→

1 0 90 2 00 0 3

E313( 9

2)

−→

1 0 00 2 00 0 3

= Λ, (1.78)

met als bijbehorende transformatiematrix

X = E323(3) · E3

12(2) · E313(

9

2) =

1 2 92

0 1 30 0 1

, (1.79)

waarvoor het eenvoudig te verifieren is dat RX = XΛ de matrix R diagonaliseert.

Page 35: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 35

Opmerking 1.3.18 Zowel de matrix X = (xij) in (1.76) als de matrix X = (xij) in (1.79)heeft de eigenschap dat xiqjq = hq voor alle (iq, jq) ∈ U(R). Dit is geen toeval. Immers,Algoritme 1.3.14 geeft een lijst entries (i1, j1), . . . , (ip, jp) met bijbehorend product X vantransformatiematrices

X = Eni1j1(h1) · . . . · Enipjp(hp) = (In + ei1e>j1) · . . . · (In + eipe

>jp) (1.80)

Als q < r geldt voor de paren indices (iq, jq) en (ir, jr) dat iq < jq en ir < jr omdat zecorresponderen met posities boven de diagonaal. Daarnaast geldt of iq > ir, of iq = ir enjq < jr, per definitie van Algoritme 1.3.14. Hieruit volgt dat het uitvermenigvuldigen van hetproduct in (1.80) geldt dat

X = In + ei1e>j1 + . . . eipe

>jp (1.81)

Immers, als iq > ir volgt uit iq < jq dat jq > ir. Anderzijds, als iq = ir dan volgt uit iq < jqook dat ir = iq < jq. In beide gevallen is dus e>jqeir = 0 en dus ook eiqe

>jqeire

>jr

= 0.

Voorbeeld 1.3.19 Voor n = 4 bewijst Opmerking 1.3.18 niets anders dan dat 1 0 0 00 1 0 00 0 1 a0 0 0 1

1 0 0 0

0 1 b 00 0 1 00 0 0 1

1 0 0 0

0 1 0 c0 0 1 00 0 0 1

1 d 0 0

0 1 0 00 0 1 00 0 0 1

1 0 e 0

0 1 0 00 0 1 00 0 0 1

1 0 0 f

0 1 0 00 0 1 00 0 0 1

=

1 d e f0 1 b c0 0 1 a0 0 0 1

voor alle a, b, c, d, e, f ∈ K.

Overeenkomstige identiteiten gelden ook voor iedere andere waarde van n, als de matrices indeze door Algoritme 1.3.14 gegenereerde volgorde staan.

1.3.2 Gerichte gelijkvormigheidstransformaties met Πk`

Gelijkvormigheidstransformaties met elementaire matrices van het type Πk` kunnen wordeningezet om gelijke eigenwaarden naast elkaar op de diagonaal van R te positioneren. Hetgevolg daarvan is dat de nullen boven de diagonaal in rechthoekige blokken terechtkomen.

Voorbeeld 1.3.20 Gegeven de matrix

R =

2 1 2 10 3 1 30 0 2 10 0 0 3

, met U(R) = (1, 2), (1, 4), (2, 3), (3, 4) . (1.82)

Algoritme 1.3.14 geeft als transformatievolgorde (3, 4), (2, 3), (1, 2), (1, 4). De respectievelijkeelementaire gelijkvormigheidstransformaties geven we schematisch weer als

RE4

34(1)−→

2 1 2 30 3 1 40 0 2 00 0 0 3

E423(−1)−→

2 1 1 30 3 0 40 0 2 00 0 0 3

E412(1)−→

2 0 1 −10 3 0 40 0 2 00 0 0 3

E414(−1)−→

2 0 1 00 3 0 40 0 2 00 0 0 3

.

Page 36: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

36 HOOFDSTUK 1. CANONIEKE VORMEN

Deze matrix kunnen we met een permutatie Πk` nu zo transformeren, dat gelijke eigenwaardennaast elkaar op de diagonaal komen te staan, 2 0 1 0

0 3 0 40 0 2 00 0 0 3

Π423−→

2 1 0 00 2 0 00 0 3 40 0 0 3

. (1.83)

De getransformeerde matrix is blok-diagonaal is en beide blokken op de diagonaal zijn boven-driehoeks. Het bijbehorende product X van de elementaire matrices is

X = E434(1) · E4

23(−1) · E412(1) · E4

14(−1) ·Π423 =

1 1 0 −10 1 −1 00 0 1 10 0 0 1

Π423 =

1 0 1 −10 −1 1 00 1 0 10 0 0 1

.Merk op dat X zelf geen bovendriehoeksmatrix meer is.

Opmerking 1.3.21 De gelijkvormigheidstransformatie met Π23 kan al toegepast worden zo-dra de entry op positie (2, 3) gelijk is aan nul. Immers, dan is het resultaat al bovendriehoeks.

Opmerking 1.3.22 Het is ook mogelijk om de volgorde van de diagonaalentries om tedraaien in vergelijking tot (1.83), middels

Π423Π4

34Π412

2 0 1 00 3 0 40 0 2 00 0 0 3

Π412Π4

34Π423 =

3 4 0 00 3 0 00 0 2 10 0 0 2

.Sterker nog, iedere volgorde van de getallen op de diagonaal kan worden bewerkstelligd.

Bovenstaand voorbeeld met opmerkingen geeft aanleiding tot de volgende stelling.

Lemma 1.3.23 Laat (rij) = R ∈ Kn×n bovendriehoeks zijn, en k zo dat rkk 6= rk+1,k+1. Danis

T = Π−1k,k+1 · E

nk,k+1(h)−1 ·R · Enk,k+1(h) ·Πk,k+1 met h =

rk,k+1

rk+1,k+1 − rkk(1.84)

bovendriehoeks met tkk = rk+1,k+1 en tk+1,k+1 = rkk.

Bewijs. De gelijkvormigheidstransformatie met Enk,k+1(h) creeert een nul op positie (k, k+1),waarna verwisseling van rijen k en k + 1 en kolommen k en k + 1 de beide diagonaalentriesrkk en rk+1,k+1 verwisselt. De entries op posities (k, k+ 1) en (k+ 1, k) zijn en blijven nul.

Lemma 1.3.23 wordt geıllustreerd in het volgende eenvoudige voorbeeld.

Voorbeeld 1.3.24 Zie hoe R naar T wordt getransformeerd in

R =

1 2 30 2 20 0 1

E323(−2)−→

1 2 −10 2 00 0 1

Π323−→

1 −1 20 1 00 0 2

= T (1.85)

en dat de volgorde 1, 2, 1 van de diagonaalentries van R is veranderd in 1, 1, 2 voor T .

Page 37: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 37

We kunnen nu een van de hoofdresultaten uit deze sectie formuleren.

Stelling 1.3.25 Laat R ∈ Kn×n bovendriehoeks zijn met verschillende eigenwaarden λ1, . . . , λpmet respectievelijke algebraısche multipliciteiten m1, . . . ,mp. Dan bestaat er een X ∈ GLn(K)zodanig dat

X−1RX =

T1 0 . . . 0

0 T2. . .

......

. . .. . . 0

0 . . . 0 Tp

= T, (1.86)

waarbij Tj een mj ×mj bovendriehoeksmatrix is met alle diagonaalentries gelijk aan λj.

Bewijs. Laat k het kleinste gehele getal zijn waarvoor rkk = λ1. Dan zijn in het bijzonderr11, . . . , rk−1,k−1 allemaal ongelijk aan rkk. Pas nu Lemma 1.3.23 toe om de entries op posities(k, k) en (k−1, k−1) te verwisselen, vervolgens nogmaals om de entries op posities (k−1, k−1)en (k− 2, k− 2) te verwisselen, enzovoorts, totdat λ1 op positie (1, 1) staat. Doe nu hetzelfdemet de overige diagonaalentries die gelijk zijn aan λ1, dan met alle diagonaalentries die gelijkzijn aan λ2, enzovoorts. Pas tot slot Stelling 1.3.13 toe om nullen te creeren op alle posities(k, `) waarvoor de entries op posities (k, k) en (`, `) verschillen. Dit geeft precies een matrixvan de vorm T in (1.86).

In Sectie 1.3.4 bestuderen we verdere transformaties van de matrices T1, . . . , Tp uit Stelling1.3.25. Eerst besteden we Sectie 1.3.3 aan de beschrijving van het beoogde doel.

1.3.3 De klasse van nilpotente Jordanvormen

In deze sectie introduceren we de matrices die uiteindelijk als bouwstenen zullen fungerenvoor de eenvoudigste matrix J die gelijkvormig is met een gegeven A ∈ Kn×n.

Definitie 1.3.26 (Nilpotente Jordanvorm) Een matrix (sij) = S ∈ Kn×n waarvoor ie-dere entry die ongelijk aan 0 is, gelijk is aan 1 en direct boven de diagonaal op een positie(i, i+ 1) staat, oftewel,

sij 6= 0 ⇒ j = i+ 1 en sij = 1, (1.87)

noemen we een nilpotente Jordanvorm.

Definitie 1.3.27 (Nilpotent Jordanblok) De nilpotente Jordanvorm in Kn×n met n − 1entries gelijk aan 1 heet het nilpotente Jordanblok, en wordt genoteerd als Nn.

Opmerking 1.3.28 Voor n = 1 is de matrix N1 = [0] het 1× 1 nilpotente Jordanblok.

Opmerking 1.3.29 Er bestaan precies 2n−1 nilpotente Jordanvormen in Kn×n, want iedereentry op positie (i, i+1) wordt gekozen uit 0, 1. Er is precies een n×n nilpotent Jordanblok.

Voorbeeld 1.3.30 Voor n = 4 bestaan er dus precies acht nilpotente Jordanvormen, te weten 0 00 0

0 00

, 0 1

0 00 0

0

, 0 0

0 10 0

0

, 0 0

0 00 1

0

,

Page 38: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

38 HOOFDSTUK 1. CANONIEKE VORMEN

0 00 1

0 10

, 0 1

0 00 1

0

, 0 1

0 10 0

0

, 0 1

0 10 1

0

.De matrix rechtsonder is het 4× 4 nilpotente Jordanblok N4.

Opmerking 1.3.31 Een nilpotente Jordanvorm S ∈ Kn×n beeldt iedere standaardbasisvec-tor ek af op 0 of op ek−1. In het bijzonder is Se1 = 0. Hieruit volgt direct dat Sn = 0, en dusdat S inderdaad nilpotent is. Het grootste gehele getal p waarvoor Sp 6= 0, de nilpotentie-index van S, is gelijk aan het grootste aantal naast elkaar staande enen op posities (i, i+ 1).Het nilpotente Jordanblok is dus de enige nilpotente Jordanvorm met nilpotentie-index n−1.

Lemma 1.3.32 Voor het nilpotente Jordanblok Nt ∈ Kt×t geldt dat

ker(N jt ) = spane1, . . . , ej (1.88)

voor alle j ∈ 1, . . . , t, en ker(N jt ) = Kt voor alle j ≥ t.

Bewijs. De matrix Nt beeldt de standaardbasisvectoren van Kt als volgt op elkaar af,

etNt−→ et−1

Nt−→ . . .Nt−→ e1

Nt−→ 0. (1.89)

Dus N jt beeldt ek af op 0 als k ≤ j, en op ek−j als k > j.

Voorbeeld 1.3.33 Bovenstaand lemma wordt geıllustreerd door

N4 =

0 10 1

0 10

, N24 =

0 0 10 0 1

0 00

, N34 =

0 0 0 10 0 0

0 00

, N44 =

0 0 0 00 0 0

0 00

en hogere machten van N4 zijn uiteraard ook gelijk aan nul.

Iedere nilpotente Jordanvorm is als volgt opgebouwd uit nilpotente Jordanblokken.

Lemma 1.3.34 Elke nilpotente Jordanvorm S ∈ Kn×n heeft een blokpartitionering als

S =

Nt1 0 . . . 0

0 Nt2

. . ....

.... . .

. . . 00 . . . 0 Ntp

(1.90)

met nilpotente Jordanblokken Nt1 , . . . , Ntp op de diagonaal, en nullen buiten deze blokken.

Bewijs. Laat i1 < · · · < ip = n de indices zijn van de rijen in S die gelijk aan nul zijn. Laati0 = 0 en definieer tj = ij − ij−1 voor alle j ∈ 1, . . . , p. Dan is S van de vorm (1.90).

Opmerking 1.3.35 De blokpartitionering van S ontstaat derhalve door onder iedere rijnullen een horizontale streep te zetten, en links van iedere kolom nullen een verticale streep.

Page 39: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 39

Voorbeeld 1.3.36 We illustreren Lemma 1.3.34 middels het blokpartitioneren van vier vande matrices uit Voorbeeld 1.3.30 0 1 0 0

0 0 0 00 0 0 00 0 0 0

en

0 0 0 00 0 1 00 0 0 00 0 0 0

en

0 0 0 00 0 1 00 0 0 10 0 0 0

en

0 1 0 00 0 0 00 0 0 10 0 0 0

.met respectievelijke diagonaalblokken N2, N1, N1 en N1, N2, N1 en N1, N3 en N2, N2.

We introduceren nu eerst wat nieuwe terminologie, die resultaten compacter helpt verwoorden.Partities en de partitiefunctie spelen een grote rol binnen de wiskunde.

Definitie 1.3.37 (Partitie(-functie)) Laat n ∈ N. Een partitie τ van n ∈ N, notatie τ ` n,is een tupel τ = [t1, . . . , tk] van getallen t1, . . . , tk ∈ N zo, dat

n = t1 + · · ·+ tk met t1 ≥ · · · ≥ tk. (1.91)

De getallen t1, . . . , tk heten de delen van n, en k ≤ n is de lengte van de partitie. De functiep : N→ N die aan n het aantal partities p(n) van n toevoegt heet de partitiefunctie.

Voorbeeld 1.3.38 De volgende tupels zijn alle verschillende partities van 5,

[5], [4, 1], [3, 2], [3, 1, 1], [2, 2, 1], [2, 1, 1, 1], [1, 1, 1, 1, 1],

en dus is p(5) = 7.

Partities kunnen inzichtelijk worden gevisualiseerd met behulp van Young tableaus.

Definitie 1.3.39 (Young tableau) Het Young tableau van een partitie τ = [τ1, . . . , τp] ` nis een afbeelding bestaande uit n vierkanten van gelijke grootte. Deze zijn verdeeld over paansluitende rijen, met τj aansluitende vierkanten links uitgelijnd naast elkaar in rij j.

Figuur 2.2 Young tableaus van de zeven partities van n = 5.

Sommige paren van Young tableaus zijn elkaars gespiegelde in de hoofddiagonaal.

Definitie 1.3.40 (Geconjugeerde partitie) Laat τ = [τ1, . . . , τp] ` n ∈ N. Voor iederej ∈ 1, . . . , n, schrijf τ∗j voor het aantal delen van τ dat groter dan of gelijk is aan j. Depositieve getallen τ∗1 , . . . , τ

∗q vormen de geconjugeerde partitie τ∗ = [τ∗1 , . . . , τ

∗q ] ` n van τ .

Voorbeeld 1.3.41 Beschouw de partitie τ = [2, 2, 1] ` 5. Alledrie de delen zijn groter danof gelijk aan 1, dus τ∗1 = 3. Alleen het eerste en tweede deel zijn groter dan of gelijk aan 2dus τ∗2 = 2. Er zijn geen delen groter dan twee. Dus τ∗ = [3, 2] is de geconjugeerde partitievan τ .

Page 40: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

40 HOOFDSTUK 1. CANONIEKE VORMEN

Eenvoudig gesteld telt τ∗ het aantal vierkanten per kolom in het Young diagram van τ . Alsgevolg hiervan is het Young diagram van τ∗ de gespiegelde van het Young diagram van τ .

τ = [2, 2, 1] τ∗ = [3, 2]conjugatie

Figuur 2.3 Young tableaus van geconjugeerde partities zijn elkaars gespiegelde.

We gaan nu in op de vraag wat partities te maken hebben met nilpotente Jordanvormen.

Definitie 1.3.42 (Type nilpotente Jordanvorm) De aflopend gesorteerde groottes vande Jordanblokken op de diagonaal van de volgens (1.90) gepartitioneerde nilpotente Jordan-vorm S ∈ Kn×n vormen een partitie τ ` n. Deze partitie heet het type van S.

Voorbeeld 1.3.43 De acht matrices in Voorbeeld 1.3.30 hebben de volgende types,

[1, 1, 1, 1] [2, 1, 1] [2, 1, 1] [2, 1, 1][3, 1] [2, 2] [3, 1] [4]

waarbij de types op de overeenkomstige positie staan genoteerd als de matrices.

Opmerking 1.3.44 Het type τ ` n van het n× n Jordanblok Nn is de partitie τ = [n].

Lemma 1.3.45 Zij S ∈ Kn×n een nilpotente Jordanvorm van type τ met geconjugeerde τ∗.Dan is τ∗` het aantal nilpotente Jordanblokken van S van afmetingen `× ` of groter.

Stelling 1.3.46 Laat S ∈ Kn×n een nilpotente Jordanvorm zijn van type τ ` n. Dan geldtdat

dim(ker(S`)) = τ∗1 + · · ·+ τ∗` (1.92)

voor alle ` ≤ q, waarbij τ∗ = [τ∗1 , . . . , τ∗q ] de geconjugeerde van τ is.

Bewijs. Laat ` ∈ 1, . . . , q gegeven zijn. Wegens de blokvorm van S in (1.90) geldt datS`v = 0 als en alleen als N `

tjvj = 0 voor alle j ∈ 1, . . . , p, waarbij vj bestaat uit de entriesvan v die in dezelfde rijen staan als Ntj . In het bijzonder geldt dus dat

dim(ker(S`)) = dim(ker(N `t1)) + · · ·+ dim(ker(N `

tp)). (1.93)

Lemma 1.3.32 geeft dat dim(ker(N `tj )) gelijk is aan het minimum van tj en `. Dus, dim(ker(N `

tj ))

is precies dan 1 groter dan dim(ker(N `−1tj

)) als het blok Ntj afmetingen `× ` of groter heeft,

oftewel, als tj ≥ `. Dus dim(ker(S`))−dim(ker(S`−1)) is gelijk aan het aantal nilpotente Jor-danblokken Ntj van S met tj ≥ `, en dus volgens Lemma 1.3.45 gelijk aan τ`. Een eenvoudiginductieargument bewijst nu de bewering.

Voorbeeld 1.3.47 Bekijk de machten van de nilpotente Jordanvorm S van type τ = [3, 2],

S =

0 1

0 10

0 10

, S2 =

0 0 1

0 00

0 00

, S3 = 0,

dan is τ∗ = [2, 2, 1] en zien we dat dim(ker(S)) = τ∗1 = 2, dim(ker(S2)) = τ∗1 + τ∗2 = 4, endim(ker(S3)) = τ∗1 + τ∗2 + τ∗3 = 5. Dit illustreert de uitspraak van Stelling 1.3.46.

Page 41: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 41

e3 e2 e10

S S S

e5 e40

S S

ker(S1) = spane1, e4

ker(S2) = spane1, e4, e2, e5

ker(S3) = spane1, e4, e2, e5, e3

Figuur 2.4 Illustratie horend bij Voorbeeld 1.3.47.

Reden dat we het concept type van een Jordanblok introduceren, is de volgende stelling.

Stelling 1.3.48 Gegeven nilpotente Jordanvormen S, T ∈ Kn×n met types σ ` n en τ ` n.Dan zijn S en T gelijkvormig als en alleen als σ = τ .

Bewijs. Veronderstel dat σ 6= τ . Dan is ook σ∗ 6= τ∗ en bestaat er dus een ` ∈ N zo, dat

dim(ker(S`)) = σ∗1 + · · ·+ σ∗` 6= τ∗ + · · ·+ τ∗` = dim(ker(T `)). (1.94)

Hieruit volgt dat S` en T ` niet gelijkvormig zijn, en dus S en T ook niet. Immers, alsB = X−1AX dan is B` = (X−1AX)` = X−1A`X, en als b1, . . . , bq een basis is voor ker(B`)dan is Xb1, . . . , Xbq een basis voor ker(A`). Omgekeerd, veronderstel dat σ = τ . Dan bestaater een permutatie Π ∈ GLn(K) zodanig dat B = Π−1AΠ. Voor details, zie Lemma 1.3.49.

Lemma 1.3.49 (Blokpermutatie) Zij X ∈ Kn×n en k + ` = n. Blokpartitioneer X als

X =

[A B

C D

]waarbij A ∈ Kk×k en D ∈ K`×`. Dan geldt dat

Π−1XΠ =

[D C

B A

]waarbij Π =

[0 I`Ik 0

].

Bewijs. De rechtsvermenigvuldiging met Π zet kolommen ` + 1, . . . , n voor de kolommen1, . . . , k, en de linksvermenigvuldiging met Π−1 doet hetzelfde met de rijen.

Opmerking 1.3.50 Iedere permutatiematrix Π is unitair, en dus is Π−1 = Π>.

We laten nu zien dat iedere nilpotente matrix gelijkvormig is met een nilpotente Jordanvorm.

1.3.4 Gelijkvormigheidstransformaties van stricte bovendriehoeksmatrices

Ieder van de bovendriehoeksmatrices T1, . . . , Tp in (1.86) heeft de eigenschap dat de entriesop de diagonaal allemaal hetzelfde zijn. Deze matrices zijn dus van de vorm

T` = λ`I` +M` (1.95)

voor zekere λ` ∈ K, en waarbij M` een stricte bovendriehoeksmatrix is.

Definitie 1.3.51 (Stricte bovendriehoeksmatrix) Een bovendriehoeksmatrix (rij) = R ∈Kn×n heet strict als rjj = 0 voor alle j ∈ 1, . . . , n.

Page 42: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

42 HOOFDSTUK 1. CANONIEKE VORMEN

Merk op dat alle eigenwaarden van een stricte bovendriehoeksmatrix gelijk zijn aan nul.

Opmerking 1.3.52 Als M ∈ Kn×n strict bovendriehoeks is en T = λI + M voor zekereλ ∈ K, dan is voor iedere X ∈ GLn(K),

X−1TX = λI +X−1MX. (1.96)

Als ook X−1TX bovendriehoeks is, zijn al zijn diagonaalentries gelijk aan λ. Immers, deeigenwaarden van T en X−1TX zijn gelijk. In dat geval is X−1MX strict bovendriehoeks.

Om gelijkvormigheidstransformaties van matrices T = λI +M met M strict bovendriehoekste begrijpen volstaat het dus om die van M te begrijpen.

Stelling 1.3.53 (Jordan) Laat M ∈ Kn×n strict bovendriehoeks zijn. Dan bestaat er eenX ∈ GLn(K) zo, dat S = X−1MX een nilpotente Jordanvorm is.

Bewijs. Het volgende eenvoudige voorbeeld bewijst deze stelling voor n = 2, en doet alszodanig dienst als inductiebasis.

Voorbeeld 1.3.54 Laat M ∈ K2×2 strict bovendriehoeks zijn. Dan is M van de vorm

M =

[0 k0 0

]met k ∈ K.

Als k = 0 dan is M een nilpotente Jordanvorm van type τ = [1, 1]. Als k 6= 0 dan is

D2(1

k)−1MD2(

1

k) =

[1 00 k

] [0 k0 0

] [1 00 1

k

]=

[0 10 0

]= S (1.97)

en is S een nilpotente Jordanvorm van type τ = [2], oftewel, het 2× 2 nilpotente Jordanblok.

Inductiehypothese. Veronderstel dat als M ∈ K(n−1)×(n−1) strict bovendriehoeks is, er eenY ∈ GLn−1(K) bestaat zo, dat Y −1MY = S een nilpotente Jordanvorm is.

Eerste deel Inductiestap. Laat M ∈ Kn×n strict bovendriehoeks zijn. Dan kunnen we Mblok-partitioneren als

M =

[M b

0 0

], met M ∈ K(n−1)×(n−1) strict bovendriehoeks en b ∈ Kn−1.

Volgens de inductiehypothese bestaat er een Y ∈ GLn−1(K) zo, dat[Y 0

0 1

]−1

M

[Y 0

0 1

]=

[S c

0 0

]waarbij c = Y −1b, (1.98)

en S = Y −1MY een nilpotente Jordanvorm is van M . De taak die resteert is om de matrixin (1.98), die op de laatste kolom na in de gewenste vorm staat, nog verder te transformeren.

Tweede deel Inductiestap. We laten nu zien hoe we de entry ck van c naar nul kunnentransformeren als er op positie (k, k + 1) in S een 1 staat.

Page 43: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 43

Lemma 1.3.55 Veronderstel dat S = (sij) een nilpotente Jordanvorm is met sk,k+1 = 1.Dan geldt na de transformatie [

S c

0 0

]Enk+1,n(−ck)−→

[S c

0 0

](1.99)

dat cj = cj voor alle j 6= k en ck = 0.

Bewijs. De linksvermenigvuldiging met Enk+1,n(−ck) telt een veelvoud van de n-de rij opbij de (k + 1)-ste rij. Echter, de n-de rij is nul en dit verandert dus niets aan de matrix. Derechtsvermenigvuldiging met Enk+1,n(−ck)−1 trekt ck maal de (k+1)-ste kolom af van de n-dekolom. Maar die (k + 1)-ste kolom is gelijk aan ek. Dit bewijst de bewering.

Lemma 1.3.55 wordt duidelijk geıllustreerd door het volgende voorbeeld.

Voorbeeld 1.3.56 Wegens de enen op posities (1, 2) en (3, 4) kunnen de eerste en derdeentry van de laatste kolom met behulp van Lemma 1.3.55 naar nul worden getransformeerd,

0 1 0 0 10 0 0 2

0 1 30 4

0

E525(−1)−→

0 1 0 0 0

0 0 0 20 1 3

0 40

E545(−3)−→

0 1 0 0 0

0 0 0 20 1 0

0 40

.Omdat ieder van beide transformaties slechts een entry verandert, kunnen ze ook in omge-keerde volgorde worden toegepast met hetzelfde resultaat, er geldt namelijk

X = E525(−1)E5

45(−3) = E545(−3)E5

25(−1)

en hiermee is

X =

1 0 0 0 0

1 0 0 −11 0 0

1 −31

en X−1 =

1 0 0 0 0

1 0 0 11 0 0

1 31

oftewel, de inverse kan weer eenvoudig worden bepaald.

Derde deel Inductiestap. De uitgangssituatie is de matrix na herhaald toepassen van Lemma1.3.55, zodat als de i-de entry van c ongelijk is aan nul, de i-de rij van S gelijk is aan nul.

Het volgende lemma ligt aan de basis van de resterende transformaties.

Opmerking 1.3.57 Wegens Lemma 1.3.49 nemen we zonder verlies van algemeenheid aan,dat S in de vorm (1.90) staat met oplopende blokgroottes t1 ≤ · · · ≤ tp.

Lemma 1.3.58 Zij S ∈ Kn×n een nilpotente Jordanvorm met nilpotente Jordanblokken inoplopende groottes van linksboven naar rechtsonder. Laat[

S d

0 0

],

Page 44: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

44 HOOFDSTUK 1. CANONIEKE VORMEN

en neem aan dat elke entry van d = (dj) die niet nul is, staat naast een rij van S die wel nulis. Laat ` het grootste gehele getal zijn met d` 6= 0. Veronderstel dat d` = 1 en dat dk 6= 0met k 6= `. Dan is [

S d

0 0

]Enk,n−1(dk)−→ · · ·

Enk−q+1,n−q(dk)−→

[S d

0 0

],

waarbij q de grootte is van het nilpotente Jordanblok waartoe de entry (k, k) van S behoort,en geldt dat dj = dj voor alle j 6= k en dk = 0.

Bewijs. Toepassing van Enk,n−1(dk) maakt de (k, n)-entry gelijk aan nul, en de entry oppositie (k − 1, n− 1) gelijk aan dk als kolom k − 1 niet nul is. In dat geval zal Enk−1,n−2(dk)de entry op positie (k− 1, n− 1) nul maken, maar de entry op positie (k− 2, n− 2) gelijk aandk als kolom k − 2 niet nul is. Omdat het aantal rijen van het nilpotente Jordanblok waarentry (`, `) toe behoort groter dan of gelijk is aan het aantal kolommen van het blok waarentry (k, k) toe behoort, zal in stap q met transformatiematrix Enk−q+1,n−q(dk) de entry dkop positie (k − q + 1, n− q) nul worden zonder verdere veranderingen.

Opmerking 1.3.59 De aanname dat d` = 1 is zonder verlies van algemeenheid. Als d` 6= 0kan dit immers bewerkstelligd worden middels de transformatie Dn(d−1

` ).

Lemma 1.3.58 laat zich goed uitleggen middels een voorbeeld. Hierin zijn de entries in delaatste kolom in beide nul-rijen ongelijk aan nul, oftewel, op posities (2, 6) en (5, 6).

Voorbeeld 1.3.60 In termen van Lemma 1.3.58 is hier ` = 5 en k = 2 en q = 2, en dus0 1 0 0 0 0

0 0 0 0 20 1 0 0

0 1 00 1

0

E6

25(2)−→

0 1 0 0 2 0

0 0 0 0 00 1 0 0

0 1 00 1

0

E6

14(2)−→

0 1 0 0 0 0

0 0 0 0 00 1 0 0

0 1 00 1

0

.

Toepassing van E625(2) maakt weliswaar de (2, 5) entry gelijk aan nul, maar introduceert een

2 op positie (1, 4) omdat de tweede kolom niet nul is. Toepassing van E614(2) maakt deze entry

weer nul. Echter, omdat de eerste kolom nul is, gebeurt er verder niets en is het doel bereikt.

Opmerking 1.3.61 Het product X van de transformatiematrices

X = Enk`(h1) · Enk−1,`−1(h2) · . . . · Enk−t,`−t(ht)

kan, net als in Opmerking 1.3.18, direct worden opgeschreven.

Lemma 1.3.58 kan worden toegepast om op c` na iedere entry ongelijk aan nul in de laatstekolom, liggende in een nulrij, naar nul te transformeren. De entry c` = 1 blijft als enigeongelijk aan nul over in de laatste kolom. Tot slot kan een blok-permutatie worden toegepastzo, dat deze 1 aansluit bij het blok waar hij rechts naast ligt.

Page 45: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.3. DE JORDANNORMAALVORM VAN EEN LINEAIRE TRANSFORMATIE 45

Voorbeeld 1.3.62 Stel dat de laatste kolom op een entry na naar nul is getransformeerd, dansluit een blokpermutatie deze entry aan op het Jordanblok waar hij bij hoort, zoals bijvoorbeeld

0 1 0 0 0 00 0 0 0 0 10 0 0 1 0 00 0 0 0 1 00 0 0 0 0 00 0 0 0 0 0

Π−→

0 1 0 0 0 00 0 1 0 0 00 0 0 0 0 00 0 0 0 1 00 0 0 0 0 10 0 0 0 0 0

met Π =

0 0 1 0 0 00 0 0 1 0 00 0 0 0 1 01 0 0 0 0 00 1 0 0 0 00 0 0 0 0 1

.Er resulteert dus een nilpotente Jordanvorm van type τ = [3, 3].

Hiermee is het inductiebewijs van Stelling 1.3.53 voltooid.

We geven nu ook een volledig voorbeeld waarin alle stappen van het bewijs van Stelling 1.3.53achter elkaar worden uitgevoerd op een expliciet gegeven 4× 4 matrix.

Voorbeeld 1.3.63 We bepalen inductief een nilpotente Jordanvorm van de gegeven matrixM . De eerste drie stappen liggen voor de hand,

M =

0 2 1 30 0 2

0 10

D42( 1

2)

−→

0 1 1 30 0 4

0 10

E423(−1)−→

0 1 0 30 0 5

0 10

E424(−3)−→

0 1 0 00 0 5

0 10

.De eerste stap brengt het 2×2 linksbovenblok in Jordanvorm, de tweede stap het 3×3 linksbo-venblok met Lemma 1.3.55, dat in de derde stap gebruikt wordt om entry (1, 3) nul te maken.Omdat het grootste Jordanblok van de 3 × 3 matrix niet rechtsonder staat, permuteren webeide blokken, 0 1 0 0

0 0 50 1

0

Π−→

0 0 0 10 1 0

0 50

met Π =

0 1 00 0 11 0 0

1

Vervolgens passen we Lemma 1.3.58 toe, waarbij ` = 3, k = 1 en q = 1, maar niet voordat wede entry op positie (3, 4) middels een diagonaalschaling naar 1 hebben getransformeerd, 0 0 0 1

0 1 00 5

0

D44( 1

5)

−→

0 0 0 15

0 1 00 1

0

E413( 1

5)

−→

0 0 0 00 1 0

0 10

,en dit is derhalve een nilpotente Jordanvorm van M , met type τ = [3, 1]. Om de bijbehorendetransformatiematrix X uit te rekenen, berekenen we

X = D42(

1

2) · E4

23(−1) · E424(−3) ·Π ·D4

4(1

5) · E4

13(1

5).

De eerste drie termen zijn eenvoudig samen te nemen, net als de laatste drie, wat resulteertin

X =

1 0 0 00 1

2 −12 −

32

0 0 1 00 0 0 1

0 1 0 0

0 0 1 01 0 1

5 00 0 0 1

5

=1

10

0 10 0 0−5 0 4 −310 0 2 00 0 0 2

.Deze matrix X is dus zo, dat X−1MX een nilpotente Jordanvorm is.

Page 46: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

46 HOOFDSTUK 1. CANONIEKE VORMEN

Opmerking 1.3.64 Als X−1MX een nilpotente Jordanvorm is, is ook (λX)−1M(λX) datvoor alle 0 6= λ ∈ K. Dus als K = Q dan kan een X met gehele entries worden gekozen.

1.3.5 Jordanvormen en de Jordannormaalvorm van een matrix

We koppelen nu de nilpotente Jordanvormen via Stelling 1.3.25 aan willekeurige matrices.

Definitie 1.3.65 (Jordanvorm) Een matrix J ∈ Kn×n heet een Jordanvorm als

J =

J1 0 . . . 0

0 J2. . .

......

. . .. . . 0

0 . . . 0 Jp

waarbij Jt ∈ Knt×nt = λtIt + St (1.100)

voor iedere t ∈ 1, . . . , p en iedere matrix St is een nilpotente Jordanvorm.

Stelling 1.3.66 (Jordan) Zij K algebraısch afgesloten. Iedere matrix A ∈ Kn×n is gelijk-vormig met een Jordanvorm.

Bewijs. Volgens Stelling 1.3.25 is A gelijkvormig met een blok-diagonaalmatrix met diago-naalblokken gelijk aan Tt = λtI + Mt met Mt strict bovendriehoeks. Volgens Stelling 1.3.48bestaat er een inverteerbare Xt zo, dat X−1

t MtXt = St een nilpotente Jordanvorm is, en dusX1 0 . . . 0

0 X2. . .

......

. . .. . . 0

0 . . . 0 Xp

−1

T1 0 . . . 0

0 T2. . .

......

. . .. . . 0

0 . . . 0 Tp

X1 0 . . . 0

0 X2. . .

......

. . .. . . 0

0 . . . 0 Xp

=

J1 0 . . . 0

0 J2. . .

......

. . .. . . 0

0 . . . 0 Jp

,waarbij Jt = λtIt + St.

Definitie 1.3.67 (Jordannormaalvorm) Zij A ∈ Kn×n. Een Jordanvorm J die gelijkvor-mig is met A heet een Jordannormaalvorm van A.

1.4 Opgaven

Opgave 1.1: Aanvulling tot een inverteerbare of zelfs unitaire 2× 2 matrix

(a) Bepaal voor ieder van de volgende vectoren uit C2 een matrix X ∈ GL2(C) met eenniet-triviaal veelvoud van die vector als eerste kolom. Geef daarnaast ook X−1.

u =

[11

], v =

[02

], w =

[3−4

], x =

[2−4

], y =

[1i

].

(b) Bepaal voor ieder van die vectoren een matrix U ∈ C3×3 met orthonormale kolommenwaarvan de eerste een niet-triviaal veelvoud is van de gegeven vector. Geef ook U−1.

Page 47: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.4. OPGAVEN 47

Opgave 1.2: Aanvulling tot een inverteerbare 3× 3 matrix

(a) Bepaal voor ieder van de volgende vectoren uit C3 een matrix X ∈ GL3(C) met eenniet-triviaal veelvoud van die vector als eerste kolom. Geef daarnaast ook X−1.

u =

111

, v =

024

, w =

00i

, x =

2−4

6

y =

321

.Opgave 1.3: 2× 2 Jacobi-triangulatie en Schur-triangulatie

(a) Bepaal voor ieder van de volgende matrices Aj ∈ C2×2 een matrix Xj ∈ GL2(C) zo, datX−1j AjXj = Rj een bovendriehoeksmatrix is.

A1 =

[1 01 1

], A2 =

[1 02 1

], A3 =

[3 2−2 −1

], A4 =

[1 1−1 −1

].

(b) Bepaal voor iedere Aj ook een unitaire Uj zo, dat U−1j AjUj = Tj bovendriehoeks is.

(c) Verifieer dat ‖Tj‖2F = ‖Aj‖2F , met ‖X‖2F de som van de kwadraten van de entries van X.

Opgave 1.4: 3× 3 Jacobi-triangulatie en Schur-triangulatie

(a) Bepaal voor ieder van de volgende matrices Aj ∈ C3×3 een matrix Xj ∈ GL3(C) zo, datX−1j AjXj = Rj een bovendriehoeksmatrix is.

A1 =

0 0 01 3 15 −1 1

, A2 =

1 −1 −31 3 30 0 2

, A3 =

0 4 2−1 0 1

1 2 0

.(b) Bepaal voor iedere Aj ook een unitaire Uj zo, dat U−1

j AjUj = Tj bovendriehoeks is.

(c) Verifieer dat ‖Tj‖2F = ‖Aj‖2F , met ‖X‖2F de som van de kwadraten van de entries van X.

Opgave 1.5: Een 4× 4 Jacobi-triangulatie

Bepaal voor de matrix

A =

2 1 0 0−1 0 0 0

2 2 3 1−1 −1 −1 1

een matrix X ∈ GL4(C) zo, dat X−1AX = R bovendriehoeks is.

Opgave 1.6: Unitaire matrices

Laat U, V unitair zijn. Bewijs dat de matrices

UV,

[U 00 V

], en

1√2

[U U−U U

]ook unitair zijn.

Page 48: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

48 HOOFDSTUK 1. CANONIEKE VORMEN

Opgave 1.7: Een spectraalstelling voor scheefsymmetrische matrices

Formuleer en bewijs middels de Schurdecompositie een spectraalstelling voor scheefsymme-trische matrices. Herinner je dat A ∈ Cn×n scheefsymmetrisch is als A∗ = −A.

Opgave 1.8: Schur-decompositie van een rang-1 matrix

Laat e1 de eerste standaardbasisvector van Cn zijn.

(a) Laat zien dat er voor iedere 0 6= u ∈ Cn een unitaire U bestaat met U∗u = ‖u‖e1.

Laat nu u, v ∈ Cn ongelijk aan nul zijn en bekijk de rang-1 matrix A = uv∗.

(b) Bepaal met behulp van U een Schurdecompositie van A.

Opgave 1.9: Gelijkvormigheid versus unitaire equivalentie

Matrices A,B ∈ Cn×n zijn gelijkvormig als er een inverteerbare X is waarvoor B = X−1AX,en unitair equivalent als er een unitaire X is waarvoor B = X∗AX.

(a) Ga na dat beide begrippen een equivalentierelatie definieren op Cn×n.

(b) Laat zien dat unitair equivalente matrices gelijkvormig zijn.

(c) Geef een voobeeld van twee gelijkvormige matrices die niet unitair equivalent zijn.

(d) Laat zien dat gelijkvormige matrices dezelfde eigenwaarden hebben.

Schrijf nu SA,SB voor de respectievelijke verzamelingen van Schurvormen van A,B ∈ Cn×n.

(e) Als A en B unitair equivalent zijn, geldt dan dat SA = SB?

(f) Als A en B gelijkvormig zijn, geldt dan dat SA = SB?

(g) Als SA ∩ SB 6= ∅, zijn A en B dan unitair equivalent?

Herinner je de definitie van de elementaire matrices Dnk (h), Enk`(h) en Πk`. Voor het schrijf-

gemak zullen we hier de superscripts n steeds weglaten.

Opgave 1.10: Elementaire gelijkvormigheidstransformaties met Dk(h) en Πk`

Bereken de volgende producten zonder de elementaire matrices uit te schrijven, en dus doorhet effect van deze matrices te interpreteren als elementaire rij- en kolomoperaties.

D2(1

2)−1

[1 20 1

]D2(

1

2) en D3(

1

2)−1D2(

1

2)−1

1 2 00 1 20 0 1

D2(1

2)D3(

1

2). (1.101)

Π−113

1 2 34 5 67 8 7

Π13 en Π−123 Π−1

12

1 2 34 5 67 8 7

Π12Π23. (1.102)

Probeer in een keer de correcte productmatrix op te schrijven, dus zonder tussenresultaten.

Page 49: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.4. OPGAVEN 49

Opgave 1.11: Elementaire gelijkvormigheidstransformaties met Ek`(h)

Bereken de volgende producten zonder de elementaire matrices uit te schrijven, en dus doorhet effect van deze matrices te interpreteren als elementaire rij- en kolomoperaties.

E12(1)−1

2 1 10 4 10 0 8

E12(1) en E23(−1)−1

2 1 10 4 10 0 8

E23(−1). (1.103)

E34(π)−1

1 1 1 10 2 1 10 0 1 10 0 0 1

E34(π) en E24(−1)−1

1 1 1 10 2 1 10 0 1 10 0 0 1

E24(−1). (1.104)

Probeer in een keer de correcte productmatrix op te schrijven, dus zonder tussenresultaten.

Opgave 1.12: Diagonalisatie middels gelijkvormigheidstransformaties met Ek`(h)

Diagonaliseer ieder van de volgende matrices middels ten hoogste drie gelijkvormigheidstrans-formaties met een elementaire matrix van het type Ek`(h).

R1 =

[1 1 00 0 60 0 3

], R2 =

[2 1 00 1 60 0 4

]R3 =

[1 2 −30 −1 10 0 −2

].

Geef aan welke matrices Ek`(h) achteraanvolgens worden toegepast, en geef hun product.

Opgave 1.13: Transformeren naar een deels gegeven vorm

Geef aan welke elementaire gelijkvormigheidstransformaties op Ri moeten worden toegepastom Ri naar de gegeven vorm Ti te transformeren. Bereken ook hun product.

R1 =

[1 1 10 2 10 0 3

]−→

[1 ∗ ∗0 3 ∗0 0 2

]= T1 R2 =

[1 1 10 2 10 0 3

]−→

[2 ∗ ∗0 1 ∗0 0 3

]= T2.

R3 =

1 3 4 50 2 1 60 0 1 70 0 0 2

−→ 1 ∗ ∗ ∗

0 1 ∗ ∗0 0 2 ∗0 0 0 2

= T3.

De getalswaarden van de sterretjes zijn willekeurig (en hoeven niet aan elkaar gelijk te zijn).

Opgave 1.14: Transformeren naar een gegeven vorm

Geef aan welke elementaire gelijkvormigheidstransformaties op R moeten worden toegepastom R naar de gegeven vorm T te transformeren.

R =

0 3 4 60 1 5 70 0 0 80 0 0 1

−→ 1 1 0 0

0 1 0 00 0 0 10 0 0 0

= T.

Page 50: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

50 HOOFDSTUK 1. CANONIEKE VORMEN

Opgave 1.15: Transformeren naar een gegeven Jordanvorm

Geef aan welke elementaire gelijkvormigheidstransformaties op Ri moeten worden toegepastom Ri naar de gegeven vorm Tj te transformeren.

R1 =

1 1 10 1 00 0 1

−→ 1 1 0

0 1 00 0 1

= T1, R2 =

0 1 10 0 10 0 0

−→ 0 1 0

0 0 10 0 0

= T2.

R3 =

1 1 0 30 1 1 20 0 1 10 0 0 1

−→ 1 1 0 0

0 1 1 00 0 1 10 0 0 1

= T3.

R4 =

2 0 0 10 2 1 00 0 2 10 0 0 2

−→ 2 0 0 0

0 2 1 00 0 2 10 0 0 2

= T4.

Opgave 1.16: Transformeren naar een Jordanvorm

Geef aan welke elementaire gelijkvormigheidstransformaties op Ri moeten worden toegepastom Ri naar een Jordanvorm Ji te transformeren. Geef ook Ji.

R1 =

1 1 0 0 20 1 0 0 00 0 1 1 30 0 0 1 20 0 0 0 1

, R2 =

0 1 0 0 00 0 0 0 10 0 0 1 00 0 0 0 10 0 0 0 0

, R3 =

0 1 0 0 00 0 0 0 10 0 0 1 00 0 0 0 00 0 0 0 0

R4 =

1 1 0 0 20 1 0 0 00 0 2 1 30 0 0 2 20 0 0 0 3

, R5 =

1 1 0 0 20 1 0 0 00 0 2 2 40 0 0 2 20 0 0 0 2

.

Opgave 1.17: Partities en hun geconjugeerden

(a) Geef alle partities τ ` 6, waarbij geconjugeerden onder elkaar staan.

(b) Teken ook hun Young tableaus.

(c) Geef voor iedere τ ` 6 een nilpotente Jordanvorm S van type τ .

Opgave 1.18: Gelijkvormigheid van nilpotente Jordanvormen

(a) Gegeven de twee nilpotente Jordanvormen

S1 =

0

0 10

0 10 1

0

en S2 =

0 1

0 10

00 1

0

.

Page 51: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

1.4. OPGAVEN 51

Bewijs dat S1 en S2 gelijkvormig zijn door een X ∈ GL6(C) te geven waarvoor X−1S1X = S2.

(b) Gegeven de twee nilpotente Jordanvormen

S1 =

0

0 10

0 10 1

0

en S2 =

0 1

00 1

00 1

0

.Bewijs vanuit de definitie van gelijkvormigheid dat S1 en S2 niet gelijkvormig zijn.

Opgave 1.19

Gegeven zijn de matrices

M1 =

0 2 10 0

0

, M2 =

0 2 10 2

0

, M3 =

0 0 10 2

0

.(a) Bepaal een Xj ∈ GL3(C) zo, dat X−1

j MjXj = Sj een nilpotente Jordanvorm is.

Opgave 1.20

Een matrix N ∈ Kn×n heet nilpotent als Np voor zekere gehele p ≥ 1. Bewijs dat A ∈ Kn×n

met K algebraısch afgesloten, nilpotent is als en alleen als alle eigenwaarden van A nul zijn.

Opgave 1.21

Gegeven zijn de nilpotente matrices

A1 =

[−2 4−1 2

], A2 =

0 4 2−1 0 1

1 2 0

, A3 =

−2 3 2 −1−1 1 2 −1−1 1 1 0−1 1 1 0

.(a) Bepaal een Xj ∈ GL3(C) zo, dat X−1

j AjXj = Mj een stricte bovendriehoeksmatrix is.

(b) Bepaal een Yj ∈ GL3(C) zo, dat Y −1j MjYj = Sj een nilpotente Jordanvorm is.

Opgave 1.22: Hoeveelheid nilpotente Jordanvormen van een gegeven type

Bewijs dat het aantal nilpotente Jordanvormen van type τ = [τ1, . . . , τp] ` n gelijk is aan

p!

(τ∗1 − τ∗2 )! · . . . · (τ∗q − τ∗q+1)!,

waarbij τ∗ = [τ∗1 , . . . , τ∗q ] de geconjugeerde partitie van τ is, en τq+1 = 0.

Hint:

Zij S ∈ Kn×n een nilpotente Jordanvorm is van type τ = [τ1, . . . , τp] ` n.

Bewijs dat τ∗` − τ∗`−1 het aantal nilpotente Jordanblokken van S van afmetingen `× ` is.

Page 52: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

52 HOOFDSTUK 1. CANONIEKE VORMEN

Page 53: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

Hoofdstuk 2

Dualiteit

Dit hoofdstuk behandelt enkele concepten gerelateerd aan dualiteit. Dualteit is een begripdat op zeer uiteenlopende deelgebieden van de wiskunde een rol speelt maar desondanks, ofmisschien wel juist daardoor, een niet goed gedefinieerde betekenis heeft. Gelukkig is de dualevectorruimte die we hier introduceren en bestuderen ondubbelzinnig en duidelijk gedefinieerd.We geven voorbeelden van (elementen uit) de duale vectorruimte, en beschrijven de dualebasis van de duale vectorruimte en de relatie met het begrip coordinaten. We behandelenhet natuurlijk isomorfisme tussen een vectorruimte en de duale van zijn duale, en het Ries-isomorfisme tussen de duale vectorruimte en de vectorruimte zelf. We definieren de duale vaneen lineaire afbeelding, en de annihilator van een verzameling. Daar waar dwarsverbandenzijn zullen deze expliciet worden opgemerkt.

2.1 De duale vectorruimte

We brengen de volgende definitie in de herinnering.

Definitie 2.1.1 (homK(V,W )) Gegeven twee vectorruimtes (V,K) en (W,K) over K noterenwe de verzameling van alle lineaire afbeeldingen V →W met homK(V,W ).

Lemma 2.1.2 De verzameling homK(V,W ) is een vectorruimte over K indien voorzien vande gebruikelijke optelling van L,K ∈ homK(V,W ) middels

L+K : V →W : v 7→ L(v) +K(v)

en de gebruikelijke vermenigvuldiging met scalairen k ∈ K middels

k · L : V →W : v 7→ k · L(v)

waarbij de + en de · in de rechterleden de vectorruimtebewerkingen op W zijn.

Als speciaal geval van deze definitie en dit lemma bekijken we de keuze W = K.

Definitie 2.1.3 (Duale vectorruimte (V ∗,K) van (V,K)) De vectorruimte homK(V,K) no-teren we met (V ∗,K) of kortweg met V ∗ en noemen we de duale vectorruimte van V .

Elementen uit de duale vectorruimte staan bekend onder een veelvoud van namen.

Definitie 2.1.4 (Lineaire functionaal, covector, 1-vorm) Een element v∗ ∈ V ∗ wordtook wel een lineaire functionaal genoemd, of een covector, of een 1-vorm.

53

Page 54: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

54 HOOFDSTUK 2. DUALITEIT

2.1.1 Voorbeelden en eerste orientatie

We geven hier voorbeelden van elementen uit de duale vectorruimte, en daarnaast ook watresultaten die we verderop in meer algemeenheid zullen bewijzen. Eerst bekijken we (Kn)∗.

Voorbeeld 2.1.5 Beschouw de vectorruimte (Kn,K). Dan is voor iedere vast gekozen y ∈ Kn

de afbeelding`y : Kn → K : x 7→ y>x (2.1)

een lineaire functionaal op Kn en daarmee dus een element van (Kn)∗.

Opmerking 2.1.6 In Voorbeeld 2.1.5 is `y ∈ (Kn)∗. De matrix y> is geen element van (Kn)∗.Het is slechts de matrix van de lineaire afbeelding `y ten opzichte van de standaardbasis.

Stelling 2.1.7 De afbeeldingL : Kn → (Kn)∗ : y 7→ `y (2.2)

met `y als in Voorbeeld 2.1.5 is een lineaire bijectie.

Bewijs. De lineariteit is eenvoudig na te gaan. Omdat er voor iedere y 6= 0 een x ∈ Kn

bestaat met y>x 6= 0, geldt dat `y = 0 ⇔ y = 0. Dus is ker(L) = 0, en is L injectief. Ookis L surjectief, immers, laat ` : Kn → K gegeven zijn en laat z ∈ K1×n de matrix zijn van `ten opzichte van de standaardbases van Kn en van K. Dan is dus `(x) = zx voor alle x ∈ Ken dus geldt met y = z> dat ` = `y. Dus iedere ` ∈ (Kn)∗ is van de vorm `y voor zekere y.

Gevolg 2.1.8 Er geldt dat (Kn)∗ ∼= Kn. In het bijzonder is dim(Kn)∗ = n.

Bewijs. De afbeelding L uit Stelling 2.1.7 is een lineaire bijectie en dus een isomorfisme.

Opmerking 2.1.9 Het voorgaande kan geherformuleerd worden als dat

(Kn)∗ = `y | y ∈ Kn, (2.3)

waarbij er voor iedere ` ∈ (Kn)∗ precies een y ∈ Kn bestaat zo, dat ` = `y.

Opmerking 2.1.10 Als K = R dan is `y(x) = y>x = 〈y, x〉 het standaardinproduct op Rnmet een vast gekozen vector y ∈ Rn. Ook als K = C is `y(x) = y>x = y∗x = 〈y, x〉 hetstandaardinproduct op Cn met een vast gekozen vector, alleen nu is dat met y.

Lineaire functionalen op een eindigdimensionale vectorruimte laten zich beschrijven middelsde combinatie van Stelling 2.1.7 en de coordinaatafbeelding horende bij een basis β van V .

Opmerking 2.1.11 In het vervolg zullen we een willekeurig element uit V ∗ vaak aanduidenmet v∗. Dit is slechts een notatie, in het bijzonder is de asterisk hier geen bewerking op v.

Stelling 2.1.12 Gegeven een vectorruimte (V,K) met basis β = 〈v1, . . . , vn〉. Dan bestaat ervoor iedere v∗ ∈ V ∗ precies een y ∈ Kn zodat

v∗ = `y coβ (2.4)

waarbij `y de afbeelding Kn → K : x 7→ y>x is. De toevoeging Kn → V ∗ : y 7→ v∗ is lineair.

Page 55: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 55

Bewijs. Laat v∗ : V → K gegeven zijn en beschouw daarnaast de coordinaatafbeeldingcoβ : V → Kn. Zie nu het diagram in Figuur 3.1.

V K

Kn

∼=

v∗

coβ`y

v∗ co−1β : Kn → K

`y : Kn → K

=

Figuur 3.1 Factorisatie van een element v∗ ∈ V ∗.

De samenstelling v∗ co−1β is een lineaire afbeelding Kn → K. Volgens Stelling 2.1.7 bestaat

er een unieke y ∈ Kn zo, dat v∗ co−1β = `y, en dus zo, dat v∗ = `y coβ. Volgens Stelling

2.1.7 is de toevoeging y 7→ `y lineair. Dus is de samenstelling y 7→ `y coβ = v∗ dat ook.

Gevolg 2.1.13 Er geldt dat V ∗ ∼= Kn, en in het bijzonder dat V ∗ ∼= V .

We eindigen deze sectie met enkele explicietere voorbeelden van lineaire functionalen. Eenbekend element uit de duale van de ruimte van vierkante matrices is het spoor.

Voorbeeld 2.1.14 De lineaire afbeelding

Sp : Kn×n → K : A 7→ Sp(A) (2.5)

waarbij Sp(A) staat voor het spoor van A, is een covector uit (Kn×n)∗. Daarnaast is voorgegeven vast gekozen v, w ∈ Kn ook

Kn×n → K : A 7→ v>Aw (2.6)

een lineaire functionaal op Kn×n en daarmee een element uit (Kn×n)∗.

Oneindigdimensionale vectorruimtes leveren doorgaans interessantere duale vectorruimtes.

Voorbeeld 2.1.15 Beschouw de vectorruimte (C(I),R) van continue functies op het intervalI = [a, b] met a, b ∈ R. Dan is de afbeelding

Iba : C(I)→ R : f 7→∫ b

af(x)dx, (2.7)

waar∫ ba de Riemann-integraal is, een lineaire functionaal op C(I), en dus is Iba ∈ C(I)∗.

Daarnaast is de functie-evaluatie

ex : C(I)→ R : f 7→ f(x) (2.8)

ook een element van C(I)∗ voor iedere vast gekozen x ∈ I. In het bijzonder is ook

T ba : C(I)→ R : f 7→ (b− a)f(a) + f(b)

2(2.9)

een element van C(I)∗, het is immers een lineaire combinatie van ea en eb uit (2.8).

Page 56: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

56 HOOFDSTUK 2. DUALITEIT

De lineaire functionalen Iba en T ba uit vorig voorbeeld zijn als volgt aan elkaar gerelateerd.

Opmerking 2.1.16 Definieer de zogeheten interpolatie-afbeelding

π : C(I)→ R[X]≤1 : f 7→ π(f) (2.10)

die aan f ∈ C(I) toevoegt het unieke lineaire polynoom π(f) ∈ R[X]≤1 dat waarde f(a)aanneemt in a en f(b) in b. Zie ook Figuur 3.2. Het polynoom π(f) heet de lineaire interpolantvan f . Het is eenvoudig na te gaan dat dan voor alle f ∈ C(I),

T ba(f) = Iba(π(f)), (2.11)

dus T ba(f) is een approximatie van Iba(f) berekend door π(f) te integreren in plaats van f zelf.

Definitie 2.1.17 (Trapeziumregel) T ba(f) heet de trapeziumregel-approximatie van Iba(f).

De trapeziumregel is een voorbeeld van een zogeheten kwadratuurformule.

a b

f

π(f)

f(a)

f(b)

T ba(f)

a b

f(a)

f(b)

12(f(a) + f(b))

T ba(f)

Figuur 3.2 De trapeziumregel T ba(f) = 12(f(a) + f(b))(b− a) benadert Iba(f).

2.1.2 De duale basis β∗ van V ∗ behorende bij een basis β van V

Veronderstel dat (V,K) een vectorruimte is van eindige dimensie. In Sectie 2.1.1 zagen wedat V ∗ isomorf is met V . We definieren nu een basis voor V ∗, gegeven een basis β van V .

Definitie 2.1.18 (Duale basis) Zij (V,K) een vectorruimte met basis β = 〈v1, . . . , vn〉.Laat voor iedere j ∈ 1, . . . , n

vj : V → K : v 7→ e>j coβ(v). (2.12)

Hiermee is β∗ = 〈v1, . . . , vn〉 een basis voor V ∗, de duale basis genaamd.

Opmerking 2.1.19 In Figuur 3.3 wordt vj gedefinieerd in termen van Figuur 3.1.

V K

Kn

∼=

vj

coβ`ej

vj = `ej coβ

Page 57: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 57

Figuur 3.3 De vj ∈ V ∗ uit Definitie 2.1.18 in termen van `ej uit Voorbeeld 2.1.5.

Opmerking 2.1.20 Met Definitie 2.1.18 laat de coordinaatafbeelding zich als volgt herschrij-ven,

coβ : V → Kn : v 7→

v1(v)...

vn(v)

. (2.13)

In het bijzonder zien we dus dat voor alle v ∈ V,

v = v1(v)v1 + · · ·+ vn(v)vn, (2.14)

en tevens dat

vj(vi) = δij =

1 als i = j0 als i 6= j

. (2.15)

Merk op dat de karakterisering van v1, . . . , vn in (2.15) equivalent is met Definitie 2.1.18.

We bewijzen nu dat β∗ inderdaad een basis is. Omdat we in Gevolg 2.1.13 al zagen datdim(V ∗) = dim(V ) = n volstaat het om de lineaire onafhankelijkheid van β∗ aan te tonen.

Lemma 2.1.21 De covectoren v1, . . . , vn zijn lineair onafhankelijk.

Bewijs. Laat α1, . . . , αn ∈ K zodanig zijn dat

α1v1 + · · ·+ αnv

n = 0 ∈ V ∗, (2.16)

waarbij het rechterlid het neutrale element van V ∗ is, oftewel de nulfunctionaal 0 : V → K :v 7→ 0 ∈ K. Laat nu j ∈ 1, . . . , n en evalueer (2.16) in vj ∈ V . Wegens (2.15) is vj(vi) = δijen dus impliceert (2.16) dat

K 3 0 = 0(vj) = α1v1(vj) + · · ·+ αnv

n(vj) = αjvj(vj) = αj .

Omdat j willekeurig was, is α1 = · · · = αn = 0 en zijn v1, . . . , vn dus lineair onafhankelijk.

We kunnen vervolgens de bij β∗ horende coordinaatafbeelding coβ∗ : V ∗ → Kn onderzoeken.

Lemma 2.1.22 Zij V een vectorruimte met basis β = 〈v1, . . . , vn〉 en laat β∗ = 〈1, . . . , vn〉de bij β horende duale basis zijn voor V ∗. Dan geldt dat

coβ∗ : V ∗ → Kn : v∗ 7→

v∗(v1)...

v∗(vn)

, (2.17)

oftewel, met andere woorden, dat

v∗ = v∗(v1)v1 + · · ·+ v∗(vn)vn (2.18)

voor alle v∗ ∈ V ∗.

Page 58: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

58 HOOFDSTUK 2. DUALITEIT

Bewijs. Evalueer de beide lineaire functionalen in het linker- en rechterlid van (2.18) inv1, . . . , vn met behulp van relatie (2.15) en concludeer gelijkheid.

We illustreren de duale basis en Lemma 2.1.22 met twee voorbeelden.

Voorbeeld 2.1.23 Beschouw R2 voorzien van de standaardbasis ε = 〈e1, e2〉. De duale vec-torruimte (R2)∗ bestaat volgens Stelling 2.1.7 uit alle afbeeldingen

`y : R2 → R :

[x1

x2

]7→ [y1, y2]

[x1

x2

], met y1, y2 ∈ R.

We zien in het bijzonder dat `y = y1e1 + y2e

2, waarbij

e1 : R2 → R : x 7→ e>1 x en e2 : R2 → R : x 7→ e>2 x

de individuele-coordinaatfunctionalen zijn. Het tupel 〈e1, e2〉 is de duale basis ε∗ voor (R2)∗.Merk op dat `y = `y(e1)e1 + `y(e2)e2, wat Lemma 2.1.22 illustreert.

Het volgende voorbeeld speelt zich af in een polynoomruimte.

Voorbeeld 2.1.24 Beschouw de vectorruimte (R[X]≤2,R). Laat β = 〈φ0, φ1, φ2〉, waarbij

φ0 : R→ R : X 7→ 1, φ1 : R→ R : X 7→ X, φ2 : R→ R : X 7→ X2.

De duale basis β∗ = 〈φ0, φ1, φ2〉 voor (R[X]≤2)∗ bestaat per Definitie 2.1.18 en Opmerking2.1.20 uit de individuele-coordinaatfunctionalen, die samen de coordinaatafbeelding coβ bepa-len,

coβ(·) =

φ0(·)φ1(·)φ2(·)

.Beschouw nu de integratie-afbeelding

I10 : R[X]≤2 → R : p→

∫ 1

0p(X)dX.

Dan is I10 ∈ (R[X]≤2)∗ en vertelt Lemma 2.1.22 dat

I10 = I1

0 (φ0)φ0 + I10 (φ1)φ1 + I1

0 (φ2)φ2 = φ0 +1

2φ1 +

1

3φ2.

Hiermee hebben we de integratie-functionaal I10 dus expliciet geschreven als lineaire combinatie

van de individuele-coordinaatfunctionalen φ1, φ2, φ3.

Opmerking 2.1.25 In het voorgaande voorbeeld hebben we in feite niets anders laten ziendan dat ∫ 1

0a+ bX + cX2 dX = a+

1

2b+

1

3c (2.19)

oftewel, we hebben de integraal uitgedrukt als lineaire combinatie van de coordinaten a, b, c.

Page 59: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 59

2.1.3 De dubbelduale vectorruimte V ∗∗ en het natuurlijke isomorfisme

In deze sectie bestuderen we de duale van de duale vectorruimte V ∗, oftwel de dubbeldualevectorruimte V ∗∗ = (V ∗)∗ van V . Volgens Definitie 2.1.3 is

V ∗∗ = homK(V ∗,K) (2.20)

en deze vectorruimte bestaat dus uit alle lineaire functionalen V ∗ → K.

Opmerking 2.1.26 Als V = R bestaat V ∗ = R∗ uit de lineaire afbeeldingen van R naar R, enV ∗∗ uit de lineaire afbeeldingen, die aan dergelijke lineaire afbeeldingen scalairen toevoegen.

Dus V ∗∗ lijkt doorgaans niet hetzelfde als V , tenzij we onze interpretatie van V subtiel herzien.

Definitie 2.1.27 (Duale koppeling) Zij V een vectorruimte met duale V ∗. Schrijf vooralle v∗ ∈ V en v ∈ V

〈v∗, v〉 = v∗(v). (2.21)

De afbeelding 〈·, ·〉 : V ∗ × V → K heet de duale koppeling van het duale paar V, V ∗.

Opmerking 2.1.28 De uitdrukking 〈v∗, v〉 is geen inproduct. Als V een inproductruimte is,zullen we verschillende notaties nodig hebben voor inproduct en duale koppeling.

De charme van de notatie 〈v∗, v〉 en van het hele concept van duale koppeling is, dat het eenperfecte symmetrie suggereert tussen wat v∗ doet met v, en omgekeerd, wat v doet met v∗.

Opmerking 2.1.29 Het is gebruikelijk om v∗(v) en dus 〈v∗, v〉 te lezen als v∗ geevalueerd inv. De symmetrie in de notatie 〈v∗, v〉 moedigt echter aan om dit ook te lezen als v geevalueerdin v∗. Dit interpreteert v als lineaire functionaal V ∗ → K : v∗ 7→ 〈v∗, v〉, als element van V ∗∗.

In Figuur 3.4 illustreren we de symmetrie tussen de gebruikelijke werking van V ∗ op V en dehier nieuw te beschouwen werking van V op V ∗.

v1

v2

vn

v1 v2 vn

1

1

1

1

0

0

0

0 0

0

v∗(v) = 〈v∗, v〉 = v(v∗)

v∗ : V → K : v 7→ 〈v∗, v〉

v : V ∗ → K : v∗ 7→ 〈v∗, v〉

Figuur 3.4. Dualiteit: het symbool v is zowel een element van V , als een element van V ∗∗.

We gebruiken in Figuur 3.4 voor de lineaire functionaal V ∗ → K : v∗ 7→ 〈v∗, v〉 uit devectorruimte V ∗∗ hetzelfde symbool v als voor het element v uit V . De motivatie hiervoor isdat we voor de lineaire functionaal V → K : v 7→ 〈v∗, v〉 standaard het symbool v∗ gebruiken.

Opmerking 2.1.30 Om de vraag te beantwoorden of het gebruik van het symbool v voorde afbeelding V ∗ → K : v∗ 7→ 〈v∗, v〉 geen mathematische inconsistentie oplevert, zullen weaantonen dat iedere v ∈ V op deze manier precies een element uit V ∗∗ voorstelt, en omgekeerd,dat ieder element uit V ∗∗ voor is te stellen middels precies een element uit V .

Page 60: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

60 HOOFDSTUK 2. DUALITEIT

In de volgende stelling gebruiken we daarom vooralsnog niet het symbool v maar H(v).

Stelling 2.1.31 (Natuurlijk isomorfisme) Zij V, V ∗ een duaal paar met duale koppeling〈·, ·〉 : V ∗×V → K. Laat H : V → V ∗∗ de afbeelding zijn die aan v ∈ V de lineaire functionaal

H(v) : V ∗ → K : v∗ 7→ 〈v∗, v〉 (2.22)

uit V ∗∗ toevoegt. Dan is H een lineaire bijectie tussen V en V ∗∗, het natuurlijke isomorfisme.

Opmerking 2.1.32 We schrijven H(v)(v∗) voor de functionaal H(v) ∈ V ∗∗ geevalueerd inv∗. Het alternatief is om de duale koppeling tussen V ∗ en V ∗∗ te gebruiken, maar dat iswellicht verwarrend. In het bijzonder is dus H(v)(v∗) = 〈v∗, v〉.

Bewijs. We bewijzen eerst de lineariteit van H. Laat α, β ∈ K en v, w ∈ V . Dan geldt vooralle v∗ ∈ V ∗ dat

H(αv + βw)(v∗) = 〈v∗, αv + βw〉 = α〈v∗, v〉+ β〈v∗, w〉 = αH(v)(v∗) + βH(w)(v∗),

en dus zijn H(αv + βw) en αH(v) + βH(w) gelijk als afbeeldingen op V ∗. Vervolgens latenwe zien dat H injectief is. Veronderstel hiertoe dat H(v) = 0. Dit betekent dat

H(v)(v∗) = 〈v∗, v〉 = 0 ∈ K

voor alle v∗ ∈ V ∗, en dus in het bijzonder voor de elementen v1, . . . , vn van de duale basisβ∗ van V ∗ horende bij een gekozen basis β = 〈v1, . . . , vn〉 van V . Dus is 〈vj , v〉 = vj(v) = 0voor alle j ∈ 1, . . . , n, en volgt met behulp van Opmerking 2.1.20 dat coβ(v) = 0 en dus isv = 0. Dus is H injectief, en omdat dim(V ) = dim(V ∗∗) = n is H bijectief.

Opmerking 2.1.33 Als we het symbool v gebruiken voor zowel het element uit V als voorhet element V ∗ → K : v∗ 7→ 〈v∗, v〉 uit V ∗∗ dan valt te verdedigen dat V ∗∗ = V .

2.1.4 Het isomorfisme van Riesz

In Opmerking 2.1.9 zagen we dat iedere lineaire functionaal ` op Rn op precies een manierkan worden geschreven als het nemen van het inproduct met een vast gekozen y ∈ Rn. Webewijzen nu iets soortgelijks voor iedere eindigdimensionale reele inproductruimte.

Opmerking 2.1.34 Om verwarring met de duale koppeling 〈·, ·〉 te voorkomen schrijven we(·, ·) voor een inproduct.

Stelling 2.1.35 (Riesz) Laat (V,R, (·, ·)) een inproductruimte zijn van dimensie n ∈ N.Dan is voor iedere u ∈ V de afbeelding

`u : V → R : v 7→ (u, v) (2.23)

een element uit V ∗. Definieer nu

J : V → V ∗ : u 7→ `u (2.24)

dan is J een lineaire bijectie en dus een isomorfisme, het Riesz-isomorfisme genaamd.

Page 61: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 61

Bewijs. De lineariteit van `u en van J volgen eenvoudig. Om injectiviteit van J te bewijzen,merk op dat `u(u) = (u, u) = ‖u‖2 en dus volgt uit een inproductaxioma dat `u = 0⇒ u = 0.Dus ker(J ) = 0 en is J injectief. Gevolg 2.1.13 laat zien dat dim(V ∗) = dim(V ) = n endus is J zelfs bijectief. We concluderen dat J een isomorfisme is.

Opmerking 2.1.36 In de overeenkomstige Stelling 2.1.7 was nog niet bewezen dat dim(V ∗) =dim(V ) en dus moest daar de surjectiviteit van L nog expliciet worden bewezen.

Frigyes Riesz (1880-1956)

Definitie 2.1.37 (Riesz-representant) Het unieke element v ∈ V zo, dat (v, w) = v∗(w)voor alle w ∈ V heet de Riesz-representant van v∗ in V .

Opmerking 2.1.38 Laat (V,C, (·, ·)) een complexe inproductruimte zijn van dimensie n ∈ N.Dan is voor iedere u ∈ V de afbeelding

`u : V → R : v 7→ (u, v) (2.25)

een element uit V ∗, want complexe inproducten zijn lineair in de tweede component. Definieernu

J : V → V ∗ : u 7→ `u (2.26)

dan is J weliswaar een bijectie maar niet een lineaire bijectie. Immers,

J (αu) = `αu

en

`αu(v) = (αu, v) = α(u, v) = α`u(v)

dus J (αu) = αJ (u). Dus is J geen lineaire afbeelding. Hij wordt anti-lineair of geconjugeerd-lineair genoemd. We zullen in het vervolg alleen de reele inproductruimten bekijken.

Voorbeeld 2.1.39 In Opmerking 2.1.9 is y de Riesz-representant van `y.

Voorbeeld 2.1.40 Beschouw voor zekere a < b het standaardinproduct

(q, r) =

∫ b

aq(X)r(X)dX

Page 62: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

62 HOOFDSTUK 2. DUALITEIT

op de vectorruimte (R[X]≤n,R) van polynomen van graad ten hoogste n. De Riesz-representantvan de integratie-afbeelding Iba ∈ (R[X]≤n)∗ gedefinieerd door

Iba : R[X]≤n → R : r 7→∫ b

ar(X)dX

is het polynoom R→ R : X 7→ 1. Immers, Iba(r) = (1, r) voor alle r ∈ R[X]≤n.

Voorbeeld 2.1.41 Op de ruimte (Rn×n,R) definieren we het inproduct

(X,Y ) = Sp(X>Y ).

De Riesz-representant van de lineaire functionaal

Sp : Rn×n → R : Y 7→ Sp(Y )

is de identiteitsmatrix I ∈ Rn×n. Immers, Sp(Y ) = Sp(I>Y ) = (I, Y ) voor alle Y ∈ Rn×n.

Het volgende voorbeeld is wellicht wat verrassender.

Voorbeeld 2.1.42 Laat A ∈ GLn(R) gegeven zijn met A> = A. Definieer voor alle y, z ∈Rn,

(y, z)A = y>Az. (2.27)

Dan is (·, ·)A een inproduct op Rn. Beschouw nu het stelsel Ax = b van lineaire vergelijkingenvoor gegeven b ∈ Rn. Omdat geldt dat

(x, z)A = x>Az = x>A>z = (Ax)>z = b>z (2.28)

is de oplossing x van Ax = b de Riesz-representant van de lineaire functionaal z 7→ b>z.

Het Riesz-isomorfisme J is een lineaire afbeelding tussen vectorruimtes, en dus kunnen wede matrix J β

β van J beschouwen ten opzichte van bases β en β∗.

Lemma 2.1.43 Zij (V,R, (·, ·)) een inproductruimte met basis β = 〈v1, . . . , vn〉. Schrijf β∗ =〈v1, . . . , vn〉 voor de bijbehorende duale basis van V ∗. Dan is

J β∗

β =

(v1, v1) . . . (vn, v1)...

...(v1, vn) . . . (vn, vn)

(2.29)

de matrix van het Riesz-isomorfisme J : V → V ∗ ten opzichte van β en β∗.

Bewijs. Per definitie is J β∗

β de matrix waarvoor geldt dat

coβ∗(J (v)) = J β∗

β · coβ(v) (2.30)

voor alle v ∈ V , zoals afgebeeld in Figuur 3.5. Dus is de j-de kolom van J β∗

β gelijk aan

coβ∗(J (vj)) =

J (vj)(v1)...

J (vj)(vn)

=

(vj , v1)...

(vj , vn)

, (2.31)

Page 63: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 63

waar we gebruik maakten van Lemma 2.1.22 en de definitie van J uit Stelling 2.1.35.

In Figuur 3.5 vatten we een en ander schematisch samen. Definitie 2.1.18 van duale basisβ∗ = 〈v1, . . . , vn〉, Opmerking 2.1.20 over de vorm van coβ in termen van v1, . . . , vn, Lemma2.1.22 voor de coordinaten ten opzichte van β, en bovenstaand Lemma 2.1.43 voor de matrixvan het Riesz-isomorfisme ten opzichte van β en β∗.

V V ∗

Rn Rn

coβ coβ∗

J

J β∗

β

coβ∗(v∗) =

〈v∗, v1〉...

〈v∗, vn〉

coβ(v) =

〈v1, v〉...

〈vn, v〉

v∗ =n∑j=1

〈v∗, vj〉vjv =n∑j=1

〈vj , v〉vj

β = v1, . . . , vn β∗ = v1, . . . , vn

(v1, v1) . . . (vn, v1)...

...(v1, vn) . . . (vn, vn)

=

Figuur 3.5 Matrix van het Riesz-isomorfisme ten opzichte van basis en duale basis.

Opmerking 2.1.44 De coordinaatvector coβ(J −1(v∗)) van de Riesz-representant J −1(v∗)van v∗ kan dus worden uitgerekend als oplossing x van het stelsel lineaire vergelijkingen

J β∗

β x = coβ∗(v∗), (2.32)

waarbij de matrix J β∗

β is als in Lemma 2.1.43.

Voorbeeld 2.1.45 Beschouw nogmaals Voorbeeld 2.1.40, met voor het gemak de explicietekeuzes n = 2 en verder a = 0 en b = 1. We gaan de Riesz-representant p = J −1(I1

0 ) van I10

uitrekenen. Kies hiertoe β = 〈1, X,X2〉. De coordinaten van I10 ten opzichte van β∗ hebben

we reeds uitgerekend in Voorbeeld 2.1.24. Dan geeft Lemma 2.1.43 dat

J β∗

β coβ(p) =

1 12

13

12

13

14

13

14

15

coβ(p) =

11213

= coβ∗(I10 ). (2.33)

Hieruit volgt dat coβ(p) = e1 ∈ R3 en dus dat p = 1, zoals we al zagen in Voorbeeld 2.1.40.

Opmerking 2.1.46 Als β in Lemma 2.1.43 orthonormaal is, is J β∗

β = I, de identiteitsmatrix.In dat geval geldt kennelijk coβ∗(J (v)) = coβ(v), oftewel,

v =

n∑j=1

αjvj ⇔ J (v) =

n∑j=1

αjvj . (2.34)

In dat geval kan de Riesz-representant v = J −1(v∗) van v∗ het eenvoudigst worden bepaald.

Page 64: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

64 HOOFDSTUK 2. DUALITEIT

We geven nu een voorbeeld waaruit blijkt dat als de vectorruimte V geen eindige dimensieheeft, de representatiestelling van Riesz niet zonder meer geldig blijft.

Voorbeeld 2.1.47 Beschouw de inproductruimte (C(I),R, (·, ·)) van continue functies op hetinterval I = [0, 1], voorzien van het standaardinproduct

(f, g) =

∫ 1

0f(x)g(x)dx. (2.35)

We bekijken weer de lineaire functionaal I10 ∈ C(I)∗. Net als in Voorbeeld 2.1.40 geldt ook

hier dat(1, g) = I1

0 (g) (2.36)

voor alle g ∈ C(I). Dus I10 heeft een Riesz-representant in C(I). Bekijk nu echter de functie-

evaluatie in x = 0,ε0 : C(I)→ R : g 7→ g(0). (2.37)

Deze functionaal is lineair en dus ε0 ∈ C(I)∗. Veronderstel nu dat er een f ∈ C(I) bestaatmet de eigenschap dat

(f, g) = ε0(g) voor alle g ∈ C(I). (2.38)

Dan is f niet de nulfunctie. Omdat f continu is, bestaat er een niet-leeg open intervalK = (a, b) ⊂ [0, 1] zo, dat f(x) 6= 0 voor alle x ∈ K. Laat nu g(x) = (x − a)(b − x)voor alle x ∈ K en g(x) = 0 voor alle x 6∈ [a, b]. Zie Figuur 3.6.

0 1a bK

g

f f(x)g(x) > 0 op K

f(x)g(x) = 0 op I \K

(f, g) > 0

ε0(g) = 0⇒

Figuur 3.6 Voor iedere f ∈ C(I) is er een g ∈ C(I) met g(0) = 0 en (f, g) 6= 0.

Dan is g ∈ C(I) met ε0(g) = 0. Ook is f(x)g(x) = 0 voor alle x 6∈ K. Omdat voor allex ∈ K of f(x)g(x) > 0, of f(x)g(x) < 0 is (f, g) 6= 0. Uit deze tegenspraak volgt dat er geenf ∈ C(I) bestaat zo, dat (f, g) = ε0(g) voor alle g ∈ C(I).

Opmerking 2.1.48 Dualiteit heeft in oneindig veel dimensies veel meer onverwachte wen-dingen dan in eindig veel dimensies. De representatiestelling van Riesz, maar bijvoorbeeldook het natuurlijk isomorfisme hoeven daar niet meer geldig te zijn.

Functie-evaluatie heeft wel een Riesz-representant op iedere polynoomruimte (R[X]≤n,R).

Voorbeeld 2.1.49 Beschouw de vectorruimte (R[X]≤1,R) van lineaire polynomen voorzienvan het standaardinproduct

(q, r) =

∫ 1

−1q(X)r(X)dX.

We bepalen de Riesz-representant van de evaluatie-functionaal ε0 : R[X]≤1 → R : p 7→ p(0).Hietoe kiezen we de basis β = 〈1, X〉 voor R[X]≤1. We vinden middels Lemma 2.1.22 dat

coβ∗(ε0) =

[ε0(1)ε0(X)

]=

[10

]. (2.39)

Page 65: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 65

Vervolgens berekenen we expliciet de matrix

J β∗

β =

[2 00 2

3

](2.40)

met als gevolg dat

coβ(J −1(ε0)) =[J β

β

]−1coβ∗(ε0) =

[120

], (2.41)

en dus dat r = J −1(ε0) = 12 · 1 + 0 ·X. En inderdaad, met p(X) = a+ bX vinden we dat

(r, p) =

∫ 1

−1

1

2(a+ bX)dX =

1

2(aX +

1

2bX2)

∣∣∣∣1−1

= a = p(0) = ε0(p). (2.42)

Dit bevestigt dat r de Riesz-representant is van ε0 ∈ (R[X]≤1)∗.

2.1.5 De duale L∗ van een lineaire afbeelding L

Laat (V,K) en (W,K) vectorruimtes zijn over een lichaam K. Dan induceert iedere lineaireafbeelding L : V →W op natuurlijke wijze een zogeheten duale afbeelding L∗ : W ∗ → V ∗.

Definitie 2.1.50 (Duale afbeelding en pull-back) Voor iedere L ∈ homK(V,W ) definierenwe de duale afbeelding L∗ ∈ homK(W ∗, V ∗) middels

L∗ : W ∗ → V ∗ : w∗ 7→ w∗ L. (2.43)

De functionaal L∗(w∗) heet de pull-back van w∗ in V ∗ onder L.

Het is eenvoudig na te gaan dat L∗ goedgedefinieerd en linear is.

V W

Kw∗ ∈W ∗V ∗ 3 w∗ L

L

L∗

L∗ : W ∗ → V ∗ : w∗ 7→ w∗ L

Figuur 3.6 Definitie van de duale afbeelding L∗ en de pull-back w∗ L van w∗.

Opmerking 2.1.51 In de context van complexe inproductruimtes gebruikten we de notatieL∗ voor de geadjungeerde van een lineaire afbeelding L : V →W . Dit is de afbeelding zo, dat

(v, L∗(w))V = (L(v), w)W (2.44)

voor alle v ∈ V en w ∈ W . Hier is (·, ·)V het inproduct op V en (·, ·)W het inproduct op W .Ondanks dat we de duale van een afbeelding L ook met L∗ aanduiden, is dit niet hetzelfde.

Opmerking 2.1.52 De asterisk in L∗ is een bewerking ∗ : homK(V,W )→ homK(W ∗, V ∗).

Page 66: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

66 HOOFDSTUK 2. DUALITEIT

Voorbeeld 2.1.53 Laat L : R→ R : x 7→ 2x. Dan beeldt L∗ een functionaal w∗ op R af opde functionaal v∗ = L∗(w∗) gedefinieerd door

v∗ : R→ R : x 7→ w∗(2x). (2.45)

Deze v∗ is dan de pull-back van w∗ onder L.

Voorbeeld 2.1.54 Laat (C(I),R) de vectorruimte van continue functies op I = [a, b] zijn.Beschouw de lineaire afbeelding

π : C(I)→ R[X]≤1 : f 7→ π(f), (2.46)

waarbij π(p) de lineaire interpolant is van f , oftewel, het unieke polynoom in R[X]≤1 datwaarde f(a) aanneemt in a en waarde f(b) in b. Laat vervolgens

Iba : R[X]≤1 → R : g 7→∫ b

ag(x)dx. (2.47)

Dan is Iba ∈ (R[X]≤1)∗ en is L∗(Iba) gelijk aan de lineaire functionaal Iba L, die we herkennenals

T ba : C(I)→ R : f 7→∫ b

aπ(f)(x)dx =

1

2(f(a) + f(b)) (b− a), (2.48)

oftewel, de trapeziumregel T ba ∈ (C(I))∗ is de pull-back van Iba onder π. Zie Figuur 3.7.

C(I) R[X]≤1

RIba ∈ (R[X]≤1)∗C(I)∗ 3 T ba

π

π∗

π∗(Iba) = T ba

Figuur 3.7 Relatie tussen Iba en T ba via de duale π∗ van de lineaire-interpolatieafbeelding.

De duale L∗ van een lineaire afbeelding is zoals gezegd niet gelijk aan de geadjungeerde. Welkunnen we het volgende onmiddellijk inzien. Vergelijk dit met Opmerking 2.1.51.

Stelling 2.1.55 Laat L∗ ∈ homK(W ∗, V ∗) de duale zijn van L ∈ homK(V,W ). Dan geldtvoor alle v ∈ V en w∗ ∈W ∗,

〈L∗(w∗), v〉V = 〈w∗, L(v)〉W (2.49)

waarbij 〈·, ·〉V de duale koppeling tussen V ∗ en V en 〈·, ·〉W die tussen W ∗ en W is.

Bewijs. Er geldt per definitie van duale koppeling en van L∗ dat

〈w∗, L(v)〉W = w∗(L(v)) = (w∗ L)(v) = L∗(w∗)(v) = 〈L∗(w∗), v〉V . (2.50)

Dit bewijst de bewering.

De matrix van L∗ blijkt eenvoudigweg de getransponeerde te zijn van die van L, indien weV ∗ en W ∗ voorzien van de duale bases van die van V en W .

Page 67: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 67

Stelling 2.1.56 Laat βV = 〈v1, . . . , vn〉 een basis zijn van V en βW = 〈w1, . . . , wk〉 een basisvoor W . Laat L∗ ∈ homK(W ∗, V ∗) de duale zijn van L ∈ homK(V,W ). Dan is

(L∗)β∗Vβ∗W

= (LβWβV )>, (2.51)

waarbij β∗V en β∗W de duale bases van βV en βW zijn.

Bewijs. Per definitie van de beide matrices geldt

coβ∗V

(L∗(w∗)) = (L∗)β∗Vβ∗Wcoβ∗

W(w∗) (2.52)

voor alle w∗ ∈W ∗, en tevens dat voor alle v ∈ V ,

coβW (L(v)) = LβWβV coβV (v). (2.53)

Laat nu i ∈ 1, . . . , k en j ∈ 1, . . . , n gegeven zijn. Dan geldt dat

e>i (L∗)β∗Vβ∗Wej = e>i (L∗)

β∗Vβ∗Wcoβ∗

W(wj) = e>i coβ∗

V(L∗(wj)) = 〈L∗(wj), vi〉V ,

waar de tweede gelijkheid (2.52) gebruikt en de derde gelijkheid Lemma 2.1.22. Idem vindenwe

e>j LβWβVei = e>j L

βWβVcoβV (vi) = e>j coβW (L(vi)) = 〈wj , L(vi)〉W ,

waarbij de tweede gelijkheid (2.53) gebruikt en de derde Opmerking 2.1.20. Omdat wegensStelling 2.1.56 geldt dat 〈wj , L(vi)〉W = 〈L∗(wj), vi〉V vinden we dat

e>i (L∗)β∗Vβ∗Wej = e>j L

βWβVei. (2.54)

Dit bewijst de bewering.

2.1.6 De annihilator

Het begrip annihilator in de duale vectorruimte is gerelateerd aan het begrip orthogonaalcomplement in een inproductruimte.

Definitie 2.1.57 (Annihilator) Zij (V,K) een vectorruimte en S ⊂ V . Dan heet de verza-meling

S = v∗ ∈ V ∗ | v∗(s) = 0 voor alle s ∈ S (2.55)

de annihilator van S in V ∗.

In het bijzonder geldt dus dat v∗ ∈ S als en alleen als S ⊂ ker(v∗).

Opmerking 2.1.58 Als v∗ nul is op S, is v∗ ook nul op de deelruimte van V opgespannendoor de elementen van S. In het bijzonder is S dus een lineaire deelruimte van V ∗, ook alsS geen deelruimte is. Tot slot is eenvoudig in te zien dat V = 0 en 0 = V ∗.

Annihilatoren worden uiteraard kleiner naarmate de te annihileren verzameling groter wordt.

Lemma 2.1.59 Laat (V,K) een vectorruimte zijn met duale V ∗. Dan geldt

S ⊂ T ⊂ V ⇒ T ⊂ S ⊂ V ∗. (2.56)

Page 68: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

68 HOOFDSTUK 2. DUALITEIT

Bewijs. Als v∗(t) = 0 voor alle t ∈ T dan is v∗(s) = 0 voor alle s ∈ S.

De omgekeerde implicatie in (2.56) is niet geldig.

De Canadese band Annihilator (1984)

Voorbeeld 2.1.60 Beschouw de deelverzameling e1 ⊂ R3. Ieder element van (R3)∗ is teschrijven als `y : R3 → R : x 7→ y>x, en `y(e1) = 0 als en alleen als e>1 y = 0. Dus,

e1 = `y : R3 → R : x 7→ y>x | e>1 y = 0. (2.57)

Merk op dat e1 ook gelijk is aan het opspansel van e2 en e3, waarbij ε∗ = 〈e1, e2, e3〉 deduale basis is van de standaardbasis ε = 〈e1, e2, e3〉.

Het voorgaande voorbeeld illustreert het aangekondigde verband tussen orthogonale comple-menten en annihilatoren. Dit verband wordt expliciet gemaakt middels het Riesz-isomorfisme.

Stelling 2.1.61 Zij (V,R, (·, ·)) een inproductruimte en S ⊂ V . Dan geldt

span(S)⊥ = J −1(S), (2.58)

waarbij J : V → V ∗ het Riesz-isomorfisme is.

Bewijs. Laat v∗ ∈ S. Dan is v∗(s) = 0 voor alle s ∈ S. Per definitie van Riesz-representantis J −1(v∗) de vector uit V waarvoor geldt dat

(J −1(v∗), v) = v∗(v) voor alle v ∈ V , (2.59)

en dus staat J −1(v∗) loodrecht op alle s ∈ S en daarmee ook loodrecht op alle lineairecombinaties van vectoren uit S. Dus J −1(v∗) ∈ span(S)⊥. Omgekeerd, laat w ∈ span(S)⊥,dan geldt in het bijzonder dat (w, s) = 0 voor alle s ∈ S, en dus is

J (w) : V → R : v 7→ (w, v) (2.60)

een element is van S. Dit bewijst de bewering.

2.1.7 Quotientruimtes

Laat V een vectorruimte zijn met lineaire deelruimte W . Dan kunnen we de volgende equi-valentierelatie definieren op V ,

x ∼ y ⇔ x− y ∈W. (2.61)

Page 69: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.1. DE DUALE VECTORRUIMTE 69

Deze relatie verdeelt V in equivalentieklassen die we aanduiden met [x], waarbij

[x] = x+ w | w ∈W. (2.62)

De quotientverzameling V/W is de verzameling van equivalentieklassen,

V/W = [x] | x ∈ V . (2.63)

Als we deze verzameling voorzien van de volgende optelling en scalaire vermenigvuldiging, inde zin dat voor alle [x], [y] ∈ V/W en alle α ∈ K,

[x] + [y] = [x+ y] en α[x] = [αx], (2.64)

dan is V/W zelfs een vectorruimte, de quotientruimte van V en W genaamd.

Voorbeeld 2.1.62 Beschouw R2 met als deelruimte het opspansel van w ∈ R2 met w 6= 0.Dan bestaat R2/W uit de verzameling van lijnen parallel aan W , oftewel,

R2/W = x+ αw | α ∈ R | x ∈ R2. (2.65)

Het nul-element uit R2/W is [0]. Immers, [x] + [0] = [x + 0] = [x]. Merk op dat [w] en[0] hetzelfde element zijn in R2/W . Ter illustratie gaan we nu aantonen dat als [v] 6= [0],de verzameling 〈[v]〉 een basis is voor R2/W . Omdat [v] 6= [0] geldt sowieso dat 〈[v]〉 lineaironafhankelijk is in R2/W . We hoeven dus alleen nog maar aan te tonen dat het opspanselvan 〈[v]〉 gelijk is aan R2/W . Laat hiertoe [x] ∈ R2/W willekeurig zijn. Dan vinden we

α[v] = [x] ⇔ [αv] = [x] ⇔ αv − x ∈W ⇔ αv + βw = x (2.66)

voor zekere β ∈ R. Omdat [v] 6= [w] = [0] zijn v en w lineair onafhankelijk in R2, en dus ishet bestaat van α en β waarvoor αv + βw = x voor iedere x ∈ R2 gegarandeerd. Dus is ereen α ∈ R zodanig dat α[v] = [x] en dus wordt R2/W opgespannen door 〈[v]〉.

We laten tot slot een verband zien tussen de duale van de quotientruimte V/W van eenvectorruimte V en een deelruimte W , en de eerder ten tonele gevoerde annihilator.

Stelling 2.1.63 Laat W een deelruimte zijn van een eindig dimensionale vectorruimte V .Dan geldt dat

(V/W )∗ ∼= W ⊂ V ∗.

Bewijs. Een lineaire functionaal v∗ op V induceert een goed gedefinieerde lineaire functio-naal v∗ op V/W

v∗ : V/W → K : [v] 7→ v∗(v) (2.67)

als en alleen als v∗ constant is op de equivalentieklassen van V . Dit is zo als en alleen alsv∗(x) = v∗(x) + v∗(w) voor alle x ∈ V en alle w ∈ W , en dus als en alleen als W ⊂ ker(v∗),oftewel v∗ ∈W . Hiermee is bewezen dat de afbeelding

W → (V/W )∗ : v∗ 7→ v∗

met v∗ als in (2.67), een bijectie is. De lineariteit van deze bijectie volgt eenvoudig.

Page 70: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

70 HOOFDSTUK 2. DUALITEIT

2.2 Opgaven

Opgave 2.1

Geef voor ieder van de volgende vectorruimtes twee voorbeelden van elementen uit de duale,

(a) (R,R)

(b) (C,C)

(c) (C,R)

(d) (R3×2,R)

(e) (RN,R)

(f) (R[X]≤3,R)

(g) (R∗,R)

(h) ((RR)∗,R).

Opgave 2.2

(a) Geef de duale basis β∗ horende bij de basis β = 2 van (C,C).

(b) Geef de duale basis β∗ horende bij de basis β = 1, i van (C,R).

Opgave 2.3

Gegeven is de basis β = v1, v2, v3 van R3 waarbij

v1 =

100

, v2 =

110

, v3 =

111

.Geef de volledige functievoorschriften van de elementen v1, v2, v3 van de duale basis β∗.

Opgave 2.4

Ga na dat de afbeelding L lineair is, waarbij

L : Kn → (Kn)∗ : y 7→ `y (2.68)

en waarbij `y : Kn → K : x 7→ y>x.

Opgave 2.5

Definieer de afbeelding

π : C(I)→ R[X]≤1 : f 7→ π(f) (2.69)

die aan f ∈ C(I) toevoegt het lineaire polynoom π(f) ∈ R[X]≤1 dat waarde f(a) aanneemtin a en f(b) in b. Het polynoom π(f) heet de lineaire interpolant van f .

(a) Bewijs dat π een goed gedefinieerde lineaire afbeelding is.

Page 71: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.2. OPGAVEN 71

(b) Ga na dat voor alle f ∈ C(I),

T ba(f) = Iba(π(f)), (2.70)

waarbij Iba en T ba zijn zoals gedefinieerd in een van de voorbeelden.

Opgave 2.6

Beschouw de vectorruimte (R[X]≤2,R) met basis β = φ0, φ1, φ2 waarbij

φ0 : R→ R : X 7→ 1, φ1 : R→ R : X 7→ X, φ2 : R→ R : X 7→ X2.

Laat voor gegeven x ∈ R de afbeelding εx gedefinieerd zijn door

εx : R[X]≤2 → R : f 7→ f(x).

(a) Laat zien dat εx ∈ (R[X]≤2)∗.

Laat β∗ = φ0, φ1, φ2 de bij β horende duale basis zijn van (R[X]≤2)∗, en

coβ∗ : (R[X]≤2)∗ → R3

de bij β∗ horende coordinaatafbeelding.

(b) Bereken coβ∗(εx).

Opgave 2.7

Beschouw de vectorruimte (R[X]≤2,R) met basis β = φ0, φ1, φ2 waarbij

φ0 : R→ R : X 7→ 1, φ1 : R→ R : X 7→ X, φ2 : R→ R : X 7→ X2.

Laat zoals voorheen de afbeelding T 10 gedefinieerd zijn als

T 10 : R[X]≤2 → R : f 7→ 1

2(f(0) + f(1)).

(a) Laat zien dat T 10 ∈ (R[X]≤2)∗.

Laat β∗ = φ0, φ1, φ2 de bij β horende duale basis zijn van (R[X]≤2)∗, en

coβ∗ : (R[X]≤2)∗ → R3

de bij β∗ horende coordinaatafbeelding.

(b) Bereken coβ∗(T 10 ).

Opgave 2.8

Beschouw op de vectorruimte (R2×2,R) de afbeelding

Sp : R2×2 → R : A 7→ Sp(A).

(a) Laat zien dat Sp ∈ (R2×2)∗.

Page 72: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

72 HOOFDSTUK 2. DUALITEIT

Schrijf 〈·, ·〉 voor de duale koppeling tussen R2×2 en (R2×2)∗.

(b) Bereken 〈Sp, I〉.

Laat nu ε = E1, E2, E3, E4 de standaardbasis van R2×2 zijn, dus

E1 =

[1 00 0

], E2 =

[0 01 0

], E3 =

[0 10 0

], E4 =

[0 00 1

].

Laat ε∗ = E1, E2, E3, E4 de duale basis zijn van ε voor de duale ruimte (R2×2)∗, en

coε∗ : R2×2 → R4

de bijbehorende coordinaatafbeelding.

(c) Bereken coε∗(Sp).

Opgave 2.9. De duale basis β∗∗ van de duale basis β∗

Gegeven is een vectorruimte (V,K) met basis β = v1, . . . , vn. Laat β∗ = v1, . . . , vn de bijβ horende duale basis van V ∗ zijn. Schrijf

H : V → V ∗∗ : v 7→ H(v), waarbij H(v) : V ∗ → K : v∗ 7→ 〈v∗, v〉

voor het natuurlijke isomorfisme tussen V en V ∗∗.

Bewijs dat β∗∗ = H(v1), . . . ,H(vn) de duale basis van β∗ voor V ∗∗ is.

Opgave 2.10

Beschouw de inproductruimte (R3,R, (·, ·)) voorzien van het standaardinproduct. Gegeven isde basis β = v1, v2, v3 van R3, waarbij

v1 =

100

, v2 =

110

en v3 =

111

.Schrijf β∗ = v1, v2, v3 voor de bijbehorende duale basis van (R3)∗, en laat J : R3 → (R3)∗

het Riesz-isomorfisme zijn.

(a) Bereken de Riesz-representanten van v1, v2 en v3 in R3.

Laat vervolgens H : R3 → (R3)∗∗ het natuurlijke isomorfisme zijn.

(b) Bereken H(v1 + v2 + v3)(v1 + v2 + v3).

Opgave 2.11

Beschouw de inproductruimte (R[X]≤n,R, (·, ·)) waarbij

(q, r) =

∫ 1

−1q(X)r(X)dX.

Page 73: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.2. OPGAVEN 73

Definieer voor iedere gehele niet-negatieve n de afbeelding

εn0 : R[X]≤n → R : q 7→ q(0).

(a) Bepaal de Riesz-representant van ε00 in R[X]≤0.

(b) Bepaal de Riesz-representant van ε10 in R[X]≤1.

(c) Bepaal de Riesz-representant van ε20 in R[X]≤2.

Opgave 2.12

Beschouw de inproductruimte (R[X]≤n,R, (·, ·)) waarbij

(q, r) =

∫ 1

−1q(X)r(X)dX.

Definieer voor iedere gehele niet-negatieve n de afbeelding

δn0 : R[X]≤n → R : q 7→ q′(0).

(a) Bepaal de Riesz-representant van δ00 in R[X]≤0.

(b) Bepaal de Riesz-representant van δ10 in R[X]≤1.

(c) Bepaal de Riesz-representant van δ20 in R[X]≤2.

Opgave 2.13

Bn = 0, 1n bestaat uit de vectoren in Rn met entries uit 0, 1. We schrijven e ∈ Bn voorde som van de standaardbasisvectoren e1, . . . , en van Rn. Voor gegeven r ∈ Bn is r = e−r, endus is e = 0, 0 = e en r = r. De entries van r, r ∈ Bn noteren we met r1, . . . , rn en r1, . . . , rn.

Voor iedere vast gekozen r ∈ Bn, definieer een lineaire functionaal `r ∈ (Rn×n)∗

door

`r : Rn×n → R : X 7→ r>Xr.

Laat βn de standaardbasis van Rn×n zijn, oftewel,

βn = Xij ∈ Rn×n | Xij = eie>j .

Dus Xij = eie>j heeft als gebruikelijk een 1 op positie (i, j) en nullen op de overige posities.

Schrijf β∗n = X11, . . . , Xnn voor de bijbehorende duale basis voor (Rn×n)∗.

Voor iedere r ∈ Bn bestaan er dan a11, . . . , ann ∈ R zodanig dat

`r = a11X11 + · · ·+ annX

nn.

(a) Laat zien dat aij = rirj voor alle i, j ∈ 1, . . . , n.

Schrijf vervolgensJ : Rn×n →

(Rn×n

)∗voor het Riesz-isomorfisme behorende bij het inproduct (X,Y ) = Sp(X>Y ).

(b) Bewijs datJ (rr>) = `r,

oftewel, dat de matrix R = rr> de Riesz-representant van `r in Rn×n is.

Page 74: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

74 HOOFDSTUK 2. DUALITEIT

Opgave 2.14

Laat L ∈ homK(V,W ), en laat L∗ : W ∗ → V ∗ : w∗ 7→ w∗ L de duale afbeelding zijn.

(a) Bewijs dat L∗(w∗) een lineaire afbeelding is.

(b) Bewijs dat L∗ een lineaire afbeelding is.

(c) Bewijs dat L injectief is als en alleen als L∗ surjectief is.

(d) Bewijs dat L∗ bijectief is als en alleen als L bijectief is.

Opgave 2.15

Gegeven drie vectorruimtes U, V,W over K, laat A ∈ homK(U, V ) en B ∈ homK(V,W ).

Bewijs dat (BA)∗ = A∗B∗.

Opgave 2.16

Laat V en W eindigdimensionale vectorruimten over een lichaam K zijn. Bewijs dat detoevoeging

∗ : homK(V,W )→ homK(W ∗, V ∗) : L 7→ L∗

een lineaire bijectie is.

Opgave 2.17

Gegeven de lineaire afbeelding

L : R3×3 → R3×3 : X 7→ X +X>

2.

(a) Bepaal de pull-back van Sp ∈ (R3×3)∗ onder L.

Schrijf S voor de deelverzameling van elementen uit (R3×3)∗ die door de pull-back onder Lop zichzelf worden afgebeeld.

(b) Bewijs dat S een deelruimte is en geef een basis voor S.

Opgave 2.18

Schrijf H : R2×2 →(R2×2

)∗∗: Y 7→ H(Y ) voor het natuurlijke isomorfisme.

(a) Geef het domein, codomein, en (functie-)voorschrift van H(Y ), voor gegeven Y ∈ R2×2.

Beschouw nu de afbeelding

T : R2×2 → R : X 7→ [1 1]X

[11

].

Schrijf 〈·, ·〉1 voor de duale koppeling tussen R2×2 en (R2×2)∗ en 〈·, ·〉2 voor de duale koppelingtussen (R2×2)∗ en (R2×2)∗∗. Kies vanaf nu expliciet

Y =

[1 11 1

].

Page 75: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

2.2. OPGAVEN 75

Geef in de komende onderdelen voldoende motivatie voor je antwoorden.

(b) Bereken 〈H(Y ), T 〉2.

Definieer L : R2×2 → R2×2 : X 7→ Y X en schrijf L∗ voor zijn duale afbeelding.

(c) Bepaal de pull-back van T onder L en bereken vervolgens 〈L∗(T ), Y 〉1.

Opgave 2.19

Zij (V,K) een vectorruimte met dim(V ) = n ∈ N en L ∈ homK(V, V ). Laat L∗ : V ∗ → V ∗ deduale afbeelding zijn van L, en L∗∗ = (L∗)∗ : V ∗∗ → V ∗∗ de duale afbeelding van L∗.

Bewijs dat L∗∗H = HL, oftewel, dat voor alle v ∈ V geldt dat

L∗∗(H(v)) = H(L(v))

waarbij H : V → V ∗∗ het natuurlijke isomorfisme is.

Page 76: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

76 HOOFDSTUK 2. DUALITEIT

Page 77: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

Hoofdstuk 3

Niet-negatieve lineaire algebra

Het deelgebied van de niet-negatieve lineaire algebra houdt zich bezig met matrices en vectorenwaarvan alle entries niet-negatieve (of zelfs positieve) reele getallen zijn. Zulke matrices komenbijvoorbeeld af van een lineaire transformatie L : Rn → Rn die de eigenschap heeft dat hetniet-negatieve orthant Rn≥0 = [0,∞)n ⊂ Rn op zichzelf wordt afgebeeld. Ten opzichte vande standaardbasis ε van Rn is de matrix Lεε van L dan niet-negatief. Echter, ook binnende stochastiek komen niet-negatieve matrices en vectoren nogal eens voor. Hiervan liggenalle entries vaak zelfs in het interval [0, 1] en stellen in die context waarschijnlijkheden voor.We bestuderen daarom de dubbelstochastische matrices en definieren tevens de permanentvan een matrix, een functie die op het eerste gezicht erg lijkt op de determinant, en dieook in de niet-negatieve combinatorische context een belangrijke rol speelt. Binnen diezelfdecombinatoriek en in het bijzonder de grafentheorie komen zelfs geregeld 0/1-matrices voor,oftewel matrices waarvan alle entries uit de verzameling 0, 1 komen.

3.1 Perron-Frobeniustheorie

Positieve en niet-negatieve matrices komen veel voor binnen de stochastiek, combinatoriek,en binnen het wiskundig modelleren van allerlei natuurwetenschappelijke fenomenen: tempe-ratuur, dichtheid, en concentratie zijn immers allemaal niet-negatief.

Definitie 3.1.1 (Positieve/niet-negatieve matrix) Laat (aij) = A ∈ Rn×k. Als aij > 0voor alle i, j ∈ 1, . . . , n schrijven we A > 0 en heet A een positieve matrix. Als aij ≥ 0 vooralle i, j ∈ 1, . . . , n schrijven we A ≥ 0 en heet A een niet-negatieve matrix.

Opmerking 3.1.2 Overeenkomstig schrijven we A > B als A−B > 0 en A ≥ B als A−B ≥0, en bedoelen we met A < B dat B > A, met A ≤ B dat B ≥ A, enzovoorts. Tot slotschrijven we |A| voor de matrix waarvan de entries de absolute waarden zijn van die van A.

Een waarschuwing is hier op zijn plaats. Als x ∈ R en x ≥ 0 en x 6= 0 dan is x > 0. Echter,als A ∈ Rn×k met nk > 1 en A ≥ 0 en A 6= 0, impliceert dit niet dat A positief is: ziebijvoorbeeld de 1× 2 matrix A = [1 0]. Deze is niet positief, maar ook niet de nul-matrix.

Zonder bewijs vermelden we de volgende elementaire eigenschappen.

Lemma 3.1.3 (E1) Als A > 0 en x ≥ 0, x 6= 0, dan is Ax > 0;

77

Page 78: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

78 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

(E2) Als A > 0 en x > y dan is Ax > Ay;

(E3) Als A ≥ 0 en x ≥ y dan is Ax ≥ Ay;

(E4) Voor alle A ∈ Rn×k en x ∈ Rk geldt dat |Ax| ≤ |A||x|;

(E5) Voor alle matrices A en B waarvoor AB bestaat geldt dat |AB| ≤ |A||B|.

Deze en dergelijke eigenschappen zullen we in het vervolg vrijelijk toepassen indien nodig.

3.1.1 De Neumannrij en de Neumannreeks

Als r ∈ R en |r| < 1 dan is limk→∞ rk+1 = 0, en convergeert tevens de meetkundige reeks

∞∑j=0

rk =1

1− r, want 1 + r + r2 + · · ·+ rk =

1− rk+1

1− r. (3.1)

Een vooral theoretisch zeer nuttig overeenkomstig resultaat voor matrices werd bewezen doorde Duitse wiskundige Carl Neumann.

Carl Neumann (1832-1925)

Eerst een definitie, die de voorwaarde |r| < 1 voor convergentie helpt te generaliseren.

Definitie 3.1.4 (Spectraalstraal) Laat A ∈ Cn×n. De spectraalstraal van A is het reele,niet-negatieve getal

ρ(A) = max|λ| | λ ∈ σ(A)

waarbij σ(A) de verzameling van eigenwaarden van A is, het spectrum van A. De verzamelingz ∈ C | |z| ≤ ρ(A) heet de spectrale schijf, met als rand de spectrale cirkel.

Dus ρ(A) is de straal van de kleinste gesloten schijf rond 0 ∈ C waarop alle eigenwaarden vanA liggen, de spectrale schijf.

Cρ(A)

ρ(A)0

∗∗

∗∗ is een eigenwaarde

Figuur 3.1 Het spectrum, de spectrale cirkel, de spectrale schijf, en de spectraalstraal.

Page 79: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.1. PERRON-FROBENIUSTHEORIE 79

Opmerking 3.1.5 De spectraalstraal ρ(A) is niet altijd een eigenwaarde. Zie A = [−1].

De met (3.1) corresponderende uitspraken verdelen we over een lemma en twee stellingen.

Lemma 3.1.6 Laat λ ∈ C met |λ| < 1 en laat ` ∈ N. Dan geldt dat

limk→∞

(k

`

)λk−` = 0. (3.2)

Bewijs. Dit volgt uit de begrenzing van de binomiaalcoefficient middels(k

`

)=

k!

`!(k − `)!=k(k − 1) . . . (k − `+ 1)

`!≤ k`

`!,

en de eventueel herhaalde toepassing van de regel van de l’Hopital op f(x) = x`λx.

Stelling 3.1.7 (Neumannrij) Laat A ∈ Cn×n en veronderstel ρ(A) < 1, dan geldt dat delimiet voor k →∞ van de Neumannrij (Ak)k≥0 gelijk is aan de nulmatrix,

limk→∞

Ak = 0.

Bewijs. In Stelling 1.3.25 bewezen we dat er voor alle A ∈ Cn×n een X ∈ GLn(C) bestaatzo, dat

X−1AX =

T1 0 . . . 0

0 T2. . .

......

. . .. . . 0

0 . . . 0 Tp

(3.3)

waarbij Tj = λjI +Mj met Mj ∈ Cmj×mj strict bovendriehoeks en dus nilpotent. Hierbij ismj de meetkundige multipliciteit van de eigenwaarde λj van A. Nu volgt eenvoudig dat

Ak = X

T k1 0 . . . 0

0 T k2

. . ....

.... . .

. . . 00 . . . 0 T k

p

X−1.

Gebruik makend van het feit dat de beide matrices λjI en Mj commuteren, vinden we metbehulp van het binomium van Newton dat voor alle k ∈ N,

T kj = (λjI +Mj)k =

k∑`=0

(k

`

)λk−`j M `

j =

mj∑`=1

(k

`

)λk−`j M `

j .

waarbij de laatste gelijkheid geldt omdat Mj nilpotent is met index ten hoogste mj . Omdat|λj | < 1 wegens de aanname dat ρ(A) < 1 volgt met Lemma 3.1.6 dat de limiet voor k naaroneindig van T kj gelijk is aan de nulmatrix, en dus ook die van Ak.

Opmerking 3.1.8 De voorwaarde ρ(A) < 1 is noodzakelijk voor de convergentie van deNeumannrij naar nul, maar niet noodzakelijk voor convergentie. Zie bijvoorbeeld A = I. InSectie 3.1.3 laten we zien dat limk→∞A

k ook bestaat als A > 0 en ρ(A) = 1.

Page 80: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

80 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

Stelling 3.1.9 (Neumannreeks) Laat A ∈ Cn×n en veronderstel dat ρ(A) < 1, dan geldtdat

∞∑j=0

Ak = (I −A)−1. (3.4)

Bewijs. Voor iedere gehele k ≥ 0 geldt dat

(I +A+A2 + · · ·+Ak)(I −A) = I −Ak+1.

De limiet voor k →∞ van het rechterlid bestaat volgens Lemma 3.1.7 en dus vinden we dat

∞∑j=0

Ak(I −A) = I.

Omdat I −A vierkant is, is de som links van de matrix I −A kennelijk zijn inverse. .

Dus als N nilpotent is, is I −N inverteerbaar met als inverse een polynoom in N .

Opmerking 3.1.10 De voorwaarde ρ(A) < 1 is noodzakelijk voor de convergentie van deNeumannreeks in Stelling 3.1.9, omdat in een convergente som de individuele termen naarnul convergeren. De voorwaarde is echter niet nodig voor de inverteerbaarheid van I−A. Zie

A =

[3 11 3

]met σ(A) = 2, 4, I −A = −

[2 11 2

]en merk op dat I −A inverteerbaar is wegens det(I −A) = 3 ondanks dat ρ(A) = 4.

3.1.2 Perron-Frobeniustheorie voor positieve matrices

Oskar Perron en Georg Frobenius bewezen resultaten voor eigenwaarden en eigenvectoren vanniet-negatieve matrices.

Oskar Perron (1880-1975) en Georg Ferdinand Frobenius (1849-1917)

De bewijzen zijn het eenvoudigst voor positieve matrices.

Lemma 3.1.11 Laat A ∈ Rn×n. Als A > 0 dan is zijn spectraalstraal ρ(A) > 0.

Bewijs. Stel dat ρ(A) = 0. Dit betekent dat alle eigenwaarden van A gelijk zijn aan nul.Maar dan is A nilpotent en bestaat er dus een p met Ap = 0. Echter, als A > 0 dan isduidelijk ook Ak > 0 voor alle k. Deze tegenspraak bewijst de bewering.

Het volgende lemma is sterker dan het lijkt: uit de aanname dat A > 0 een niet-negatieveeigenvector x heeft, volgt dat x zelfs positief is, met positieve bijbehorende eigenwaarde.

Page 81: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.1. PERRON-FROBENIUSTHEORIE 81

Lemma 3.1.12 Laat A ∈ Rn×n, A > 0. Als Ax = λx voor zekere x ≥ 0, x 6= 0, dan volgt datx > 0 en tevens dat λ > 0.

Bewijs. Omdat 0 6= x ≥ 0 geeft (E1) uit Lemma 3.1.3 dat Ax > 0. Omdat Ax = λx geldtdus dat λx > 0. Omdat Rn 3 x ≥ 0 volgt dat R 3 λ > 0 en dus, tot slot, dat x > 0.

Ondanks dat de spectraalstraal van een matrix doorgaans geen eigenwaarde is, is dit wel hetgeval indien A > 0, en bestaat er een positieve eigenvector horende bij ρ(A).

Stelling 3.1.13 Laat A ∈ Rn×n. Als A > 0 dan bestaat er een x > 0 zodanig dat

Ax = ρ(A)x. (3.5)

waarbij ρ(A) de spectraalstraal is van A.

Bewijs. Veronderstel op grond van Lemma 3.1.11 zonder verlies van algemeenheid dat ρ(A) =1. Dit impliceert dat er een λ ∈ σ(A) bestaat met |λ| = 1 en een y 6= 0 waarvoor Ay = λy.Voor deze λ en y geldt dat

|y| = |λ||y| = |λy| = |Ay| ≤ |A||y| = A|y|,

waarbij we gebruik maken van eigenschap (E4) uit Lemma 3.1.3. We concluderen dat

w = A|y| − |y| ≥ 0. (3.6)

We gaan bewijzen dat zelfs w = 0 door een tegenspraak af te leiden uit de veronderstellingdat w 6= 0. Omdat A > 0 volgt met (E1) uit Lemma 3.1.3 dat zowel Aw > 0 als dat A|y| > 0.Dit verklaart beide ongelijkheden in

AA|y| > A|y| > 0. (3.7)

Kennelijk is iedere entry van AA|y| groter dan de overeenkomstige entry van A|y|. Dus bestaater een ε > 0 met

1

1 + εAA|y| > A|y| > 0. (3.8)

Schrijf nu

B =A

1 + εen z = A|y|.

Met deze notatie verandert (3.8) in Bz > z > 0. Maar dan is met (E2) uit Lemma 3.1.3 ookB2z = B(Bz) > Bz want B > 0, en met inductie zien we dat Bkz > z > 0 voor alle k ∈ N.Echter

ρ(B) =ρ(A)

1 + ε=

1

1 + ε< 1,

dus geeft Stelling 3.1.7 dat Bk → 0 voor k → ∞. Dit is in tegenspraak met Bkz > z > 0voor alle k. Dus w = 0, oftewel, A|y| = |y|. Maar dan is x = |y| 6= 0 een eigenvector van Abehorende bij een eigenwaarde λ = 1 van A, en uit Lemma 3.1.12 volgt tot slot dat x > 0.

Opmerking 3.1.14 Het feit dat Bk → 0 is niet in tegenspraak met Bkz > 0 voor alle k.Het is dus noodzakelijk om de ongelijkheid Bkz > z > 0 te bewijzen in plaats van slechtsBkz > 0. Dit verklaart de ogenschijnlijke grote hoeveelheid werk in bovenstaand bewijs.

Page 82: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

82 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

De eigenruimte van de eigenwaarde ρ(A) van A bevat dus een positieve vector x > 0. Welaten zien dat alle andere eigenvectoren behorende bij ρ(A) hier veelvouden van zijn.

Stelling 3.1.15 Laat A ∈ Rn×n en veronderstel dat A > 0. Dan is dim ker(A− ρ(A)I) = 1.

Bewijs. Veronderstel wegens Lemma 3.1.11 zonder verlies van algemeenheid dat ρ(A) = 1.Uit Stelling 3.1.13 volgt dat er een x > 0 bestaat met Ax = x. Laat nu y 6= 0 met Ay = y.We tonen aan dat y een veelvoud is van x. Merk hiertoe op dat er een α ∈ R bestaat zodanigdat z = y + αx ≥ 0, terwijl z ook ten minste een entry gelijk aan nul heeft. Als nu z 6= 0volgt uit Az = z en Lemma 3.1.12 dat z > 0, wat in tegenspraak is met het feit dat z tenminste een entry gelijk aan nul heeft. Dus z = 0 en dus is y = −αx een veelvoud van x.

Definitie 3.1.16 (Perronvector) Laat A ∈ Rn×n met A > 0. De unieke x > 0 waarvoor

Ax = ρ(A)x en e>x = 1, waarbij e = e1 + · · ·+ en

de all-ones vector is, heet de Perronvector van A.

Opmerking 3.1.17 Een van de bekendste en recent in de belangstelling staande Perronvec-toren is de Google PageRank vector van Larry Page en Sergey Brin.

Ter afronding van de Perron-Frobeniustheorie voor positieve matrices tot slot het volgende.

Stelling 3.1.18 De enige eigenwaarde van 0 < A ∈ Rn×n met absolute waarde ρ(A) is ρ(A).

Bewijs. Volgens Stelling 3.1.13 is ρ(A) ∈ σ(A). Resteert de uniciteit aan te tonen.Veronderstel op grond van Lemma 3.1.11 zonder verlies van algemeenheid dat ρ(A) = 1. Laatλ ∈ σ(A) met |λ| = 1. Dan bestaat er dus een y 6= 0 met Ay = λy. Hiervoor geldt net als in hetbewijs van Steling 3.1.13 dat A|y| = |y| > 0. Per definitie van matrix-vectorvermenigvuldigingimpliceren de respectievelijke gelijkheden A|y| = |y| en Ay = λy, dat voor alle k ∈ 1, . . . , n,

|yk| =n∑j=1

akj |yj | en λyk =n∑j=1

akjyj (3.9)

en dus,n∑j=1

akj |yj | = |yk| = |λyk| =

∣∣∣∣∣∣n∑j=1

akjyj

∣∣∣∣∣∣ . (3.10)

Nu geldt dat de absolute waarde |z1 + · · · + zn| van de som van n complexe getallen alleengelijk is aan de som |z1|+· · ·+|zn| van de absolute waarden als ze allemaal hetzelfde argumenthebben, zoals geıllustreerd in Figuur 3.2.

C0 ∗ ∗

∗∗∗ |z1|+ · · ·+ |zn| = |z1 + · · ·+ zn|

φ = arg(z1) = · · · = arg(zn)φ

Figuur 3.2 Driehoeksgelijkheid in C alleen bij gelijke argumenten.

Dus concluderen we uit (3.10) en het feit dat |y| > 0 dat yk = αky1 voor zekere αk > 0 vooralle k ∈ 1, . . . , n. Dus is y een (eventueel complex) veelvoud y1α van een positieve vectorα. Maar dan is ook α een eigenvector van A behorende bij eigenwaarde λ. En omdat Aαreeel is, gelijk is aan λα, en in het bijzonder positief, is λ ook positief en reeel. Hieruit volgtdat λ = 1, en dus is λ = 1 de enige eigenwaarde van A op de spectrale cirkel.

Page 83: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.1. PERRON-FROBENIUSTHEORIE 83

3.1.3 Von Mises-iteratie

De Von Mises-iteratie, ook wel machtsmethode genoemd, is een methode, al veel eerder ge-bruikt door Jacobi, om een eigenvector te berekenen horend bij de unieke eigenwaarde van Adie het grootst is in absolute waarde, en waarvan de eigenruimte dimensie een heeft.

Richard von Mises (1883-1953) en Carl Jacobi (1804-1851)

We bewijzen nu dat de Neumannrij (Ak)k∈N convergeert als ρ(A) = 1 en A > 0. Het bewijsmaakt gebruik van de Neumann rij- en reeks uit Sectie 3.1.1 en van de Schurdecompositie uitSectie 1.2.6 en illustreert als zodanig de onderlinge samenhang van diverse gereedschappen.

Stelling 3.1.19 Laat A ∈ Rn×n met A > 0. Veronderstel dat ρ(A) = 1. Dan geldt dat

limk→∞

Ak = uw> (3.11)

waarbij Au = u > 0 met ‖u‖ = 1 en A>w = w met w > 0.

Bewijs. Omdat A > 0 is volgens Stelling 3.1.13 ρ(A) = 1 een eigenwaarde van A, en bestaater een unieke positieve eigenvector u > 0 met ‖u‖ = 1 zo, dat Au = u. Dus bestaat er (zieSectie 1.2.6) een Schurdecompositie van A van de vorm

A = UTU∗ waarbij T =

[1 b0 R

], met U∗U = I en Ue1 = u.

De eigenwaarden van de bovendriehoeksmatrix R zijn de eigenwaarden van A ongelijk aan1. Op grond van Stelling 3.1.18 zijn deze allemaal kleiner dan 1 in absolute waarde. Dusρ(R) < 1. We berekenen nu machten van A,

Ak =

(U

[1 b0 R

]U∗)k

= U

[1 b0 R

]kU∗.

Met volledige inductie kan eenvoudig worden aangetoond dat[1 b0 R

]k=

[1 b(I +R+ · · ·+Rk−1)0 Rk

]. (3.12)

Omdat ρ(R) < 1 volgt met behulp van Lemma 3.1.7 en Stelling 3.1.9 dat

limk→∞

Ak = U

[1 b(I −R)−1

0 0

]U∗ = Ue1v

>U∗ waarbij v> = [1, b(I −R)−1]

Page 84: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

84 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

en dus vinden we dat

limk→∞

Ak = uw> waarbij u = Ue1 en w> = v>U∗.

Daarnaast geldt kennelijk dat limk→∞(A>)k = wu> en dus is w > 0 een eigenvector bijλ = 1 = ρ(A>) van A>. .

Gevolg 3.1.20 Als x ∈ Rn zodanig is dat w>x = α 6= 0, dat

limk→∞

Akx = u(w>x) = αu.

Dus, de rij (Akx)k≥0 convergeert naar een niet-triviaal veelvoud van de eigenvector bij λ = 1.

Opmerking 3.1.21 Matrixvermenigvuldiging is associatief: (Ak)x = Ak−1(Ax). Het is ech-ter veel rekenwerk om A tot de k-de macht te verheffen en Ak te vermenigvuldigen met x. Ef-ficienter is x1 = Ax uit te rekenen, dan x2 = Ax1, tot en met xk = Axk−1 = Akx. Het laatstevergt k matrix-vectorvermenigvuldigingen, het eerste k matrix-matrixvermenigvuldigingen.Het uiteindelijke resultaat is natuurlijk hetzelfde: xk = Akx.

Opmerking 3.1.22 De Google Pagerankvector wordt in de praktijk niet precies uitgerekend,maar in drie decimalen nauwkeurig benaderd met xk = Axk−1 = Akx voor zekere k << n. Deiteratie xk = Axk−1 met gegeven x0 heet de Von Mises-iteratie, of ook wel de machtsmethode.

3.1.4 Een analytische aanpak van Perron-Frobeniustheorie

Perron-Frobeniusstellingen kunnen ook worden bewezen middels technieken uit de Analyse.

Definitie 3.1.23 (Convexe verzameling) Een verzameling C ⊂ Rn heet convex als vooriedere x, y ∈ C geldt dat tx+ (1− t)y ∈ C voor alle t ∈ [0, 1].

Een belangrijk Nederlands resultaat uit de Analyse zegt het volgende.

Stelling 3.1.24 (Dekpuntstelling van Brouwer) Laat D ⊂ Rn gesloten, begrensd, enconvex zijn, en f : D → D continu. Dan bestaat er een x ∈ D waarvoor f(x) = x.

Luitzen Brouwer (1881-1966)

Opmerking 3.1.25 Ingeval D = [a, b] een gesloten interval is, zegt de stelling niets andersdan dat de grafiek van f de lijn y = x snijdt, wat direct uit de Tussenwaardestelling volgt.

Page 85: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.1. PERRON-FROBENIUSTHEORIE 85

De dekpuntstelling aannemende kan Perron-Frobeniustheorie iets inzichtelijker en intuıtieverworden bewezen. Als voorbeeld hiervan (her-)bewijzen we het volgende resultaat.

Stelling 3.1.26 Laat A ∈ Rn×n. Als A > 0 dan heeft A een positieve eigenvector behorendebij een positieve eigenwaarde.

Bewijs. Associeer met de matrix A > 0 de lineaire afbeelding

LA : Rn≥0 → Rn≥0, x 7→ Ax

van het onbegrensde niet-negatieve orthant Rn≥0 naar zichzelf. Definieer

S = x ∈ Rn≥0 | e>x = 1.

Oftewel, S is het deel van het affiene hypervlak met vergelijking x1 + · · ·+xn = 1 dat in Rn≥0

ligt. In Figuur 3.3 is S de driehoek in R3 met als hoekpunten de drie standaardbasisvectoren.Merk op dat S gesloten, begrensd, en convex is. Bekijk nu de continue afbeelding

KA : S → S : x 7→ Ax

e>Ax=

LA(x)

e>LA(x).

Dan is KA continu als quotient van continue afbeeldingen.

R3≥0

010

100

001

S = x ∈ R3≥0 | e>x = 1

KA : S → S

x 7→ Ax

e>AxS

Figuur 3.3: Dekpuntstelling van Brouwer toegepast op het domein S.

Volgens Stelling 3.1.24 is er een x ∈ S is met KA(x) = x. Voor deze x geldt dus datAx = (e>Ax)x. Omdat x ∈ S geldt dat x ≥ 0 en x 6= 0. Omdat x ≥ 0 en x 6= 0 is Ax > 0.Omdat Ax = (e>Ax)x vinden we dus tot slot dat e>Ax > 0 en x > 0.

In plaats van alle Perron-Frobeniusstellingen opnieuw te bewijzen, richten we ons nu op devraag welke overeenkomstige resultaten gelden voor de klasse van niet-negatieve matrices.

3.1.5 Niet-negatieve matrices als limiet van positieve matrices

We bekijken nu de niet-negatieve matrices A ≥ 0 die niet positief zijn. Met andere woorden,we gaan uit van tenminste een entry gelijk aan nul. De volgende observatie is triviaal.

Page 86: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

86 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

Opmerking 3.1.27 Ieder niet-negatieve n×n matrix A ≥ 0 is de limiet van een rij positievematrices (Ak)k≥1. Een voorbeeld van zo’n rij is

Ak = A+1

kee> > 0,

waarbij e = e1 + · · ·+ en de all-ones vector is.

Sommige eigenschappen van positieve matrices blijken soms zelfs in de limiet niet meer op tegaan voor niet-negatieve matrices, zoals blijkt uit de volgende voorbeelden.

Voorbeeld 3.1.28 Laat

A =

0 1 00 0 00 0 0

. (3.13)

Dan is ρ(A) = 0, wat inderdaad een limietgeval is van Lemma 3.1.11. Tevens is ρ(A) ∈ σ(A),net zoals in Stelling 3.1.13. Echter A heeft in contrast met Stelling 3.1.18 heeft A twee lineaironafhankelijke niet-negatieve eigenvectoren horend bij ρ(A).

Voorbeeld 3.1.29 De matrix

A =

[0 11 0

]. (3.14)

heeft twee verschillende eigenwaarden −1 en 1 op de spectrale cirkel, wat wezenlijk anders isdan voor positieve matrices, zie Stelling 3.1.18. Omdat

A2k =

[1 00 1

]en A2k+1 =

[0 11 0

],

bestaat de limiet voor k → ∞ van Ak niet, in tegenstelling tot Stelling 3.1.19 voor positievematrices. De limiet van Akx bestaat alleen in het triviale geval x1 = x2.

Stelling 3.1.30 Laat A ∈ Rn×n, A ≥ 0. Dan bestaat er een 0 6= x ≥ 0 zo, dat Ax = ρ(A)x.

Bewijs. Laat Ak = A + 1kee> > 0 voor iedere k ∈ N. Schrijf ρk = ρ(Ak) en laat pk > 0 de

unieke Perronvector van Ak zijn, oftewel,

Akpk = ρkpk, e>pk = 1. (3.15)

Omdat eigenwaarden continu zijn als functies van de entries van de matrix, zijn ook continuefuncties van die eigenwaarden, zoals de spectraalstraal, continu. Dus geldt dat

limk→∞

ρk = limk→∞

ρ(Ak) = ρ( limk→∞

Ak) = ρ(A). (3.16)

De verzameling van bijbehorende Perronvectoren pk∞k=1 is bevat in [0, 1]n en dus begrensd.Volgens de stelling van Bolzano-Weierstrass heeft pk∞k=1 een convergente deelrij pk`∞`=1,waarvoor dus geldt

lim`→∞

pk` = p ≥ 0 en e>p = e> lim`→∞

pk` = lim`→∞

e>pk` = 1 (3.17)

waaruit volgt dat p 6= 0. Tot slot vinden we omdat beide afzonderlijke limieten bestaan dat

Ap = lim`→∞

Ak` lim`→∞

pk` = lim`→∞

Ak`pk` = lim`→∞

ρk`pk` = lim`→∞

ρk` lim`→∞

pk` = ρ(A)p. (3.18)

En dit bewijst de bewering.

Opmerking 3.1.31 Stelling 3.1.30 bewijst niet dat de eigenvector p ≥ 0 van A ≥ 0 de limietis van de rij (pk)k∈N van Perronvectoren van de matrices Ak, noch dat deze uniek is.

Page 87: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.1. PERRON-FROBENIUSTHEORIE 87

3.1.6 Reducibele en irreducibele niet-negatieve matrices

Om verdere resultaten te kunnen bewijzen over niet-negatieve matrices introduceren watenkele begrippen uit de grafentheorie binnen de lineaire algebra.

Definitie 3.1.32 (Verbindingsgraaf) Laat (aij) = A ∈ Rn×n. De gerichte graaf G(A) =(V,E) bestaande uit de punten (vertices) V = 1, . . . , n en de pijlen (edges) E ⊂ V ×V met(i, j) ∈ E als en alleen als aij 6= 0 heet de verbindingsgraaf van A.

Merk op dat deze definitie loops toestaat: pijlen van een punt naar zichzelf.

Grafen vormen een wiskundige structuur die voor het eerst werd bestudeerd door Euler.

Leonhard Euler (1707-1783)

Omgekeerd kunnen we met iedere gerichte graaf een matrix associeren.

Definitie 3.1.33 (Verbindingsmatrix) Zij G = (V,E) met V = 1, . . . , n een gerichtegraaf. De matrix (mij) = M(G) ∈ 0, 1n×n waarvoor mij = 1 als en alleen als er in G eenpijl van vertex i naar vertex j gaat heet de verbindingsmatrix van G. Dusmij = 1⇔ (i, j) ∈ E.

Voorbeeld 3.1.34 Hier tekenen we de verbindingsgraaf G(A) van de gegeven matrix A ende verbindingsmatrix M(G(A)) van die graaf.

G(A) =

4

1 2

3

A =

0 −1 0 00 0 1 −20 0 0 13 1 0 0

M(G(A)) =

0 1 0 00 0 1 10 0 0 11 1 0 0

Merk op dat A =M(G(A)) als en alleen als A een 0/1-matrix is, oftewel, als A ∈ 0, 1n×n.

Definitie 3.1.35 (Wandeling) Zij G = (V,E) een gerichte graaf en p ∈ N. Dan heeteen rij (v0, . . . , vp) ∈ V p+1 van punten in G een wandeling van lengte p van v0 naar vp als(vk, vk+1) ∈ E voor alle k ∈ 0, . . . , p− 1.

Opmerking 3.1.36 De wandelingen in G = (V,E) van lengte 1 zijn precies de edges e ∈ E.

Voorbeeld 3.1.37 Er zijn precies tien wandelingen van lengte twee in de verbindingsgraafG(A) van A uit Voorbeeld 3.1.34, te weten

(1, 2, 3), (1, 2, 4), (2, 3, 4), (2, 4, 1), (2, 4, 2), (3, 4, 1), (3, 4, 2), (4, 1, 2), (4, 2, 3), (4, 2, 4).

Dit zijn uiteraard alle mogelijkheden om een wandeling van lengte 1 met 1 stap uit te breiden.

Page 88: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

88 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

De volgende stelling veralgemeniseert de observatie uit het voorgaande voorbeeld.

Stelling 3.1.38 Zij G een graaf met verbindingsmatrix B = M(G). Schrijf w(i, j, k) voorhet aantal verschillende wandelingen in G van i naar j van lengte k. Dan geldt dat

w(i, j, k) = e>i Bkej . (3.19)

Het rechterlid is de entry van Bk op positie (i, j).

Bewijs. Laat `1, . . . , `p de vertices zijn die een wandeling van lengte een verwijderd zijn vani, oftewel, de directe buren van i. Deze buren zijn als volgt verkrijgbaar uit de i-de rij van B,

e>i B = (e`1 + · · ·+ e`p)>. (3.20)

Daarnaast geldt natuurlijk dat

w(i, j, k) = w(`1, j, k − 1) + · · ·+ w(`p, j, k − 1). (3.21)

Veronderstel nu als inductie-hypothese dat (3.19) correct is voor alle wandelingen van lengtek − 1, oftewel, dat

w(i, j, k − 1) = e>i Bk−1ej (3.22)

voor alle i, j. Dan vinden we in combinatie met (3.21) en (3.20) dat

w(i, j, k) = e>`1Bk−1ej + · · ·+ e>`pB

k−1ej = (e`1 + · · ·+ e`p)>Bk−1ej = e>i BB

k−1ej (3.23)

en dus is (3.19) ook geldig voor het bepalen van de hoeveelheid verschillende wandelingen vanlengte k. Omdat de inductie-basis is verwoord in Opmerking 3.1.36 bewijst dit de stelling.

Het bewijs van Stelling 3.1.38 is gevisualiseerd in Figuur 4.3.

i j

`1

`2

`p

e>`1Bk−1ej

e>`2Bk−1ej

e>`pBk−1ej

...

e>i B = e>`1 + · · ·+ e>`p

e>`1Bk−1ej+· · ·+e>`pB

k−1ej =(e>i B

)Bk−1ej = e>i B

kej

Figuur 4.3 Illustratie van het bewijs van Stelling 3.1.38.

Voorbeeld 3.1.39 Keren we terug naar Voorbeeld 3.1.34, dan berekenen we dat

M(G(A))2 =

0 1 0 00 0 1 10 0 0 11 1 0 0

0 1 0 00 0 1 10 0 0 11 1 0 0

=

0 0 1 11 1 0 11 1 0 00 1 1 1

. (3.24)

De entries ongelijk aan nul in M(G(A))2 komen overeen met de tien wandelingen van lengtetwee in G(A) die zijn opgesomd in Voorbeeld 3.1.37.

Page 89: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.1. PERRON-FROBENIUSTHEORIE 89

Definitie 3.1.40 (Drager) De drager supp(A) van een matrix (aij) = A ∈ Kn×k is deverzameling van alle paren (i, j) waarvoor aij 6= 0.

Opmerking 3.1.41 Als A ≥ 0 dan is supp(A) = supp(M(G(A))). Ook geldt dat de dragersvan M(G(A))k en Ak dan aan elkaar gelijk zijn. Zo geldt bijvoorbeeld schematisch dat 0 + 0 0

0 0 + +0 0 0 ++ + 0 0

0 + 0 0

0 0 + +0 0 0 ++ + 0 0

=

0 0 + ++ + 0 ++ + 0 00 + + +

,ongeacht de exacte waarden van de positieve entries. Dit komt doordat voor alle x ≥ 0, y ≥ 0het inproduct x>y ≥ 0, en dat x>y = 0 als en alleen als supp(x) ∩ supp(y) = ∅.

We formuleren dit resultaat zonder verder bewijs in de volgende stelling.

Stelling 3.1.42 Laat k ∈ N, A,B ≥ 0. Als supp(A) = supp(B), dan supp(Ak) = supp(Bk).

We introduceren nu tot slot een combinatorische eigenschap van matrices die de Perron-Frobeniustheorie voor positieve matrices deels laat generaliseren voor niet-negatieve matrices.

Definitie 3.1.43 (Reducibiliteit) Gegeven A ∈ Rn×n met verbindingsgraaf G(A). Als erin G(A) voor ieder paar i, j ∈ 1, . . . , n een wandeling van i naar j bestaat dan heet Airreducibel. Als A niet irreducibel is, heet A reducibel.

Gevolg 3.1.44 Een niet-negatieve matrix A ∈ Rn×n is irredicibel als en alleen als voor iederpaar i, j ∈ 1, . . . , n er een k ≤ n bestaat zo, dat e>i A

kej > 0.

Bewijs. Dit volgt uit Stelling 3.1.38 in combinatie met Stelling 3.1.42 (want A is niet nood-zakelijkerwijs gelijk aan M(G(A))) en de observatie dat als er een wandeling bestaat van inaar j in G(A), dan bestaat er ook een van lengte ten hoogste n.

Opmerking 3.1.45 Irreducibiliteit van A ≥ 0 impliceert niet dat er een N ∈ N bestaat zo,dat Ak > 0 voor alle k ≥ N . Zie bijvoorbeeld de duidelijk irreducibele matrix A horend bijde graaf of drie vertices 1, 2, 3 met pijlen 1→ 2, 2→ 3 en 3→ 1,

A =

0 1 00 0 11 0 0

, A2 =

0 0 11 0 00 1 0

, A3 =

1 0 00 1 00 0 1

, A4 = A.

Dus is (e>i Akej)k∈N is een 3-periodieke rij voor ieder paar i, j ∈ 1, . . . , n, en dus is voor

ieder paar i, j ∈ 1, . . . , n tenminste een van de matrices A,A2, A3 positief op positie (i, j).

Gevolg 3.1.46 0 ≤ A ∈ Rn×n is irreducibel als en alleen als A+A2 + . . .+An > 0.

De volgende stelling bewijst hetzelfde voor een eenvoudiger ogend polynoom in A.

Stelling 3.1.47 0 ≤ A ∈ Rn×n met n ≥ 2 irreducibel als en alleen als (I +A)n−1 > 0.

Page 90: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

90 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

Bewijs. Veronderstel dat A ≥ 0 irreducibel is. Laat i 6= j. Per definitie bestaat er eenwandeling van i naar j. De kortste wandeling van i naar j heeft uiteraard lengte ten hoogsten− 1. Definieer nu de graaf G als G(A) met daaraan toegevoegd voor iedere vertex een extrapijl naar zichzelf indien deze niet al bestaat. Dan heeft G de volgende eigenschappen:

• G = G(I +A);

• er bestaat een wandeling in G van lengte n− 1 van iedere vertex i naar zichzelf;

• ieder wandeling van lengte ` < n− 1 van i naar j kan worden aangevuld tot lengte n− 1.

Omdat er in G(A + I) voor ieder tweetal punten i, j ∈ 1, . . . , n een wandeling van lengteprecies n−1 bestaat van i naar j, volgt uit Stelling 3.1.38 dat alle entries van [M(G(A+I))]n−1

positief zijn. Stelling 3.1.42 geeft nu dat ook (A+ I)n−1 > 0. Dit bewijst de bewering in deene richting. Om de te bewijzen dat A irreducibel is als (A + I)n−1 > 0, merk op dat ditlaatste impliceert dat de verbindingsgraaf G(A+ I) van A+ I voor ieder paar i, j ∈ 1, . . . , neen wandeling bevat van i naar j, en in het bijzonder voor elk paar i, j met i 6= j. Deverbindingsgraaf G(A) van A ontstaat uit G(A + I) door het eventueel verwijderen van eenaantal pijlen van een punt i naar zichzelf. Dit verwijdert wellicht wandelingen van i naarzichzelf van lengte een. Echter, als n ≥ 2 dan is er een wandeling van i naar een punt j 6= i,en een wandeling van j naar i, en dus ook een wandeling van i naar zichzelf.

Opmerking 3.1.48 De 1×1 matrix A = [0] is reducibel. Echter, (I+A)0 = (1+ 0)0 = 10 =1 > 0. Dit laat zien dat de aanname dat n ≥ 2 in de vorige stelling niet kan worden gemist.

3.1.7 Perron-Frobeniustheorie voor irreducibele niet-negatieve matrices

Laat A ≥ 0. Veronderstel dat A irreducibel is. Dan weten we dat B = (A+I)n−1 > 0. Dus opB is de Perron-Frobeniustheorie voor positieve matrices van toepassing, en we concluderen:

• Lemma 3.1.11: 0 < ρ(B) ∈ σ(B),

• Stelling 3.1.13: er bestaat een x > 0 waarvoor Bx = ρ(B)x,

• Stelling 3.1.15: de dimensie van de kern van B − ρ(B)I is gelijk aan een,

• Stelling 3.1.18: ρ(B) is de enige eigenwaarde van B die op de spectrale cirkel ligt.

We destilleren hieruit de volgende informatie over de matrix A zelf.

Lemma 3.1.49 Laat 0 ≤ A ∈ Rn×n en B = (I +A)n−1. Dan geldt

λ ∈ σ(A) ⇒ (1 + λ)n−1 ∈ σ(B). (3.25)

Bewijs. Laat Av = λv. Dan is (I + A)v = v + λv = (1 + λ)v, en dus (I + A)(I + A)v =(I +A)(1 + λ)v = (1 + λ)2v. Een eenvoudig inductie-argument bewijst nu de bewering.

Lemma 3.1.50 Laat 0 ≤ A ∈ Rn×n. Veronderstel dat A irreducibel is. Laat B = (I+A)n−1.Dan geldt dat

ρ(B) = (1 + ρ(A))n−1. (3.26)

Page 91: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.2. DUBBELSTOCHASTISCHE MATRICES EN DE PERMANENT 91

Bewijs. De eigenwaarden van B zijn gelijk aan (1 + λ)n+1, met λ ∈ σ(A), en dus is

ρ(B) = maxλ∈σ(A)

|(1 + λ)n−1| = ( maxλ∈σ(A)

|1 + λ|)n−1 = (1 + ρ(A))n−1.

De tweede gelijkheid geldt omdat er een λ ∈ σ(A) bestaat zo, dat |1 + λ| ≥ 1, namelijkλ = ρ(A) ∈ σ(A). De derde geldt omdat als de schijf |z| ≤ ρ een naar rechts verschuift in C,het punt met grootste modulus in de verschoven schijf het punt z = 1 + ρ is.

Lemma 3.1.51 Laat 0 ≤ A ∈ Rn×n. Veronderstel dat A irreducibel is. Dan is ρ(A) > 0.

Bewijs. Omdat A irreducibel is, bestaat er wegens Definitie 3.1.43 een wandeling van zekerepositieve lengte k van vertex 1 naar 1 in de verbindingsgraaf G(A) van A. Maar dan bestaater ook een wandeling van 1 naar 1 van lengte `k voor alle ` ∈ N. Wegens Stelling 3.1.38 geldtnu dat e>1 A

k`e1 > 0 voor alle ` ∈ N. Dus is A niet nilpotent, en dus is ρ(A) > 0.

Stelling 3.1.52 Laat 0 ≤ A ∈ Rn×n. Als A irreducibel is dan bestaat er een v > 0 zo, datAv = ρ(A)v. Tevens is dim(ker(A− ρ(A)I)) = 1.

Bewijs. Volgens Stelling 3.1.30 is ρ(A) een eigenwaarde van A en bestaat er een v ≥ 0 zo,dat Av = ρ(A)v. Laat nu B = (I + A)n−1. Dan is Bv = (1 + ρ(A))n−1v = ρ(B)v wegensLemma 3.1.49 en Lemma 3.1.50 en dus is v een veelvoud van de positieve Perronvector vanB. Deze v is dus een positieve eigenvector van A horende bij eigenwaarde ρ(A). Tot slot, steldat ook Aw = ρ(A)w voor zekere w ∈ Rn. Dan volgt met Lemma 3.1.49 en Lemma 3.1.50dat Bw = ρ(B)w. Omdat volgens Stelling 3.1.15 dim(ker(B−ρ(B)I)) = 1 zijn v en w lineairafhankelijk. Dus is ook de kern van A− ρ(A)I eendimensionaal.

Opmerking 3.1.53 De eigenschap dat een positieve matrix precies een eigenwaarde op despectrale cirkel heeft, geldt niet voor irreducibele niet-negatieve matrices. De matrix B uit(3.13) die twee verschillende eigenwaarden heeft op de spectrale cirkel is immers irreducibel.

3.2 Dubbelstochastische matrices en de permanent

Een belangrijke klasse van niet-negatieve matrices komt voort uit het vakgebied van de sto-chastiek. De entries representeren bepaalde kansen en liggen daarmee in het interval [0, 1].De naam Markov is onlosmakelijk met dergelijke matrices verbonden. Verderop komen weook een belangrijk resultaat tegen van Konig.

Andrej Markov (1856-1922) en Denes Konig (1884-1944)

Page 92: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

92 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

Schrijf zoals gebruikelijk e = e1 + · · ·+ en voor de som van de standaardbasisvectoren in Rn.Dan is Ae de vector met rijsommen van A, en e>A de vector met kolomsommen van A.

Definitie 3.2.1 (Stochastische matrices) Een niet-negatieve matrix S heet rijstochas-tisch als Se = e en kolomstochastisch als e>S = e>, en dubbelstochastisch indien beide hetgeval is. We schrijven Ωn ⊂ Rn×n voor de deelverzameling van dubbelstochastische matrices.

Voorbeeld 3.2.2 De eenvoudigste voorbeelden van dubbelstochastische matrices zijn de per-mutatiematrices. Voor n = 3 zijn dit de zes matrices 1 0 0

0 1 00 0 1

, 1 0 0

0 0 10 1 0

, 0 1 0

1 0 00 0 1

, 0 1 0

0 0 11 0 0

, 0 0 1

1 0 00 1 0

, 0 0 1

0 1 01 0 0

.Andere voorbeelden van dubbelstochastische matrices zijn magische vierkanten gedeeld doorhun magische som, en de constante matrices Cn waarvan alle entries gelijk zijn aan 1/n,

M3 =1

15

8 1 63 5 74 9 2

en M4 =1

34

16 2 3 135 11 10 89 7 6 124 14 15 1

, C3 =1

3

1 1 11 1 11 1 1

.Opmerking 3.2.3 Dubbelstochastische matrices spelen verrassend vaak een belangrijke rolin deelgebieden van de wiskunde die schijnbaar niets met stochastiek van doen hebben.

De permutatiematrices uit bovenstaand voorbeeld blijken de elementaire bouwstenen te zijnvan alle dubbelstochastische matrices, en verdienen daarom een formele definitie.

Definitie 3.2.4 (Permutatiematrices) Schrijf Sn voor de groep van alle bijecties

σ : 1, . . . , n → 1, . . . , n : i 7→ σ(i), (3.27)

oftewel, Sn is de symmetrische groep op 1, . . . , n. Voor gegeven σ ∈ Sn is

Πσ = [eσ(1)| . . . |eσ(n)] (3.28)

de permutatiematrix bestaande uit de door σ gepermuteerde standaard basisvectoren.

Opmerking 3.2.5 In Definitie 3.2.4 wordt impliciet een groepshomomorfisme gedefinieerd,

h : Sn → GLn(R) : σ 7→ Πσ.

Het is namelijk niet moeilijk om na te gaan dat voor alle τ, σ ∈ Sn,

h(τ σ) = Πτσ = ΠτΠσ = h(τ)h(σ).

De studie van groepshomomorfismes G→ GL(V ) met onder andere als doel de structuur vaneen groep G te bestuderen binnen een vertrouwdere context heet representatietheorie.

De volgende observaties zijn nuttig voor het begrip van dubbelstochastische matrices.

Page 93: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.2. DUBBELSTOCHASTISCHE MATRICES EN DE PERMANENT 93

Lemma 3.2.6 Laat σ, τ ∈ Sn en M,N ∈ Ωn. Dan geldt

ΠσMΠτ ∈ Ωn en MN ∈ Ωn.

Oftewel, de verzameling Ωn van dubbelstochastische matrices is gesloten onder rij- en kolom-permutaties en vormt een halfgroep ten opzichte van de gebruikelijke matrixvermenigvuldiging.

Bewijs. De tweede bewering volgt doordat Ne = e en e>M = e> en dus,

MNe = Me = e en e>MN = e>N = e>.

De eerste bewering is een speciaal geval van de tweede.

Opmerking 3.2.7 Veronderstel dat M ∈ Ωn inverteerbaar is. Dan geldt natuurlijk datM−1e = e en e>M−1 = e>. Echter, M−1 ∈ Ωn als en alleen als M een permutatiematrix is.

Definitie 3.2.8 (Convexe combinatie) Zij V een reele vectorruimte. Gegeven v1, . . . , vm ∈V heet v een convexe combinatie van v1, . . . , vm als geldt dat

v =m∑j=1

µjvj waarbijm∑j=1

µj = 1 en ∀j ∈ 1, . . . , n : µj ≥ 0. (3.29)

Iedere convexe combinatie is dus een specifieke lineaire combinatie van gegeven vectoren.

Lemma 3.2.9 Laat n ∈ N. Iedere convexe combinatie

M =∑σ∈Sn

µσΠσ, µσ ≥ 0 (σ ∈ Sn) en∑σ∈Sn

µσ = 1 (3.30)

van permutatiematrices is dubbelstochastisch.

Bewijs. Het is duidelijk dat M ≥ 0, en bovendien geldt dat

Me =∑σ∈Sn

µσΠσe =∑σ∈Sn

µσe = e

ene>M = e>

∑σ∈Sn

µσΠσ =∑σ∈Sn

µσe>Πσ =

∑σ∈Sn

µσe> = e>,

waarbij we gebruikten dat Πσ dubbelstochastisch is. Dit bewijst de bewering.

3.2.1 De stelling van Birkhoff-Van Neumann

De omgekeerde implicatie van Lemma 3.2.9 lijk intuıtief duidelijk, maar is desondanks tocheen behoorlijk pittige stelling

Garrett Birkhoff (1911-1996) en John von Neumann (1903-1957)

Page 94: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

94 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

Hij is vernoemd naar Garrett Birkhoff en John Von Neumann.

Stelling 3.2.10 (Birkhof-Von Neumann) Zij M een dubbelstochastische n × n matrix.Dan is

M =∑σ∈Sn

µσΠσ met µσ ≥ 0 en∑σ∈Sn

µσ = 1. (3.31)

Oftewel, iedere dubbelstochastische matrix is een convexe combinatie van permutatiematrices.

Het bewijs van deze steling vereist flink wat wat voorbereiding. Deze voorbereiding motiverenwe eerst door het bewijs met een voorbeeld aannemelijk te maken.

Definitie 3.2.11 (Diagonaal (combinatorisch)) Laat A ∈ Kn×n met entries aij . Binnenhet wiskundige deelgebied van de combinatoriek heet voor iedere σ ∈ Sn de deelverzameling

dσ = a1σ(1), . . . , anσ(n)

een diagonaal van A. Dit generaliseert het concept van de gebruikelijke (hoofd-)diagonaal.Als dσ uit positieve getallen bestaat, noemen we dσ een positieve diagonaal.

Opmerking 3.2.12 Helaas sluit deze definitie niet heel mooi aan op Definitie 3.2.4, in dezin dat dσ niet precies de positieve diagonaal van Πσ is, maar die van Π>σ = Π−1

σ = Πσ−1 .Dit zou natuurlijk eenvoudig rechtgezet kunnen worden door de definitie van diagonaal aante passen tot

dσ = aσ(1)1, . . . , aσ(n)n

maar om historische redenen kiezen we ervoor dat hier niet te doen.

Voorbeeld 3.2.13 Beschouw het 3 × 3 magische vierkant met rij- en kolomsommen gelijkaan 15,

M =

8 1 63 5 74 9 2

.De matrix M heeft zes diagonalen in de zin van Definitie 3.2.11. We zien dat bijvoorbeeld dehoofddiagonaal 8, 5, 2 positief is, met minimum element 2. Dus is M schrijven als 2I +N ,

M =

8 1 63 5 74 9 2

=

2 0 00 2 00 0 2

+

6 1 63 3 74 9 0

= 2I +N,

waarbij N niet-negatief is, en de rijen en kolommen van N allemaal optellen tot 13 en dedrager van N strict kleiner is dan die van M . De hoofddiagonaal van N is niet positief, maarde diagonaal 6, 7, 9 wel, en dus is N = 6J + P ,

N =

6 1 63 3 74 9 0

=

6 0 00 0 60 6 0

+

0 1 63 3 14 3 0

= 6J + P,

Page 95: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.2. DUBBELSTOCHASTISCHE MATRICES EN DE PERMANENT 95

waarbij P niet-negatief is met rij- en kolomsommen gelijk aan 7, en kleinere drager heeft danN . Zo doorgaande vinden we

M = 2

1 0 00 1 00 0 1

+ 6

1 0 00 0 10 1 0

+ 3

0 0 10 1 01 0 0

+ 3

0 0 11 0 00 1 0

+

0 1 00 0 11 0 0

en dus hebben we M geschreven als som van positieve veelvouden van permutatiematrices. Dehier gevolgde strategie ligt niet uniek vast, maar berust op keuzes voor positieve diagonalen.

De strategie in het voorgaande voorbeeld is succesvol als iedere niet-negatieve matrix waarvanalle rijen en kolommen optellen tot hetzelfde positieve getal, een positieve diagonaal heeft.Om dit te bewijzen bekijken we nu eerst een stelling over niet-negatieve matrices zonderpositieve diagonalen. Dergelijke matrices bevatten noodzakelijkerwijs behoorlijk wat nullen.

Voorbeeld 3.2.14 Het is eenvoudig na te gaan dat de volgende matrices geen positieve dia-gonaal hebben: 1 1 1

1 1 10 0 0

en

1 1 10 0 10 0 1

en

0 1 10 1 10 1 1

.Dit komt doordat deze matrices een k × ` blok met nullen hebben, dat zo groot is (namelijkk+ ` = 4 = n+ 1), dat de k rijen naast dit blok in minder dan k kolommen liggen, en er dusgeen positieve diagonaal langs dit blok met nullen gelegd kan worden.

Opmerking 3.2.15 Laat σ, τ ∈ Sn. Als A ∈ Rn×n geen positieve diagonaal heeft, dan heeftook ΠσAΠτ geen positieve diagonaal.

Stelling 3.2.16 (Frobenius-Konig) Een niet-negatieve n×n matrix A heeft geen positievediagonaal als en alleen als er indexverzamelingen i1, . . . , ik en j1, . . . , j` bestaan metk + ` = n+ 1 waarvoor aij = 0 indien i ∈ i1, . . . , ik en j ∈ j1, . . . , j`.

Bewijs. Veronderstel op grond van Opmerking 3.2.15 zonder verlies van algemeenheid dat

A =

[B C

0 D

]met 0 ∈ Rk×`, waarbij k + ` = n+ 1. (3.32)

De matrix D met k rijen heeft wegens k + ` = n + 1 minder dan k kolommen. Laat nu dσeen diagonaal van A zijn. De laatste k entries van dσ staan (per definitie) in k verschillendekolommen van A. Dus tenminste een van die entries staat niet in D en dus heeft A in (3.32)geen positieve diagonaal. We bewijzen nu de omgekeerde bewering met inductie. Als Aeen niet-negatieve 1 × 1 matrix is zonder positieve diagonaal, volgt dat A = [0] en heeft Ainderdaad een k × ` deelmatrix gelijk aan nul met k + ` = n + 1. Als inductiehypothesenemen we aan dat iedere niet-negatieve (n − 1) × (n − 1) matrix zonder positieve diagonaaleen p× q deelmatrix gelijk aan nul heeft met p+ q = n. Laat nu A ∈ Rn×n niet-negatief zijnen veronderstel dat A geen positieve diagonaal heeft. Als A de nulmatrix is, is er niets tebewijzen. Neem daarom zonder verlies van algemeenheid aan dat de entry a11 van A positiefis en schrijf

A =

[a11 c>

b B

]. (3.33)

Page 96: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

96 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

Omdat a11 > 0 en A geen positieve diagonaal heeft, volgt dat B geen positieve diagonaalheeft. Dus heeft B een p × q deelmatrix gelijk aan nul met p + q = n. Zonder verlies vanalgemeenheid veronderstellen we dit blok rechts-onder in B. Dus:

A =

[E F

G 0

]waarbij G ∈ Rp×p en F ∈ Rq×q kennelijk vierkante matrices zijn. Als dG en dF diagonalenzijn van G en F , dan is dG ∪ dF een diagonaal van A. Omdat A geen positieve diagonaalheeft impliceert dit dat tenminste een van de matrices F en G geen positieve diagonaal heeft.Neem weer zonder verlies van algemeenheid aan dat G geen positieve diagonaal heeft. Deinductiehypothese laat zien dat G dan een s× t nulblok heeft met s+ t = p+ 1. Samen methet nulblok rechts van G geeft dit het gevraagde k× ` blok nullen in A met k+ ` = n+ 1.

Gevolg 3.2.17 Laat M ∈ Ωn. Dan heeft M een positieve diagonaal.

Bewijs. Laat M ≥ 0 en veronderstel dat M geen positieve diagonaal heeft. De Stelling vanFrobenius-Konig 3.2.16 laat zien dat de rijen en kolommen van M dan gepermuteerd kunnenworden tot

Π1MΠ2 =

[A B

0 D

], (3.34)

waarbij D p rijen heeft en q < p kolommen. Als de rijen van D optellen tot een, tellen alleentries van D op tot p. Maar dan telt minstens een kolom van D op tot ten minste p/q > 1.Hieruit volgt dat de matrix in (3.34) niet dubbelstochastisch is, en dus M 6∈ Ωn.

Na al deze voorbereiding kunnen we nu de Stelling van Birkhoff-Von Neumann bewijzen. Wedoen dit middels een eindig inductie-argument naar de grootte van de drager.

Bewijs. Omdat iedere M ∈ Ωn wegens Gevolg 3.2.17) een positieve diagonaal heeft, bestaatde drager van M uit minimaal n elementen. Als inductiebasis beschouwen we het geval dat dedrager van M ∈ Ωn uit n elementen bestaat. Duidelijk is dat M dan een permutatiematrix is.Veronderstel nu als inductiehypothese dat iedere M ∈ Ωn waarvan de drager uit q elementenbestaat, met n ≤ q ≤ p te schrijven is als convexe combinatie van maximaal p − (n − 1)permutatiematrices. Beschouw nu een M ∈ Ωn met een drager van p + 1 elementen. Danheeft M wegens Gevolg 3.2.17 een positieve diagonaal dσ. Het minimale element d∗σ van dezediagonaal is uiteraard positief, maar ook kleiner dan 1 omdat M behalve de diagonaal dσ nogminstens een entry groter dan nul heeft. Laat nu

N =1

1− d∗σ

(M − d∗σΠ>σ

).

Het is eenvoudig na te gaan dat N ∈ Ωn, en dat N een drager heeft met maximaal p elementen.Volgens de inductiehypothese geldt dat

N =

p−(n−1)∑j=1

µjΠj met

p−(n−1)∑j=1

µj = 1 en mj ≥ 0, j ∈ 1, . . . , p− (n− 1),

waarbij sommige uj mogelijk gelijk aan nul zijn. En dus is

M = d∗σΠ>σ + (1− d∗σ)N

Page 97: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.2. DUBBELSTOCHASTISCHE MATRICES EN DE PERMANENT 97

en dit is een convexe combinatie van ten hoogste p+ 1− (n− 1) permutatiematrices.

Omdat bovenstaand bewijs een sterker resultaat is dan de bewering in Stelling 3.2.10, scherpenwe deze stelling nog wat aan tot de volgende.

Stelling 3.2.18 (Birkhof-Von Neumann) Laat M ∈ Ωn. Veronderstel dat M een dragervan p elementen heeft. Dan is

M =

p−(n−1)∑j=1

µσjΠσj met µσj ≥ 0 en

p−(n−1)∑j=1

µσj = 1. (3.35)

Iedere M ∈ Ωn is dus een convexe combinatie van hooguit n2 − n+ 1 permutatiematrices.

Bovenstaande kan deels geherformuleerd worden in termen van de permanent van een matrix.

3.2.2 De permanent van een matrix

De definitie van de permanent van een matrix heeft veel weg van die van de determinant.

Definitie 3.2.19 (Permanent) De permanent per(A) van een n×n matrix A = (aij) is hetgetal

per(A) =∑σ∈Sn

a1σ(1) · a2σ(2) · . . . · anσ(n). (3.36)

De permanent is dus de som van alle diagonaalproducten van een matrix, waarbij we met hetdiagonaalproduct van een diagonaal dσ het product van alle getallen in dσ bedoelen.

Opmerking 3.2.20 Als A ∈ 0, 1n×n is per(A) het aantal positieve diagonalen van A. AlsA niet-negatief is dan is per(A) > 0 als en alleen als A een positieve diagonaal heeft.

Voorbeeld 3.2.21 Voor 2× 2 matrices A is

per(A) = a11a22 + a12a21

terwijl voor 3× 3 matrices A

per(A) = a11a22a33 + a11a23a32 + a12a21a33 + a12a23a31 + a13a21a32 + a13a22a31. (3.37)

Opmerking 3.2.22 De permanent is net als de determinant een voorbeeld van een Schur-functie. Dat is een matrixfunctie van de vorm∑

σ∈Sn

f(σ)a1σ(1) · a2σ(2) · . . . · anσ(n),

waarbij f : Sn → C een groepshomomorfisme is. Dit homomorfisme is voor de permanent hettriviale homomorfisme σ 7→ 1 en voor de determinant is het σ 7→ sign(σ).

We kunnen enkele resultaten uit Sectie 3.2 herformuleren middels de permanent. Zo laat deStelling 3.2.16 van Frobenius-Konig zien wanneer de permanent van een matrix nul is. Netals voor de determinant heeft dat een duidelijke, in dit geval combinatorische, interpretatie.

Page 98: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

98 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

Stelling 3.2.23 (Frobenius-Konig) Laat A ≥ 0. Dan is per(A) = 0 als en alleen als erpermutaties σ, τ ∈ Sn bestaan zo, dat

ΠσAΠτ =

[B C

0 D

]en waarin de nulmatrix afmetingen k × ` heeft met k + ` = n+ 1.

Gevolg 3.2.17 wordt in de nieuwe terminologie het volgende.

Stelling 3.2.24 Voor alle M ∈ Ωn geldt dat per(M) > 0.

De volgende aanscherping van dit laatste resultaat vermelden we om historische redenen: hijwerd in eerste instantie in 1926 als vermoeden geformuleerd door Van der Waerden.

Schrijf zoals eerder Cn voor de matrix in Ωn waarvan alle entries gelijk zijn aan 1/n.

Stelling 3.2.25 Voor alle M ∈ Ωn geldt per(M) ≥ per(Cn) = n−nn!.

De hier geformuleerde ongelijkheid lijkt niet onaannemelijk maar werd pas in 1980 bewezenen heeft ervoor gezorgd dat de permanent enkele decennia uitvoerig onder de loep is genomen,ondanks dat hij lang daarvoor al geıntroduceerd werd door Augustin-Louis Cauchy.

Augustin-Louis Cauchy (1789-1857), Bartel Leendert van der Waerden (1903-1996),

Herbert John Ryser (1923-1985), en Henryk Minc (1919-2013)

Een van de ontwikkelingen was het algoritme van Ryser in Sectie 3.2.5, tot op heden een van desnelste manieren om de permanent van een matrix te berekenen. Het naslagwerk Permanentsvan Henryk Minc is een beroemd boek dat vrijwel alleen over de permanent gaat.

3.2.3 De permanent versus de determinant

De permanent lijkt sterk op de determinant. Zo geldt bijvoorbeeld dat

• per(I) = det(I) = 1 waarbij I de identiteitsmatrix is;

• de permanent en de determinant zijn lineair in ieder van de rijen.

Laat nu σ ∈ Sn een transpositie zijn, oftewel, het omwisselen van twee elementen. Dan geldt

det(ΠσA) = −det(A) maar per(ΠσA) = per(A). (3.38)

Dit ogenschijnlijk onschuldige onderscheid tussen beide heeft verstrekkende consequenties. Zois de permanent van een matrix met twee gelijke rijen niet altijd nul. Wel is de permanentnet als de determinant te berekenen door rij- en/of kolom-ontwikkeling.

Page 99: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.2. DUBBELSTOCHASTISCHE MATRICES EN DE PERMANENT 99

Voorbeeld 3.2.26 Laat

A =

1 0 42 1 13 2 1

dan geldt dat

per(A) = 1 · per

[1 12 1

]+ 0 · per

[2 13 1

]+ 4 · per

[2 13 2

]= 3 + 0 + 28 = 31,

maar bijvoorbeeld ook dat

per(A) = 1 · per

[1 12 1

]+ 2 · per

[0 42 1

]+ 3 · per

[0 41 1

]= 3 + 16 + 12 = 31,

dus ontwikkeling gaat net als bij de determinant, maar dan zonder de mintekens.

Voor de berekening van de determinent is er een alternatief dat ook prima werkt als er geennullen in de matrix staat. Immers, A kan middels elementaire rij-operaties geschreven wordenals

A = E1 · . . . · Ep ·R

waarbij Ej elementaire matrices zijn en R bovendriehoeks is. De Stelling van Cauchy-Binetstelt dat det(AB) = det(A) det(B) en dus is

det(A) = det(E1) · . . . · det(Ep) · det(R)

waarbij det(R) het diagonaalproduct van R is. Een dergelijke productregel geldt echter nietvoor de permanent, zoals blijkt uit het volgende voorbeeld.

Voorbeeld 3.2.27 Beschouw de matrices A en B met per(A) = 6 en per(B) = 0,

A =

[1 1 11 1 11 1 1

], B =

[1 1 10 0 10 0 1

], AB =

[1 1 31 1 31 1 3

].

We berekenen eenvoudig dat per(AB) = 18.

Ondank dit negatieve resultaat gelden wel de volgende eenvoudige deelresultaten.

Lemma 3.2.28 Als R bovendriehoeks is, is per(R) het product van de diagonaalentries.

Lemma 3.2.29 Laat A,B ∈ Rn×n. Dan geldt

per(AB) = per(A)per(B)

als B een diagonaalmatrix of een permutatiematrix is.

Page 100: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

100 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

3.2.4 De determinantale complexiteit van de permanent

Het is onbekend wat de snelste manier is om de permanent van een matrix uit te rekenen.

Opmerking 3.2.30 Evaluatie van per(A) middels

per(A) =∑σ∈Sn

a1σ(1) · a2σ(2) · . . . · anσ(n)

berekent n!− 1 keer een som en n!(n− 1) keer een product van twee getallen.

Voorbeeld 3.2.31 Voor n = 3 is dit 3! − 1 = 5 optellingen en 3!(3 − 1) = 12 vermenigvul-digingen:

per(A) = a11a22a33 + a11a23a32 + a12a21a33 + a12a23a31 + a13a21a32 + a13a22a31.

Passen we echter rij-ontwikkeling naar de eerste rij toe, oftewel, halen we a11 en a12 en a13

buiten haakjes, dan is

per(A) = a11 (a22a33 + a23a32) + a12 (a21a33 + a23a31) + a13 (a21a32 + a22a31) .

Dit kost 5 optellingen en 9 vermenigvuldigingen, en is dus iets goedkoper.

Het volgende eenvoudige lemma geeft het algemene resultaat.

Lemma 3.2.32 Het berekenen van per(A) middels rij-ontwikkeling kost n!−1 optellingen enn! vermenigvuldigingen.

Bewijs. Met volledige inductie. Het berekenen van de 2× 2 permanent kost 1 optelling en2 producten. Veronderstel als inductiehypothese dat voor B ∈ R(n−1)×(n−1) de berekening(n− 1)!− 1 optellingen en (n− 1)! producten kost. Rij-ontwikkeling voor A ∈ Rn×n berekent

per(A) = a11per(M11) + · · ·+ a1nper(M1n) (3.39)

waarbij Mij de matrix is die overblijft door uit A de i-de rij en j-de kolom te verwijderen.Evaluatie van deze uitdrukking zoals in (3.39) kost n[(n−1)!−1]+(n−1) = n!−1 optellingenen n(n− 1)! = n! vermenigvuldigingen.

Opmerking 3.2.33 Als er een algoritme bestaat dat per(A) uitrekent door minder dan q(n)optellingen en vermenigvuldigingen te doen waarbij q een vast polynoom is, dan is implicietbewezen dat P=NP. De vraag of P=NP is een Milleniumprobleem waarvan de oplossing eenmiljoen dolar oplevert. Overigens denken de meeste experts dat P ongelijk is aan NP.

Opmerking 3.2.34 Voor de determinant bestaat zo’n polynoom q, en is derdegraads in n.

Om het berekenen van de permanent te vereenvoudigen zijn vele pogingen ondernomen. Eenonderdeel van dergelijke pogingen is om per(A) te schrijven als det(F (A)) voor een geschikteafbeelding F . Zo is bijvoorbeeld

per

([a bc d

])= det

([a −bc d

]).

Page 101: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.2. DUBBELSTOCHASTISCHE MATRICES EN DE PERMANENT 101

Het is bewezen dat voor 3× 3 matrices er geen F bestaat met de eigenschap dat iedere entryvan F (A) affien lineair is in de entries van A, waarvoor per(A) = det(F (A)). Daarom zoektmen het nu hogerop; in dit geval, in hogere dimensies.

Open probleem: Gegeven A ∈ Rn×n. Wat is de kleinste waarde van m als functie van nzo, dat er een afbeelding

F : Rn×n → Rm×m : A 7→ F (A)

bestaat die affien-lineair is in de entries van A, met de eigenschap dat per(A) = det(F (A)).

Definitie 3.2.35 (Determinantale complexiteit van de permanent) De waarde vanmals functie van n in dit open probleem heet de determinantal complexity of the permanent.

Een stelling van Grenet uit 2012 bewijst dat m ≤ 2n − 1 en geeft daarnaast expliciet deafbeelding F . Voor A ∈ R3×3 geeft dit de volgende 7× 7 matrix F (A),

A =

a b cd e fg h i

, F (A) =

0 a d g 0 0 00 1 0 0 i f 00 0 1 0 0 c i0 0 0 1 c 0 fe 0 0 0 1 0 0h 0 0 0 0 1 0b 0 0 0 0 0 1

, en per(A) = det(F (A).

Het is voor n = 3 verder alleen bekend dat m > 4, dus de minimale waarde is 5, 6 of 7.

3.2.5 Het algoritme van Ryser voor het berekenen van de permanent

In 1963 vond Herbert William Ryser een methode om de complexiteit van de berekening vande permanent terug te brengen van O(n!) voor rij-ontwikkeling tot O(2nn). Eerst illustrerenwe deze methode voor n = 3. Bekijk als voorbeeld de matrix 1 2 3

4 5 67 8 9

. (3.40)

Met (3.37) vinden we dat per(A) de som is van de zes diagonaalproducten

per(A) = 1 · 5 · 9 + 1 · 6 · 8 + 2 · 4 · 9 + 2 · 6 · 7 + 3 · 4 · 8 + 3 · 5 · 7 = 450. (3.41)

Deze zes diagonaalproducten vormen een deelverzameling van de in totaal 33 = 27 productenvan de entries die je krijgt als je de haakjes wegwerkt in het product P (A) van de rijsommenvan A, gedefinieerd als P (A) = (1 + 2 + 3)(4 + 5 + 6)(7 + 8 + 9). Deze 27 producten zijn

1 · 4 · 7 1 · 5 · 7 1 · 6 · 71 · 4 · 8 1 · 5 · 8 1 · 6 · 81 · 4 · 9 1 · 5 · 9 1 · 6 · 9

2 · 4 · 7 2 · 5 · 7 2 · 6 · 72 · 4 · 8 2 · 5 · 8 2 · 6 · 82 · 4 · 9 2 · 5 · 9 2 · 6 · 8

3 · 4 · 7 3 · 5 · 7 3 · 6 · 73 · 4 · 8 3 · 5 · 8 3 · 6 · 83 · 4 · 9 3 · 5 · 9 3 · 6 · 9

Ryser bedacht een manier om de som van de ongewenste 21 producten op efficiente wijze afte trekken van P (A). Deze manier is er eerst de som van 24 van af te trekken, en de som van

Page 102: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

102 HOOFDSTUK 3. NIET-NEGATIEVE LINEAIRE ALGEBRA

de drie die er teveel van zijn afgetrokken, daarna toch weer bij op te tellen. Hoe deed hij dit?

Schrijf Aj voor de 3× 2 matrix die uit A ontstaat door de j-de kolom te verwijderen,

A1 =

2 35 68 9

, A2 =

1 34 67 9

, A3 =

1 24 57 8

.Voor iedere j ∈ 1, 2, 3 bestaat het product P (Aj) van de rijsommen van Aj uit acht termen,

P (A1) = (2+3)(5+6)(8+9) = 2 ·5 ·8+2 ·5 ·9+2 ·6 ·8+2 ·6 ·9+3 ·5 ·8+3 ·5 ·9+3 ·6 ·8+3 ·6 ·9,

P (A2) = (1+3)(4+6)(7+9) = 1 ·4 ·7+1 ·4 ·9+1 ·6 ·7+1 ·6 ·9+3 ·4 ·7+3 ·4 ·9+3 ·6 ·7+3 ·6 ·9,P (A2) = (1+2)(4+5)(7+8) = 1 ·4 ·7+1 ·4 ·8+1 ·5 ·7+1 ·5 ·8+2 ·4 ·7+2 ·4 ·8+2 ·5 ·7+2 ·5 ·8.Merk op dat ieder van deze 24 producten bestaat uit drie getallen die uit twee van de driekolommen van A komen, en dus geen diagonaalproducten van A zijn. Merk vervolgens op datdrie van de bovenstaande 24 producten twee keer voorkomen, namelijk, precies de productenvan drie getallen uit dezelfde kolom. Dit leidt tot de conclusie dat

per(A) = P (A)− [P (A1) + P (A2) + P (A3) ] + P (A1,2) + P (A2,3) + P (A1,3), (3.42)

waarbij Ai,j de matrix is die je krijgt door kolommen i en j uit A te verwijderen. Voor degegeven matrix A vinden we daarom dat

per(A) = 2160− (935 + 640 + 405) + 270 = 450.

Dit komt dus precies overeen met de middels de definitie gevonden waarde in (3.41).

Opmerking 3.2.36 Ryser berekent in totaal 11 producten, tegen 12 producten in (3.41).Echter, in (3.41) worden slechts 5 optellingen gedaan, en in Ryser’s methode 21 (alhoewelslim administreren dit aantal wat laat slinken). Dus voor n = 3 kost Ryser’s methode nietbepaald minder werk dan het uitschrijven van de definitie van permanent of rij-ontwikkeling.

Aan de basis van de methode van Ryser voor een matrix A ∈ R3×3 staat het product van derijsommen

P (A) = (a11 + a12 + a13)(a21 + a22 + a23)(a31 + a32 + a33). (3.43)

Als we de dit product uitvermenigvuldigen, ontstaat er een som van 27 producten van driegetallen, die de eigenschap hebben dat ze uit drie verschillende rijen van A komen. Dus,

P (A) =∑

f :1,2,3→1,2,3

a1f(1) · a2f(2) · a3f(3) (3.44)

waarbij gesommeerd wordt over de verzameling S van alle 27 verschillende functies van1, 2, 3 naar zichzelf. De permanent van A is precies gelijk aan de som over de deelver-zameling S∗ van bijectieve functies van 1, 2, 3 naar zichzelf.

De methode van Ryser is nu gebaseerd op de volgende observatie. Laat Sj de verzamelingzijn van functies van 1, 2, 3 naar 1, 2, 3 \ j. Dan behoort iedere niet-bijectieve f ∈ Stot een of meerdere van de verzamelingen S1, S2, S3. En dus kan de som over S∗ geschrevenworden als ∑

S∗

=∑S

−∑S1

−∑S2

−∑S3

+∑S1∩S2

+∑S2∩S3

+∑S1∩S3

−∑

S1∩S2∩S3

, (3.45)

waarbij aangetekend dient te worden dat de doorsnede S1 ∩ S2 ∩ S3 in dit geval leeg is.

Page 103: Lineaire Algebra 2 - Homepage Jan Brandtsjanbrandts.nl/TEACHING/NUMLA/PDF/LA2.pdf · ben gehad met het vakgebied van de lineaire algebra en bekend zijn met vectorruimtes over ...

3.2. DUBBELSTOCHASTISCHE MATRICES EN DE PERMANENT 103

Opmerking 3.2.37 Formule (3.45) heet het principe van inclusie en exclusie, en kan wordengegeneraliseerd naar n × n matrices, met hierbij horende matrices die ontstaan door uit Aeen, twee, tot en met n− 1 kolommen weg te laten.

Schrijf [n] = 1, . . . , n. Het product P (A) van de rijsommen van A bestaat uit de nn

producten van n entries van A, waarbij ieder van deze n entries afkomstig zijn uit de nverschillende rijen van A. Met andere woorden,

(a11 + . . .+ a1n) · . . . · (an1 + . . .+ ann) = P (A) =∑

f :[n]→[n]

a1f(1) · a2f(2) · . . . · anf(n) (3.46)

waarbij gesommeerd wordt over alle nn functies f : [n]→ [n]. Hiervan willen we de n! produc-ten overhouden waarvan de n getallen die het product vormen, uit verschillende kolommenvan A afkomstig zijn: oftewel, sommeren over alle bijectieve functies f : [n]→ [n].

De algemene formule van Ryser laat zich als volgt opschrijven. Schrijf Σj(A) voor de verza-meling van alle n×(n−k) matrices die ontstaan door op alle mogelijke verschillende manierenk kolommen uit A te verwijderen. Dan is dus

Σ0(A) = A, Σ1(A) = A1, . . . , An, . . . , Σn−1(A) = Ae1, . . . , Aen. (3.47)

Laat vervolgens

Sk =∑

X∈Σk(A)

P (X), (3.48)

waarbij P (X) staat voor het product van de rijsommen van X. Dan geldt dat

per(A) = S0 − S1 + S2 − S3 + . . .+ (−1)n−1Sn−1. (3.49)

Merk op dat S0 = P (A) en S1 = P (A1) + · · ·+ P (An) en Sn−1 = P (Ae1) + · · ·+ P (Aen) endat we voor n = 3 hiermee inderdaad de eerder gegeven formule (3.42) terugvinden.

Opmerking 3.2.38 Laat s ⊂ [n]. De formule van Ryser voor A ∈ Rn×n berekent P (As) voorde matrix As die uit A ontstaat door de kolommen waarvan de index in s zit te verwijderen.Omdat [n] precies 2n deelverzamelingen heeft, worden er dus in totaal (n − 1)2n vermenig-vuldigingen berekend. Dit is veel, maar ook veel minder dan n! zoals bij rij-ontwikkeling.

3.2.6 Een formule van Glynn

In 2010 ontwikkelde David G. Glynn van de Flinders University of South Australia in Adelaideeen familie van alternatieve formules om de permanent van een n×n matrix A = (aij) te be-rekenen in zijn artikel The permanent of a square matrix, European Journal of Combinatorics31(7):1887-1891. De eenvoudigste van deze formules is de volgende:

per(A) = 21−n∑v∈Bn

n∏j=1

vj

n∏i=1

n∑j=1

aijvj . (3.50)

Hierbij loopt de eerste som over de verzameling

Bn = v = (v1, . . . , vn) ∈ −1, 1n | v1 = 1 , (3.51)

die dus uit 2n−1 vectoren bestaat. We zullen deze formule hier niet bewijzen.