Tätortskategorisering genom klusteranalys

Klusteranalys

K-means klusteranalys är en statistisk metod som används för att organisera data i grupper (kluster) baserat på likheter mellan datapunkter. Målet är att gruppera objekt så att de som är inom samma kluster liknar varandra mer än de som är i olika kluster. K-means klusteranalys tillhör kategorin “unsupervised learning” inom maskininlärning, vilket betyder att den arbetar med data utan fördefinierade etiketter eller kategorier. I praktiken innebär detta att metoden självständigt identifierar mönster och strukturer i datan genom att analysera likheter mellan datapunkter, utan att luta sig mot någon yttre vägledning om hur klustren ska formuleras.

Steg-för-steg Process

  1. Förberedelse av data: Vi börjar med att välja ut relevanta indikatorer som ska analyseras. I detta fall har ni valt variabler som relaterar till befolkningen och pendling. Data filtreras för att inkludera specifika år och indikatorer, och omvandlas sedan till ett format som är lämpligt för analys.

  2. Standardisering: Data standardiseras för att säkerställa att varje variabel bidrar lika till klusteranalysen, oberoende av deras skala.

  3. Bestämning av antal kluster: Användning av metoder som Elbow-metoden och Silhuettmetoden hjälper till att bedöma det optimala antalet kluster. Dessa metoder analyserar data för att hitta en balans mellan antalet kluster och den interna kohesionen inom dessa kluster.

  4. Utförande av K-means klusteranalys: Med ett fastställt antal kluster utförs själva k-means analysen, där data grupperas i kluster baserat på likheter.

  5. Resultatanalys och tolkningsbarhet: Slutligen analyseras och tolkas resultaten. Kluster identifieras och beskrivs utifrån de karaktäristiska egenskaperna för datapunkterna inom varje kluster.

Indikatorer

  1. Sysselsatt dagbefolkning (Dagbefolkning): Denna indikator refererar till antalet personer som arbetar inom en tätort under dagen och avser personer som bor och arbetar på orten samt inpendlare. Den ger en uppfattning om tätortens ekonomiska aktivitet och dragningskraft som arbetsort. Ju större dagbefolkning, desto större ekonomisk betydelse för regionen.

  2. Befolkning (Befolkning): Antalet personer i en tätort påverkar vilka typer av privata och offentliga tjänster som finns tillgängliga. Fler människor betyder vanligtvis ett större utbud av tjänster. Större tätorter är i regel viktiga målpunkter för övriga delar av en region.

  3. Förändring i befolkning 00-20 (For_befolkning_0020: Denna indikator visar på befolkningstillväxt eller -minskning under en specifik period (år 2000 till 2020). Det är en viktig faktor för att bedöma en tätorts långsiktiga utvecklingspotential och attraktivitet.

  4. Pendlingskvot (Pendlingskvot): Kvoten mellan sysselsatt dagbefolkning och sysselsatt nattbefolkning ger en bild av in- och utpendlingens omfattning. En kvot över 1 innebär att fler människor pendlar till än från tätorten för arbete, vilket indikerar dess funktion som ett arbetscentrum. Denna indikator är central för att förstå tätortens roll i den regionala arbetsmarknaden och mobilitetsmönster.

  5. Andel utpendlare (Andel_utpendlare): Andelen utpendlare mäter hur stor andel av de som bor i tätorten och som har en sysselsättning som arbetar i en annan tätort. Måttet kompletterar pendlingskvoten i den meningen att en ort kan ha en hög andel utpendling samtidigt som den har en nettoinpendling. Detta är särskilt vanligt i mindre orter med en enskild större arbetsgivare. Det vanliga är dock att de flesta orter har en hög andel utpendlare och i huvudsak är en boendeort.

  6. Befolkning i omlandet (30 km) utanför tätortsgränsen (befolkning_omland): Denna indikator visar på storleken av den befolkning som bor i närheten av tätorten men utanför dess officiella gränser. Det ger en indikation på tätortens influensområde och är relevant för planering av regionala tjänster och infrastruktur, samt förståelse för tätortens utstrålning och interaktion med omgivande områden.

Ingående data

Tabellen nedanför visar de faktiska värdena för respektive indikator som vi har använt i klusteranalysen. Tabellen är sorterad efter antalet invånare, det vill säga indikatorn Befolkning. Totalt omfattar datasetet 88 tätorter i Hallands län och senaste statistikåret är 2020.

Kommun Tätort_namn Dagbefolkning Befolkning For_befolkning_0020 Pendlingskvot Andel_utpendlare befolkning_omland
1380 Halmstad 37274 71173 14958 1.59 0.30 82973
1383 Varberg 17364 35980 7340 1.13 0.42 86990
1382 Falkenberg 11031 28309 6257 0.74 0.45 137316
1384 Kungsbacka 11855 23755 6418 1.14 0.68 781741
1384 Onsala 1513 12415 1697 0.17 0.86 603722
1381 Laholm 3285 6885 1228 1.31 0.61 167490
1384 Åsa 933 6479 1975 0.23 0.84 189870
1381 Mellbystrand 573 4193 1701 0.26 0.83 185546
1380 Oskarström 824 4157 313 0.34 0.81 138925
1315 Hyltebruk 1865 4057 383 1.38 0.54 27574
1384 Vallda 614 3933 869 0.26 0.89 712305
1383 Tvååker 883 2930 537 0.66 0.78 107720
1380 Frösakull 493 2699 726 0.48 0.85 164803
1384 Fjärås kyrkby 484 2515 408 0.36 0.89 586737
1384 Frillesås 487 2442 798 0.26 0.85 163351
1383 Veddige 825 2346 187 0.84 0.79 136183
1383 Bua 192 2124 312 0.14 0.88 133729
1380 Getinge 922 2045 192 1.09 0.80 149045
1380 Haverdal 114 1821 305 0.09 0.89 148132
1380 Åled 284 1786 260 0.31 0.93 131842
1380 Gullbrandstorp 158 1776 291 0.15 0.93 154094
1384 Halla Heberg 157 1740 419 0.09 0.89 610796
1380 Trönninge 442 1645 229 0.55 0.89 142094
1380 Harplinge 247 1602 118 0.28 0.86 146194
1381 Veinge 346 1519 164 0.45 0.84 144472
1384 Västra Hagen 125 1381 486 0.13 0.91 452564
1315 Torup 407 1274 67 0.78 0.74 42268
1381 Knäred 357 1219 28 0.70 0.68 78706
1382 Slöinge 503 1095 144 1.25 0.78 151835
1382 Glommen 83 1085 288 0.09 0.87 103242
1383 Tångaberg 231 1078 407 0.38 0.88 103331
1380 Steninge 77 1075 200 0.14 0.85 145827
1383 Bläshammar och Trönningenäs 119 1049 748 0.19 0.92 97095
1381 Våxtorp 315 1019 42 0.73 0.77 116159
1380 Kvibille 193 974 120 0.41 0.87 148197
1381 Lilla Tjärby 201 971 63 0.42 0.89 145170
1383 Väröbacka 328 863 256 0.89 0.84 139228
1382 Vessigebro 255 836 84 0.68 0.82 114530
1380 Holm 112 828 287 0.21 0.91 156369
1315 Unnaryd 442 781 1 1.95 0.46 46113
1380 Eldsberga 79 771 80 0.17 0.89 145838
1384 Buerås 44 768 231 0.04 0.91 413931
1382 Ullared 1579 748 62 3.00 0.63 101055
1380 Villshärad 40 743 45 0.06 0.91 152193
1381 Vallberga 201 736 79 0.57 0.89 176713
1384 Kläppa 12 735 257 0.00 0.95 187213
1383 Årnäs 31 730 253 0.03 0.91 107355
1381 Genevad 72 686 56 0.24 0.93 145641
1380 Simlångsdalen 123 673 43 0.31 0.83 130393
1384 Röda holme 43 673 268 0.06 0.89 173070
1380 Gullbranna 49 667 -99 0.11 0.92 148080
1382 Vinberg 30 654 73 0.07 0.96 108810
1383 Skällinge 81 653 26 0.17 0.87 106357
1383 Rolfstorp 148 588 54 0.60 0.90 119128
1382 Långås 113 584 44 0.42 0.86 105818
1381 Skottorp 167 568 122 0.57 0.85 177760
1383 Åsby 604 507 26 2.60 0.82 112726
1383 Tofta 634 497 95 3.00 0.85 98144
1380 Laxvik 17 483 45 0.02 0.91 146263
1382 Heberg 144 463 -14 0.72 0.92 145291
1381 Ränneslöv 115 453 -13 0.47 0.86 174010
1382 Älvsered 87 441 -14 0.40 0.78 29169
1382 Långasand och Ugglarp 20 417 169 0.04 0.84 147729
1383 Kungsäter 138 408 40 0.80 0.77 110706
1315 Rydöbruk 37 408 76 0.25 0.96 38823
1382 Ätran 160 405 1 1.10 0.81 30810
1315 Landeryd 54 393 -12 0.32 0.88 34729
1380 Sennan 85 370 -54 0.54 0.93 131485
1380 Skedala 18 365 -14 0.04 0.90 134993
1383 Getterön 36 363 114 0.19 0.92 106907
1381 Hishult 81 338 -24 0.48 0.84 74958
1382 Morup 116 331 61 0.86 0.83 105448
1315 Kinnared 143 319 18 1.29 0.75 33194
1383 Himle 47 292 12 0.28 0.91 111828
1382 Årstad 30 280 51 0.17 0.91 119411
1383 Hunnestad 39 278 26 0.20 0.85 115865
1381 Hasslöv 36 272 2 0.21 0.82 136521
1384 Hjälm 7 272 9 0.00 0.95 682426
1383 Valinge 29 270 13 0.12 0.88 106269
1383 Nordvära och Källstorp 11 265 54 0.03 0.90 145168
1381 Ysby 56 262 11 0.48 0.86 155956
1382 Bergagård 46 259 -43 0.36 0.87 110017
1383 Ringhals, Skällåkra och Lingome 1932 242 54 3.00 0.76 142077
1382 Fegen 141 242 30 1.68 0.82 28394
1382 Olofsbo 206 234 83 2.88 0.78 104437
1382 Köinge 19 219 28 0.11 0.90 112726
1384 Fjärås station 334 214 55 3.00 0.86 344509
1383 Moarna 6 207 88 0.00 0.93 109989

Val av antal kluster

Elbow-metoden är en teknik för att bestämma det optimala antalet kluster genom att identifiera “armbågen” i en plot av den totala inom-klustersumman av kvadrater (WSS) mot antalet kluster. WSS mäter hur tätt datapunkter är grupperade inom kluster; en minskning av WSS tyder på tätare kluster. Optimalt antal kluster väljs vid punkten där kurvan planar ut och ytterligare kluster inte ger betydande förbättring, vilket indikerar en balans mellan antalet kluster och klusterkvaliteten.

I grafen nedan ser vi att kurvans minskningstakt avtar efter fem kluster. Detta betyder att ytterligare tillägg av kluster inte bidrar med lika mycket information eller separation mellan datapunkterna. Efter fem kluster uppnår vi en punkt där fördelarna med att lägga till fler kluster börjar avta, vilket indikerar att den optimala klusterantalet för vår data troligen ligger runt detta värde.

Klusteranalys

Resultatet av vår analys ger oss fem olika kluster. Utifrån de ingeånde orternas karaktäristik kan de beskrivas enligt följande:

Grupp 1: Den största klustergruppen som innehåller totalt 66 orter. Här återfinns primärt mindre orter med en boendekaraktäristik.

Grupp 2: Den andra gruppen rymmer mellanstora städer (Kungsbacka, Varberg och Falkenberg).

Grupp 3: Denna grupp har endast Halmstad som medlem.

Grupp 4: Den fjärde gruppen består av mindre orter som har ett folkrikt omland. Återfinns i norra delarna av Halland i närheten av Kungsbacka och Göteborg.

Grupp 5: Innehåller mindre orter som fyller en viktig arbetsmarknadsfunktion, exempelvis Laholm, Hyltebruk och Ullared.

Tätort_namn Befolkning Klustergrupp
Mellbystrand 4193 5
Lilla Tjärby 971 5
Bläshammar och Trönningenäs 1049 5
Hunnestad 278 5
Ysby 262 5
Glommen 1085 5
Kungsäter 408 5
Årstad 280 5
Vallberga 736 5
Knäred 1219 5
Långasand och Ugglarp 417 5
Skottorp 568 5
Åled 1786 5
Sennan 370 5
Köinge 219 5
Vinberg 654 5
Långås 584 5
Skedala 365 5
Tvååker 2930 5
Laxvik 483 5
Morup 331 5
Kvibille 974 5
Älvsered 441 5
Gullbranna 667 5
Veinge 1519 5
Genevad 686 5
Landeryd 393 5
Bergagård 259 5
Veddige 2346 5
Ätran 405 5
Heberg 463 5
Våxtorp 1019 5
Årnäs 730 5
Frösakull 2699 5
Himle 292 5
Torup 1274 5
Väröbacka 863 5
Vessigebro 836 5
Trönninge 1645 5
Tångaberg 1078 5
Gullbrandstorp 1776 5
Åsa 6479 5
Harplinge 1602 5
Nordvära och Källstorp 265 5
Oskarström 4157 5
Ränneslöv 453 5
Hasslöv 272 5
Rolfstorp 588 5
Steninge 1075 5
Moarna 207 5
Rydöbruk 408 5
Simlångsdalen 673 5
Slöinge 1095 5
Holm 828 5
Valinge 270 5
Skällinge 653 5
Getinge 2045 5
Bua 2124 5
Villshärad 743 5
Getterön 363 5
Frillesås 2442 5
Haverdal 1821 5
Hishult 338 5
Eldsberga 771 5
Röda holme 673 5
Kläppa 735 5
Olofsbo 234 4
Unnaryd 781 4
Ringhals, Skällåkra och Lingome 242 4
Åsby 507 4
Fjärås station 214 4
Laholm 6885 4
Kinnared 319 4
Fegen 242 4
Tofta 497 4
Ullared 748 4
Hyltebruk 4057 4
Halmstad 71173 3
Buerås 768 2
Onsala 12415 2
Västra Hagen 1381 2
Vallda 3933 2
Hjälm 272 2
Fjärås kyrkby 2515 2
Halla Heberg 1740 2
Falkenberg 28309 1
Varberg 35980 1
Kungsbacka 23755 1

Slutsatser

  • Klusteranalysen identifierar två distinkta “kärngrupper” som kan ses som “regionala” (Halmstad) och delregionala (Kungsbacka, Varberg, Falkenberg).

  • Analysen behöver kompletteras med hänsyn till de mindre arbetscentrumen. Förslagsvis kan orter som Laholm, Hyltebruk, Åsa, Oskarström, Mellbystrand och Onsala ses som “kommunala centrum”. Klustermetodiken har svårt att urskilja denna “mellankategori”.

  • Analysen visar på att det finns en del lokala kärnor med en arbetsmarknadsfunktion, exempelvis Ullared och Unnaryd. Här kan eventuellt orter som Getinge och inplaceras.