• Artiklens indhold er godkendt af redaktionen

clusteranalyse

Oprindelig forfatter KCon Seneste forfatter Redaktionen

clusteranalyse, (1. led af eng. cluster 'klynge'), klyngeanalyse, klase, fællesbetegnelse for en række statistiske metoder til at placere objekter i grupper eller klynger baseret på ligheder og forskelle mellem målinger af forskellige egenskaber ved objekterne. Clusteranalyse anvendes inden for områder som fx botanik, geologi og sociologi. Måler man fx længde og bredde af kronblade hos nogle blomster og afbilder disse værdier i et koordinatsystem, hvor hvert punkt svarer til en enkelt blomst, vil man ofte finde, at punkterne fordeler sig i adskilte klynger. Hver af klyngerne vil så (muligvis) kunne identificeres med en bestemt blomsterart. Selve opgaven med at inddele punkterne i de adskilte klynger kaldes en ikke-hierarkisk eller disjunkt clusteranalyse. Der er mange måder at opnå en sådan inddeling på. Man kan starte med at vælge en række tilfældige udgangsobjekter (klyngefrø), hvor væksten af nogle midlertidige klynger starter. Det enkelte objekt tilordnes den klynge, som det i en passende forstand ligger nærmest ved. Når alle objekter er fordelt, kan man fx erstatte de oprindelige klyngefrø med gennemsnitsværdien for klyngen og gentage processen. Alternativt kan man danne følger af klynger ved i første trin at opfatte hvert objekt som en klynge. Dernæst slår man de to klynger, der ligner hinanden mest, sammen. Dette gentages i en række trin, indtil der kun er en klynge tilbage. Herved fås en hierarkisk clusteranalyse (numerisk taksonomi).

For såvel den hierarkiske som den ikke-hierarkiske clusteranalyse gælder, at der findes en lang række forskellige mål, såkaldte similaritetsmål, der bruges ved definition af, hvornår objekter ligner hinanden. Ligeledes findes en lang række metoder til at definere ligheder mellem klynger, fx lighedsmålet mellem de to objekter fra hver klynge, der ligner hinanden mest, eller lighedsmålet mellem de to, der ligner hinanden mindst.

Annonce

Referér til denne tekst ved at skrive:
Knut Conradsen: clusteranalyse i Den Store Danske, Gyldendal. Hentet 23. oktober 2017 fra http://denstoredanske.dk/index.php?sideId=57768