Datamining, analyse, der forsøger at afdække sammenhænge i store datamængder fra især erhvervslivet. Et typisk eksempel er datamining i en bank, der vha. alle tilgængelige oplysninger om kunderne forsøger at forudsige, hvem der bliver dårlige betalere.

Faktaboks

Etymologi
Ordet datamining er engelsk, 2. led mining egentlig 'minedrift'.

I modsætning til en statistisk analyse (se statistik) bygger datamining ikke på en egentlig model for data. Derved opnår man ikke i videnskabelig forstand indsigt, men fokuserer udelukkende på resultaterne. Mange statistikere er derfor kritiske over for datamining, mens analysens fortalere mener, at det ikke er muligt at opstille modeller for sådanne datamængder.

I praksis udføres datamining ved et kald af et computerprogram, fx SAS. Programmerne er konstrueret, så de i blinde afprøver en stor mængde mulige sammenhænge for derpå at vælge den stærkeste. De mange avancerede beregninger er gemt bag en brugervenlig facade, så datamining kan udføres uden statistiske kundskaber.

OLAP (Online Analytical Processing) er en dataminingmetode til at håndtere store multidimensionale forretningsdatamængder med det formål at lave analyser eller beslutninger med kort søgetid. Data fra den oprindelige database overføres og omorganiseres til såkaldte OLAP-cubes; kategorier af data beregnes og lagres på en sådan måde, at det bliver let og frem for alt hurtigt for brugeren at zoome ind på relevante data.

Da OLAP-cubes ofte er millioner af gange større end den oprindelige database, vandt de først udbredelse omkring år 2000, hvor computerkraft blev tilstrækkelig billigt.

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig