· Web viewHeb gezegd niks gebruikt, combo is under- en oversampling. Wat is de cost? Heb...

1

Click here to load reader

Transcript of · Web viewHeb gezegd niks gebruikt, combo is under- en oversampling. Wat is de cost? Heb...

Page 1: · Web viewHeb gezegd niks gebruikt, combo is under- en oversampling. Wat is de cost? Heb gezegd niet gebruikt, vroeg dan cost-benefit. Postcode genormaliseerd?

Vragen Datamining

1) Een statisticus zegt dat je data mining niet moet gebruiken want je zal altijd wel een patroon vinden. Hoe weerleg je dit?

2) Oefening text mining: entity, 2 bigrams, preprocessing stappen, tf-idf tabel, sensitivity analysis

3) Waarom kNN lazy learner en wat met computational efficiency?4) Wat is confidence?5) Wat is data mining?

Project:1) Sampling uitleggen combo en wat gebruikt? Heb gezegd niks gebruikt, combo is

under- en oversampling2) Wat is de cost? Heb gezegd niet gebruikt, vroeg dan cost-benefit3) Postcode genormaliseerd? Niet gebruikt, uitleggen waarom niet.4) Decision tree geplot of zijn die variabelen degenen van model? Heb gezegd dat die

variabelen van model zijn, niet geplot5) Op basis van wat training en test set bepaald? Test set van 2014, vroeg dan

validatieset en heb gezegd random.