Barusan diskusi dengan Tika (Eka Kartika) tentang tugas akhirnya seputar penggunaan KNN untuk imbalance classification, utamanya untuk aplikasi churn prediction.
Dia merencanakan mengambil ide dari tulisan A Scalable Clustering Technique for Intrusion Signature Recognition
Pertama di cluster, instance kelas minor dicluster terpisah dengan yang kelas mayor. Lalu dicek semua instance di training tsb, apakah centroid yang terdekat center dengannya apakah kelasnya sama dengan kelasnya dia atau tidak, kalau tidak maka buatlah cluster baru dengan instance tsb sebagai centroid.... Begitu katanya...