Monday, November 17, 2008

algoritma Costing dll

[under construction]

level imbalance: ..

minor = rev - c_retensi
mayor = c_retensi

cost retensi

evaluasi: sum rev TP - sum c_retensi TP+FP

voting menggunakan confidence (clementine)

dibandingkan dengan:
base clsssifier: C.50
base clsssifier: C.50 + balancing (ada macam-macam balancing)

revenue max: ...
revenue min: ....
revenue Costing: ....


Penggunaan Bagging apakah membantu dalam Costing?
Tren pengaruh iterasi bagging terhadap evaluasi (Recall, Precison, F, Revenue)

Pengaruh cost retensi terhadap evaluasi (Recall, Precison, F, Revenue)

Seberapa bagus (efektif -> revenue) algoritma Costing untuk
cost sensitive learning,
churn prediction

Mengapa bagus/jelek?
al. rejection sampling menghasilkan sample yang sedikit. Seberapa sedikit. (berapa %) cost-proportionate rejection sampling produces a smaller training set (by a factor of about N/Z).

Paper Roulette: we set the constant Z = maxC(i). Bagaimana cara mendapatkannya?

**sampling-based cost sensitive. Papernya algoritmanya apa saja.
pendekatan lain: ensemble

target:
* roulette (per instance) + rejection sampling

presisi berapa angka dibelakang koma untuk angka random (0-1)