Dalam teks mining, ada learning method yang memproses teks sebagai vector (vector space model) seperti Rocchio dan kNN, ada juga yang merepresentasikan dlam skalar seperti Tree dan SVM. Dengan representasi yang berbeda, pengukuran jarak/perbedaan juga berbeda. Vektor dengan sudut dan skalar dengan jarak Ecludian.
Terlepas dari keunggulan metoda pembelajaran, representasi dokumen yang mana yang lebih baik?