Saturday, November 6, 2010

Text: direpresentasikan vector atau skalar?

Dalam teks mining, ada learning method yang memproses teks sebagai vector (vector space model) seperti Rocchio dan kNN, ada juga yang merepresentasikan dlam skalar seperti Tree dan SVM. Dengan representasi yang berbeda, pengukuran jarak/perbedaan juga berbeda. Vektor dengan sudut dan skalar dengan jarak Ecludian.

Terlepas dari keunggulan metoda pembelajaran, representasi dokumen yang  mana yang lebih baik?