Friday, November 21, 2008

ide riset: word clustering untuk bahasa Indonesia

Stemming merupakan salah satu bentuk word clustering

Stemming biasanya memotong sampai kata dasar.

Namun misalkan untuk kata aktif dan pasif apakah dapat dianggap sama?

Juga dalam word clustering: thesaurus.

Word clustering, bisa secara bahasa juga berdasarkan data.



Bagaimana peran word clustering untuk keperluan text categorization (juga yang lain)