Stemming merupakan salah satu bentuk word clustering
Stemming biasanya memotong sampai kata dasar.
Namun misalkan untuk kata aktif dan pasif apakah dapat dianggap sama?
Juga dalam word clustering: thesaurus.
Word clustering, bisa secara bahasa juga berdasarkan data.
Bagaimana peran word clustering untuk keperluan text categorization (juga yang lain)