Setiap Kamis pagi dan Selsa sore saya ketemu dengan tim penelitian text summarization (Nur, Febi, Husnul, Devi dan kemungkinan sebentar lagi bertambah beberapa mahasiswa). Kosentrasi utama sekarang adalah "graph-based for ranking summarization" Ide dasarnya adalah menerapkan PageRank untuk summarization. pelopor teknik ini adlaah LexRank dan TextRank.
Diskusi tadi pai al. membahas.
* apa perbedaan LexRank dengan TextRank?
Pada paper LexRank ada tida teknik: pertama yang sederhana, kedua menggunakan PageRank, ketiga continuos. Yang paling utama adalah yang kedua. Dari konsep yang disampaikan pada tulisan LexRank dan pada tulisan TextRank pebedaanya hanyalah: LexRank untuk multi-document dan Textrank untuk single-document. Pada implementasinya untuk mengatasi tantangan informasi ganda untuk multi-document, LexRank menerapkan juga "reranker" setalah dilakukan perankingan menggunakan "PageRank-based". Kemudian juga pada paper LexRank ada tambahan informasi bagaimana PageRank direpresentasikan menggunakan matriks. Dengan representasi matriks operasi dan implementasinya bisa terbantu/lebih mudah.
* beberapa kemungkinan untuk memperbaiki akurasi LexRank dan TextRank.
* timestamp graph.
* evaluasi menggunakan Rouge.