Thursday, December 11, 2008

diskusi summarization

Setiap Kamis pagi dan Selsa sore saya ketemu dengan tim penelitian text summarization (Nur, Febi, Husnul, Devi dan kemungkinan sebentar lagi bertambah beberapa mahasiswa). Kosentrasi utama sekarang adalah "graph-based for ranking summarization" Ide dasarnya adalah menerapkan PageRank untuk summarization. pelopor teknik ini adlaah LexRank dan TextRank.

Diskusi tadi pai al. membahas.

* apa perbedaan LexRank dengan TextRank?

Pada paper LexRank ada tida teknik: pertama yang sederhana, kedua menggunakan PageRank, ketiga continuos. Yang paling utama adalah yang kedua. Dari konsep yang disampaikan pada tulisan LexRank dan pada tulisan TextRank pebedaanya hanyalah: LexRank untuk multi-document dan Textrank untuk single-document. Pada implementasinya untuk mengatasi tantangan informasi ganda untuk multi-document, LexRank menerapkan juga "reranker" setalah dilakukan perankingan menggunakan "PageRank-based". Kemudian juga pada paper LexRank ada tambahan informasi bagaimana PageRank direpresentasikan menggunakan matriks. Dengan representasi matriks operasi dan implementasinya bisa terbantu/lebih mudah.

* beberapa kemungkinan untuk memperbaiki akurasi LexRank dan TextRank.

* timestamp graph.

* evaluasi menggunakan Rouge.