Thursday, October 30, 2008

TextRank

Barusan diskusi summarization dengan Nur. Dia penelitiannya summarization dengan graph-based.....

TextRank (TextRank: Bringing Order into Texts) merupakan sebuah teknik yang dibuat untuk meranking kalimat dalam dokumen(atau kumpulan dokumen). Teknik ini adalah sebuah teknik graph-based. Salah satu aplikasi dari pemberian peringkat ini adalah untuk untuk peringkasan dokumen atau sentence extraction.

Ide TextRank berasal dari PageRank (The PageRank citation ranking: Bringing order to the Web) yang dipakai untuk memberi peringkat web page oleh banyak search engine.

Nur sudah membuat contoh penghitungan PageRank dengan Excel. xls. ppt

Slides: pptx

Namun di paper TextRank tidak disebutkan bagaimana cara membuat arahnya edge-nya.

Tampaknya untuk TextRank (dan juga LexRank) lebih ke undirected graph. Dengan undirected graph penghitungan ranking juga menjadi lebih mudah. Di sini tidak ada in link ataupun out link.

Contoh penghitungan undirected graph untuk TextRank juga sudah dubuat oleh Nur .xls