Nov 172012
 

Bagi yang berkutat di bidang Temu Kembali Informasi/Perolehan Informasi (Information Retrieval) biasanya memerlukan kamus kata dasar (root words) dan stopword list (atau stop list). Kata dasar semuanya pasti sudah tahu, yaitu kata yang belum mengalami perubahan kata (morfologis) seperti penambahan imbuhan awalan (prefix), akhiran (suffiix), sisipan (infix), infleksi, reduplikasi, dll. Stopword list adalah kata umum (common word) yang tidak memberikan informasi penting (yang biasanya tidak diacuhkan atau dibuang, misalnya dalam proses pembuatan indeks).

Supaya tidak kesulitan mencari-cari akhirnya saya mengunggah file-file tersebut. Kredit diberikan bagi mereka yang telah bersusah payah telah membuatnya. Ada beberapa file yang dapat diunduh, terserah mau pakai yang mana.

Kata Dasar Bahasa Indonesia

  1. File Teks  (.doc)| mirror  (.doc) | miror (.txt)
  2. Database  (.sql) | mirror (.sql di .zip)

Stopword List Bahasa Indonesia

Stopword List Bahasa Lain

Untuk stopword bahasa lain dapat diunduh di

 

Referensi

  1. Kata Dasar Bahasa Indonesia. http://liyantanto.wordpress.com/2010/12/06/kata-dasar-bahasa-indonesia/
  2. Database Kata Dasar Bahasa Indonesia. http://camilanrakyat.blogspot.com/2012/07/database-kata-dasar-bahasa-indonesia.html
  3. Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. M.S. thesis. M.Sc. Thesis. Master of Logic Project. Institute for Logic, Language and Computation. Universiteti van Amsterdam The Netherlands.
  4. Free Stop Word Lists in 23 Languages. http://www.semantikoz.com/blog/2008/04/02/free-stop-word-lists-in-23-languages/