Jumat, 19 Oktober 2012

tugas IR



NAMA  : LUSI DHESI SUSANTI
NIM      : 10011845
KELAS   : A

DOKUMEN 1
Tokenisasi
Case
folding
Filtering
Stop-Word
Removal
Steeming
Tips
tips
tips
tips
tips
Sehat
sehat
sehat
sehat
sehat
meningkatkan
meningkatkan
meningkatkan
meningkatkan
ningkat
Berat
berat
berat
berat
berat
Badan
badan
badan
badan
badan
Alami
alami
alami
alami
alami
Memiliki
memiliki
memiliki
memiliki
milik
Didambakan
didambakan
didambakan
didambakan
damba
Setiap
setiap
setiap
orang
orang
Orang
orang
orang
solusi
solusi
Solusi
solusi
solusi
di internet
internet
Banyak
banyak
banyak
malas
malas
di-internet
di-internet
di internet
dilakukan
laku
Kadang
kadang
kadang


Malas
malas
malas


Dilakukan
dilakukan
dilakukan



DOKUMEN 2
Tokenisasi
Case
folding
Filtering
Stop-Word
Removal
Steeming
Sebenarnya,
Sebenarnya,
Sebenarnya
penyebab
penyebab
Penyebab
penyebab
penyebab
berat
berat
Berat
berat
berat
terjadi
jadi
Badan
badan
badan
pola
pola
Bisa
bisa
bisa
makan
makan
Terjadi
terjadi
terjadi
kurang
kurang
Karena
karena
karena
baik
baik
pola
pola
pola
berpengaruh
pengaruh
Makan
makan
makan
unsur
unsur
Kurang
kurang
kurang
genetika
genetika
Baik
baik
baik
kurus
kurus
Juga
juga
juga
kekurangan
kurang
berpengaruh
berpengaruh
berpengaruh
membuat
buat
Unsur
unsur
unsur
langsing
langsing
Genetika
genetika
genetika
ibarat
ibarat
Kurus
kurus
kurus
tulang
tulang
Kekurangan
kekurangan
kekurangan
maaf
maaf
Membuat
membuat
membuat


Tubuh
tubuh
tubuh


Terasa
terasa
terasa


Langsing
langsing
langsing


Ibarat
ibarat
ibarat


Tinggal
tinggal
tinggal


Tulang
tulang
tulang


(maaf)
(maaf)
maaf



DOKUMEN 3
Tokenisasi
Case
folding
Filtering
Stop-Word
Removal
Steeming
Kekurangan
kekurangan
kekurangan
kekurangan
kurang
berat
berat
berat
berat
pede
Badan
badan
badan
badan
sama
Membuat
membuat
membuat
kurang
teman
Terasa
terasa
terasa
pede
sebelum
Kurang
kurang
kurang
bersama
ideal
Pede
pede
pede
teman
silah
Tidak
tidak
tidak
sebelumnya
cek
Nyaman
nyaman
nyaman
idealkah

Bersama
bersama
bersama
silahkan

teman-
teman
teman-
teman
teman
teman
cek

Sebelumnya
sebelumnya
sebelumnya


Idealkah
idealkah
idealkah


Kamu
kamu
kamu


Silahkan
silahkan
silahkan


Cek
cek
cek


Disini
disini
disini



DOKUMEN 4
Tokenisasi
Case
folding
Filtering
Stop-Word
Removal
Steeming
Nah,
nah,
nah
sekarang
sekarang
sekarang
sekarang
sekarang
fokus
fokus
fokus
fokus
fokus
terlihat
lihat
untuk
untuk
untuk
ideal
ideal
terlihat
terlihat
terlihat
penampilan
nampil
ideal
ideal
ideal
bertambah
tambah
dalam
dalam
dalam
olahraga
olahraga
penampilan
penampilan
penampilan
makan
makan
Jika
jika
jika
teratur
atur
ingin
ingin
ingin


bertambah
bertambah
bertambah


olahraga
olahraga
olahraga


dan
dan
dan


makan
makan
makan


teratur
teratur
teratur




INCIDENCE INDEX

INVERTED


OVERLAP


KESIMPULAN:
Setelah melakukan text processing  dan weighting maka di simpulkan dokumen yang paling relevan adalah dokumen yang ke dua.
 

Tidak ada komentar:

Posting Komentar