shinta marlinda kusumaningratri · vision untuk implementasi optical character recognition (ocr)...
TRANSCRIPT
SKRIPSI
ANALISIS PERBANDINGAN LIBRARY TESSERACT DAN LIBRARY
MOBILE VISION UNTUK IMPLEMENTASI OPTICAL CHARACTER
RECOGNITION (OCR) PADA HURUF DAN ANGKA BERBASIS
ANDROID
SHINTA MARLINDA KUSUMANINGRATRI
Nomor Mahasiswa : 145410101
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
AKAKOM
YOGYAKARTA
2017
i
SKRIPSI
ANALISIS PERBANDINGAN LIBRARY TESSERACT DAN
LIBRARY MOBILE VISION UNTUK IMPLEMENTASI
OPTICAL CHARACTER RECOGNITION (OCR) PADA HURUF
DAN ANGKA BERBASIS ANDROID
Diajukan sebagai salah satu syarat untuk menyelesaikan studi jenjang
strata satu (S1)
Program Studi Teknik Informatika
Sekolah Tinggi Manajemen Informatika dan Komputer
Akakom
Yogyakarta
Disusun Oleh
SHINTA MARLINDA KUSUMANINGRATRI
Nomor Mahasiswa : 145410101
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
AKAKOM
YOGYAKARTA
2017
i
ii
iii
HALAMAN PERSEMBAHAN
Alhamdulillahirabbil’alamin.
Niat, kerja keras, ketekunan serta do’a yang saya curahkan untuk menyelesaikan
karya tulis ini, dengan bangga dan kerendahan hati saya persembahkan kepada :
Kedua orang tua saya, Bapak Drs. Mujiyo Latif Jauhari dan Ibu Rosidah yang
telah memberikan dukungan moril maupun materi, yang cinta dan kasihnya tak
pernah habis untuk saya, yang selalu menyebut nama saya disetiap do’anya, tiada
kata seindah do’a dan tiada do’a yang paling khusuk selain do’a yang terucap dari
kedua orang tua. Semoga ini menjadi langkah awal untuk membuat Bapak dan Ibu
bahagia karena diri ini sadar selama ini belum bisa banyak berbuat lebih, kalian
adalah orang tua terbaik. Terimakasih, Bapak. Terimakasih, Ibu.
Bapak / Ibu Dosen yang telah tulus dan ikhlas mendedikasikan waktunya untuk
memberikan ilmu yang bermanfaat bagi saya, Ibu Sri Redjeki, S.Si., M.Kom.
selaku dosen pembimbing saya yang telah memberikan bimbingan, pengarahan,
ilmu dan nasihat dalam penyelesaian karya tulis ini.
Adik yang saya sayangi, Galih Fachrudin Priyambodo yang selalu memberikan
dukungan, semangat, senyum dan do’anya untuk keberhasilan ini.
Seseorang yang saya kasihi, Rizki Maulana, S.Kom. yang selalu memberikan
semangat serta waktunya, yang selalu sabar dan menjadi pendengar yang baik
sehingga saya dapat menyelesaikan tugas akhir ini.
Seluruh sahabat dan teman-teman seperjuangan, terimakasih untuk canda tawa,
tangis dan perjuangan yang telah kita lewati bersama serta kenangan manis yang
terukir selama ini, semoga kita dapat berjumpa lagi dengan kesuksesan yang telah
tercapai. Dan kepada Almamater saya, STMIK AKAKOM Yogyakarta yang telah
menaungi saya dalam menuntut ilmu, semoga ilmu yang telah diperoleh dapat
bermanfaat, aamiin ya rabbal’alamin.
iv
MOTTO
“Boleh jadi kamu membenci sesuatu, padahal ia amat baik bagimu. Dan boleh jadi
kamu mencintai sesuatu, padahal ia amat buruk bagimu. Allah Maha mengetahui
sedangkan kamu tidak mengetahui”.
(Q.S. Al-Baqarah : 216)
v
INTISARI
Optical Character Recognition (OCR) adalah salah satu bidang ilmu pada
Image Processing. Pengembangan OCR saat ini banyak menggunakan library,
diantaranya adalah Tesseract dan Mobile Vision (MV), namun masih sedikit
karya tulis ilmiah yang membahas dan membandingkan keduanya dari berbagai
inidikator.
Tugas akhir ini bertujuan untuk melakukan analisis perbandingan
Tesseract dan MV untuk implementasi OCR pada huruf dan angka. Indikator yang
digunakan adalah waktu, ketepatan, kebutuhan memori dan resolusi citra dengan
20 citra cetak (10 berwarna, 10 grayscale) dan 20 citra tulis tangan (10 berwarna,
10 grayscale).
Dari hasil pengujian, Tesseract membutuhkan waktu pemrosesan lebih
lama dibandingkan MV. Tesseract mempunyai ketepatan 100% untuk citra cetak
sedangkan MV mempunyai ketepatan 100% citra cetak berwarna, 98% citra cetak
grayscale. Pada citra tulis tangan, MV mempunyai ketepatan lebih tinggi (82%
tulis tangan berwarna, 83% tulis tangan grayscale) dibandingkan Tesseract (64%
tulis tangan berwarna, 68% tulis tangan grayscale). Penggunaan memori MV
lebih banyak dibandingkan Tesseract. Minimum resolusi membaca citra dengan
ketepatan 100% Tesseract lebih tinggi (270x202px cetak berwarna, 342x256px
cetak grayscale, 234x175px tulis tangan berwarna, 208x156px tulis tangan
grayscale) dibandingkan MV (159x119px cetak warna, 209x157px cetak
grayscale, 87x66px tulis tangan berwarna, 83x62px tulis tangan grayscale).
Kata Kunci : Android, Mobile Vision, OCR (Optical Character Recognition),
Tesseract.
vi
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa, berkat
rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan tugas akhir ini
yang berjudul Analisis Perbandingan Library Tesseract Dan Library Mobile
Vision Untuk Implementasi Optical Character Recognition (OCR) Pada Huruf
Dan Angka Berbasis Android.
Penulisan tugas akhir ini tidak terlepas dari bantuan berbagai pihak, oleh
karena itu pada kesempatan ini penulis ingin menyampaikan rasa terima kasih
kepada semua pihak yang telah membantu dalam penulisan tugas akhir ini, antara
lain :
1. Bapak Cuk Subiyantoro, S.Kom., M.Kom., selaku Ketua Sekolah Tinggi
Manajemen Informatika dan Komputer AKAKOM Yogyakarta.
2. Bapak Ir. M. Guntara, M.T. selaku Ketua Jurusan Teknik Informatika Jenjang
Strata Satu (S1) di Sekolah Tinggi Manajemen Informatika dan Komputer
AKAKOM Yogyakarta.
3. Ibu Sri Redjeki, S.Si., M.Kom., selaku dosen pembimbing yang dengan sabar
memberikan bimbingan, pengarahan, ilmu, waktu, dan semangat kepada saya
dalam penyusunan tugas akhir ini.
4. Ibu Dini Fakta Sari, S.T., M.T. selaku dosen narasumber yang telah
memberikan bimbingan dan arahan kepada saya dalam pengerjaan metode
pada tugas akhir yang saya buat.
vii
5. Bapak Danny Kriestanto, S.Kom., M.Eng. selaku dosen narasumber yang
memberikan bimbingan dalam penyusunan tugas akhir saya.
6. Seluruh dosen dan staff karyawan Sekolah Tinggi Manajemen Informatika
dan Komputer AKAKOM Yogyakarta.
7. Terimakasih kepada kedua Orang Tua, kepada adik saya, Galih Fachrudin
Priyambodo yang selalu memberikan semangat dan waktunya. Jati, Lauren,
Anis, Heppy, Agata, Silpi, Tria, Arum dan seluruh sahabat Kos Garden serta
teman-teman yang tidak bisa saya sebutkan satu persatu namanya didalam
naskah tugas akhir saya. Dan yang banyak memberikan masukan, semangat
dan waktunya dalam penyusunan tugas akhir ini, Rizki Maulana,S.Kom.
Penulis menyadari bahwa Tugas Akhir ini jauh dari sempurna, oleh karena itu
kritik dan saran yang bersifat membangun sangatlah diharapkan. Semoga hasil
karya tulis ini bisa memberikan manfaat bagi semua pihak.
Yogyakarta, 12 Desember 2017
Penulis
viii
DAFTAR ISI
HALAMAN JUDUL ...................................................................................... i
HALAMAN PERSETUJUAN ...................................................................... ii
HALAMAN PENGESAHAN ........................................................................ iii
HALAMAN PERSEMBAHAN .................................................................... iv
HALAMAN MOTO ....................................................................................... v
INTISARI ....................................................................................................... vi
KATA PENGANTAR .................................................................................... vii
DAFTAR ISI ................................................................................................... ix
DAFTAR GAMBAR ...................................................................................... xii
DAFTAR TABEL .......................................................................................... xiv
BAB I PENDAHULUAN ............................................................................... 1
1.1. Latar Belakang ............................................................................ 1
2.1. Rumusan Masalah....................................................................... 2
3.1. Ruang Lingkup ........................................................................... 2
4.1. Tujuan Penelitian ........................................................................ 3
5.1. Manfaat Penelitian ...................................................................... 4
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI ............................. 5
2.1. Tinjauan Pustaka .......................................................................... 5
2.2. Dasar Teori .................................................................................. 6
2.2.1. Pengenalan Pola ............................................................... 6
2.2.2. OCR (Optical Character Recognition) ............................. 6
ix
2.2.3. Tesseract ............................................................................ 7
2.2.4. Mobile Vision .................................................................... 11
2.2.5. Sistem Operasi Android .................................................... 12
2.2.6. UML (Unified Modeling Language) ................................. 12
BAB III ANALISIS DAN PERANCANGAN SISTEM .............................. 13
3.1. Analisis Sistem ............................................................................ 13
3.1.1. Kebutuhan Data ................................................................ 13
3.1.2. Kebutuhan Input ................................................................ 14
3.1.3. Kebutuhan Proses .............................................................. 14
3.1.4. Kebutuhan Output ............................................................. 14
3.1.5. Kebutuhan Perangkat Lunak ............................................. 15
3.1.6. Kebutuhan Perangkat Keras .............................................. 15
3.2. Perancangan Sistem ..................................................................... 15
3.2.1. Use Case Diagram ............................................................ 15
3.2.2. Activity Diagram ............................................................... 16
3.2.3. Sequence Diagram ............................................................ 18
3.2.4. Class Diagram .................................................................. 19
3.3. Perancangan Antar Muka ............................................................ 20
BAB IV IMPLEMENTASI DAN PEMBAHASAN SISTEM .................... 23
4.1. Implementasi Sistem .................................................................... 23
4.1.1. Potongan Program untuk Menambah Library pada
Project .............................................................................. 23
x
4.1.2. Potongan Program untuk Mengambil Citra dari Kamera
atau Gallery ....................................................................... 24
4.1.3. Potongan Program untuk Melakukan Perubahan Rotasi
dan Pemotongan Citra ....................................................... 25
4.1.4. Potongan Program untuk Konversi Citra ke Bitmap ......... 25
4.1.5. Potongan Program untuk Proses OCR Tesseract .............. 26
4.1.6. Potongan Program untuk Proses OCR Mobile Vision ...... 27
4.1.7. Potongan Program untuk Penghitungan Penggunaan
Waktu ................................................................................ 29
4.2. Pembahasan Sistem ..................................................................... 29
4.2.1. Tampilan Sistem ................................................................ 29
4.2.2. Persiapan pada Smartphone .............................................. 35
4.2.3. Pengujian Waktu Proses OCR .......................................... 36
4.2.4. Pengujian Ketepatan Hasil OCR ....................................... 38
4.2.5. Pengujian Kebutuhan Memori Proses OCR ...................... 41
4.2.6. Pengujian Resolusi Citra ................................................... 43
4.2.7. Perbandingan Hasil Uji ..................................................... 52
BAB V KESIMPULAN DAN SARAN ......................................................... 54
5.1. Kesimpulan .................................................................................. 54
5.2. Saran ............................................................................................ 57
DAFTAR PUSTAKA ..................................................................................... 59
LAMPIRAN-LAMPIRAN
xi
DAFTAR GAMBAR
Gambar 2.1. Arsitektur Tesseract OCR Engine (Smith, 2009) ........................ 8
Gambar 3.1. Use Case Diagram ...................................................................... 16
Gambar 3.2. Activity Diagram ......................................................................... 17
Gambar 3.3. Sequence Diagram ...................................................................... 18
Gambar 3.4. Class Diagram............................................................................. 19
Gambar 3.5. Halaman Utama untuk Memilih Citra ......................................... 20
Gambar 3.6. Halaman untuk Memilih Penggunaan Library ............................ 21
Gambar 3.7. Halaman untuk Pemrosesan Citra per Library ............................ 21
Gambar 3.8. Halaman Untuk Pemrosesan Citra dua Library .......................... 22
Gambar 4.1. Potongan Program untuk Menambah Library pada Project ....... 23
Gambar 4.2. Potongan Program untuk Mengambil Citra dari Kamera atau
Gallery ............................................................................................................. 24
Gambar 4.3. Potongan Program untuk Melakukan Perubahan Rotasi dan
Pemotongan Citra ............................................................................................ 25
Gambar 4.4. Potongan Program untuk Mengkonversi Citra ke Bitmap .......... 25
Gambar 4.5. Potongan Program untuk Proses OCR Tesseract ........................ 26
Gambar 4.6. Potongan Program untuk Proses OCR Mobile Vision ................ 27
Gambar 4.7. Ilustrasi Segmen Pengenalan Teks Mobile Vision ...................... 28
Gambar 4.8. Potongan Program untuk Penghitungan Penggunaan Waktu ...... 29
Gambar 4.9. Halaman Awal ............................................................................. 30
Gambar 4.10. Halaman Ambil Citra ................................................................ 30
xii
Gambar 4.11. Halaman Edit Citra .................................................................... 31
Gambar 4.12. Halaman Pemilihan Library ...................................................... 31
Gambar 4.13. Halaman Pemrosesan Library Tesseract ................................... 32
Gambar 4.14. Halaman Pemrosesan Library Mobile Vision ........................... 32
Gambar 4.15. Halaman Pemrosesan Kedua Library ........................................ 33
Gambar 4.16. Pengambilan Data Kebutuhan Memori ..................................... 33
Gambar 4.17. Save Data Latih Library Tesseract di Storage Smartphone ...... 35
Gambar 4.18. Grafik Penggunaan Waktu Proses OCR.................................... 37
Gambar 4.19. Output Uji Citra Cetak Warna Kata Ke-2 ................................. 39
Gambar 4.20. Grafik Hasil Uji Ketepatan (Akurasi) ....................................... 40
Gambar 4.21. Grafik Hasil Uji Kebutuhan Memori ........................................ 43
Gambar 4.22. Grafik Hasil Uji Resolusi Citra Cetak Warna ........................... 45
Gambar 4.23. Grafik Hasil Uji Resolusi Citra Cetak Grayscale ..................... 47
Gambar 4.24. Grafik Hasil Uji Resolusi Citra Tulis Tangan Warna ............... 49
Gambar 4.22. Grafik Hasil Uji Resolusi Citra Tulis Tangan Grayscale ......... 51
xiii
DAFTAR TABEL
Tabel 2.1. Perbandingan Metode Penelitian .................................................... 5
Tabel 4.1. Hasil Uji Lama Waktu Proses OCR ................................................ 36
Tabel 4.2. Hasil Uji Ketepatan OCR Citra Cetak ............................................ 38
Tabel 4.3. Hasil Uji Ketepatan OCR Citra Tulis Tangan ................................ 39
Tabel 4.4. Hasil Uji Kebutuhan Memori Citra Cetak ...................................... 41
Tabel 4.5. Hasil Uji Kebutuhan Memori Citra Tulis Tangan .......................... 42
Tabel 4.6. Hasil Uji Resolusi Citra Cetak Berwarna ....................................... 44
Tabel 4.7. Hasil Uji Resolusi Citra Cetak Grayscale....................................... 46
Tabel 4.8. Hasil Uji Resolusi Citra Tulis Tangan Berwarna............... 48
Tabel 4.9. Hasil Uji Resolusi Citra Tulis Tangan Grayscale .............. 50
Tabel 4.10. Hasil Perbandingan Uji Waktu, Ketepatan, Kebutuhan Memori
dan Resolusi Citra pada Library Tesseract dan Library Mobile
Vision ............................................................................................ 52