PENERAPAN TEKNIK WEB SCRAPING PADA SITUS IMDb DENGAN NODE JS

Arif Maulana Komarudin, Asep Nurul Huda, Doni Agistira

Abstract


Web Scraping merupakan salah satu cara untuk ekstraksi konten halaman situs. Melalui teknik ini data dapat diambil dari suatu situs tanpa harus membuka situs tersebut menggunakan browser. Internet Movie Database (https://www.imdb.com/) merupakan suatu situs yang menyediakan informasi terkait: film, acara TV, dan lainnya. Produk dan layanan IMDb dirancang untuk dapat diakses melalui situs web, perangkat seluler dan IMDb X-Ray pada perangkat Fire TV serta menawarkan saluran streaming gratis.Tujuan dari penelitian ini melakukan pengambilan data dari web target dengan menerapkan scraping. Html parsing dipilih sebagai metode scraping yang akan digunakan dalam percobaan pada penelitian ini, serta, penggunaan node.js dengan tambahan modul Cheerio. Percobaan pada penelitian ini telah berhasil mengimplementasikan teknik scraping dan mengambil data dari web target.


Full Text:

PDF (55-59)

References


M. S. Utomo, “No Title,†J. Teknol. Inf. Din. Vol., vol. 17, no. 2, pp. 147–153, 2012.

“Ruang Pers - IMDb.†[Online]. Available: https://www.imdb.com/pressroom/?ref_=helpms_ih_gi_whatsimdb. [Accessed: 18-Dec-2019].

“Mengenal Prototyping - DOT Intern - Medium.†[Online]. Available: https://medium.com/dot-intern/sdlc-metode-prototype-8f50322b14bf. [Accessed: 18-Dec-2019].

M. Turland, “No Title,†in php|architect’s Guide to Web Scraping with PHP, 2010, p. 2.

“Developer Tools - Open-Source HTML Parser.†[Online]. Available: https://blog.appseed.us/developer-tools-html-parser/. [Accessed: 18-Dec-2019].

“Node.js - Wikipedia bahasa Indonesia, ensiklopedia bebas.†[Online]. Available: https://id.wikipedia.org/wiki/Node.js. [Accessed: 18-Dec-2019].

“cheerio | Implementasi inti jQuery cepat, fleksibel, dan ramping yang dirancang khusus untuk server.†[Online]. Available: https://cheerio.js.org/. [Accessed: 18-Dec-2019].




DOI: https://doi.org/10.37058/jssainstek.v8i2.6371

Refbacks

  • There are currently no refbacks.