Save HTML Otomatis sambil Menjelajah Web


Ada kalanya kita ingin menyimpan setiap laman yang kita jelajahi. Biasanya yang bisa kita lakukan adalah menekan Ctrl + S. Tapi dengan menggunakan ekstensi Chrome dan script PHP berikut ini, kita bisa leluasa menjelajah web, sementara mereka bekerja menyimpan setiap laman yang telah kita buka.

Artikel ini diadaptasi dari artikel yang ditulis oleh Craige Thomas, Automatically Save HTML Of Every Page You Visit. Artikel tersebut ditulis pada tahun 2011, dan selama 3 tahun, terdapat pembaruan dalam API Google Chrome yang menyebabkan kode dalam artikel tersebut tidak lagi bisa bekerja pada versi Google Chrome terkini. Kode yang dibahas dalam artikel ini telah disesuaikan agar dapat bekerja dalam versi Google Chrome terkini (versi 36).

Kode tersebut terdiri atas 2 bagian, yakni ekstensi Google Chrome dan sebuah script PHP sederhana. Cara kerja kode tersebut pada dasarnya adalah sebagai berikut:
1. Setelah laman web dimuat, ekstensi Google Chrome mengirimkan request AJAX berisi kode HTML laman web tersebut ke file PHP dalam server lokal.
2. File PHP tersebut begitu menerima kode HTML, langsung menyimpannya dalam server lokal.

 

Instruksi Pemasangan:

1. Download kode sumber html-capturer-chrome-extension di github. Ekstrak file zip tersebut. Perhatikan bahwa di dalam file zip tersebut terdapat 2 folder, yakni “src” dan “localserver”. “src” adalah folder yang berisi file kode sumber ekstensi Google Chrome sedangkan “localserver” berisi script PHP “recv.php” yang perlu kita simpan dalam server lokal. File di luar kedua folder tersebut dapat diabaikan.

2. Install XAMPP jika belum punya dan nyalakan server Apache. Tutorial bisa dicari di internet, ini salah satu contohnya. 

3. Install Google Chrome jika belum punya.

4. Bukalah folder htdocs dalam XAMPP (biasanya di “C:\xampp\htdocs\” (Windows) atau “/opt/lampp/htdocs” (Ubuntu)). Buat folder dengan nama “capturer” di dalam folder htdocs.

5. Di dalam folder “capturer”:
5.a. masukkan file “recv.php”, dan
5.b. buat folder “Captured”.
Peringatan: Pastikan huruf kapital dan huruf kecil sesuai dengan instruksi, karena PHP dan Javascript bersifat “case-sensitive”.

6. Kini, seharusnya di dalam folder htdocs anda, ada file dan folder berikut ini:
– …\htdocs\capturer\recv.php
– …\htdocs\capturer\Captured

“recv.php” adalah script yang menerima request AJAX dari ekstensi Chrome, sedangkan “Captured” adalah folder penyimpanan file-file HTML. (nama dan lokasi file “recv.php” dan folder “Captured” bisa kita ubah nantinya dengan mengedit file “eventPage.js” dan “recv.php”, tapi saat ini sebaiknya kita ikuti instruksi dahulu :p )

7. Buka “chrome://extensions/” di Google Chrome. Pastikan kotak “Mode Pengembang” sudah tercentang. Klik “Muat ekstensi yang belum dibuka kemasannya”, akan muncul kotak dialog untuk membuka folder lokasi ekstensi.

8. Pilih folder “src” (sebagaimana di poin 1). Akan muncul “HTML Capturer” di laman “chrome://extensions/”. Pastikan “Diaktifkan” sudah tercentang.

9. Waktunya pengujian, cobalah buka sebuah laman web. Jika berhasil, maka setelah laman tersebut dibuka, akan muncul hasil simpanan laman tersebut di dalam folder “Captured”.

 

Instruksi Penggunaan:

1. Untuk mematikan fitur, cukup dengan menghapus centang “Diaktifkan” di samping “HTML Capturer” pada  “chrome://extensions/”.

2. Untuk menyalakan fitur: pastikan apache server sudah menyala dan centang  “Diaktifkan” di samping “HTML Capturer” pada  “chrome://extensions/”.

 

Kita bisa klik “Kemas Ekstensi” di laman “chrome://extensions/” agar ekstensi bisa dijalankan dalam Mode Biasa (tidak harus Mode Pengembang).

Data dalam HTML-HTML yang telah kita koleksi dalam folder “Captured” dapat kita olah menjadi informasi yang berarti. Salah satu alat yang relatif mudah digunakan untuk mengolah HTML adalah Beautiful Soup, sebuah pustaka Python untuk menarik data dari HTML. Pengolahan secara sederhana dengan Beautiful Soup In Sya Allah akan dibahas suatu saat nanti. Demikian. Semoga bermanfaat. :)

 

Referensi:

Automatically Save HTML Of Every Page You Visit.

Chrome Extension Overview

php.net

Komentar Pemirsa