Panduan Semalt Pada Ekstensi Scraper Untuk Chrome

Agar setiap bisnis dapat bertahan dan pada akhirnya tumbuh, perlu untuk tetap unggul dari para pesaingnya dan berbagai risiko. Membuat keputusan berdasarkan data analitis adalah cara yang pasti untuk melupakan masalah ini. Data semacam itu dapat diperoleh melalui scrapping data. Di situlah ekstensi scraper mudah untuk Chrome masuk: itu tidak hanya akan memfasilitasi proses pengambilan data tetapi juga memungkinkan untuk mengikis saat bepergian tanpa penyiapan yang rumit.

Cara menggunakan Scraper

    1. Hal pertama yang perlu Anda lakukan adalah menginstal ekstensi, jadi pergilah ke toko web chrome, cari "scraper" dan klik add to Chrome.

    2. Arahkan ke situs web tempat Anda ingin mengorek data , tandai entri yang Anda minati dengan menyorotnya. Klik kanan padanya dan pilih "gesek serupa" pada menu yang muncul.

    3. Melakukannya akan meluncurkan jendela konsol scraper terpisah. Di sini, Anda akan melihat daftar data yang dikikis .

    4. Untuk menyimpan konten, klik "save to Google docs," ini akan secara otomatis mengekspor data ke Google spreadsheet.

Kerokan yang diperpanjang

Jika Anda berencana untuk mengikis lebih banyak data, Anda dapat menggunakan pendekatan lanjutan. Catatan, akan jauh lebih mudah untuk bekerja dengan alat ini jika Anda memiliki pengetahuan tentang HTML. Misalkan Anda ingin mengikis data dari sumber yang memiliki arsip berdasarkan data deret waktu. Dalam kasus seperti itu, jika Anda mencoba metode yang dijelaskan di atas, Anda akan mendapatkan data yang kacau.

Untuk mengatasi masalah ini, Anda dapat menggunakan bahasa permintaan HTML dan XML yang dikenal sebagai XPath. Apa fungsinya? XPath mengenali data tentang elemen-elemen berbeda yang terkandung dalam setiap seleksi. Berikut ini adalah panduan tentang cara melakukannya:

1. Pergi ke konsol Scraper, di kiri atas Anda akan melihat tombol "XPath", klik di atasnya dan lanjutkan untuk merakit tabel awal.

2. Anda perlu menulis XPath untuk elemen yang tepat. XPath saat ini yang mencakup seluruh informasi akan ditampilkan dalam format seperti ini "// div [3] / div [3] / div [2] / div". Elemen <div> akan dikenali dalam dokumen HTML oleh komputer.

3. Untuk memisahkan data yang dikenali, Anda harus menggunakan kolom Scraper. Untuk melakukannya, Anda perlu mencari berbagai jenis informasi yang Anda miliki. Bergantung pada data yang Anda gores, Anda mungkin memiliki judul. Judul-judul ini ada di sebelah setiap set data. Mereka disertai dengan tag, dalam hal ini, tag <b>.

4. Menggunakan elemen inspeksi, cari dan tambahkan tag <b> ke XPath Anda. Sekarang Anda dapat memberi label pada kolom pertama ini sebagai "kolom judul" karena akan mencantumkan judulnya. Lanjutkan untuk membuat XPath yang berbeda untuk setiap kolom yang Anda butuhkan.

5. Klik pada gesekan dan ekstensi akan secara otomatis memanen data dan mengaturnya ke dalam kolom berbeda yang telah Anda atur.