Rumah Keuangan Pribadi Bagaimana Menggunakan Regular Expressions in R - dummies

Bagaimana Menggunakan Regular Expressions in R - dummies

Video: How to use regex to scrape HTML pages 2024

Video: How to use regex to scrape HTML pages 2024
Anonim

R mendukung konsep ekspresi reguler, yang memungkinkan Anda untuk mencari pola di dalam teks. Anda mungkin tidak pernah mendengar ungkapan biasa, tapi mungkin Anda sudah familiar dengan konsep yang luas. Jika Anda pernah menggunakan * atau? untuk menunjukkan surat apa pun dalam satu kata, berarti Anda telah menggunakan bentuk pencarian wildcard. Ungkapan biasa mendukung gagasan wildcard dan masih banyak lagi.

Ekspresi reguler memungkinkan tiga cara membuat pola pencarian lebih umum daripada ekspresi tunggal dan tetap:

  • Alternatif: Anda dapat mencari contoh dari satu pola atau pola lainnya, ditunjukkan oleh | simbol. Misalnya pantai | beech cocok dengan beech beach dan .

    Pada keyboard Inggris dan Amerika Inggris, Anda biasanya dapat menemukan tombol | pada tombol yang sama seperti garis miring terbalik ().

  • Pengelompokan: Pola kelompok Anda bersama-sama menggunakan tanda kurung (). Misalnya Anda menulis be (a | e) ch untuk menemukan beech beach dan .

  • Quantifiers: Anda menentukan apakah elemen dalam pola harus diulang atau tidak dengan menambahkan * (terjadi nol atau berkali-kali) atau + (terjadi satu atau beberapa kali). Misalnya, untuk menemukan bach atau beech (nol atau lebih dari a dan e tapi tidak keduanya), Anda menggunakan b (e * | a *) ch.

Cobalah contoh berikut. Pertama, buat variabel baru dengan lima kata: >> rwords <- c ("bach", "back", "beech", "beach", "black")

Temukan pantai

> atau beech menggunakan pencocokan alternatif:

>> grep ("beach | beech", rwords) [1] 3 4 Ini berarti string pencarian ditemukan pada elemen 3 dan 4 rwords. Untuk mengekstrak elemen sebenarnya, Anda dapat menggunakan subsetting dengan tanda kurung siku: >> rwords [grep ("beach | beech", rwords)] [1] "beech" "beach"

Sekarang gunakan aturan pengelompokan untuk mengekstrak kata yang sama: >> rwords [grep ("be (a | e) ch", rwords)] [1] "beech" "beach"
Terakhir, gunakan modifikasi pengukur untuk mengekstrak

bach < dan

beech

tapi tidak

pantai:

rwords [grep ("b (e * | a *) ch", rwords)] [1] "bach" "beech" > Untuk menemukan lebih banyak bantuan dalam R tentang ekspresi reguler, lihat halaman Bantuan? regexp. Beberapa sumber hebat lainnya untuk belajar lebih banyak tentang ekspresi reguler adalah Wikipedia dan, di mana Anda dapat menemukan panduan dan tutorial ringkas.

Bagaimana Menggunakan Regular Expressions in R - dummies

Pilihan Editor

Bagaimana Memeriksa Kinerja Sistem dengan AWS - dummies

Bagaimana Memeriksa Kinerja Sistem dengan AWS - dummies

AWS (Amazon Web Services) memberi Anda sejumlah metode untuk memantau layanan AWS-spesifik. Namun, Anda mungkin memiliki masalah kinerja sistem yang mendasarinya atau masalah aplikasi non-AWS yang harus dihadapi, yang berarti memiliki alat yang dapat bekerja di luar AWS. Paket grup Alat Kinerja berisi sejumlah alat khusus Linux untuk menyelesaikan tugas ini ...

Bagaimana Memilih Layanan AWS yang Anda Butuhkan - kenangan sehari-hari

Bagaimana Memilih Layanan AWS yang Anda Butuhkan - kenangan sehari-hari

Ingat bahwa Anda hanya memiliki 12 bulan kebebasan Anda percobaan untuk membuat keputusan tentang layanan AWS (Amazon Web Services) yang akan digunakan dalam bisnis Anda. Dua belas bulan mungkin tampak seperti banyak waktu, tapi Anda akan mendapati bahwa itu menguap di depan mata Anda saat Anda mencoba menyulap tanggung jawab, pertemuan, dan pertemuan sehari-hari Anda ...

Amazon Web Services For Dummies Cheat Sheet - dummies

Amazon Web Services For Dummies Cheat Sheet - dummies

Amazon Web Services (AWS) adalah penyedia layanan cloud yang menawarkan akses mudah ke berbagai sumber daya komputasi yang berguna, semuanya ditawarkan secara on-demand, dengan biaya yang efektif. Jika Anda seorang praktisi IT yang siap untuk merangkul Amazon Web Services, matikan kebiasaan desain aplikasi lama Anda dan terapkan pendekatan baru yang memanfaatkan karakteristik AWS dan ...

Pilihan Editor

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

Ketika Anda mencapai bagian Sains GED, Anda akan diharapkan memiliki pengetahuan umum di semua cabang Ilmu Pengetahuan, termasuk Ilmu Fisika. Berikut adalah contoh jenis pertanyaan yang mungkin Anda hadapi pada hari ujian. Kecepatan dan Kecepatan Ada perbedaan antara kecepatan dan kecepatan, meskipun terkadang Anda ...

Latihan GED RLA: Reading Comprehension - dummies

Latihan GED RLA: Reading Comprehension - dummies

Cara terbaik untuk mempersiapkan bagian pemahaman bacaan GED Tes RLA adalah melakukan sebanyak mungkin pertanyaan latihan. Simak sampel untuk melihat apa yang akan Anda hadapi pada hari ujian. Contoh Pertanyaan Pertanyaan 1-6 mengacu pada bagian berikut. Fasilitas untuk Akses ke Perusahaan Kreatif (FACE) Awalnya didirikan ...

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

Komponen bacaan Penalaran meskipun Bahasa Seni Bagian pada GED terdiri dari kutipan dari fiksi dan nonfiksi. Setiap kutipan diikuti oleh beberapa item pilihan berdasarkan bahan bacaan. Untuk pertanyaan di bagian ini, pilih satu jawaban terbaik untuk setiap pertanyaan. Bekerja dengan hati-hati, tapi jangan terlalu banyak menghabiskan waktu ...

Pilihan Editor

Bagaimana NaturallySpeaking Dapat Belajar dari Email Terkirim - dummies

Bagaimana NaturallySpeaking Dapat Belajar dari Email Terkirim - dummies

Menganalisis e-mail adalah salah satu cara untuk asisten NaturallySpeaking Anda untuk membangun kosa kata Anda. Proses ini membantu dalam dua cara. Ini belajar dari gaya e-mail Anda dan secara otomatis dapat menambahkan alamat e-mail yang Anda gunakan saat ini. Ia bekerja dengan Microsoft Outlook, Outlook. com, Lotus Notes, Gmail, Yahoo! , dan Windows Live Mail. Dari Pusat Akurasi, ...

Bagaimana NaturallySpeaking Berjalan di Latar Belakang - dummies

Bagaimana NaturallySpeaking Berjalan di Latar Belakang - dummies

Secara alamiSpeaking menggunakan beberapa jendela sekaligus. Biasanya, Anda meluncurkan aplikasi, Anda mendapatkan jendela aplikasi, dan Anda bekerja di jendela itu. Akhir dari cerita. Tidak demikian halnya dengan NaturallySpeaking, dan untuk alasan yang bagus: Anda ingin bisa menggunakan input suara di banyak tempat yang berbeda, tidak hanya di satu jendela saja. Inti ...

Bagaimana menambahkan perintah teks otomatis ke nuansa profesional - dummies

Bagaimana menambahkan perintah teks otomatis ke nuansa profesional - dummies

Menambahkan Fitur baru yang hebat yang akan membuat Anda semakin produktif saat menggunakan perintah Dragon Professional Individual Anda. Ini adalah kemampuan untuk menggunakan variabel dalam perintah auto-text Anda. Jadi bagaimana anda bisa menggunakannya? Setelah Anda membuat perintah baru dan menentukan isinya sehingga Anda tidak perlu mengetik ulang ...