Rumah Keuangan Pribadi Beralih dari model RDBMS ke HBase - dummies

Beralih dari model RDBMS ke HBase - dummies

Video: Sqoop Import and Export data from RDMBS and HDFS 2024

Video: Sqoop Import and Export data from RDMBS and HDFS 2024
Anonim

Jika Anda menghadapi fase desain untuk aplikasi Anda dan Anda yakin HBase akan sesuai, maka merancang kunci dan skema baris Anda agar sesuai dengan model dan arsitektur data HBase adalah pendekatan yang tepat Namun, terkadang masuk akal untuk memindahkan database yang awalnya dirancang untuk RDBMS ke HBase.

Skenario umum dimana pendekatan ini masuk akal adalah contoh database MySQL yang telah mencapai batas skalabilitasnya. Teknik ada untuk skala horizontal contoh MySQL ( sharding, dengan kata lain) namun proses ini biasanya tidak praktis dan bermasalah karena MySQL pada awalnya tidak dirancang untuk sharding.

denormalization, duplikasi, dan kunci cerdas (DDI) . Denormalisasi:

  • Model basis data relasional bergantung pada a) skema database yang dinormalisasi dan b) bergabung antar tabel untuk merespons operasi SQL. Normalisasi database adalah teknik yang menjaga terhadap kehilangan data, redundansi, dan anomali lainnya karena data diperbarui dan diambil.

    Ada sejumlah peraturan yang diikuti para ahli untuk sampai pada skema database yang dinormalisasi (dan normalisasi database adalah keseluruhan studi itu sendiri), namun prosesnya biasanya melibatkan pembagian tabel yang lebih besar ke dalam tabel yang lebih kecil dan hubungan yang menentukan. diantara mereka. Denormalization database adalah kebalikan dari normalisasi, dimana tabel yang lebih kecil dan lebih spesifik digabungkan ke dalam tabel yang lebih besar dan lebih umum.

    Ini adalah pola umum saat beralih ke HBase karena bergabung tidak disediakan di seluruh tabel, dan bergabung dapat menjadi lambat karena melibatkan operasi disk yang mahal. Melindungi terhadap anomali update dan retrieval sekarang menjadi tugas aplikasi klien HBase Anda, karena perlindungan yang diberikan Anda oleh normalisasi tidak berlaku dan tidak berlaku lagi.

    Duplikasi:

  • Saat Anda melakukan denormalize skema database Anda, Anda mungkin akan akhirnya menduplikat data karena dapat membantu Anda menghindari operasi baca yang mahal di beberapa tabel. Jangan khawatir tentang penyimpanan ekstra (tentu saja); Anda bisa menggunakan skalabilitas otomatis HBase untuk keuntungan Anda. Sadarilah bahwa pekerjaan ekstra itu akan diminta oleh aplikasi klien Anda untuk menduplikat data dan ingat bahwa HBase secara native hanya menyediakan operasi atomik tingkat baris bukan baris silang (dengan pengecualian yang dijelaskan dalam JASA HBASE-5229) atau lintas meja.

    Tombol Cerdas:

  • Karena data yang tersimpan dalam HBase diperintahkan oleh tombol baris, dan tombol baris adalah satu-satunya indeks asli yang disediakan oleh sistem, desain cerdas cerdas dari tombol baris dapat membuat perbedaan besar. Misalnya, kunci baris Anda bisa menjadi kombinasi dari nomor pesanan layanan dan nomor ID pelanggan yang menempatkan pesanan layanan. Desain kunci baris ini akan memungkinkan Anda mencari data yang terkait dengan pesanan layanan atau mencari data yang terkait dengan pelanggan menggunakan tombol baris yang sama di tabel yang sama. Teknik ini akan lebih cepat untuk beberapa query dan menghindari tabel mahal bergabung.

    Untuk memperjelas pola pemikiran tertentu ini, ambil tabel Informasi Kontak Pelanggan dan letakkan dalam konteks database pesanan layanan khas. Angka tersebut menunjukkan kepada Anda apa skema database pesanan layanan yang dinormalisasi.

Mengikuti aturan normalisasi RDBMS, siapkan contoh tabel Informasi Kontak Pelanggan sehingga terpisah dari tabel pesanan layanan agar tidak kehilangan data pelanggan saat pesanan layanan ditutup dan mungkin terhapus. Ambil pendekatan yang sama untuk tabel Produk, yang berarti bahwa produk baru dapat ditambahkan ke database perusahaan fiktif secara independen dari pesanan layanan.

Dengan mengandalkan operasi gabungan RDBMS, skema ini mendukung kueri yang mengungkapkan jumlah pesanan layanan yang dibuka terhadap produk tertentu dan juga lokasi pelanggan tempat produk tersebut digunakan.

Itu bagus dan keren, tapi ini adalah skema yang akan Anda gunakan dengan RDBM. Bagaimana Anda mentransisikan skema ini ke skema HBase? Angka berikutnya menggambarkan skema HBase yang mungkin - yang mengikuti pola desain DDI.

Tabel Informasi Kontak Pelanggan telah dinormalkan dengan memasukkan nama pelanggan dan info kontak sebagai pengganti kunci asing yang digunakan sebelumnya. Selain itu, datanya digandakan dengan menjaga tabel Informasi Kontak Pelanggan sebagaimana adanya. Sekarang bergabung di seluruh tabel Order Layanan dan tabel Informasi Kontak Pelanggan tidak diperlukan.

Selain itu, desain kunci baris cerdas telah digunakan yang menggabungkan nomor produk dengan nomor pelanggan untuk membentuk nomor pesanan layanan (A100 | 00001, misalnya). Dengan menggunakan kunci cerdas ini, tabel pesanan layanan dapat memberikan laporan penting tentang kekurangan produk dan pelanggan yang saat ini mengalami masalah produk.

Semua pertanyaan ini semuanya dapat didukung oleh HBase dalam mode atomik tingkat baris untuk aplikasi. Karena Anda tahu bahwa perintah baris perintah HBase dan mengurutkannya dengan cara leksikografis, aplikasi Anda dapat membuat dugaan terdidik tertentu tentang lokalitas data saat mengeluarkan pindaian untuk pelaporan. (Semua seri produk A * akan disimpan bersama-sama, misalnya.)

Database pesanan layanan yang ditunjukkan oleh skema HBase adalah contoh yang relatif sederhana, namun ini menggambarkan bagaimana HBase dapat, dalam kasus tertentu, berpotongan dengan dunia RDBMS dan memberikan nilai yang signifikan. Jika perusahaan fiktif memiliki data panggilan layanan terabyte atau bahkan petabyte untuk disimpan, HBase akan menghasilkan perbedaan besar dalam hal biaya, keandalan, kinerja, dan skala.

Anda bisa, tentu saja, merancang skema layanan pesanan Anda dalam beberapa cara yang berbeda. Diakui, desain semuanya bergantung pada kueri yang harus didukung, namun Anda memiliki kemampuan untuk mentransisikan beberapa basis data relasional ke aplikasi HBase yang sangat kuat untuk penggunaan produksi selama Anda bekerja dari pemahaman yang solid tentang arsitektur HBase dan pola desain DDI.

Contoh ini mengasumsikan bahwa kueri dilakukan oleh aplikasi Java yang memanfaatkan API klien HBase, atau mungkin melalui bahasa lain menggunakan Apache Thrift. Model aplikasi ini mungkin sesuai dengan persyaratannya saja dan memberikan pilihan kinerja dan penyesuaian yang berguna untuk perusahaan layanan fiktif.

Beralih dari model RDBMS ke HBase - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...