Daftar Isi:
Video: Keynote (TensorFlow Dev Summit 2018) 2024
Dalam pemrograman R untuk analisis prediktif, data jenis terkadang membingungkan dengan data struktur . Setiap variabel dalam memori program memiliki tipe data. Tentu, Anda bisa lolos dengan memiliki beberapa variabel dalam program Anda dan masih dapat dikelola. Tapi itu mungkin tidak akan berjalan dengan baik jika Anda memiliki ratusan (atau ribuan) variabel; Anda harus memberi setiap variabel sebuah nama sehingga Anda dapat mengaksesnya.
Ini lebih efisien untuk menyimpan semua variabel tersebut dalam koleksi logis.
Jenis data
Seperti bahasa pemrograman lainnya, R menawarkan banyak tipe data dan struktur data. Tidak perlu menentukan jenis yang Anda tetapkan ke variabel; penafsir akan melakukan itu untukmu Namun, Anda dapat menentukan atau mengubah jenis jika diperlukan; ini disebut casting . Tiga tipe data adalah sebagai berikut:
-
Numerical: Ini adalah bilangan desimal khas Anda. Ini disebut mengapung (singkatan dari bilangan floating-point ) atau ganda dalam bahasa lain.
-
Karakter: Ini adalah senar Anda yang terbentuk dengan kombinasi huruf, karakter, dan angka. Mereka tidak dimaksudkan untuk memiliki makna numerik. Ini disebut string dalam bahasa lain.
-
Logical: TRUE atau FALSE. Selalu memanfaatkan nilai-nilai ini di R. Nilai-nilai ini disebut Boolean dalam bahasa lain.
Membandingkan serangkaian angka dengan hasil angka di interpreter mengubah string angka menjadi numerik dan kemudian melakukan perbandingan numerik.
Contoh tipe data adalah sebagai berikut: >> ijkm <- i == j # logical> n <- i == k # logical
Setelah Anda menjalankan baris kode tersebut, Anda dapat menemukan nilai dan tipe dengan menggunakan fungsi str (). Operasi itu terlihat seperti ini: >> str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi TRUE
The Ekspresi dalam n tugas adalah contoh penafsir untuk sementara mengubah tipe data k menjadi numerik untuk melakukan evaluasi antara numerik i dan karakter k.
Struktur data
R memerlukan tempat untuk menyimpan kelompok tipe data agar bisa bekerja dengan efisien. Ini disebut
struktur data
. Contoh kehidupan nyata dari konsep ini adalah garasi parkir: Ini adalah struktur yang menyimpan mobil secara efisien. Ini dirancang untuk memarkir mobil sebanyak mungkin, dan memungkinkan mobil masuk secara efisien dan keluar dari struktur.Selain itu, tidak ada benda lain selain mobil yang harus diparkir di tempat parkir. Struktur data meliputi:
Vectors:
Vektor menyimpan satu set nilai dari satu tipe data. Anggap saja itu sebagai kotak pil mingguan. Setiap kompartemen di dalam kotak pil hanya bisa menyimpan jenis objek tertentu. Setelah Anda memasukkan beberapa pil ke salah satu kompartemen, semua kompartemen lainnya juga harus diisi dengan pil nol atau lebih banyak pil.
-
Anda tidak bisa memasukkan koin ke dalam kotak yang sama; Anda harus menggunakan "kotak pil" yang berbeda (vektor) untuk itu. Demikian juga, begitu Anda menyimpan nomor dalam sebuah vektor, semua nilai masa depan juga harus berupa angka. Jika tidak, interpreter mengubah semua nomor Anda menjadi karakter. Matriks:
matriks
-
matriks terlihat seperti spreadsheet Excel: Intinya tabel itu terdiri dari baris dan kolom. Data mengisi sel kosong berdasarkan urutan baris atau kolom, di mana Anda menentukan kapan Anda membuat matriks. Semua kolom harus memiliki tipe data yang sama. Bingkai data:
Bingkai data mirip dengan matriks, kecuali kolom data frame dapat berisi tipe data yang berbeda. Dataset yang digunakan dalam pemodelan prediktif dimasukkan ke dalam kerangka data dan disimpan di sana untuk digunakan dalam model. Faktor
-
Faktor
-
adalah seperti sebuah vektor dengan sejumlah nilai yang berbeda. Jumlah nilai yang berbeda disebut sebagai level . Anda dapat menggunakan faktor untuk memperlakukan kolom yang memiliki nilai nilai terbatas dan dikenal sebagai nilai kategoris. Secara default, data karakter dimasukkan ke dalam kerangka data sebagai faktor. Anda mengakses vektor, matriks, dan frame data dengan menggunakan notasi array . Misalnya, Anda akan mengetik
v [5] untuk mengakses elemen kelima vektor v. Untuk matriks dua dimensi dan bingkai data, Anda memasukkan nomor baris dan nomor kolom, dipisahkan dengan tanda koma, di dalam tanda kurung siku. Misalnya, Anda mengetikkan m [2, 3] untuk mengakses baris kedua, nilai kolom ketiga untuk matriks m . Struktur data adalah subjek lanjutan dalam ilmu komputer. Untuk saat ini, kita tetap berpegang pada praktis. Ingatlah bahwa struktur data dibuat untuk menyimpan jenis data tertentu dan mereka memiliki fungsi untuk penyisipan data, penghapusan, dan pengambilan.