Video: Pemrograman Dasar C++ | TIpe Data 2024
Variabel char standar di C ++ adalah selisih kurang dari 1 byte dan hanya dapat menangani 255 karakter yang berbeda. Ini cukup banyak untuk bahasa Eropa namun tidak cukup besar untuk menangani bahasa berbasis simbol seperti kanji.
Beberapa standar muncul untuk memperluas rangkaian karakter untuk menangani tuntutan bahasa-bahasa ini. UTF-8 menggunakan campuran karakter 8-, 16, dan 32-bit untuk menerapkan hampir semua kanji atau hieroglif yang dapat Anda pikirkan namun tetap kompatibel dengan ASCII 8-bit sederhana. UTF-16 menggunakan campuran karakter 16 dan 32-bit untuk mencapai set karakter yang diperluas, dan UTF-32 menggunakan 32 bit untuk semua karakter.
UTF adalah singkatan dari Unicode Transformation Format, dari mana ia mendapat nama panggilan akrab Unicode.
Tabel menggambarkan jenis karakter yang berbeda yang didukung oleh C ++. Pada awalnya, C ++ mencoba untuk mendapatkan dengan tipe karakter lebar didefinisikan samar-samar, wchar_t. Jenis ini dimaksudkan untuk menjadi tipe karakter yang luas asli lingkungan program aplikasi. C ++ '11 memperkenalkan tipe khusus untuk UTF-16 dan UTF-32.
Variabel | Contoh | Apa Itu | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
char | 'c' | karakter ASCII atau UTF-8 | wchar_t | Karakter karakter dalam format lebar | char_16t | u'c ' | karakter UTF-16 | char_32t | U'c' | karakter UTF-32 | UTF-16 adalah pengkodean standar untuk aplikasi Windows. Tipe wchar_t mengacu pada UTF-16 pada Kode:: Blocks / gcc compiler. |
wchar_t * wideString = L "ini adalah string yang lebar";