C ++ Tipuri de caractere - dummies - Finanțe personale 2024

Video: Tutorial, curs video c++ - Tipuri de date caracter si sir(string) 2024

Variabila standard de caractere în C ++ este de 1 octet și nu poate ocupa decât 255 de caractere diferite. Acest lucru este suficient pentru limbile europene, dar nu suficient de mare pentru a se ocupa de limbile bazate pe simboluri, cum ar fi kanji.

Au apărut mai multe standarde pentru a extinde setul de caractere pentru a face față cerințelor acestor limbi. UTF-8 utilizează un amestec de caractere de 8, 16 și 32 de biți pentru a implementa aproape fiecare kanji sau hieroglific pe care vă puteți gândi, dar rămâneți compatibil cu ASCII simplu pe 8 biți. UTF-16 utilizează un amestec de caractere de 16 și 32 de biți pentru a obține un set de caractere extins, iar UTF-32 utilizează 32 de biți pentru toate caracterele.

UTF reprezintă formatul Unicode Transformation Format, de unde devine porecla obișnuită Unicode.

Tabelul descrie diferitele tipuri de caractere suportate de C ++. La început, C ++ a încercat să treacă printr-un tip de caracter larg definit vag, wchar_t. Acest tip a fost conceput pentru a fi tipul de caractere de tip larg, originar din mediul programului aplicației. C ++ 11 a introdus tipuri specifice pentru UTF-16 și UTF-32.

Caracterele ASCII sau UTF-8 wcar_t Tipurile de caractere C ++ Caracterul în format mare char_16t u'c ' Caracterul UTF-16 char_32t U'c' UTF-16 este codificarea standard pentru aplicațiile Windows. Tipul wchar_t se referă la UTF-16 din codul:: Blocks / gcc compiler.

Orice tip de caractere din tabel poate fi combinat si in siruri de caractere:

wchar_t * wideString = L "acesta este un sir lat";