Video: Tutorial, curs video c++ - Tipuri de date caracter si sir(string) 2024
Variabila standard de caractere în C ++ este de 1 octet și nu poate ocupa decât 255 de caractere diferite. Acest lucru este suficient pentru limbile europene, dar nu suficient de mare pentru a se ocupa de limbile bazate pe simboluri, cum ar fi kanji.
Au apărut mai multe standarde pentru a extinde setul de caractere pentru a face față cerințelor acestor limbi. UTF-8 utilizează un amestec de caractere de 8, 16 și 32 de biți pentru a implementa aproape fiecare kanji sau hieroglific pe care vă puteți gândi, dar rămâneți compatibil cu ASCII simplu pe 8 biți. UTF-16 utilizează un amestec de caractere de 16 și 32 de biți pentru a obține un set de caractere extins, iar UTF-32 utilizează 32 de biți pentru toate caracterele.
UTF reprezintă formatul Unicode Transformation Format, de unde devine porecla obișnuită Unicode.
Tabelul descrie diferitele tipuri de caractere suportate de C ++. La început, C ++ a încercat să treacă printr-un tip de caracter larg definit vag, wchar_t. Acest tip a fost conceput pentru a fi tipul de caractere de tip larg, originar din mediul programului aplicației. C ++ 11 a introdus tipuri specifice pentru UTF-16 și UTF-32.
wchar_t * wideString = L "acesta este un sir lat";