Ce este Unicode?

Unicode este un standard în industria de calcul care permite codificarea, reprezentarea și manipularea de text exprimat în majoritatea sistemelor de scriere mondiale. Unicode alocă un număr întreg unic, numit Unicode Code Point fiecărui caracter. Modul în care acest număr este interpretat de către sistemele de calcul este definit de tipul de codificare al caracterelor, cel mai răspândit fiind UTF-8.
UTF-8 folosește pentru codificarea caracterelor un octet (caracterele ASCII) până la 4 octeți. Diacriticele românești sunt codificate în UTF-8 pe 2 sau 3 octeți.