Ce caractere diacritice sunt premise în domeniile .ro?
Pe lângă setul de caractere ASCII permise în numele de domenii (caracterele alfanumerice a-x 0-9 și caracterul cratimă “-“), următoarea tabelă conține diacriticele românești permise în înregistrarea domeniilor .ro, și anume:
Caracter Unicode | Code Point | Reprezentare hexazecimală UTF-8 | Reprezentare binară UTF-8 (BAZA#INTREG_BINAR) |
Descriere |
Ț | 538 | 0x21A | 2#001000011010. | latin capital letter t with comma below |
ț | 539 | 0x21B | 2#001000011011. | latin small letter t with comma below |
Ș | 536 | 0x218 | 2#001000011000. | latin capital letter s with comma below |
ș | 537 | 0x219 | 2#001000011001. | latin small letter s with comma below |
ă | 259 | 0x103 | 2#000100000011. | latin small letter a with breve |
Ă | 258 | 0x102 | 2#000100000010. | latin capital letter a with breve |
î | 238 | 0xEE | 2#11101110. | latin small letter i with circumflex |
Î | 206 | 0xCE | 2#11001110. | latin capital letter i with circumflex |
â | 226 | 0xE2 | 2#11100010. | latin small letter a with circumflex |
 | 194 | 0xC2 | 2#11000010. | latin capital letter a with circumflex |
Cu toate că tabela enumeră și caracterele majuscule, în procesul de normalizare al algoritmului Punycode acestea sunt convertite în caracterele corespondente minuscule, astfel că domeniile șanț.ro și Șanț.ro sunt echivalente deoarece au aceeași corespondență ACE xn--an-c9ak.ro. Caracterele descrise mai sus fac parte din setul de caractere Unicode numit Romanian Standard. Setul de caractere Unicode numit Romanian Legacy nu este permis în domeniile cu diacritice .ro pentru a se elimina confuzia generată de asemănarea caracterelor ş, ţ cu sedilă din standardul Romanian Legacy cu caracterele ș, ț cu virgulă dedesubt din standardul Romanian Standard. Astfel, domeniul şanţ.ro (scris cu ş, ţ cu sedilă ) este invalid.