Întrebări Domenii cu Diacritice (IDN)

IDNA sau Internationalized Domain Names for Applications este descris în RFC 5890 și enunță metodologia prin care numele de domenii construite din caractere din afara setului de caractere ASCII (domeniu IDN) pot deveni funcționale utilizând infrastructura existentă DNS care nu poate opera în afara setului de caractere ASCII. Deoarece modul de operare al sistemului DNS nu poate fi schimbat, s-a impus găsirea unei soluții de corespondență biunivocă între numele unui de domeniu IDN și forma sa ASCII care poate fi înțeleasă și interpretată de către sistemul DNS. Forma corespondentă ASCII a unui domeniu IDN (cu diacritice) se numește ACE adică ASCII- Compatible Encoding. Această corespondență este guvernată de algoritmul Punycode care stă la baza întregului sistem IDNA. Algoritmul Punycode este descris în RFC 3492 și actualizat în RFC 5892.

Un domeniu cu diacritice (domeniu IDN) poate conține și caractere din afara setului de caractere ASCII. Mai exact, un domeniu IDN este format din caractere Unicode, care au suport pentru toate caracterele din toate limbile, inclusiv pentru cele din setul ASCII. Nu toate caracterele Unicode pot fi folosite în construirea unui nume de domeniu IDN valid. Caracterele Unicode care pot produce confuzie în utilizarea domeniilor IDN nu sunt permise în domeniile IDN. De exemplu, numele de domeniu românia.ro este un domeniu IDN format corect deoarece conține caractere Unicode permise în sistemul IDN. Forma ACE biunivocă a acestui domeniu este xn--romnia-yta.ro. Forma ACE conține numai caractere ASCII și este forma recunoscută de sistemul de nume de domenii (DNS). De precizat că domeniul cu diacritice românia.ro este diferit de domeniul fără diacritice romania.ro.

Internet-ul funcționează pe principiul client/server iar fiecare entitate, client sau server, are un rol foarte bine determinat. Prima interacțiune a unui client sau aplicație cu un domeniu IDN sau ASCII simplu este aceea de a obține adresa IP a serverului cu care încearcă să comunice, cu ajutorul sistemului DNS. În cazul numelor de domenii ASCII lucrurile se desfășoară normal, însă în cazul numelor de domenii IDN, clientul trebuie mai întâi să convertească domeniul IDN în forma sa ACE deoarece această formă este înregistrată și cunoscută de către sistemul DNS. Astfel sistemul DNS poate să “rezolve” un domeniu IDN. Aplicațiile prezintă utilizatorului domeniu în format IDN (de exemplu, românia.ro), dar în interacțiunea cu serviciul DNS se folosește forma ACE (de exemplu, xn--romnia-yta.ro).

Unicode este un standard în industria de calcul care permite codificarea, reprezentarea și manipularea de text exprimat în majoritatea sistemelor de scriere mondiale. Unicode alocă un număr întreg unic, numit Unicode Code Point fiecărui caracter. Modul în care acest număr este interpretat de către sistemele de calcul este definit de tipul de codificare al caracterelor, cel mai răspândit fiind UTF-8.
UTF-8 folosește pentru codificarea caracterelor un octet (caracterele ASCII) până la 4 octeți. Diacriticele românești sunt codificate în UTF-8 pe 2 sau 3 octeți.

ASCII (American Standard Code for Information Interchange) reprezintă o schemă de codificare a caracterelor folosite în reprezentarea textului în computere, echipamente de comunicație etc. Codul ASCII specifică modul de codificare a 128 de caractere în reprezentări binare pe 7 biți. Caracterele codificate astfel sunt numerele de la 0 la 9, literele de la 'a' la 'z' și de la 'A' la 'Z', anumite simboluri de punctuație, caractere de control și spațiu.

Punycode este algoritmul care stă la baza întregului sistem IDNA. Algoritmul Punycode este descris în RFC 3492 și actualizat în RFC 5892, fiind responsabil cu prelucrarea etichetei domeniului IDN. Prelucrarea constă în transformarea caracterelor majuscule în caractere minuscule, detectarea caracterelor care nu sunt permise în sistemul IDN, aplicarea unui calcul matematic prin care se obține forma biunivocă ACE precedată de prefixul xn-- , a domeniului IDN. Forma ACE este înregistrată în sistemul DNS care îi permite acestuia să servească domenii IDN.

Prin serviciul WHOIS, interogat pe portul 43, se poate verifica doar forma ASCII a unui domeniu cu diacritice. Răspunsul la o interogare WHOIS pe portul 43 este afișat în format ASCII. Aplicația web de tip WHOIS de la www.rotld.ro permite specificarea unui domeniu în ambele forme IDN (cu diacritice) sau ACE (cu caractere ASCII).

Ce caractere diacritice sunt premise în domeniile .ro?
Pe lângă setul de caractere ASCII permise în numele de domenii (caracterele alfanumerice a-x 0-9 și caracterul cratimă “-“), următoarea tabelă conține diacriticele românești permise în înregistrarea domeniilor .ro, și anume:

Caracter Unicode Code Point Reprezentare hexazecimală UTF-8 Reprezentare binară UTF-8 
(BAZA#INTREG_BINAR)
Descriere
Ț 538 0x21A 2#001000011010. latin capital letter t with comma below
ț 539 0x21B 2#001000011011. latin small letter t with comma below
Ș 536 0x218 2#001000011000. latin capital letter s with comma below
ș 537 0x219 2#001000011001. latin small letter s with comma below
ă 259 0x103 2#000100000011. latin small letter a with breve
Ă 258 0x102 2#000100000010. latin capital letter a with breve
î 238 0xEE 2#11101110. latin small letter i with circumflex
Î 206 0xCE 2#11001110. latin capital letter i with circumflex
â 226 0xE2 2#11100010. latin small letter a with circumflex
 194 0xC2 2#11000010. latin capital letter a with circumflex

Cu toate că tabela enumeră și caracterele majuscule, în procesul de normalizare al algoritmului Punycode acestea sunt convertite în caracterele corespondente minuscule, astfel că domeniile șanț.ro și Șanț.ro sunt echivalente deoarece au aceeași corespondență ACE xn--an-c9ak.ro. Caracterele descrise mai sus fac parte din setul de caractere Unicode numit Romanian Standard. Setul de caractere Unicode numit Romanian Legacy nu este permis în domeniile cu diacritice .ro pentru a se elimina confuzia generată de asemănarea caracterelor ş, ţ cu sedilă din standardul Romanian Legacy cu caracterele ș, ț cu virgulă dedesubt din standardul Romanian Standard. Astfel, domeniul şanţ.ro (scris cu ş, ţ cu sedilă ) este invalid.

Un nume de server poate fi creat pe un domeniu cu diacritice, conținând la rândul lui caractere diacritice. De exemplu, nș.șanț.ro este un nume de server valid. În sistemul DNS, forma sa ACE este folosită și anume, xn--n-oxa.xn--an-c9ak.ro.

Formularul de administrare domenii On-line, disponibil la www.rotld.ro, permite ambele forme de specificare a unui nameserver atât la creare cât și la atașare. Dacă la creare un nameserver IDN este specificat folosind forma ACE, trebuie să se aibă în vedere ca în urma conversiei la IDN aceasta să conțină numai diacritice românești pe lângă setul ASCII de caractere permise în numele unui domeniu.

Tehnologia IDN nu este nouă, iar multe registre au permis înregistrarea numelor de domenii de acest tip de mai mulți ani. Prin urmare browserele actuale sunt capabile să înțeleagă o adresă web folosind nume de domenii cu diacritice, atunci când este introdusă în bara de navigare. Este recomandat să se utilizeze o versiune recentă a browser-ului. Acest lucru înseamnă că, în marea majoritate a cazurilor utilizarea de "www.ștanță.ro" în loc de "www.xn--tan-cpa00lpa.ro" în bara de adrese a unui browser nu va pune nicio problemă.

Deși tehnologia nu este nouă, răspunsul este NU. În cele mai multe cazuri, puteți utiliza domenii cu diacritice la fel ca orice alt nume de domeniu, dar trebuie să vă așteptați să fiți ocazional obligați să folosiți forma sa ACE, pentru că doar această formă asigură compatibilitate completă cu toate instrumentele.

Eticheta unui nume de domeniu poate conține maxim 63 de caractere. Din acest motiv un domeniu cu diacritice trebuie mai întâi convertit la forma sa ACE pentru a calcula numărul real de caractere ASCII care compun eticheta numelui de domeniu convertit. De exemplu, numărul de caractere al domeniului IDN șanț.ro nu este 4, ci 11 ca urmare a conversiei sale la forma ACE echivalentă xn--an-c9ak.ro.

Un domeniu cu diacritice poate fi înregistrat specificându-se fie forma IDN, fie forma echivalentă ACE. Un domeniu IDN pentru zona .ro trebuie să conțină diacriticele românești pe lângă setul ASCII de caractere permise în numele unui domeniu. Dacă la înregistrare, un nume de domeniu IDN este specificat folosind forma ACE trebuie să se aibă în vedere ca în urma conversiei la IDN aceasta să conțină numai diacritice românești pe lângă setul ASCII de caractere permise în numele unui domeniu. Din această cauză, caracterul cratimă ‘-‘ este permis simultan pe pozițiile 3 și 4 numai dacă numele de domeniu începe cu ‘xn’. De exemplu, domeniul ym--exemplu.ro este invalid. La înregistrarea domeniilor pe www.rotld.ro, se pot specifica maxim 12 nume de domenii, fie în forma IDN (cu diacritice), fie în forma ACE (cu caractere ASCII).

Oricare din formele IDN sau ACE a unui Nameserver poate fi folosită în procedura de Atașare/Detașare a unui Nameserver IDN la un domeniu IDN sau ASCII în formularul de Administrare Domenii On-Line, disponibil la www.rotld.ro.

Pe factura emisă de ICI, numele de domeniu va apărea în forma ASCII, de exemplu ștanță.ro va apărea xn--tan-cpa00lpa.ro.

Pe factura proformă emisă de ICI, numele de domenii sunt specificate folosind forma IDN (cu diacritice) urmată în paranteze rotunde de forma echivalentă ACE. De exemplu, șanț.ro (xn—an-c9ak.ro).

Pentru ca browser-ul de Internet să funcționeze corect folosind domenii cu diacritice, trebuie să-l actualizați cu o versiune nouă care oferă suport pentru IDN sau să instalați un plug-in special care va permite aplicației dumneavoastră să funcționeze la parametri normali atunci când folosiți diacritice.

Un număr de domenii .ro au fost rezervate pentru administrația publică centrală și locală, incluzând nume de localități și nume de instituții publice. Aceste nume de domenii sunt ușor identificate în baza de date WHOIS de la www.rotld.ro ca având textul "Rezervat pentru Administrația Publica Centrala si Locala" la nume deținător. Numele de domenii rezervate au starea "DeleteProhibited" și nu sunt funcționale, neavând nameservere atașate. Instituția publică îndreptățită să folosească un nume de domeniu rezervat va contacta Registrul de domenii ICI-ROTLD, prin formularul de contact de la www.rotld.ro, în scopul activării domeniului sau domeniilor pe numele ei. Personalul ICI-ROTLD va analiza solicitarea respectivă și dacă cererea este îndreptățită, va trimite cheia de autorizare necesară pentru accesarea formularului on-line de la https://www-apps.rotld.ro/cereri/trade/cgi-bin/index?lang=ro, pe care reprezentantul viitorului deținător îl va completa cu datele de contact ale instituției pe care o reprezintă.

După trimiterea formularului on-line către registrul ICI-ROTLD, se vor verifica datele deținătorului, iar dacă acestea corespund, se va transmite factura proformă. După efectuarea plății se va face transferul domeniului pe numele instituției respective, iar domeniul va deveni activ și va putea fi administrat on-line cu ajutorul interfeței de la www.rotld.ro – administrare domenii – on-line.

Costul este același ca și în cazul înregistrării domeniului ASCII.