Acest articol a fost publicat și în revista Print Magazin, nr.5 – august 2009. Din păcate, în ediția online editorul nu a ilustrat suficient articolul motiv pentru care îl postez integral mai jos.
Datorită multitudinii de soluții de navigare pe web și a configurațiilor diferite ale acestora nu garantez afișarea corectă a unor simboluri grafice din acest articol. Din acest motiv, la sfârșitul articolului există un link de download ca document PDF.
Folosirea simbolurilor specifice limbii române (a diacriticelor) a dat (și mai dă, încă) multă bătaie de cap tehnoredactorilor dar și tuturor celorlați utilizatori de calculatoare personale care culeg/utilizează un text în limba română și cu diacritice. Situația se poate complica la migrarea documentului între diferite platforme: Apple Mac OS X, Microsoft Windows, Linux.
„Nu există fonturi românești ci doar fonturi Unicode în care sunt sau nu prezente caracterele specifice limbii române” afirmă, pe bună dreptate, dl. Cristian Secară.
Lipsa de standardizare la începutul erei digitale alături de neimplicarea Academiei Române în acest domeniu dar și lipsa suportului pentru internaționalizare din partea producătorilor de sisteme de operare și de produse software pentru procesarea textului și paginare a dus la implementarea unor soluții neortodoxe la utilizarea diacriticelor românești. Nu le voi mai aminti pentru a nu crea și mai multă confuzie dar și pentru că sistemele de operare moderne, respectiv versiunile actuale al programelor pentru procesarea textului și paginare includ deja suportul Unicode pentru afișarea simbolurilor specifice mai multor limbi. Atrag doar atenția asupra faptului că în trecut fonturile au fost „românizate” într-un mod barbar prin simpla înlocuire a unor simboluri mai puțin folosite cu cele românești. Astfel simboluri ca [ { } ] \ | ` ~ ‘ ” au fost înlocuite ă Ă Î î â Â ț Ț ș Ș. Una din consecințele utilizării acestei metode de localizare este și incapacitatea de funcționare a modulelor Hyphenation și Spelling din programele utilizate pentru că, indiferent de fontul utilizat, aceste module „citeau” simbolurile originale din font și nu semnele cu care acestea au fost înlocuite.
Spre sfârșitul anilor ’90 s-a introdus standardizarea actuală Unicode. În anul 2003 și Academia Română și-a exprimat punctul de vedere legat de simbolurile grafice cu care sunt reprezentate diacriticile românești. Dacă pentru aspectul literelor ă Ă î Î â Â nu au existat probleme, cu totul altfel era situația pentru ș Ș ț Ț. Simbolurile folosite inițial au fost ş (s cu sedilă), Ş (S cu sedilă) ţ (t cu sedilă) Ţ (T cu sedilă). La momentul în care Institutul de Lingvistică al Academiei Române a precizat clar, iar ASRO (Asociația de Standardizare din România) a standardizat utilizarea diacriticelor cu virgulă (comma bellow) în circulație se afla standardul ISO 8859-2 Latin 2 (Central and Eastern Europe) suportat și de Microsoft în sistemele sale de operare (cu mici modificări rezultând codificarea proprietară CP1250). Comisia ISO a fost informată de către ASRO de utilizarea incorectă a diacriticelor și a aprobat în 1998 versiunea revizuită a ISO 8859-2. ASRO a pus la punct standardul românesc SR 13411 care a stat la baza ISO 8859-16 Latin 10 cu suport intregral și corect lingvistic pentru limba română. Numai că această ultimă codificare este rar întâlnită.
În tabelele ISO, resprectiv Unicode, fiecărui simbol (caracter) îi corespunde un cod specific. Din dorința de a ușura standardizarea, divizia Typography a companiei Adobe (care produce multe din fonturile de pe piață) a înlocuit pur și simplu simbolurile şŞţŢ din ISO 8859-2 cu șȘțȚ. Acest lucru a mărit confuzia și a dus la incompatibilități (de parcă nu erau destule) între fonturi, sistemele de operare și soft-urile utilizate.
În prezent situația tinde spre normalitate deși acest lucru are loc cu un conservatorism ce poate fi explicat doar de utilizarea (încă!) a fonturilor localizate nestandard. Apple a suportat parțial (compatibilitatea era dată și de aplicații nu numai de sistemul de operare) standardul Unicode încă din Mac OS 8.x, iar de la Mac OS X 10.2 suportul este integral, alături de utilizarea tastaturii românești. Tot începând cu Mac OS 10.2 sunt utilizate corect caracterele șȘțȚ (pentru compatibilitate sunt prezente și şŞţŢ). Microsoft nu utilizează nici la Windows XP simbolurile corecte șȘțȚ ci doar pe cele vechi, şŞţŢ. Soluția este aplicarea European Union Expansion Font Update. Windows Vista și Windows 7 nu au această problemă. De asemenea, cele mai multe distribuții Linux utilizează corect și fără probleme diacriticile românești. În ce privește programele de paginare utilizate în DTP, QuarkXpress începând cu versiunea 7 și InDesgin începând cu versiunea 3 (inclus în prima versiune a pachetului Adobe Creative Suite) includ suportul Unicode.
Tabel: codurile Unicode și abrevierile specifice diacriticilor limbii române
Simbol | Cod Unicode | Abreviere | Descriere | Subset |
Ă |
0102 |
Abreve |
Latin capital letter A with breve accent |
Latin Extended-A |
ă |
0103 |
abreve |
Latin small letter a with breve accent |
Latin Extended-A |
 |
00C2 |
Acircumflex |
Latin capital letter A with circumflex accent |
C1 controls and Latin-1 supplement |
â |
00E2 |
acircumflex |
Latin small letter a with circumflex accent |
C1 controls and Latin-1 supplement |
Î |
00CE |
Icircumflex |
Latin capital letter I with circumflex accent |
C1 controls and Latin-1 supplement |
î |
00EE |
icircumflex |
Latin small letter i with circumflex accent |
C1 controls and Latin-1 supplement |
Ș |
0218 |
Scommaaccent |
Latin capital letter S with comma bellow |
Latin Extended-B |
ș |
0219 |
scommaaccent |
Latin small letter s with comma bellow |
Latin Extended-B |
Ț |
021A |
uni021A |
Latin capital letter T with comma bellow |
Latin Extended-B |
ț |
021B |
uni021B |
Latin small letter t with comma bellow |
Latin Extended-B |
Ş |
015E |
Scedilla |
Latin capital letter S with cedilla |
Latin Extended-A |
ş |
015F |
scedilla |
Latin small letter s with cedilla |
Latin Extended-A |
Ţ |
0162 |
uni0162 |
Latin capital letter T with cedilla |
Latin Extended-A |
ţ |
0163 |
uni0162 |
Latin small letter t with cedilla |
Latin Extended-A |
Atenție: utilizarea și modificarea unui font sunt limitate de producător prin copyright. Nu modificați fonturi fără acceptul scris al deținătorului drepturilor asupra fonturilor.
Doar pentru exemplificare prezint modul corect în care un font se poate localiza corect pentru utilizarea în limba română. Am utilizat în acest scop versiunea DEMO a programului FontLab 4.6 și fontul FreeSans aflat sub licență GPL.
Se deschide fontul in aplicaţia FontLab și se setează modul de afișare Unicode / Pages, iar din lista cu seturi de codificare (Encodings) se alege MacOS Romanian. Se apelează Font Info… din meniul File. Se fac setările din imaginile următoare:
După alegerea numelui apăsați în ordine: Build style name și apoi Build Names.
Click pe Build OpenType Names.
Click pe Import names, apoi din lista Language alegeți 37 Romanian sau scrieți 37 Romanian dacă lipsește din listă.
Se salvează setările apăsând pe OK. La numele fontului alegeți un nume descriptiv dar unic (atenție și la familiile de fonturi) și eventual adăugați particula CE la sfârșit. Localizați în font codurile unicode specifice diacriticelor. În cazul în care un simbol lipsește FontLab îl va afișa gri. Cu dublu-click sunt aduse automat simbolurile necesare. În cazul în care este nevoie, localizați simbolul comma (virgula) și plasați-l prin Copy/Paste sub una din literele comma bellow: s (0219), S (0218), t (021B) sau T (021A). Dimensionați virgula și poziționați-o central sub simbol. Apoi cu Copy/Paste plasați-o sub celelate trei simboluri comma bellow rămase. Eventual reajustați orizontal poziția virgulei sub fiecare dintre aceste diacritice. Treceți, acum, encoding din MacOS Romanian pe MS Windows 1250 Central European. Copiați simbolul Ș de la 0218 la 015E, ș de la 0219 la 015F, Ț de la 021A la 0162 și ț de la 021B la 0163.
În final salvați noul font cu comanda Generate font… din meniul File. Alegeți (recomandabil) același nume de fișer cu numele fontului (fără spații însă) și nu uitați de particula CE. Ca format de export optați pentru OpenType (*.otf), iar fontul va funcționa astfel pe toate platformele software cu suport Unicode. |
Bibliografie:
– pagina web a dl. Cristian Secară;
– Asociația de Standardizare din România;
– secțiunea .RO a forumului MacUser.ro;
– GNU FreeFont;
– ISO (International Organization for Standardization);
Aplicația FontLab a rulat pe o mașină virtuală Wine pe sistemul de operare Linux Ubuntu 9.04, iar capturile de ecran au fost realizate cu aplicația Take Screenshot. Rezultatul modificărilor prezentate nu a fost salvat, iar fontul nu a fost modificat.