Care este scopul caracterelor fără caracter U+FDD0 până la U+FDEF? (Programare, Unicode, Noncaracter)

dan04 a intrebat.

U+FFFE trebuie să fie un noncaracter pentru a permite ca Byte Order Mark să funcționeze.

U+FFFFFF este descris în Standardul Unicode ca fiind „util în scopuri interne ca santinelă”. Are sens.

Dar nu-mi pot da seama, iar Standardul Unicode nu explică cu adevărat de ce setul de noncaractere include un bloc aleatoriu din „Arabic Presentation Forms-A”. Ce sunt aceste pentru? (În afară de ochiul busuiocului?)

Comentarii

  • @Pacerier, verifică textul Alt al benzii desenate. (hover/tooltip) –  > Por Ben.
3 răspunsuri
Ben

OK întrebarea este „la ce folosesc” și „de ce sunt în mijlocul formularelor de prezentare arabă”.

Prin urmare, s-a convenit ca aceste puncte de cod, care nu aveau să fie folosite niciodată, să fie desemnate ca noncaractere, astfel încât să poată fi utilizate la nivel intern de către aplicații/programatori.

Comentarii

  • Nu se explică cu adevărat de ce nu au folosit FFF0 până la FFFF. –  > Por Raedwald.
  • @Raedwald, FFF9 până la FFFF sunt deja folosite în alte scopuri. unicode.org/charts/PDF/UFFF0.pdf –  > Por Ben.
  • Ah, deci acele non-caractere au fost adăugate după ce FFF9 până la FFFF au fost alocate. –  > Por Raedwald.
Zimbabao

Aceste noncaractere sunt destinate utilizării interne de către aplicație și nu ar trebui să fie interschimbate.

Am încercat să explic pe baza a ceea ce se spune în standardul Unicode.

Unicode are 66 de non-caractere. Pentru toate cele 17 planuri au câte două, ultimele două puncte de cod ale planului se termină cu FFFE FFFF. Alte 32 de non-caractere sunt în bloc continuu de la U+FDD0 la U+FDEF.

Deci, numărul total

 17*2 + 32 = 66

Citiți următorul text din capitolul 16 al Unicode, care spune că este într-un loc aleatoriu din cauza unui „motiv istoric”, sunt curios, dar nu cred că există vreo ambiguitate.

Din motive istorice, intervalul U+FDD0..U+FDEF este cuprins în blocul Arabic Presentation Forms-A, dar aceste noncaractere nu sunt „noncaractere arabe” sau „noncaractere de la dreapta la stânga” și nu se disting în niciun alt mod de celelalte noncaractere, cu excepția valorilor punctelor de cod

U+FEFF este BOM și U+FFFE este o versiune schimbată pe octeți a acestuia. Dar, deoarece U+FFFE este un noncaracter, atunci când un proces de interpretare găsește U+FFFE ca prim caracter, acesta semnalează fie că procesul a întâlnit un text care are o ordine incorectă a octeților, fie că fișierul nu este un text Unicode valid, Acesta dă doar un semnal, nu un mod standard. Poate fi vorba fie de unul, de octeți inversați, fie de un text greșit.

În Unicode secțiunea 3.2 clauza C2 spune

C2 Un proces nu trebuie să interpreteze un punct de cod care nu este un caracter ca fiind un caracter abstract.

  • Punctele de cod care nu sunt caractere pot fi utilizate la nivel intern, de exemplu pentru valorile santinelă sau pentru delimitatori, dar nu trebuie să fie schimbate în mod public.

Așadar, în calitate de dezvoltatori de aplicații, sunteți liberi să utilizați aceste caractere după cum doriți. Ele sunt utilizate ca santinelă sau delimitator sau pot fi unele caractere baslik, dar nu ar trebui să fie schimbate între ele.

Secțiunea 16.7 spune

De fapt, noncaracterele pot fi considerate ca fiind puncte de cod de utilizare privată în interiorul aplicației. Spre deosebire de caracterele de uz privat discutate în secțiunea 16.5, Caractere de uz privat, care sunt caractere atribuite și care sunt destinate utilizării în cadrul schimbului deschis, sub rezerva interpretării prin acord privat, necaracterele sunt rezervate permanent (neatribuite) și nu au nici un fel de interpretare în afara posibilelor utilizări private interne ale aplicației.

Din nou, U+FFFFFF nu este rezervat ca santinelă de către standardul Unicode, ci doar dat fiind cazul tipic de utilizare. Citiți în secțiunea 16.7

U+FFFFFF și U+10FFFFFF. Aceste două puncte de cod care nu sunt caractere au atributul de a fi asociate cu cele mai mari valori ale unităților de cod pentru anumite forme de codificare Unicode. În UTF-16, U+FFFFFF este asociat cu cea mai mare valoare a unității de cod pe 16 biți, FFFF.16 U+10FFFFFF este asociat cu cea mai mare valoare legală a unității de cod UTF-32 pe 32 de biți, 10FFFFFF.16 Acest atribut face ca aceste două puncte de cod care nu sunt caractere să fie utile în scopuri interne, ca puncte santinelă. De exemplu, ele pot fi utilizate pentru a indica sfârșitul unei liste, pentru a reprezenta o valoare într-un index garantat a fi mai mare decât orice valoare de caracter validă și așa mai departe.

Comentarii

  • În acest context, fiecare dintre aceste ilustrații nu reprezintă atât o instrucțiune sau o poruncă specifică referitoare la crimă, adulter sau divorț, ci face parte dintr-o imagine a unui cadru de interpretare – oferindu-ne modelul de interpretare a oricărei legi. > Por .Înțelegerea și acceptarea acestui cadru este scopul acestor ilustrații. Acesta ar fi
  • ironic și profund eronat

  • să luăm cuvintele lui Isus de aici ca fiind > Por doar un set nou sau mai strict de observanțe exterioare..
  • > Por .Orice lege trebuie aplicată în inimă, nu doar respectată în exterior.
  • Cadrul de interpretare pe care îl oferă Iisus este acela că ascultarea la nivelul inimii este adevărata chemare a întregii legi: principiile legalismului și ale excepțiilor/localităților nu se pot aplica în acest cadru. Nici că se putea un contrast mai mare cu cărturarii și fariseii, care sunt > Por călăuze oarbe, care scot țânțarul și înghit cămila. așa cum interpretează ei.

Prin urmare, porunca despre căsătorie este o chemare la o inimă credincioasă, nu o chestiune de ascultare exterioară. În esență, chestiunea tehnică/juridică a divorțului nu este deloc în vedere: este posibil să fii divorțat legal și ascultător, și căsătorit legal (și nu adulterin) și totuși neascultător.

Soțul poartă responsabilitatea principalăÎn contextul unei societăți și al unei religii patriarhale, indiferent dacă femeia comite sau este victima adulterului, bărbatul care divorțează de ea poartă responsabilitateaU+FDD0[2]: orice îndemn la ascultare trebuie să fie urmat mai întâi de bărbatul care are o putere și o responsabilitate mai mare în cadrul căsătoriei.

Comentarii

    Femeia nu este singularizată pentru a fi condamnată sau exonerată

  • în acest context, iar aplicarea mai largă a poruncii specifice i s-ar aplica în sens secundar. O aplicare contemporană ar trebui să țină cont de cultura zilei, de exemplu dacă o femeie are sau nu dreptul legal de a divorța de soțul ei. > Por .

Concluzie: o femeie poate să Îi placă lui Dumnezeu și să se supună acestei porunci dacă are un respect și o admirație profundă din inimă pentru uniunea sfântă dintre soț și soție.