[an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]
 
[an error occurred while processing this directive] [an error occurred while processing this directive]
Skåne Sjælland Linux User Group - http://www.sslug.dk Home   Subscribe   Mail Archive   Forum   Calendar   Search
MhonArc Date: [Date Prev] [Date Index] [Date Next]   Thread: [Date Prev] [Thread Index] [Date Next]   MhonArc
 

Re: [LOCALE] UTF-8 er noget værre slam



On Thu, Jun 30, 2005 at 09:28:59PM +0200, Jacob Sparre Andersen wrote:
> Keld Jørn Simonsen skrev:
> 
> > utf-8 blev oprindeligt kaldt utf-fss - file system safe.
> > Den bevarede ascii, fordi man så ikke behøvede at lave om
> > i Unix (og plan 9) kildetekst, idet man kunne være sikker
> > på at et ascii tegn var det som man altid havde regnet
> > med.
> 
> Så bare fordi Unix' fædre ikke lige tænkte udover deres eget
> sprogområde, så skal vi hænge på UTF-8 i stedet for at løse
> problemet?
> 
> Og ville problemet ikke blive løst, hvis vi besluttede at i
> POSIX er en "char" på 32 bit?  Alle programmerne ville
> selvfølgelig skulle genoversættes, men bortset fra det bør
> der vel ikke være nogle problemer.

det er også hvad man har vedtaget, dvs der er en ekstern 
repræsentation af tegn som er variabel-længde og med ascii som subset,
og så er der en intern kodning som er 32 bit. Sådan er det i POSIX, og
sådan er det i C, som er POSIX's oprindelige implementeringssprog.
Jeg skrev endog engang et papir om det:
http://www.ex.ac.uk/~DCannon/iso-wg15/document/n658.txt
(10 år gammelt!)

> > det som MS bruger hedder utf-16 og er også variabel-længde
> > tegn - men nu i bidder af 16 bit:-(
> 
> Jeg troede de brugte BMP - og altså bare ikke kunne håndtere
> tegn udover 16 bit (ligesom ISO-8859-1 er de første 8-bit af
> ISO-10646/Unicode).

Jeg er halvstolt over ikke at kende meget til MS-Windows, men jeg tror
altså at de understøtter utf-16.

Hilsen
keld


 
Home   Subscribe   Mail Archive   Index   Calendar   Search

 
 
Questions about the web-pages to <www_admin>. Last modified 2005-08-10, 20:55 CEST [an error occurred while processing this directive]
This page is maintained by [an error occurred while processing this directive]MHonArc [an error occurred while processing this directive] # [an error occurred while processing this directive] *