[an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]
 
[an error occurred while processing this directive] [an error occurred while processing this directive]
Skåne Sjælland Linux User Group - http://www.sslug.dk Home   Subscribe   Mail Archive   Forum   Calendar   Search
MhonArc Date: [Date Prev] [Date Index] [Date Next]   Thread: [Date Prev] [Thread Index] [Date Next]   MhonArc
 

Re: [LOCALE] UTF-8 er noget værre slam



Jacob Sparre Andersen wrote:

> Ole Laursen skrev:
> > Selv hvis POSIX skulle tillade det, kan man simpelthen
> > ikke - der er ufatteligt mange programmer der er bygget op
> > om at char er en byte.
> 
> Ufatteligt mange defekte programmer med andre ord.

Snälla Jacob, vad handlar den här diskussionstråden om?  Har du 
startat ett personligt korståg mot UTF-8?  Är det inte minst tio 
år för sent?

Datatypen "char" i (ANSI) C/C++ är en 8-bits lagringsenhet och har 
inte nödvändigtvis något med skrivbara tecken att göra.  För 
kinesiska eller japanska tecken har det aldrig gått att använda 
"char", utan endera har man använt "int" eller "wchar_t".  
Funktionen getchar() returnerar en int som är positiv för tecken 
och -1 för end-of-file, så inte ens för engelska är all 
teckenhantering i form av "char".

Alla nya språk av Wikipedia använder UTF-8 och de äldre håller på 
att konverteras till UTF-8.  Programspråket Java, som lanserades 
1995, har använt UTF-8 som default från starten.

> så tiltaler løsningen med at POSIX definerer "char" til at fylde 
> 32 bit mig altså meget.  

Va?  Vilken "lösning"?  Har det varit någon sådan diskussion inom 
POSIX (IEEE) eller ANSI?


-- 
  Lars Aronsson (sslug@sslug)
  Aronsson Datateknik - http://aronsson.se


 
Home   Subscribe   Mail Archive   Index   Calendar   Search

 
 
Questions about the web-pages to <www_admin>. Last modified 2005-08-10, 20:55 CEST [an error occurred while processing this directive]
This page is maintained by [an error occurred while processing this directive]MHonArc [an error occurred while processing this directive] # [an error occurred while processing this directive] *