[an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]
 
[an error occurred while processing this directive] [an error occurred while processing this directive]
Skåne Sjælland Linux User Group - http://www.sslug.dk Home   Subscribe   Mail Archive   Forum   Calendar   Search
MhonArc Date: [Date Prev] [Date Index] [Date Next]   Thread: [Date Prev] [Thread Index] [Date Next]   MhonArc
 

Re: [LOCALE] UTF-8 er noget værre slam



On Fri, Jul 01, 2005 at 04:09:01PM +0200, Lars Aronsson wrote:
> Jacob Sparre Andersen wrote:
> 
> > Ole Laursen skrev:
> > > Selv hvis POSIX skulle tillade det, kan man simpelthen
> > > ikke - der er ufatteligt mange programmer der er bygget op
> > > om at char er en byte.
> > 
> > Ufatteligt mange defekte programmer med andre ord.
> 
> Snälla Jacob, vad handlar den här diskussionstråden om?  Har du 
> startat ett personligt korståg mot UTF-8?  Är det inte minst tio 
> år för sent?
> 
> Datatypen "char" i (ANSI) C/C++ är en 8-bits lagringsenhet och har 
> inte nödvändigtvis något med skrivbara tecken att göra.  För 
> kinesiska eller japanska tecken har det aldrig gått att använda 
> "char", utan endera har man använt "int" eller "wchar_t".  
> Funktionen getchar() returnerar en int som är positiv för tecken 
> och -1 för end-of-file, så inte ens för engelska är all 
> teckenhantering i form av "char".
> 
> Alla nya språk av Wikipedia använder UTF-8 och de äldre håller på 
> att konverteras till UTF-8.  Programspråket Java, som lanserades 
> 1995, har använt UTF-8 som default från starten.

Nej, det er ikke rigtigt. Java anvender ucs2- en 16-bits størrelse for
tegn. Jeg tror altså at det stadig er 16-bits. Andre nyere 
sprog bruger 32-bits char. Nogen bruger utf-16, som er en
variabel-længde kodning i 16 bit (gys).

Hilsen
keld


 
Home   Subscribe   Mail Archive   Index   Calendar   Search

 
 
Questions about the web-pages to <www_admin>. Last modified 2005-08-10, 20:55 CEST [an error occurred while processing this directive]
This page is maintained by [an error occurred while processing this directive]MHonArc [an error occurred while processing this directive] # [an error occurred while processing this directive] *