[an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]
[an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive] (none) [an error occurred while processing this directive] [an error occurred while processing this directive] [an error occurred while processing this directive][an error occurred while processing this directive]![]() |
![]() |
![]() |
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||||
![]() |
![]() |
![]() |
Jacob Sparre Andersen wrote: > Ole Laursen skrev: > > Selv hvis POSIX skulle tillade det, kan man simpelthen > > ikke - der er ufatteligt mange programmer der er bygget op > > om at char er en byte. > > Ufatteligt mange defekte programmer med andre ord. Snälla Jacob, vad handlar den här diskussionstråden om? Har du startat ett personligt korståg mot UTF-8? Är det inte minst tio år för sent? Datatypen "char" i (ANSI) C/C++ är en 8-bits lagringsenhet och har inte nödvändigtvis något med skrivbara tecken att göra. För kinesiska eller japanska tecken har det aldrig gått att använda "char", utan endera har man använt "int" eller "wchar_t". Funktionen getchar() returnerar en int som är positiv för tecken och -1 för end-of-file, så inte ens för engelska är all teckenhantering i form av "char". Alla nya språk av Wikipedia använder UTF-8 och de äldre håller på att konverteras till UTF-8. Programspråket Java, som lanserades 1995, har använt UTF-8 som default från starten. > så tiltaler løsningen med at POSIX definerer "char" til at fylde > 32 bit mig altså meget. Va? Vilken "lösning"? Har det varit någon sådan diskussion inom POSIX (IEEE) eller ANSI? -- Lars Aronsson (sslug@sslug) Aronsson Datateknik - http://aronsson.se
![]() |
![]() |
![]() |
||||||||||||
|
||||||||||||||
![]() | ||||||||||||||
|
||||||||||||||
![]() |
![]() |
![]() |