Re: Jaky kod pouziva google v prikazovy radce pro cesky znaky?

From: David Necas (Yeti) (yeti@physics.muni.cz)
Date: 25. 07. 2003, 14:38 CEST


On Fri, Jul 25, 2003 at 02:16:07PM +0200, Martin Kopta wrote:
> 
> ano, a take tam je napsano, ze Google do URL 
> zapisuje i znakovou sadu, takze escape sekvence 
> mohou byt treba v ISO,

Mohou. Při použití běžných klientů jsou obvykle v UTF-8.

> v UTF-8, ale klidne 
> i v Unicode. ;-)

Mohl byste mi prosím vysvětlit, jak mohou být věci
,,v UTF-8, ale klidně i v Unicode``?

Unicode/ISO-10646-1 je znaková sada (přísně vzato je Unicode
něco jiného než ISO-10646-1, a navíc to není pouhá znaková
sada ve smyslu množina znaků + přiřazení pořadových čísel,
ve standardu jsou o znacích i další informace, ale obojí je
v tomto kontextu nepodstatný detail).

Jako sekvence bajtů lze znaky z této znakové sady
representovat řadou způsobů: UTF-1, UTF-7, UTF-8, UTF-16,
UCS-2/BE, UCS-2/LE, UCS-4/BE, UCS-4/LE a co já vím, co mohl
ještě kdo vymyslet... Vždy je o nějaký způsob rozložení
pořadového čísla, která se do jednoho bajtu nevejde, do
bajtů několika.

Yeti


P.S.: Nesnažím se dělat chytrýho, ale není to poprvé, co se
tu objevily nějaké desinformace o Unicode, tak bych to rád
vyjasnil.


--
Dál nečti. Dál už je jen reklama.



This archive was generated by hypermail 2.1.3 : 25. 07. 2003, 14:38 CEST