UTF-8: Revizyonlar arasındaki fark

[kontrol edilmiş revizyon][kontrol edilmiş revizyon]
İçerik silindi İçerik eklendi
Srhat (mesaj | katkılar)
kDeğişiklik özeti yok
Srhat (mesaj | katkılar)
k bağlantı
4. satır:
 
== Özellikleri ==
Karakterlerin her birinin kendilerine Unicode tarafıdan atanan bir [[kod noktası]] vardır. Her kod noktası 0 ile 1.114.111 arasında bir sayıdır. Bu kod noktaları iki tabanına dönüştürülürken doğrudan [[Sayısal sistem#Herhangi bir tabanda verilen sayının başka bir tabanda yazılması|taban dönüşümü]] yapılmak yerine çeşitli yöntemler kullanılmaktadır. Bu yöntemlerin her biri ayrı birer karakter kodlama biçimi olarak adlandırılır. UTF-8 kodlama biçimi kod noktalarını değişken sayıda kod birimlerinden oluşacak şekilde iki tabanına dönüştürmeye olanak vermektedir. Kod birimlerinin her biri 8 bit uzunluğundadır. Dolayısıyla UTF-8 ile kodlanan bir metinde her karakterin uzunluğu 8'in katıdır. Kodlama yapılırken kodlanmış metni işleyecek bir bilgisayar yazılımının karakterlerin başlangıç ve bitiş noktalarını bilebilmesine olanak sağlamak için kod birimlerinin içine işaretçi bazı bitlerin yerleştirilmesi gerekmektedir.
 
UTF-8 kodlama biçimi şu kurallara göre çalışmaktadır:
"https://tr.wikipedia.org/wiki/UTF-8" sayfasından alınmıştır