HTML – Pitanje upotrebe odgovarajućeg karakter seta (III deo)

U ovom prilogu razmotrićemo zašto postoji toliko različitih karakter setova za svaki od brojnih svetskih jezika, šta je potrebno da znate o njima i kako ih kompjuteri koriste i prikazuju.

Jedan od karakter setova za koji ste sigurno čuli je ASCII. ASCII karakter set, inače skraćenica od American Standard Code for Information Interchange, u sebe uključuje interpunkcijske oznake, cifre, i 26 malih i 26 velikih slova engleskog alfabeta (a-z i A-Z). Pošto ovaj set sadrži oko 128 karaktera, poznat je i kao 7-bitni karakter set (27 = 128).

Dok je ASCII set sasvim dovoljan za prikaz informacija na engleskom jeziku, na prvi pogled se može videti da je nedovoljan za prikaz većine drugih jezika. Na primer, većina zapadnoevropskih jezika zahteva i prikaz karaktera sa akcentima (apostrofi, dvotačke, itd.). Rezultat ove potrebe je proširenje karakter seta kako bi opslužio sve jezike, u cilju obezbeđenja razmene informacija između kompjuterskih sistema.

Karakter set „Latin 1“, poznat i kao zapadni karakter set (oznake ISO 8859-1) ubrzo je zadvoljio široke potrebe kao što je i sam Internet standard. Ovo je 8-bitni karakter set (znači sadrži 256 karaktera) koji proširuje ASCII set dodatnim interpunkcijskim oznakama, specijalnim karakterima i akcentovanim karakterima uobičajenim u većini zapadnoevropskih jezika. Tipično je da se ASCII karakteri pojavljuju kao podskup većine drugih karakter setova. Na primer, prvih 128 karaktera hebrejskog seta (ISO 8859-8) predstavlja sve ASCII karaktere. Ovo je neophodno, jer HTML tagovi u vašim web stranicama (kao npr. <BR> ili <TABLE>) moraju ostati isti, bez obzira na to kojim jezikom se prikazuje sadržaj stranica.

U slučaju da kreirate sajt koji će imati i verziju na srpskom i na engleskom jeziku, možete koristiti ISO 8859-1karakter set, koji će zadovoljiti obe verzije. Da biste ovaj set označili kao zvanični set sajta, biće potrebno da unutar <HEAD> taga ubacite sledeći <META> tag:


<meta http-equiv="Content-Type" content="text/html;
charset=iso-8859-1">

Karakter setovi su potrebni prvenstveno radi vašeg kompjutera, da bi on „znao“ kako da konvertuje kodne oznake u karaktere. Na primer, u ASCII setu, broj 65 predstavlja kodnu oznaku za veliko slovo „A“, dok broj 97 predstavlja oznaku za malo slovo „a“. Ova konverzija šifri (kodnih oznaka) u odgovarajuće karaktere naziva se character encoding. Vašem browser-u mora biti naznačeno koja vrsta kodiranja se koristi, da bi svaku kodnu oznaku preveo u odgovarajući karakter – upravo ovome i služi vrednost karakter seta unutar navedenog <META> taga.

Napišite komentar

Najnovije iz rubrike