ikkesynlige tegn byttet ut med en dæsj Latin-15 8 bits: 0-255 desimalt Ofte feilaktig merket som Latin-1 Æ Ø Å æ ø å Ö ß e 198 216 197 230 248 229 214 223 128
som «Universal Character Set» (UCS) og ISO-10646 Under kontinuerlig utvidelse siden 1991 Definerer nå oppunder 100.000 tegn Definerer i tillegg til tegnsettet også noen enkodinger slik som UCS-2, UCS-4 og UTF-16
i Unicode-settet Hvert tegn er enkodet som 1-4 bytes Vest-europeiske tegn tar som regel 1-2 bytes A B C Æ Ø Å 65 66 67 (195, 134) (195, 152) (195, 133)
ser på en nettside kan påvirkes av dataene i databasen tilkoblingen til databasen enkoding av filer på serveren header i HTTP-responsen header i HTML-dokumentet standardenkoding i nettleseren
programmet ditt Enten, velg en enkoding som spiser det meste av tegn Les: UTF-8 Eller, bruk programmeringsspråkets Unicode-kapable strengtype: java.lang.String i Java, Scala, etc. unicode i Python 2.x, string i Python 3.x string i Ruby 1.9 vet om sin egen enkoding
vei inn Konverter alt til internenkodingen Leser du en fil i en annen enkoding? Konverter den! På vei ut Eventuelt konverter til forespurt enkoding Vær alltid tydelig på hva du gir fra deg