Vad är en teckendatatyp?
En teckendatatyp är en datatyp som lagrar ett enda tecken. Detta kan vara en bokstav, siffra eller symbol. Teckendatatyper används ofta för att lagra textdata, som namn, adresser och telefonnummer.
Teckendatatyper kan vara antingen fast längd eller variabel längd. Teckendatatyper med fast längd lagrar ett visst antal tecken, oavsett den faktiska längden på datan. Teckendatatyper med variabel längd kan lagra valfritt antal tecken, upp till en maximal angiven längd.
Den vanligaste teckendatatypen är ASCII-teckendatatypen. ASCII-teckendatatyper lagrar 7-bitarstecken, som kan representera bokstäverna i det engelska alfabetet, siffror och vanliga symboler. Andra teckendatatyper inkluderar Unicode-teckendatatypen, som kan representera ett större antal tecken, inklusive tecken från icke-engelska alfabet.
Teckendatatyp i Python
Python definierar en sträng som en oföränderlig sekvens av byte.
Vi kan skapa strängar med enkla eller dubbla citattecken. Här är några exempel på strängliteraler i Python:
```
>>> string1 ="Hej"
>>> string2 ='Världen'
>>> string3 ="123"
```
När vi vill representera en sträng med en sekvens av icke-ASCII-tecken, kan vi använda "u" eller "r" före det inledande citatet:
```
>>> string4 =u"你好" # kinesiska tecken
>>> string5 =r"C:\Users\användarnamn" # Windows-sökväg
```
`u` före inledande citattecken indikerar att strängen är i Unicode-format, medan `r` indikerar att strängen är en rå sträng, vilket betyder att omvänt snedstreck inte tolkas som escape-tecken.