Wat is een tekengegevenstype?
Een tekengegevenstype is een gegevenstype waarin één teken wordt opgeslagen. Dit kan een letter, cijfer of symbool zijn. Tekengegevenstypen worden vaak gebruikt om tekstgegevens op te slaan, zoals namen, adressen en telefoonnummers.
Tekengegevenstypen kunnen een vaste lengte of een variabele lengte hebben. Tekengegevenstypen met een vaste lengte slaan een specifiek aantal tekens op, ongeacht de werkelijke lengte van de gegevens. Tekengegevenstypen met variabele lengte kunnen een willekeurig aantal tekens opslaan, tot een maximaal opgegeven lengte.
Het meest voorkomende tekengegevenstype is het ASCII-tekengegevenstype. ASCII-tekengegevenstypen slaan 7-bits tekens op, die de letters van het Engelse alfabet, cijfers en algemene symbolen kunnen vertegenwoordigen. Andere tekengegevenstypen zijn onder meer het Unicode-tekengegevenstype, dat een breder scala aan tekens kan vertegenwoordigen, inclusief tekens uit niet-Engelse alfabetten.
Karaktergegevenstype in Python
Python definieert een string als een onveranderlijke reeks bytes.
We kunnen strings maken met enkele of dubbele aanhalingstekens. Hier zijn een paar voorbeelden van letterlijke tekenreeksen in Python:
```
>>> string1 ="Hallo"
>>> string2 ='Wereld'
>>> tekenreeks3 ="123"
```
Als we een string willen weergeven met een reeks niet-ASCII-tekens, kunnen we `u` of `r` vóór het openingscitaat gebruiken:
```
>>> string4 =u"你好" # Chinese karakters
>>> string5 =r"C:\Gebruikers\gebruikersnaam" # Windows-pad
```
De `u` vóór het openingsaanhalingsteken geeft aan dat de tekenreeks in Unicode-indeling is, terwijl de `r` aangeeft dat de tekenreeks een onbewerkte tekenreeks is, wat betekent dat backslash-tekens niet worden geïnterpreteerd als escape-tekens. |