0100001100100111011001010111001101110100001000000110011001100001011000110110
latin-1
(ISO 8859-1
). Si vous n'avez pas de voisin utilisez: « Les excès tuent
plus sûrement que les épées. »UTF-8
, ses avantages et ses
inconvénients par rapport l‘ASCII
ou au codage ISO 8859-1
.Tenter d'encoder la première phrase du texte avec python.
phrase = "Grace Murray Hopper, née le 9 décembre 1906 à New York et morte le 1er janvier"
phrase.encode("utf-8")
Tenter de décoder quelques caractères de leur forme binaire (héxadécimale) vers leur représentation réelle.
b'\xc3\xa9'.decode('utf-8')
iso-8859-1
à décoder.Pour lire un fichier texte depuis Python, la syntaxe est la suivante:
with open('file-utf-8.md') as f:
read_data = f.read()
print(read_data)
Dans ce cas, on lit le fichier sous forme de texte encodé (par défaut utf-8)
Mais si on a besoin, on peut aussi lire le texte sous forme de bits, en ajoutant un deuxième
argument à la fonction open (ici "rb"
pour read bytes):
with open('file-utf-8.md', 'rb') as f:
read_data = f.read()
print(read_data)
Dans ce cas le deuxième argument est "w"
pour write ou "wb"
pour write bytes.
with open('file-from-python-utf-8.md', 'w') as f:
f.write("À l'origine, ce fichier texte a été écrit depuis python")
# Vérification
with open('file-from-python-utf-8.md') as f:
read_data = f.read()
print(read_data)
utf-8
, puis en iso-8859-15
.