- left
- right
- up
- down
Liebe BWInf-Mitstreiter,
derzeit bin ich verunsichert, was die Textdateien angeht.
Beim Versuch eine Datei (z.B. Alice_im_Wunderland.txt) in Python einzulesen, erhalte ich je nach Plattform unterschiedliche Ergebnisse.
Auf www.online-python.com startet o.g. Datei tatsächlich "Alice...", so wie es auch Textprogramme anzeigen.
Auf Python 3.10.6 mit IDLE startet der Dateistring mit den Bytes (hex): xEF xBB x BF erst dann folgt "Alice..."
Das liest sich dann "Alice...". Auch alle Umlaute sind verstümmelt.
Sind die Textdateien codiert und manche Python-Versionen decodieren selbstständig?
Hat jemand einen Tip, wie ich die Datei unter Python 3.10.6 richtig einlesen kann?
Hallo Matthias,
ich hatte auch das Problem mit den Umlauten. Ich habe es gelöst, indem ich die Datei asl utf-8 gelesen habe,
nach dem ich sie nach dem herunterladen einfach als bytes in diese Datei geschrieben habe:
with open("data/Alice_im_Wunderland.txt", "r", encoding="utf-8") as f:
Viele Grüße
Christian Krause