我正在使用一个 Twitter 库来下载推文并允许对其进行后续处理。
问题是重音符号和其他特殊字符以下列方式显示给我:
La aplicaci\xf3n de un modelo educativo
代替
La aplicación de un modelo educativo
我一直在研究论坛,我找到了一个解决方案:
tweet="La aplicaci\xf3n de un modelo educativo";
tweet = tweet.encode("utf-8");
但我无法让它工作。
有任何想法吗?
您的字符串最初是 ISO 8859-1/Latin-1 (
\xf3n
) 编码的,而不是 UTF-8 (\xc3\xb3n
)。另一方面,你有一个字节串,你想得到一个unicode 字符串,你必须解码(decode
)字符串,而不是使用encode
:我们可以重新编码字符串以取回一个对象
str
,但这次使用的是 utf-8:在线示例:
https://repl.it/@FJSevilla/decoding