用 HTMLParser 解析页面代码,其它部分都没问题,但是个别音标会出错。
比如 abdication, 音标为: "美 [ˌæbdɪ'keɪʃ(ə)n] ",会被解析成"美[ˌbdɪ'ke�", 查看页面编码是 utf-8 没问题,音标行代码为:
<div class="hd_prUS">美 [ˌæbdɪ'keɪʃ(ə)n] </div>。
Python 版本 2.7, 请问我是哪里出了问题?
比如 abdication, 音标为: "美 [ˌæbdɪ'keɪʃ(ə)n] ",会被解析成"美[ˌbdɪ'ke�", 查看页面编码是 utf-8 没问题,音标行代码为:
<div class="hd_prUS">美 [ˌæbdɪ'keɪʃ(ə)n] </div>。
Python 版本 2.7, 请问我是哪里出了问题?