善用 thunderbird 扩展 clean subject
clean subject 是 thunderbird 必装的生产力扩展之一。作用是确保你不会回复出类似这样不礼貌的噪音标题。
默认情况下,clean subject 的配置对中文并不起作用。在它的配置窗口中直接填写“回复”,也会在保存后变成乱码,以至于我一直以为 clean subject 是不支持中文的,还给作者写过 email 请求加上 utf-8 支持。
今天偶然看见 clean subject 的设置界面,突然发觉这些 prefix 应该是正则表达式(其实上面写着呢,非母语就这点不好,不一定啥时候就看漏了),而正则表达式之于 utf-8,不是简单把汉字填进去就行的。
用 regex、javascript、utf-8 做关键词 google,很快就有结果。
尝试用“\xe5\x9b\x9e”匹配“回”字,失败,裸字节匹配不行。
尝试用“\u56DE”匹配“回”字,成功,看来 javascript regex 处理字符串的时候,已经是 unicode。
也就是说,clean subject 是可以支持中文的。翻了翻自己的邮件,附上几个正则:
默认情况下,clean subject 的配置对中文并不起作用。在它的配置窗口中直接填写“回复”,也会在保存后变成乱码,以至于我一直以为 clean subject 是不支持中文的,还给作者写过 email 请求加上 utf-8 支持。
今天偶然看见 clean subject 的设置界面,突然发觉这些 prefix 应该是正则表达式(其实上面写着呢,非母语就这点不好,不一定啥时候就看漏了),而正则表达式之于 utf-8,不是简单把汉字填进去就行的。
用 regex、javascript、utf-8 做关键词 google,很快就有结果。
尝试用“\xe5\x9b\x9e”匹配“回”字,失败,裸字节匹配不行。
echo -n "回" | hexdump -C
尝试用“\u56DE”匹配“回”字,成功,看来 javascript regex 处理字符串的时候,已经是 unicode。
echo -n "回" | iconv -f utf-8 -t unicode | hexdump
也就是说,clean subject 是可以支持中文的。翻了翻自己的邮件,附上几个正则:
- 回复: -> \u56DE\u590D\uFF1A
- 答复: -> \u7B54\u590D:
- 转发: -> \u8F6C\u53D1:
评论
我也一直以为是Clean Subject不支持多国语言……