博文

目前显示的是 四月, 2010的博文

善用 thunderbird 扩展 clean subject

图片
clean subject 是 thunderbird 必装的生产力扩展之一。作用是确保你不会回复出类似这样不礼貌的噪音标题。 默认情况下,clean subject 的配置对中文并不起作用。在它的配置窗口中直接填写“回复”,也会在保存后变成乱码,以至于我一直以为 clean subject 是不支持中文的,还给作者写过 email 请求加上 utf-8 支持。 今天偶然看见 clean subject 的设置界面,突然发觉这些 prefix 应该是正则表达式(其实上面写着呢,非母语就这点不好,不一定啥时候就看漏了),而正则表达式之于 utf-8,不是简单把汉字填进去就行的。 用 regex、javascript、utf-8 做关键词 google,很快就有结果。 尝试用“\xe5\x9b\x9e”匹配“回”字,失败,裸字节匹配不行。 echo -n "回" | hexdump -C 尝试用“\u56DE”匹配“回”字,成功,看来 javascript regex 处理字符串的时候,已经是 unicode。 echo -n "回" | iconv -f utf-8 -t unicode | hexdump 也就是说,clean subject 是可以支持中文的。翻了翻自己的邮件,附上几个正则: 回复: -> \u56DE\u590D\uFF1A 答复: -> \u7B54\u590D: 转发: -> \u8F6C\u53D1: