2022-08-01 20:44
做中文繁简转换的时候,繁体转简体比简体转繁体要容易。因为一些字的简体和繁体是一对多的关系。比如:
zh-cn:你干什么?我衣服晒不干也不干你的事。
zh-tw:你幹什麼?我衣服曬不乾也不干你的事。
>>> from zhconv import convert
>>> convert('你干什么?我的衣服晒不干也不干你的事','zh-tw')
'你幹什麼?我的衣服曬不幹也不幹你的事'
>>> from opencc import OpenCC
>>> OpenCC('s2t').convert('你干什么?我的衣服晒不干也不干你的事')
'你幹什麼?我的衣服曬不幹也不干你的事'
显然 opencc 比 zhconv 强一些。不过真正要做好,肯定还得 NLP,靠词典是不行的。
2013-09-24 22:27
我看到了。但因为要照顾各层次听众,不能讲太深,感觉有些对不住这些专程来捧场的朋友。所以这两天我把一些重要内容发到微博上和大家分享。//@张浩然大国安: 昨天tk演讲开始时候,目测会场瞬间涌入150➕的人,都是从别的场过来的,讲完后瞬间走了250➕…这是什么原理
2013-09-24 21:39
在#互联网安全大会#上的演讲《APT防御——未知攻,焉知防》中,我说了很关键的一句话:“搞信息安全研究的人,听到‘缓存’就要立即想到‘毒化’”。我注意到台下只有很个别人脸上露出会心的笑容。微观到CPU的缓存,宏观到网络基础设施的缓存,本质都是一回事。思想上打通了,想问题的就能高一个维度。
2012-12-24 14:33
曾有人根据孔子、爱因斯坦等人父母均为老夫少妻,认为老夫少妻的搭配可能是生出聪明孩子的原因。实际上,一把年纪还能找到年轻女人给自己生孩子的男人,生出聪明的孩子,有什么奇怪的?杨振宁如果再生一个聪明孩子,有什么奇怪的?