1
eric 2012 年 7 月 23 日 NLTK 的 word_tokenize 就能很方便的实现。
http://nltk.org/ |
2
stackpop OP @eric 的确好强大,就是我想要的东西。之前打算用C++ 写,后来朋友建议用python,代码简洁得多,果然py强大~难怪国外好多大学CS第一门编程课改成python了,呵呵
|
3
fanzheng 2012 年 7 月 24 日
如果只是出现次数的话用split然后counter()嘛,官方模块文档里面的counter()
|
4
from0tohero 2012 年 7 月 26 日 NLTK最好没有之一~
|