是的,有时候确实会产生一些奇怪的结果。
我们用的是结巴中文分词这个库算出来的结果,如果你对分词方面有研究,有信心做出更好的结果,或许你可以考虑给他们提一个 pull request:
https://github.com/fxsjy/jieba
这是我之前提的 issue:
https://github.com/fxsjy/jieba/issues/130
我们用的是结巴中文分词这个库算出来的结果,如果你对分词方面有研究,有信心做出更好的结果,或许你可以考虑给他们提一个 pull request:
https://github.com/fxsjy/jieba
这是我之前提的 issue:
https://github.com/fxsjy/jieba/issues/130