linux 发表于 2017-4-20 15:21:35

Ansj中文分词

http://www.nlpcn.org/demo.jsp

Ansj中文是一个基于google语义模型+条件随机场模型的中文分词的java实现.分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上,目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.项目地址:https://github.com/ansjsun/ansj_seg 文档:http://ansjsun.github.io/ansj_seg/

firemail 发表于 2017-5-2 14:11:18

http://ictclas.nlpir.org/nlpir/
页: [1]
查看完整版本: Ansj中文分词