突然想到一个不错的分词算法——搜索引擎

我一定不是第一个这么想的人吧。

服务器端程序把客户请求的句子作为查询,去请求搜索引擎。在得到的结果中观察被查句子在结果中的被拆分情况,即可确定分词方式。甚至可以确定各种分词组合的频度。

实践结果待续……


评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据