引用 5 楼 sosidami 的回复:这是一个自然语言处理问题(Open)。 最简单的用一个开源软件做分词,然后统计词频,前几个做tag(踢掉一些无关的我啊,你啊之类的) 复杂点自己来一个tokenizer分词器,然后用一个 k 阶马尔科夫模型,然后不断迭代去吧。 工程实现的时候,预处理好你的数据,比如分好类啥的。。。效果会让你很惊喜 看看这些:……
这是一个自然语言处理问题(Open)。 最简单的用一个开源软件做分词,然后统计词频,前几个做tag(踢掉一些无关的我啊,你啊之类的) 复杂点自己来一个tokenizer分词器,然后用一个 k 阶马尔科夫模型,然后不断迭代去吧。 工程实现的时候,预处理好你的数据,比如分好类啥的。。。效果会让你很惊喜 看看这些: http://stackoverfl……
大概知道,但是具体写不出
33,028
社区成员
35,336
社区内容
加载中
试试用AI创作助手写篇文章吧