社区
ASP
帖子详情
关于分词搜索
tankejin
2005-10-11 02:36:46
请问各位有没有人做过分词搜索?描述如下:
在一个字符串中自动提取符合中文语法规则的词,
比如:提取出“我们的物品”中 “我们”和“物品”两个词?
有哪些方法可以实现?或者哪里有类似的源码?
谢谢!
...全文
197
9
打赏
收藏
关于分词搜索
请问各位有没有人做过分词搜索?描述如下: 在一个字符串中自动提取符合中文语法规则的词, 比如:提取出“我们的物品”中 “我们”和“物品”两个词? 有哪些方法可以实现?或者哪里有类似的源码? 谢谢!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
qaqaqa
2006-01-16
打赏
举报
回复
up
skycuilin
2006-01-12
打赏
举报
回复
一般情况下都是使用词库,但是对于一些新词的识别性不好,可以看一些车东和田春锋的文章,他们在这一领域都有所研究.田春锋好象有一篇关于新词识别的文章忘记什么名字了,不过去他的blog应该可以看到.
一般情况下自己做分词和搜索方面的算法实现上比较困难,可以参详一下国外的开源搜索引擎lucene,不过只有两个版本java和.net 版,现在net版已经商业化了,还可以去海量科技看一下他们开发的分词,现在他们提供分词的研究版源码,不过是c版的看以看下开发方法与算法,中搜就是用他们的分词组件.
qaqaqa
2006-01-12
打赏
举报
回复
www.hvsoft.com
可能这个正是你想要的。。。。。
可以自定义搜索显示结构。。加亮。。自动分词
zhuowei
2005-10-15
打赏
举报
回复
踩个脚印 我不会
tankejin
2005-10-15
打赏
举报
回复
组件是从网上找的,已经被编译成DLL了
kao2005
2005-10-13
打赏
举报
回复
你那组件中的文件是不是放在同一目录?
tankejin
2005-10-11
打赏
举报
回复
找到一个中文分词的组件,CSW splitword,但是不能使用,出错。
按照其说明的方法操作,
Set SearchString = Server.CreateObject("Splitword.Split")
response.write SearchString.SplitWord("鸳鸯的公司", "evaluate",0)
运行时报错:
请检查分词组件中的文件有无损坏或丢失!!! 错误代码:CSW8001104
有人用过的请指教下,怎么会这样呢?
tankejin
2005-10-11
打赏
举报
回复
放在数据库里?中国那么多汉字和词语,那不是N多个词?速度不慢吗?
还有,您说的把汉字转换成拼音效率会高很多?道理何在?这样重复的词语不是很多?
jspadmin
2005-10-11
打赏
举报
回复
我朋友做个类似的东西,他当时是将词语放在数据库里,客户提交“我们的物品”时,会先取出头两个字“我们”,然后在数据库里搜索,匹配,就把字符串切断,接着做类似的搜索,同时,搜索字符串中的“的”“地”等字,在“的”字前后把字符串切成两串,大概是这么弄的。建议实际要做时,最好先把汉字转换成拼音再做,效率会高很多
.NET中文
分词
示例代码
在.NET开发环境中,中文
分词
是一项重要的任务,特别是在文本处理、
搜索
引擎、自然语言处理等领域。本文将详细探讨.NET中文
分词
示例代码及其使用的盘古
分词
类库,旨在帮助开发者理解和实现中文
分词
功能。 首先,让...
solr6.0中IK
分词
需要的资料
在Solr中,
分词
器是处理输入文本并将其分解为可
搜索
单元的关键组件。IK
分词
器(Intelligent Chinese Analyzer for Solr)是针对中文的一种高效、灵活的
分词
工具,特别适合于Solr和Elasticsearch等全文检索引擎。在这...
盘古
分词
、lucene3.0.3
搜索
的使用示例v1.3.zip
通过以上步骤,我们可以构建一个具备
分词
、
搜索
、分页以及分类
搜索
功能的系统,这对于信息检索、数据分析以及内容推荐等领域都有着广泛的应用。在实际项目中,开发者可以根据业务需求进一步优化
搜索
算法,提升用户...
lucene-4.6.0全套jar包
3.
分词
器(Analyzer):
分词
器负责将输入的文本分解为可
搜索
的词语。Lucene 4.6.0提供多种预定义的
分词
器,如标准
分词
器、中文
分词
器等,同时也支持自定义
分词
规则。 4. 索引(Index):索引是Lucene的核心,它将...
分词
搜索
必须上Elasticsearch?试试MySQL
分词
查询,轻松满足大多数
搜索
场景的需求
没错 Elasticsearch 很强大,但是对于一些中小型的项目、网站,简单的一些
分词
搜索
需求,如果使用 Elasticsearch 无论是硬件成本、开发开发成本都大大增加!如果中小项目中一些简单的
分词
搜索
,可以试试 MySQL
分词
...
ASP
28,406
社区成员
356,946
社区内容
发帖
与我相关
我的任务
ASP
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
复制链接
扫一扫
分享
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章