英文文章如何提取Tag？可以大概讲一下算法思想吗？

woshigefantong 2010-09-25 12:08:38

小弟现在需要做这个东西，其实就是一片大概100多个单词的文章，在文章发表的时候，我需要提取文章中出现频率较高的词和词组做为Tag。
很多博客都实现了这个功能，但是我不知道这个算法应该如何去实现。那位指导一下。谢谢啦。
我现在处理的只是英文文章，不需要处理中文，所以应该会简单一点。

...全文

98 4 打赏收藏转发到动态举报

写回复

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

blazingfire 2010-09-25

打赏
举报

回复

按空格提取单词，再统计

zhaoxinwei0706 2010-09-25

打赏
举报

回复

没听过。。。帮LZ顶一下。。。。。

coolbamboo2008 2010-09-25

打赏
举报

回复

试试用lucene计算词频吧

安心逍遥 2010-09-25

打赏
举报

回复

暂时没有想法，帮顶啦...祝楼主好运

感想这篇文章主要讲的是提取视觉信息特征，给图片推荐标签；利用了卷积神经网络提取图片的特征，利用最后一个全连接层合并用户和图片交互信息，得到最终的标签排序。还是挺新颖的，毕竟把推荐问题融合到一个网络，输出的直接是标签的排序，充分利用了深度学习的强大的特征表达能力。 1 介绍用户随意指定标签，用于支持用户组织或查找社交媒体的内容。可是，许多分享的内容有很少或者没有标签的，这是由于

1、无论是做软件，还是任何其他行业，甚至包括做人，很多时候，都是在解决问题。遇到麻烦，想办法解决。 2、最简单的问题，就是能够在书上找到现成答案的问题。比如：哪种排序的效率更高。 3、如果一个问题，书上没有现成的答案，能够通过Google、查找相关论文等等手段，找到答案的，也是简单问题。 4、如果，搜索不到现成答案，但是能够找到询问的人，问出答案来。比如Google不到，只

不只是一个插件，它是内容智能化管理趋势的一个缩影。当机器能够理解“这篇文章到底在说什么”，并自动为其打上精准标签时，我们就离真正的“智能内容工厂”又近了一步。而这，或许正是未来每一个内容创作者都需要掌握的新技能。🛠️📊🚀本文还有配套的精品资源，点击获取简介：auto-tag-slug.0.5.0是一款针对WordPress平台开发的自动化标签与别名（slug）生成插件，旨在帮助内容创作者高效管理文章标签。

从K近邻算法、距离度量谈到KD树、SIFT+BBF算法前言前两日，在微博上说：“到今天为止，我至少亏欠了3篇文章待写：1、KD树；2、神经网络；3、编程艺术第28章。你看到，blog内的文章与你于别处所见的任何都不同。于是，等啊等，等一台电脑，只好等待..”。得益于田，借了我一台电脑（借他电脑的时候，我连表示感谢，他说“能找到工作全靠你的博客，这点儿小忙还说，不地道”，有的时候，稍许感受到

从HTML文件中提取正文的简单方案 http://www.basesnet.com/seo/53从HTML文件中提取正文的简单方案2012-03-07/SEO/HTML文件,提取正文,简单方案/1多种基于html正文提取的思想一、基于统计的中文网页正...

81,114

社区成员

341,728

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章