lucene-3.6.0.zip下载

1努力加油1 2019-03-05 06:35:23
...全文
14 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
【资源介绍】 Javaweb课程作业基于Hadoop的中文词频统计工具源码+使用说明.zip 一、Linux下配置hadoop集群(伪分布式或完全分布式) 1、https://blog.csdn.net/z1148059382/article/details/89459182 2、Windows下管理HDFS的神器:HDFS Explorer 二、在Windows环境下通过IDEA远程连接Linux里的Hadoop并运行MapReduce程序 1、下载winutils.exe和hadoop.dll https://github.com/steveloughran/winutils 2、将hadoop.dll放到C:\windows\System32里 3、将hadoop-2.7.7.tar.gz(二进制包)解压到Windows的E:\里 4、将winutils.exe放到E:\hadoop-2.7.7\bin里 5、将Linux里配置好的hadoop的配置文件目录里的log4j.properties和core-site.xml复制到项目根目录(IDEA的maven项目的话是放到resources目录里,下同) 6、往HDFS里/user/joe/wordcount/input传要统计的文件(不要创建output文件夹) 7、执行程序 三、中文分词能力(使用IKAnalyzer分词器) 1、下载IKAnalyzer2012_u6.zip(最新版) https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/ik-analyzer/IKAnalyzer2012_u6.zip 2、由于maven库里没有ik的坐标,所以我们需要手动将IKAnalyzer2012_u6.zip里的jar包添加到本地Maven仓库里(也可以直接引入到项目的外部jar包库中) (1)cmd,进入放置jar的文件夹 (2)mvn install:install-file -DgroupId=org.wltea.ik-analyzer -DartifactId=ik-analyzer -Dversion=2012_u6 -Dpackaging=jar -Dfile=IKAnalyzer2012_u6.jar (3)在项目的pom.xml里用以下内容引入依赖: org.wltea.ik-analyzer ik-analyzer 2012_u6 org.apache.lucene lucene-core 3.6.0 3、将IKAnalyzer.cfg.xml和stopword.dic复制到项目根目录 4、配置用户自定义词库 (1)项目根目录下创建MyDic.dic,在里边打单词,一行一个 (2)修改IKAnalyzer.cfg.xml MyDic.dic; 【备注】 该项目是个人毕设/课设/大作业项目,代码都经过本地调试测试,功能ok才上传,高分作品,可快速上手运行!欢迎下载使用,可用于小白学习、进阶。 该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。 项目整体具有较高的学习借鉴价值!基础能力强的可以在此基础上修改调整,以实现不同的功能。 欢迎下载使用,也欢迎交流学习~

12,798

社区成员

发帖
与我相关
我的任务
社区描述
CSDN 下载资源悬赏专区
其他 技术论坛(原bbs)
社区管理员
  • 下载资源悬赏专区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧