采用Gate API方式进行中文命名实体识别
我在我的Java项目中想采用API的方式调用Gate进行中文命名实体识别,调用Gate中的中文插件Lang_Chinese,想先采用最简单的方式跑通程序,但是一直没有标注结果。控制台显示如下信息:
OrthoMatcher Warning: No annotations found for processing
...CHNIE complete
File name: 'F:\workspace6.5\gateExtraction\StANNIE_1.HTML'
OrigContent existing. Generate file...
Unsorted annotations count: 0
Sorted annotations count: 0
我的思路是这样的:
1.设置Gate的home等系统变量。
2.调用Gate.init()进行初始化。
3.采用语句加载中文插件: Gate.getCreoleRegister().registerDirectories(new File(pluginsHome, "Lang_Chinese").toURI().toURL())。
4.采用语句 (ConditionalSerialAnalyserController) PersistenceManager.loadObjectFromFile(new File(new File(Gate.getPluginsHome(),"Lang_Chinese"), "resources/chinese.gapp"))创建控制器。
5.设置语料路径,语料是经过分词后以空格隔开的词语。
6.程序运行。
现在程序可以运行,但运行最后生成的HTML文件却没有任何标注信息,没有识别内容,我想问一下中间过程是不是有遗漏的内容。如何加载中文插件中用于命名实体识别的资源。