公式图片ocr,输入图片输出对应的latex表达式
本项目中包含三个模型,包含im2katex,errorchecker,dismodel分别实现图像预测生成katex,预测katex错误语法纠正,和预测katex语法错误判别器。
对于im2katex和errorchecker均可以使用项目文件夹下的makefile文件进行训练和测试。
参数说明
data_type:
使用哪种数据集训练得到的权重,目前有'handwritten'—手写体图片训练集, 'original'—印刷体图片训练集, 'merged'—二者合并的训练集,默认使用二者合并的训练集。
model_type
运行那个程序,目前有两个模型,一个是im2katex,也就是上文所说的输入公式图片,输出预测的katex表达式;另一个是error,这个是对im2katex的改进(预测的katex存在缺失会导致katex无法渲染生成图片,对该类错误的图片使用nmt的方式进行错误纠正),经过训练,效果不好,目前已经废除,暂不使用。
mode
何种网络模型运行方式,可选参数为'trainval', 'test', 'val
, 相关下载链接:
https://download.csdn.net/download/shiyunzhe2021/88614959?utm_source=bbsseo