应用OFFICE的OCR控件MODI,怎么使识别出来的文本保留格式

leejayjiang1988 2011-05-04 04:18:44
我用MODI识别图像文件,识别出来的文本都是一个挨着一个的,不含有原来的格式 怎么改进下能使其还有原来的格式
这是我用的代码:
private string Recognition(string strFileName)
{
string strResult = string.Empty;

// 宣告 MODI.Document 物件 modiDocument,并且实例化
MODI.Document modiDocument = new MODI.Document();

// MODI.Document 创建
modiDocument.Create(strFileName);

// 宣告 MODI.Image 物件 modiImage,其內容值来自 MODI.Document 物件 modiDocument
MODI.Image modiImage = (MODI.Image)modiDocument.Images[0];

// OCR Method(Language, WithAutoRotation, WithStraightenImage)
modiImage.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, false, false);

// 組合 OCR 识别后的 Word
foreach (MODI.Word WordItem in modiImage.Layout.Words)
{
strResult += WordItem.Text;
}
modiDocument.Close(false);

// 回传识别结果
return strResult;
}
...全文
341 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
sixwaters 2012-05-16
  • 打赏
  • 举报
回复
根据横坐标变化,可以嵌入空格。
sixwaters 2012-05-15
  • 打赏
  • 举报
回复
可以通过IWord的接口,跟踪每个字的坐标变化,进行换行,管用的。
特别 2011-12-27
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 net_lover 的回复:]

保留格式不可能的,
[/Quote]
+1
Xzoth 2011-12-27
  • 打赏
  • 举报
回复
使用OneNote2010的组件来做OCR识别吧,效果比较理想。
Xzoth 2011-12-27
  • 打赏
  • 举报
回复
使用OneNote2010的组件来做OCR识别吧
Xzoth 2011-12-27
  • 打赏
  • 举报
回复
使用OneNote 2010的组件来进行OCR识别吧
孟子E章 2011-05-04
  • 打赏
  • 举报
回复
保留格式不可能的,

110,536

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧