关于c#转换word到图片的问题,有源码,有测试数据,结果不满意,百思不得解,谢谢回答

西村秀木 2016-01-05 11:08:51
这是原文链接:http://ask.csdn.net/questions/230773?ref=myrecommend

那边好像没论坛热闹,人好少。
问题:
一个c#控制台程序,转换结果中,图片跟页内容不一致,图片显示内容不全。

源码:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using Microsoft.Office.Interop.Word;
using System.Drawing.Imaging;
using System.Drawing;
using System.IO;
using System.Drawing.Drawing2D;
using System.Windows.Forms;

namespace ConsoleApplication3
{
class Program
{
static void Main(string[] args)
{
//运行13版本word,请改一下引用的两个dll到dll的15版本,图片是透明的,想要不透明,转换成jpg即可

ConvertWord2Png("c:\\2.docx", "d:\\");
Console.WriteLine("已完成");
Console.ReadKey();
}

private static void ConvertWord2Png(string wordFile,string destinationFileDirectory)
{
Microsoft.Office.Interop.Word.Application app = new Microsoft.Office.Interop.Word.Application();
Document doc = null;
object unknow = Type.Missing;
app.Visible = false;
object file = wordFile;
doc = app.Documents.Open(ref file,
ref unknow, ref unknow, ref unknow, ref unknow,
ref unknow, ref unknow, ref unknow, ref unknow,
ref unknow, ref unknow, ref unknow, ref unknow,
ref unknow, ref unknow, ref unknow);


//获取总页数
int pages = doc.ComputeStatistics(WdStatistic.wdStatisticPages, ref unknow);
object What = Microsoft.Office.Interop.Word.WdGoToItem.wdGoToPage;
object Which = Microsoft.Office.Interop.Word.WdGoToDirection.wdGoToNext;


for (int i = 1; i < pages + 1; i++)
{
object page = i + ""; // 页数

Microsoft.Office.Interop.Word.Range ran1 = doc.GoTo(ref What, ref Which, ref page, ref unknow);

Microsoft.Office.Interop.Word.Range ran2 = ran1.GoToPrevious(Microsoft.Office.Interop.Word.WdGoToItem.wdGoToPage);

object start = ran2.End;
object end = ran1.Start;
Range ran3 = doc.Range(ref start, ref end);
if (i == pages)//最后一页处理
{
ran3 = doc.Range(ref end);
}
string x = ran3.Text;
SaveRangeToPng(ran3, destinationFileDirectory+ i + ".png");
}
doc.Close();
}
/// <summary>
/// 把word文档的一个范围存储成png图片
/// </summary>
/// <param name="range"></param>
private static void SaveRangeToPng(Range range, string saveFilePath)
{
byte[] bt = (byte[])range.EnhMetaFileBits;
FileStream fs = new FileStream(saveFilePath, FileMode.Create);
fs.Write(bt, 0, bt.Count());
fs.Close();
//用range.copytoPicture方法内存中找不到,所以用直接储存方式。
}
}
}


测试数据,
http://wenku.baidu.com/view/4ac2f0c38bd63186bcebbc0b.html?from=search

在这里回答或在原文回答都可以,谢谢了:-)
...全文
222 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
Justin-Liu 2016-01-08
  • 打赏
  • 举报
回复
引用 5 楼 lzj_999 的回复:
[quote=引用 2 楼 FoxDave 的回复:] Check
您的回答非常有用!!非常感谢!!但是当app对象的visible属性为false时候,得不到文档页。所以不知道您有没有解决这个的办法。因为想在后台进行处理。谢谢了。[/quote] 不太清楚啦,自己研究一下 不谢
西村秀木 2016-01-08
  • 打赏
  • 举报
回复
引用 7 楼 lzj_999 的回复:
[quote=引用 4 楼 wyd1520 的回复:] 用Aspose.Word组件吧,直接存就是了
感谢您的回答。 但是: Aspose.word的注册版本要好几万人民币。不注册的话,转换长文档有限制。只能转换8页左右,后面的文档都省略了。谢谢。[/quote] 你说话挺有趣哈,已关注。。倒不失为一个好方法。应该也可以的。不过经过查资料,已经姐解决了。稍后我会放到我博客上的。嘿嘿嘿嘿
西村秀木 2016-01-08
  • 打赏
  • 举报
回复
引用 9 楼 FoxDave 的回复:
[quote=引用 5 楼 lzj_999 的回复:] [quote=引用 2 楼 FoxDave 的回复:] Check
您的回答非常有用!!非常感谢!!但是当app对象的visible属性为false时候,得不到文档页。所以不知道您有没有解决这个的办法。因为想在后台进行处理。谢谢了。[/quote] 不太清楚啦,自己研究一下 不谢[/quote] 嗯 经查资料已解决。稍后会放到我博客上的。由于指导,已关注,望好!
本拉灯 2016-01-07
  • 打赏
  • 举报
回复
引用 7 楼 lzj_999 的回复:
[quote=引用 4 楼 wyd1520 的回复:] 用Aspose.Word组件吧,直接存就是了
感谢您的回答。 但是: Aspose.word的注册版本要好几万人民币。不注册的话,转换长文档有限制。只能转换8页左右,后面的文档都省略了。谢谢。[/quote] 你非得用一个正版的么。。。。。。。
西村秀木 2016-01-07
  • 打赏
  • 举报
回复
引用 3 楼 bjgzxx 的回复:
/// <summary>
        /// Word按页读取内容
        /// </summary>
        /// <param name="page">页数</param>
        /// <param name="isHtml">html或纯文本</param>
        /// <returns></returns>
        /// 
        public string ReadPage(int page, bool isHtml)
        {
            object objWhat = Word.WdGoToItem.wdGoToPage;
            object objWhich = Word.WdGoToDirection.wdGoToAbsolute;

            object objPage = page;
            Word.Range range1 = oDoc.GoTo(ref objWhat, ref objWhich, ref objPage, ref missing);
            Word.Range range2 = range1.GoToNext(Word.WdGoToItem.wdGoToPage);

            object objStart = range1.Start;
            object objEnd = range2.Start ;
            if (range1.Start == range2.Start)
                objEnd = oDoc.Characters.Count;//最后一页
            oDoc.Range(ref objStart, ref objEnd).Copy();

            if (isHtml)
            {
                MemoryStream stream =   Clipboard.GetData("Html Format") as MemoryStream;
                stream.Position = 0;//解决从剪切板复制中文内容乱码的问题www.xuehi.com
                byte[] bytes = new byte[stream.Length];
                stream.Read(bytes, 0, (int)stream.Length);

                return Encoding.UTF8.GetString(bytes);
            }
            else
            {
                byte[] bytes = Encoding.Default.GetBytes((string)Clipboard.GetData(DataFormats.Text));

                return Encoding.GetEncoding("gb2312").GetString(bytes);
            }
        }
十分感谢!这个代码只能得到word的文本信息,不能得到图像信息。请问能得到图像吗?
西村秀木 2016-01-07
  • 打赏
  • 举报
回复
引用 4 楼 wyd1520 的回复:
用Aspose.Word组件吧,直接存就是了
感谢您的回答。 但是: Aspose.word的注册版本要好几万人民币。不注册的话,转换长文档有限制。只能转换8页左右,后面的文档都省略了。谢谢。
西村秀木 2016-01-07
  • 打赏
  • 举报
回复
引用 2 楼 FoxDave 的回复:
Check
您的回答非常有用!!非常感谢!!但是当app对象的visible属性为false时候,得不到文档页。所以不知道您有没有解决这个的办法。因为想在后台进行处理。谢谢了。
早起晚睡 2016-01-06
  • 打赏
  • 举报
回复
/// <summary>
        /// Word按页读取内容
        /// </summary>
        /// <param name="page">页数</param>
        /// <param name="isHtml">html或纯文本</param>
        /// <returns></returns>
        /// 
        public string ReadPage(int page, bool isHtml)
        {
            object objWhat = Word.WdGoToItem.wdGoToPage;
            object objWhich = Word.WdGoToDirection.wdGoToAbsolute;

            object objPage = page;
            Word.Range range1 = oDoc.GoTo(ref objWhat, ref objWhich, ref objPage, ref missing);
            Word.Range range2 = range1.GoToNext(Word.WdGoToItem.wdGoToPage);

            object objStart = range1.Start;
            object objEnd = range2.Start ;
            if (range1.Start == range2.Start)
                objEnd = oDoc.Characters.Count;//最后一页
            oDoc.Range(ref objStart, ref objEnd).Copy();

            if (isHtml)
            {
                MemoryStream stream =   Clipboard.GetData("Html Format") as MemoryStream;
                stream.Position = 0;//解决从剪切板复制中文内容乱码的问题www.xuehi.com
                byte[] bytes = new byte[stream.Length];
                stream.Read(bytes, 0, (int)stream.Length);

                return Encoding.UTF8.GetString(bytes);
            }
            else
            {
                byte[] bytes = Encoding.Default.GetBytes((string)Clipboard.GetData(DataFormats.Text));

                return Encoding.GetEncoding("gb2312").GetString(bytes);
            }
        }
Justin-Liu 2016-01-06
  • 打赏
  • 举报
回复
xdashewan 2016-01-06
  • 打赏
  • 举报
回复
如果你要获取的是图片信息的话,可以看下这篇文章http://blog.csdn.net/sharpnessdotnet/article/details/5688731
本拉灯 2016-01-06
  • 打赏
  • 举报
回复
用Aspose.Word组件吧,直接存就是了

110,534

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧