社区
C#
帖子详情
c# 有什么办法可以将包含html标签的字符串分段,字符不超过5000,翻译用的,太多Google不给你翻译
浪里个浪17
2017-11-25 01:45:01
目前的问题是 调用Google在线翻译翻译数据库的一个字段,里面是用HTML编辑器弄的一段代码,现在要翻译成其他语言,但是太多了,Google直接返回错误代码,现在是想把字符串再不影响翻译的前提下分段,html标签要完整,因为后面还有要处理html标签的,有什么好的方法,拜托各位了
...全文
404
7
打赏
收藏
c# 有什么办法可以将包含html标签的字符串分段,字符不超过5000,翻译用的,太多Google不给你翻译
目前的问题是 调用Google在线翻译翻译数据库的一个字段,里面是用HTML编辑器弄的一段代码,现在要翻译成其他语言,但是太多了,Google直接返回错误代码,现在是想把字符串再不影响翻译的前提下分段,html标签要完整,因为后面还有要处理html标签的,有什么好的方法,拜托各位了
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
7 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
特别
2017-11-27
打赏
举报
回复
google不是有翻译的
API
吗
小大飞
2017-11-27
打赏
举报
回复
把5000长度的字符串分割开来。字符串分为可翻译字符串和html字符串。 创建一个对象,对象有三个属性:原始字符,翻译后字符,bool是否可翻译; 遍历list集合进行翻译,翻译后再遍历list集合进行拼接。
帅猪儿
2017-11-27
打赏
举报
回复
接着上一个问题,之所以要截取/r/n这个换行标志,是为了保证翻译的整体性。即按照段落进行翻译,保证翻译能够整段翻译,使得翻译连贯。
帅猪儿
2017-11-27
打赏
举报
回复
我有个想法, 1、将html文档读取出来,存放到一个string内 2、截取这个string前5000字符内(string.length)最后一个换行字符/r/n,从这个字符开始截取之前的字段进行翻译。 3、对于剩下的字段,再次进行截取并翻译,并将各个翻译的内容组合。 4、这样就可以保证字符在不拆分的情况下完成翻译。 具体的代码如下: string f = "";//文件路径 StreamReader sr = new StreamReader(f, Encoding.Default); string strHTML = sr.ReadLine();//将文件内容读取到strHTML中 string strFY = "";//最终的翻译字符串组合 while (strHTML.Length>0) { string str1 = strHTML.Substring(0, 5000);//html临时值 str1 = str1.Substring(0,str1.LastIndexOf(@"/r/n")); str1 = fy();//执行翻译函数 strFY += str1; strHTML = strHTML.Substring(str1.LastIndexOf(@"/r/n")); } //strFY就是最终的翻译字符串组合 没有调试过,可能中间还有些 问题需要你自己解决。
秋的红果实
2017-11-27
打赏
举报
回复
正则表达式取出如1000个标签,进行翻译
闭包客
2017-11-27
打赏
举报
回复
http://blog.csdn.net/closurer/article/details/73466685
你可以使用一个 html 解析器拆分,翻译后再合并。
圣殿骑士18
2017-11-25
打赏
举报
回复
没什么办法把,你自己根据html标记解析,先把数据拆分好,送给google解析,回头再拼装。
一个
C#
多线程读文件列表的方法
因为从头一个个读文件太满,所以想用多线程
分段
读取,最后合成
(x)表示读取的线程和已经读的文件,(0)表示还没读取的文件
也就是迅雷下载时右边那个下载模块图一样的东西。。。
每个线程该从哪个文件读起、到哪个文件结束,方法已经写好,就是不知道如何将这些 fileModule 传给这些线程,backgroundworker用过了,虽然开始时间好象都是一样的,但是感觉好象还是从头开始读的一样,读文件的效率没得到提升,敢问如何使用多线程做成这样的效果,或者我的backgro
C#
实现的多线程异步Socket数据包接收qi框架
几天前在博问中看到一个
C#
Socket问题,就想到笔者2004年做的一个省级交通流量接收服务器项目,当时的基本求如下: 接收自动观测设备通过无线网卡、Internet和Socket上报的交通量数据包全年365*24运行的自动观测设备5分钟上报一次观测数据,每笔记录约2K大小规划全省将有100个左右的自动观测设备(截止2008年10月还只有30个) 当时,VS2003才发布
TCP Socket服务器编程
文章来源:http://www.cnblogs.com/zc22/archive/2010/06/27/1766007.
html
------------------ 前言 ------------------ 开发了这么多年,发现最困难的程序开发就是通讯系统。 其他大部分系统,例如CRM/CMS/权限框架/MIS之类的,无论怎么复杂,基本上都能够本地代码本地调试,性能也不太重要。
面经zijie
以下是对
C#
GC 和 Lua GC 的详细分析,包括它们的原理、特性、优化方式及对比。
C#
的垃圾回收器 (Garbage Collector, GC) 是一个自动内存管理系统,它在程序运行时负责管理对象的分配和释放,防止内存泄漏。
C#
使用 分代回收算法(Generational Garbage Collection):分代内存模型:回收过程:减少分配频率:避免 Gen 2 回收:分代调整:调试和监控:Lua 的垃圾回收器主要负责管理动态分配的内存,如表、
字符
串
和闭包。其实现基于 标记-清除算法,从
C#
AWS 开发指南(一)
如果你必须选择过去 20 年中出现的两种流行技术进行重点关注,那么很难挑选出比
C#
和 AWS 更好的选择。Anders Hejlsberg 于 2000 年为微软设计了
C#
,几年后,.NET 框架和 Visual Studio 推出。接下来,在 2004 年,跨平台的
C#
编译器和运行时环境 Mono 广泛可用。这个生态系统已经实现了包括跨平台移动框架 Xamarin 在内的独特平台和技术。在 2000 年代初的另一个宇宙中,亚马逊转向了面向服务的架构,并在 2002 年发布了公共 Web 服务。
C#
111,097
社区成员
642,554
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章