思路求教，分不够再加

westwin 2003-11-27 05:59:05

请考虑一下这样一个工具。

比如我们已经翻译了sp1的user_guide（由html文件所构成）。
当需要翻译sp2的user_guide时，
因为到底文件哪里改动了不十分清楚，所以
需要从头查对所有文件。

希望有这样一个工具，能够自动把文件中一致的句子的翻译，
从sp1拷贝到sp2,保留不一致的英文内容，
这样就只需要翻译不一致的句子即可，

请开发一个这样的工具。

初步设想：
分析sp1的翻译来建立一个英文句子和中文句子的对照库，
在查对sp2的时候，自动把一致的内容拷贝到sp2处。

个人认为难点如下:
1.如何解析html文件，除去html标记
2.如何建立英文和中文之间的对应关系(翻译后的中文有可能不按照英文句子的顺序排列，所以说如果以句为单位截取英文和中文是不严密、不准确的)
3.如果以段为单位截取英文和中文，那么如何区分段?另:解析范围比较窄....

请教解决思路.thx!

...全文

25 10 打赏收藏转发到动态举报

写回复

10 条回复

切换为时间正序

请发表友善的回复…

发表回复

iamwls 2003-11-28

打赏
举报

回复

思路如下：

html要去除，可参考使用JDK中自带的HTML包，估计满足不了你的需求

语言翻译目前的技术是不能很好处理你的第二条要求的
关于目前的水平及发展史，可参考人工职能书籍的机器理解人类语言相关内容

机器理解人类语言，金山快译如果能理解句子，那就能翻译句子了，现在还不成熟

用别的方法完成一部分工作吧
将英文原文比较工作完成就不错了，目前只能做到这样

westwin 2003-11-28

打赏
举报

回复

Leemaasn(他这家伙不怀好意 :P) 的思路我也考虑过:通过编号建立对应关系，首先你要清楚英文句子与中文句子之间的关系，如果加上编号，那么需要你在翻译的时候加上编号，这对用户来说基本上是不可能的;

对于第一个问题，这应该是在你分析好模型后，才考虑的事:嗯，这点说的非常对.

yangjuanli 2003-11-28

打赏
举报

回复

友情UP！

wobelisk 2003-11-28

打赏
举报

回复

use Diff tools or HTMLDiff tools

westwin 2003-11-28

打赏
举报

回复

谢谢大家的参与，请示经理后，经理建议按照以段为单位进行解析.结贴!

mzqali1 2003-11-27

打赏
举报

回复

用XML解决

killme2008 2003-11-27

打赏
举报

回复

关注ing.....
我也准备写个小型的网络对战游戏
大家能不能给点建议？
楼主，借一点点地方了：）

wxh512 2003-11-27

打赏
举报

回复

不好说呀
主要是你对数据库的理解了
有几个命令是拷贝数据库文件的
还有就是数据结构了
那要有树的漫游

Leemaasn 2003-11-27

打赏
举报

回复

我觉得对第二个和第三个问题：
你是否可以考虑一下，将英文中的某一个相对独立的句子或短语或段落翻译成对应的汉语后，将他们编个号，建立对应关系，

然后你再sp2里搜索原来的英文时，尽量以你原来保存的
相对独立的句子或短语或段落
为标准来查找。

对于第一个问题，这应该是在你分析好模型后，才考虑的事，

moke33 2003-11-27

打赏
举报

回复

有难度，考虑考虑

——拆（拆分） 4/ 天下大势，合久必分，分久必合。——合（合并） 5/ 隔空取物，犹如探囊取物——提（提取） 6/ 百转千回后的峰回路转。——转（转换） 7/ 它判断真假的唯一标准。——判（判断） 8/ 人以群分，...

C语言求教一个算概率的问题,c语言概率计算C语言求教一个算概率的问题,c语言概率计算匿名网友:----------------------int f6,ok;/--------------------------------放代码：/:150/:%d/%d\getch()!cardi) return,i;-...

但是在我平时学习中，往往代码能在网上找到一堆，能看懂的却不多（渣渣天性），喜欢这样的记录方式，自己能理清思路加深印象，或许还能帮到当初像我一样面对陌生知识一脸懵逼又无从求教的小白们~ 之前看过的用C++...

把上面两个步骤做了， sub 试炼 //多点找色 end sub call 试炼怎样实现这个语句，我call不到试炼，提示未定义试炼另外我想加一个判断现状的段子，思路还是把所有的多点找色放进名为判断现状的数组，然后还是用...

接前篇java解析json复杂数据的两种思路java解析json复杂数据的第三种思路我们已经有了解析json数据的几种思路，下面介绍的方法是最少依赖情况下的字符串解析, 流程如图:fill:#333;color:#333;color:#333;fill:none;...

62,614

社区成员

307,326

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章