思路求教,分不够再加

westwin 2003-11-27 05:59:05
请考虑一下这样一个工具。

比如我们已经翻译了sp1的user_guide(由html文件所构成)。
当需要翻译sp2的user_guide时,
因为到底文件哪里改动了不十分清楚,所以
需要从头查对所有文件。

希望有这样一个工具,能够自动把文件中一致的句子的翻译,
从sp1拷贝到sp2,保留不一致的英文内容,
这样就只需要翻译不一致的句子即可,

请开发一个这样的工具。

初步设想:
分析sp1的翻译来建立一个英文句子和中文句子的对照库,
在查对sp2的时候,自动把一致的内容拷贝到sp2处。

个人认为难点如下:
1.如何解析html文件,除去html标记
2.如何建立英文和中文之间的对应关系(翻译后的中文有可能不按照英文句子的顺序排列,所以说如果以句为单位截取英文和中文是不严密、不准确的)
3.如果以段为单位截取英文和中文,那么如何区分段?另:解析范围比较窄....


请教解决思路.thx!
...全文
25 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
iamwls 2003-11-28
  • 打赏
  • 举报
回复
思路如下:

html要去除,可参考使用JDK中自带的HTML包,估计满足不了你的需求

语言翻译目前的技术是不能很好处理你的第二条要求的
关于目前的水平及发展史,可参考人工职能书籍的 机器理解人类语言 相关内容


机器理解人类语言,金山快译如果能理解句子,那就能翻译句子了,现在还不成熟

用别的方法完成一部分工作吧
将英文原文比较工作完成就不错了,目前只能做到这样


westwin 2003-11-28
  • 打赏
  • 举报
回复
Leemaasn(他这家伙不怀好意 :P) 的思路我也考虑过:通过编号建立对应关系,首先你要清楚英文句子与中文句子之间的关系,如果加上编号,那么需要你在翻译的时候加上编号,这对用户来说基本上是不可能的;

对于第一个问题,这应该是在你分析好模型后,才考虑的事:嗯,这点说的非常对.
yangjuanli 2003-11-28
  • 打赏
  • 举报
回复
友情UP!
wobelisk 2003-11-28
  • 打赏
  • 举报
回复
use Diff tools or HTMLDiff tools
westwin 2003-11-28
  • 打赏
  • 举报
回复
谢谢大家的参与,请示经理后,经理建议按照以段为单位进行解析.结贴!
mzqali1 2003-11-27
  • 打赏
  • 举报
回复
用XML解决
killme2008 2003-11-27
  • 打赏
  • 举报
回复
关注ing.....
我也准备写个小型的网络对战游戏
大家能不能给点建议?
楼主,借一点点地方了:)
wxh512 2003-11-27
  • 打赏
  • 举报
回复
不好说呀
主要是你对数据库的理解了
有几个命令是拷贝数据库文件的
还有就是数据结构了
那要有树的漫游
Leemaasn 2003-11-27
  • 打赏
  • 举报
回复
我觉得对第二个和第三个问题:
你是否可以考虑一下,将英文中的某一个相对独立的句子或短语或段落翻译成对应的汉语后,将他们编个号,建立对应关系,

然后你再sp2里搜索原来的英文时,尽量以你原来保存的
相对独立的句子或短语或段落
为标准来查找。


对于第一个问题,这应该是在你分析好模型后,才考虑的事,
moke33 2003-11-27
  • 打赏
  • 举报
回复
有难度,考虑考虑

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧