中英双语TXT文本资源的官方下载地址

人工智能 2026-02-27 09:24:30

📚 专业语料库资源

资源名称官方下载/访问地址关键指引
燚炎英汉平行语料库http://corpus.bfsu.edu.cn/info/1082/1693.htm 访问该页面后,在内容中找到直接的下载链接,点击即可获取语料库压缩包 。
联合国平行语料库https://www.un.org/dgacm/zh/content/uncorpus/ch 页面提供了几种下载方式。要下载现成的TXT文本,请在 "Plain-text bitexts" 区域,找到 "English-Chinese" 对应的链接进行下载 。
“文桥”中英平行语料库wenqiao.top 这是一个在线检索平台。你需要在注册登录后,使用检索功能,并将结果导出为TXT格式 。

🚀 大规模机器翻译数据集

资源名称官方下载/访问地址关键指引
AI Challenger 2018需从启智社区(OpenI)页面获取这是一个学术数据集。上一个回复中提到的“启智社区”链接未能直接获取到,但根据搜索结果,该数据集的文本语料(AICtext)可以在中国科学院自动化研究所的页面找到:http://www.nlpr.ia.ac.cn/pal/Dataset/BLATID.html 。在该页面中找到并下载 "AICtext" 即可 。
ParaCrawl (英-中 bonus 语料库)https://paracrawl.eu/ 访问官网后,找到 "Bonus Release" 或最新版本(如 Release v9)的页面 。在语言列表中找到 "English-Chinese",点击对应的图标即可下载TXT格式的语料 。

 

 

资源名称内容特点完整下载地址/获取方式费用
牛津英汉词典 TXT 格式收词量约36万条,包含单词、短语、释义。精选了本世纪以来的新词新义7000余条,以及5.2万科技术语和1.2万百科知识条目。完整介绍页面https://blog.gitcode.com/c6a2c87168332a545d1314874e5f6119.html 
或访问备用介绍页:https://blog.gitcode.com/598287082d80fc8cb5f6754253083670.html 

下载指引:访问上述介绍页面后,页面中通常会提供直接的下载链接或网盘地址,点击即可获取TXT格式的词典文件。
免费
ECDICT 英汉词典数据库开源、免费、数据量极大(数十万词条)。包含单词、音标、中文释义、词性、柯林斯星级、考试标签(四六级/考研等)、词形变化等丰富信息。1. Git克隆git clone https://github.com/skywind3000/ECDICT.git 下载整个项目,核心文件为 ecdict.csv
2. 在线下载:在GitHub或GitCode搜索 "ECDICT",找到项目页面后直接下载 ecdict.csv 文件。
完全免费
...全文
84 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
学习交流人工智能相关算法及技术栈
opencv计算机视觉人工智能 技术论坛(原bbs) 广东省·深圳市
社区管理员
  • 亿只小灿灿
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧