中英双语TXT文本资源的官方下载地址

人工智能 2026-02-27 09:24:30

📚 专业语料库资源

资源名称官方下载/访问地址关键指引
燚炎英汉平行语料库http://corpus.bfsu.edu.cn/info/1082/1693.htm 访问该页面后,在内容中找到直接的下载链接,点击即可获取语料库压缩包 。
联合国平行语料库https://www.un.org/dgacm/zh/content/uncorpus/ch 页面提供了几种下载方式。要下载现成的TXT文本,请在 "Plain-text bitexts" 区域,找到 "English-Chinese" 对应的链接进行下载 。
“文桥”中英平行语料库wenqiao.top 这是一个在线检索平台。你需要在注册登录后,使用检索功能,并将结果导出为TXT格式 。

🚀 大规模机器翻译数据集

资源名称官方下载/访问地址关键指引
AI Challenger 2018需从启智社区(OpenI)页面获取这是一个学术数据集。上一个回复中提到的“启智社区”链接未能直接获取到,但根据搜索结果,该数据集的文本语料(AICtext)可以在中国科学院自动化研究所的页面找到:http://www.nlpr.ia.ac.cn/pal/Dataset/BLATID.html 。在该页面中找到并下载 "AICtext" 即可 。
ParaCrawl (英-中 bonus 语料库)https://paracrawl.eu/ 访问官网后,找到 "Bonus Release" 或最新版本(如 Release v9)的页面 。在语言列表中找到 "English-Chinese",点击对应的图标即可下载TXT格式的语料 。

 

 

资源名称内容特点完整下载地址/获取方式费用
牛津英汉词典 TXT 格式收词量约36万条,包含单词、短语、释义。精选了本世纪以来的新词新义7000余条,以及5.2万科技术语和1.2万百科知识条目。完整介绍页面https://blog.gitcode.com/c6a2c87168332a545d1314874e5f6119.html 
或访问备用介绍页:https://blog.gitcode.com/598287082d80fc8cb5f6754253083670.html 

下载指引:访问上述介绍页面后,页面中通常会提供直接的下载链接或网盘地址,点击即可获取TXT格式的词典文件。
免费
ECDICT 英汉词典数据库开源、免费、数据量极大(数十万词条)。包含单词、音标、中文释义、词性、柯林斯星级、考试标签(四六级/考研等)、词形变化等丰富信息。1. Git克隆git clone https://github.com/skywind3000/ECDICT.git 下载整个项目,核心文件为 ecdict.csv
2. 在线下载:在GitHub或GitCode搜索 "ECDICT",找到项目页面后直接下载 ecdict.csv 文件。
完全免费
...全文
287 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
【更新至2025年】2001-2025年上市公司数字化转型年报词频统计(吴非、赵宸宇、甄红线)(300+年报词频统计) 1、时间:2001-2025年 2、来源:上市公司年报 3、参考文献:企业数字化转型与资本市场表现——来自股票流动性的经验证据(吴非) 数字化转型如何影响企业全要素生产率(赵宸宇) 知识产权行政保护与企业数字化转型(甄红线) 4、方法说明:(1)参考吴非老师的做法,对人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用五个维度76个数字化相关词频进行统计 (2)参考赵宸宇老师的做法,对数字技术应用、互联网商业模式、智能制造、现代信息系统四个维度99个数字化相关词频进行统计 (3)参考甄红线老师的做法,对技术分类、组织赋能、数字化应用等类别下139个数字化相关词频进行统计 5、指标:年份、股票代码、公司简称、行业名称、行业代码、全文-文本总长度、仅英文-文本总长度、人工智能技术-吴、大数据技术-吴、云计算技术-吴、区块链技术-吴、数字技术运用-吴、数字技术应用-赵、互联网商业模式-赵、智能制造-赵、现代信息系统-赵、技术分类-人工智能技术-甄、技术分类-区块链技术-甄、技术分类-云计算技术-甄、技术分类-大数据技术-甄、组织赋能-人工智能技术-甄、组织赋能-云计算技术-甄、组织赋能-大数据技术-甄、组织赋能-广义数字技术-甄、数字化应用-技术创新-甄、数字化应用-流程创新-甄、数字化应用-业务创新-甄、人工智能、商业智能、图像理解、投资决策辅助系统、智能数据分析、智能机器人、机器学习、深度学习、语义搜索、生物识别技术、人脸识别、语音识别、身份验证、自动驾驶、自然语言处理、大数据、数据挖掘、文本挖掘、数据可视化、异构数据、征信、增强现实、混合现实、虚拟现实、云计算、流计算、图计算、内存计算、多方安全计算、类脑计算、绿色计算、认知计算等300+词频

5

社区成员

发帖
与我相关
我的任务
社区描述
学习交流人工智能相关算法及技术栈
opencv计算机视觉人工智能 技术论坛(原bbs) 广东省·深圳市
社区管理员
  • 亿只小灿灿
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧