Magic Data加入信通院“数据安全推进计划(DSI),共建健康规范的数据安全生态
社区首页 (3633)




请编写您的帖子内容
社区频道(3)
显示侧栏
卡片版式
主页
博文收录
Ada助手
最新发布
最新回复
标题
阅读量
内容评分
精选

2565
评分
回复


Magic Data加入信通院“数据安全推进计划(DSI),共建健康规范的数据安全生态
“数据安全推进计划”(Data Security Initiative,以下简称“DSI”)由中国信息通信研究院(以下简称“中国信通院”)联合三十余家企业于2021年9月1日正式发起。旨在帮助企业建立健全数据安全建设,推动促进《数据安全法》的落实。 截至目前,共有前后两批共138家企业申请并通过严格审核成为DSI参与单位。DSI参与单位均为业内龙头企业,行业广泛分布于金融、互联网、通信、汽车、安全厂商和医疗等领域。 近日,北京爱数智慧科技有限公司(Magic Data)与中国建设银行、潍柴智能
复制链接 扫一扫
分享

3992
评分
1


从数据原材料和生产工具看AI产业发展源动力
2021 年是对话式 AI爆发元年,想要推动对话式人工智能的落地,除了依靠人机交互技术外,更需要百倍千倍以上规模的训练数据量。 AICon | Magic Data创始人兼CEO 张晴晴博士《对话式AI数据赋能企业数字化转型》 01对话式AI是人机交互中的典型形态 无论是在所谓的虚拟世界中,还是在最近很火的“元宇宙”里,其中都提到很多关于对话式交流现象,人和人的交互,人和机器,人和虚拟世界的交互,“对话式”成了非常典型的一种交互形态。 相较于相对死板的朗读数据,对话数据里存在很多自然语言现象,
复制链接 扫一扫
分享

93
评分
回复


爱数智慧张晴晴荣膺《财富》2021年中国最具影响力的商界女性未来榜
2021年11月9日,《财富》公布“2021中国最具影响力的商界女性榜和中国最具影响力的商界女性未来榜”,爱数智慧创始人兼CEO张晴晴与微软亚洲研究院陈薇、中兴通讯崔丽、埃森哲大中华区朱虹、华大集团朱岩梅等49名商界女性入选中国最具影响力的商界女性未来榜。 《财富》编辑部表示:“这份始于2010年的榜单,旨在呈现中国商界女性领导者的智慧、勇气、坚持与信心。过去11年中,中国商界几乎所有重要的女性领导者都在这份榜单上有迹可循。 今年的榜单包括两个部分:中国最具影响力的商界女性榜,以及中国最具影响
复制链接 扫一扫
分享

181
评分
回复


女科学家创业:曾花300天整数据、被通知立刻搬家,如今她为超100家AI企业输送“原油”
爱数智慧创始人兼CEO 张晴晴 作者丨巴里 编辑丨子钺 图源丨受访者 “能够让机器理解人的所思所想,并能够将这些内容转化成文字是一件很酷的事情。” 17年前,还在北邮读通信的本科生张晴晴偶然间接触到了语音识别。她当时也许没有料到,在接下来的17年,语音识别会与她的理想与事业结下不解之缘。 在人工智能三驾马车中,数据是算法的基础,就好比原油,只有经过清洗、分类、标注、质检和筛选等结构化过程,才能用于AI模型训练。 2015年,已经在中科院声学所从事对话式AI研究的张晴晴意识到,如果不从根本上解
复制链接 扫一扫
分享

93
评分
回复


我们5岁啦 | 给你我们的“AI”,开启下一段探索之旅!
5年前的今天,2016年11月3日,爱数智慧正式成立。 如今我们走过了整整5个春秋, 作为人工智能时代的弄潮儿, 爱数智慧从最初的起步阶段,到不断成长,再到如今快速发展, 都离不开每个爱数智慧人的辛勤付出, 离不开为客户提供优质的数据服务。 5年里, 我们的客户数量不断积累, 已为上百家国内外头部互联网企业提供服务, 现在客户数量仍在不断增加。 5年里, 我们积累海量语音数据集产品, 超过20万小时自有AI训练数据集, 涵盖60个语种数据,8大方言区方言。 5年里, 我们进一步聚焦智慧出行、智
复制链接 扫一扫
分享

833
评分
回复


爱数智慧5周年 | 专访颜永红 :开发好应用标准,帮别人省钱,或帮别人赚钱
开发一个好的应用标准是,要么你能帮别人省钱,要么你能帮别人赚钱。 我们想招一些想做事的人,并且努力在寻找一些有趣的方向做研究。 我们自己也想做得好一点,总要超越昨天的自己。 这些年我们一直在做尝试,做别人没有做过的应用,就是当时技术还支撑不了的,我们突破了这个技术然后把它做了出来。 我们作为科研单位就要努力解决从零到一的问题,做出一个产品然后在所有行业复制,这些代表性应用会对整个行业起到牵引作用。 在CNCC大会前的专访中,颜永红说出上面的金句。 第十八届中国计算机大会(CNCC 2021)将于
复制链接 扫一扫
分享

366
评分
回复


爱数智慧5周年 | 专访美的向江旭: 打造IoT界的“安卓” 首推“元家居”概念
我们提出了“元家居”概念,在家居的环境下,通过多模态融合感知技术,可以为用户提供一种全新的虚实结合的智能家居操作体验。 物理空间、虚拟空间和互联网空间三大空间结合一起,让人们在家居生活中感受到三大空间的服务和核心功能。 通过视觉、嗅觉、听觉等多模态信息感知,提供主动智能服务能力,让家居和人进行更自然的交互。 设备不仅感知人的行为,还可以感知水、空气、食材等物理环境。 不同品牌设备之间做到互相协同,智能家居行业可能就会起飞了。 我们一直在做第一个吃螃蟹的人,我们呼唤行业开放,当然我们自己也要开放。
复制链接 扫一扫
分享

119
评分
回复


爱数智慧5周年 | 专访田彪:多模态应用做到“眼耳并用” 数据是关键
我们是最早把多模态技术融合起来,最终做成一个应用产品的团队。 要降低硬件成本,让不同用户能够使用到,从而推动技术普惠化。 多模态技术只是设备的一部分,它还要和其他技术进行融合。 如何结合行业产品的具体需求去把算法的作用发挥出来,这是落地中的一个痛点。 未来趋势上,多模态技术将从模态联合走向模态融合,进而端到端多模态。 在CNCC大会前的专访中,阿里巴巴达摩语音实验室田彪接受采访时表达的精彩观点。 第十八届中国计算机大会(CNCC 2021)将于10月28日在深圳国际会展中心举行,CNCC由中国计
复制链接 扫一扫
分享

210
评分
回复


爱数智慧5周年 | 专访宋彦 :鼓励数据开放,推动高质量中文数据建设
由于自然语言本身的复杂性(例如歧义等),文本表征一直以来都是自然语言理解领域的最基础,也是极具挑战的问题。 如果有更多的研究者愿意公开中文特定领域的数据集,将能够极大地帮助和推动中文特定领域自然语言处理的研究。 高质量的数据应当体现人对于语言的知识和使用方式。 在未来短时间内,基于深度学习的方法,尤其是基于预训练模型的方法,仍然会是主流。 人工标注的质量十分重要,标注的准确性,一致性都是非常重要的评价指标。 在CNCC大会前的专访中,宋彦接受采访时表达以上精彩观点。 第十八届中国计算机大会(CN
复制链接 扫一扫
分享

183
评分
1


NCMMSC 2021 | ASR&SD挑战赛圆满结束 参赛者论坛现场案例分享成绩亮眼
竞赛论坛在NCMMSC 2021大会现场举办 由爱数智慧、中科院声学所和江苏师范大学主办,MagicHub.com开源社区、上海白玉兰开源开放研究院、华为MindSpore社区、英特尔OpenVINO中文社区协办的“对话式AI语音识别及说话人识别(ASR&SD)挑战赛”顺利闭幕,并在10月16日的2021年第十六届全国人机语音通讯学术会议(NCMMSC 2021)大会现场举行竞赛案例分享和颁奖仪式。 西北工业大学教授,博士生导师,IEEE fellow陈景东、中科院声学所助理研究员程高峰、爱数
复制链接 扫一扫
分享

191
评分
回复


NCMMSC 2021 | 工业论坛大咖共话数据 爱数智慧CEO张晴晴论“当数据遇上开源”
第十六届全国人机语音通讯学术会议(NCMMSC 2021)于10月15日~18日在徐州隆重召开,爱数智慧以金牌赞助商身份参与此次盛会,通过展位、主题分享、竞赛论坛等方式,为与会嘉宾带来爱数智慧的数据产品、标注工具和技术成果。 17日下午工业论坛开展,论坛由西北工业大学教授谢磊主持,聚集爱数智慧、好未来等多家企业嘉宾现场做报告分享。爱数智慧创始人兼CEO张晴晴做《当数据遇上开源》的主题演讲,为在座嘉宾详细介绍爱数智慧的数据开源社区、标注工具和数据集产品,并呼吁业界更多机构和个人加入开源队伍,共同
复制链接 扫一扫
分享

218
评分
回复


社区上新 | 甜美女神伴你回家路 MagicHub.com开源不同音色用于导航的TTS数据集
MagicHub.com开源社区官网 在智能汽车领域,车载导航是最为常见的车内应用场景之一,也是“智能座舱”的重要组成部分,对用户体验有直接的影响。 随着用户需求的提升,车载导航要求有不同的体验,兼顾导航精准度同时,不同的音色可供选择,用户在悦耳的导航音下完成愉快的驾乘体验。 不同的用户对音色有不同的喜好,车载导航需要根据目标用户需求,选择能够最大化满足大多数客户的音色,既要有幽默男声,还要有甜美女声等等。 10月15日,MagicHub.com开源社区新开源一批数据集,专门针对导航开源了3个
复制链接 扫一扫
分享

148
评分
回复


爱数智慧五周年庆,数据集产品感恩赠送活动开启
恰逢爱数智慧五周年之际,为感恩新老客户一直以来的陪伴,爱数智慧将开展“5周年特别活动”:从10月15日到12月31日止,凡累计购买爱数智慧600小时以上语音训练数据集,即可获赠180小时中文对话式训练数据集及20小时自然甜美中文TTS训练数据集。 20万+自有数据集产品 目前,爱数智慧拥有超过20万自有训练数据集,其中超过12万小时对话式数据,超过6万小时朗读式数据,超过2万小时自发式数据,涵盖ASR、TTS、NLP、发音词典等。 爱数智慧的数据服务语种超过60种语言和方言,既有常用语种如英语、
复制链接 扫一扫
分享

137
评分
1


阿强严选 | 当AI遇到“方言英语” 该怎么破?
大家好,阿强又和大家见面啦! 这一个月,我们给大家推荐了20万小时自有数据集,涵盖30+语种,这些数据集目前优惠3折起。但是很多人会问,这些数据集里都包含了哪些语种,特别英语是被问到最多的数据之一。 那么,今天阿强就为大家系统介绍英语对话/朗读/自发式数据集,以及这些数据集在各大场景的应用,这些英语数据集照例优惠3折起! 英语在世界各地的应用 图片来源:摄图网 英语是大家最不陌生的一种语言,同时也是目前学校唯一普及的一个语言。按照分布面积而言,英语是目前世界上最流行的语言,作为母语者数量是世界第
复制链接 扫一扫
分享

175
评分
1


社区上新 | 来自大湾区哥哥们的粤语数据集 可用在智能座舱智能家居场景 确定不来看看?
图:MagicHub.com开源社区 “互联互通”是人们对未来科技的新幻想,如今物联网技术已经渗透到各行各业,与我们的生活息息相关,其中智能家居是物联网的重点应用领域。据艾瑞报告显示,2019年中国智能家电市场规模首次突破3000亿元,智能生活电器未来发展前景较好,预计在2020年到2022年间将有7%~9%的增长速度。 一起来看看MagicHub.com开源社区9月份又开源了哪些数据集↓↓↓ 智能座舱数据集 目前汽车行业进入存量市场,市场竞争加剧推动了智能汽车的发展,智能座舱的技术水平决定了
复制链接 扫一扫
分享

510
评分
回复


喜讯 | Annotator® 5.0智能化标注平台斩获“2021企业数字化转型最佳产品奖”
2021年9月16日,中国科学院《互联网周刊》、中国社会科学院信息化研究中心、eNet研究院、德本咨询(北京)有限公司主办“2021中国新科技100强评选暨秋季金i奖颁奖”活动,爱数智慧Annotator® 5.0智能化标注平台凭借创新的技术、实用前瞻的功能和个性化的良好体验,从众多候选产品中脱颖而出,一举斩获“2021企业数字化转型最佳产品奖”。 图:爱数智慧标注平台荣获“2021企业数字化转型最佳产品奖” 爱数智慧加速推动行业创新步伐 此次颁奖活动,主办方从品牌、产品、解决方案、模式等维度
复制链接 扫一扫
分享

92
评分
1


技术大咖齐聚爱数智慧人机交互技术论坛 | CNCC2021
恰逢爱数智慧成立五周年之际,CNCC2021在深圳隆重开展。CNCC2021【人机交互技术的机遇与挑战】技术论坛将于2021年10月28日13:00-16:00在深圳国际会展中心CC105B召开,本次论坛由CCF主办,爱数智慧赞助。爱数智慧创始人兼CEO张晴晴担任论坛主席,邀请来自产学研各界技术大咖,就人机交互、智能语音技术的应用、对话式AI技术、语料库建设、多模态语音交互技术、自然语言处理等议题进行主题报告,展开深入探讨。欢迎学术和企业界的同行参加本次论坛,期待与您的深入交流。 CNCC20
复制链接 扫一扫
分享

109
评分
回复


北京爱数智慧正式上线SaaS免费标注平台-Annotator® 5.0
8月27日,北京爱数智慧正式上线Annotator® 5.0 智能化标注SaaS平台免费版,该平台是公司核心团队深耕数据行业数十年,首次发布的免费版标注平台,为数据工程师、算法工程师和AI训练师带来全新的标注体验。目前标注平台已在MagicHub.com开源社区上线,供AI开发者们免费使用。 Annotator® 5.0 智能化标注SaaS平台免费版界面 AI数据服务市场规模不断扩大 人工智能商业化目前在算力、算法和数据方面基本达到阶段性成熟时期,在寻求进一步落地过程中,需要大量经过标注处理
复制链接 扫一扫
分享

778
评分
回复


社区上新 | MagicHub.io开源这5个数据集 涵盖对话式、朗读式和NLP数据
MagicHub.io开源社区 数据是人工智能的燃料,为人工智能与人交流提供动力支撑。网络和硬件的普及带来数据量的飞速增长,但是结构化的数据才能用于监督学习,才是人工智能真正理解人的关键。当开发者开发出AI模型,将结构化的数据输入到模型中,进行大量的训练,不断提升模型的识别率和响应速度。这里涉及到语音识别(ASR)、语音合成(TTS)和自然语言理解(NLP)等技术。 近期,MagicHub.io开源社区继续开源数据,此次开源超过20小时不同数据集,包括语音识别(朗读和对话语音数据)以及自然语言
复制链接 扫一扫
分享

800
评分
回复


MagicHub.io开源社区上线标注平台SaaS免费版啦,最全使用教程请收好!
很多AI开发者在做算法时,模型需要数据进行训练,有些数据需要标注才能用。Annotator ®5.0标注平台SaaS免费版是新出来的一款免费音频数据标注工具,接下来模拟一下平台使用过程,帮助刚接触平台的小伙伴们快速上手,希望能帮助到大家。 具体步骤: 步骤一:进入平台:复制该链接https://app.magichub.io到浏览器,或者通过MagicHub.io开源社区进入标注平台,勾选下方“阅读并同意Annotator使用条款”,然后点击“立即使用”: 步骤二:导入文件:进入标注平台后,把
复制链接 扫一扫
分享
为您搜索到以下结果:
5
社区成员
28
社区内容





MagicHub.io开源社区
社区为AI开发者提供大量免费的结构化数据集,包括ASR、TTS、NLP等数据集,供大家训练和测试模型使用。
复制链接 扫一扫

确定
社区描述
社区为AI开发者提供大量免费的结构化数据集,包括ASR、TTS、NLP等数据集,供大家训练和测试模型使用。 数据结构 企业社区
加入社区
获取链接或二维码
- 近7日
- 近30日
- 至今
加载中
社区公告
暂无公告