赋能数字经济,第三届江苏大数据开发与应用大赛赛题设计与评审工作圆满完成

t15653212167_ 2022-10-11 14:10:28

第三届江苏大数据开发与应用大赛8月启动以来,一直备受关注,近日,大赛工作取得里程碑进展,四个赛道的赛题设计工作顺利完成。在赛题评审会上,赛题体现出的技术水平和创新思维均获得大赛专家团队的的高度认可

江苏大数据开发与应用大赛是江苏省工业和信息化厅指导下的高规格数据大赛,又简称“SEED大赛”,寓意海量的数据像沉睡的种子,等待开发培育。江苏省数字经济发展起步早,基础好,政府在推进数据价值化、推进数据要素市场建设方面工作力度很大,SEED大赛就是在探索数据价值化实现路径的背景下应运而生,到今年已是第三届。南数研究院连续三年承接SEED大赛的运营工作,并提供数据服务平台进行支撑。

 

图片

自主创新,数据竞赛专业服务

大赛引领,数字经济赋能江苏

南数研究院依托于平台+解决方案,为各级政府提供综合性的数字经济赋能服务,数字创新大赛是研究院数字经济服务中的重要内容。研究院拥有成熟的赛事运营、选手推广的经验,为多个地方政府成功打造数字经济名片,赛事业务已走向全国,并以大赛为抓手,为各地政府、企业进行综合性的创新创业、数字化转型服务。

SEED大赛作为高规格的省级赛事,选手覆盖全国乃至世界范围,不乏业界高手,对赛事的技术规格,数据规格都要求很高。在赛事运营服务上,充分体现了研究院在云计算、大数据、人工智能、隐私计算方面深厚的技术积累,在政务、行业数据开放运营方面的丰富经验。在这三年的SEED大赛中,南数研究院为江苏省数字经济发展,数据要素市场建设,做出了独特的创新性贡献,为江苏省打造了医疗健康、智能制造、车联网、能源管理等数个典型大数据开放应用场景。在政府的引导和支撑下,研究院在SEED大赛中实践技术,打造和完善了大数据安全共享与开发服务平台,研发出基于隐私保护的数据安全计算沙箱技术、多云协同算力调度技术、自动化模型评估技术等。

在研究院主持设计下,今年的赛题在前两届赛事的基础上实现多处创新和技术升级,其中医疗卫生赛道持续聚焦胃癌领域,为参赛选手提供病理和影像的融合数据,实践人工智能的多模态学习;能源管理赛道中,大赛赛题首次与隐私计算技术结合,在“可用不可得”的前提下,实现了电力和政务数据的融合分析。同时,在南数研究院的精心打磨下,MARS大数据服务平台也焕然一新,在这届大赛中展现3.0版新面貌,整体提升大赛的数据应用技术水平和选手体验。

 

 

图片

SEED升级,大赛数据价值挖掘

MARS改版,平台数据开放服务

本届SEED大赛,为了赛题在内容和规格上实现全方位的突破升级,研究院抽调数据分析和算法团队核心成员加入赛题设计工作,持续2个月的辛苦努力与大赛专家组协同完成了赛题的设计工作。研究院数据分析和算法团队的成员,多年深耕于数据领域,有丰富的大数据分析挖掘经验,为多家大型客户进行过数字化转型、人工智能应用服务。团队在大数据分析挖掘、计算机视觉,分析决策等方面有深厚积累,在城市智能管理、医疗病理诊断、工业瑕疵检测等应用领域有多项先进技术成果。这些技术积累和经验,为本届SEED大赛赛题的论证和设计提供了可靠的理论和技术支撑。

在大赛运营赛题设计工作中,尤其对于算法赛题,需要以清晰明确的思路,帮助参赛选手充分理解考察重点和开发目标,同时配套科学的计算方法对模型效果进行合理评价。在赛事数据条件的基础上,在成本限制、计算资源约束、数据安全防护的前提下,赛题设计需要平衡可解性、前沿性和创新性等多方面的要求。这对赛题设计专家要求极高,除了数据方面的技术底蕴,还需要在各领域具备非常广博的知识储备。

为更好地支持SEED大赛,南数研究院对MARS平台进行了全方位的升级改造,即将上线的MARS3.0发布后将形成竞赛、大数据开放服务、大数据开放实验室、大数据生态合作等丰富板块的大数据公共服务平台。MARS平台是国内唯一一家集大赛、数据开放为一体的大数据公共服务平台,平台依托区块链、隐私计算技术,集数据开放、算力开放、算法模型开放、场景开放、教育实训开放服务为一体,目前注册用户40000多人,遍布全球20多个国家和地区。大赛累计参与院校1200余所,数据开放应用涉及24个行业领域。

图片

大赛赛题评审会精彩实录及摘要

9月28日,由江苏大数据开发与应用大赛组委会发起,邀请了来自南京大学郭延文教授、南京航空航天大学梁栋副教授、东南大学倪巍伟副教授、东南大学沈卓炜副教授、南京航空航天大学朱旗副教授等专家对大赛四个赛道赛题展开评审。南数研究院院长曹祯庭携运营团队以及承办方代表国网江苏省电力有限公司相关负责人通过线上+线下方式参会。

今年的赛道数量与往届相同,共设4个赛道,分为3个算法赛道,1个创新创意赛道,一方面,巩固往届大赛成效和应用,延续性设置医疗卫生和数字媒体赛道;另一方面,推进行业产业数字化转型,创新设置智能制造和能源管理赛道,不断探索与实践数据与产业融合的创新发展模式。

图片

图片

图片

图片

专家组对今年赛题的质量和规则设计都给予高度肯定,特别是医疗卫生赛道和能源管理赛道,都实现重大突破和创新。南数研究院数据科学团队与评审专家对四个赛道的赛题创意、赛题内容、技术实现、评审规则、应用场景等进行了充分讨论,提出了科学合理的意见建议,确保了赛题的合理性和公平性,整体上保证赛题质量,为大赛的成功举办奠定了坚实的基础。

南数研究院算法总监孟娇特别重点介绍了医疗赛道的多模态技术:医疗卫生的胃癌风险智能预测是一个专业性要求极高的任务,本届再次聚焦胃癌病理诊断并对赛题进行全方位设计,为参赛选手提供多模态的融合数据用于目标建模。生活中,每一种信息的来源或者形式,都可以称为一种模态。个体对场景进行感知时会接收到多种信号,如视觉、听觉、嗅觉等,所以多模态机器学习方法更贴近人类认识世界的形式,也是人工智能技术取得进一步进展的基石。随着技术和产业的进一步发展,多模态成为人工智能技术和产业突围的新方向,更多场景应用需要多模态模型来支撑。在精准医学时代,核心的基础要素是多模态数据,唯有多模态数据,才能让医生看到全部信息,还原疾病与人体健康情况的真实面貌。

能源管理的赛题设计上也进行了重大创新,南数研究院技术总监赵梧初介绍在能源管理赛道设计上运用了隐私计算技术,它是在保护数据本身不对外泄露的前提下实现数据分析计算的技术,能够增强对于数据的隐私保护、降低数据泄露风险,实现“数据可用不可得”。

南京大学郭延文教授评价,“多模态技术在本次大赛医疗卫生赛道中的图像识别任务中应用,将为参赛选手提供不同类型的融合数据,考察选手综合处理多模态数据的能力,让选手有更大的赛题发挥空间。”

东南大学副教授倪巍伟在评议赛题时谈到政务数据和电力数据融合分析时,深度探讨了联合建模时如何平衡准确率和性能,在我们赛题的特殊场景中,应兼顾效率的同时优先保证准确率,与会专家深入讨论了在现实中纵向联邦场景的实现,探讨了数据垄断的问题和商业公平性问题。

在评审会的尾声,与会评审专家意犹未尽,总结发言中,对南数研究院自主研发的MARS大数据服务平台表示高度认可,并表达了希望后续在MARS平台上进行科研领域的合作探索。

南京南数数据运筹科学研究院是依托南京大学数学系国家一级重点数学学科、科技部国家应用数学中心、教育部国家理科基础科学研究和教学人才培养基地组建成立的新型研发机构,江苏大数据联盟理事长单位。

南数研究院集数字化转型咨询服务、数字化人才发展服务、数字产业研究咨询服务、数据科学竞赛服务、数字文商旅聚合服务为一体,致力于政产学研用的融合创新。

图片

...全文
35 1 打赏 收藏 举报
写回复
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复

http://www.marsbigdata.com/?channel=shequ&carrier=pmd
欢迎登陆mars大数据开放服务平台
2022年第三届seed大赛火热进行中,88万现金大奖,人才引进政等
关注mars平台微信公众号即可参与抽奖活动
邀请好友报名参与即可获得算力服务

发帖
BSV区块链

41

社区成员

BSV区块链(BSV Blockchain)是唯一遵从2008年发布的比特币白皮书宗旨的全球公有链,具有稳定性、可拓展性、安全性、支持安全即时交易四大核心特性。
区块链 技术论坛(原bbs)
社区管理员
  • BitcoinSV社区
  • m0_61093267
  • 吴小花❀
加入社区
帖子事件
编辑了帖子 (查看)
2022-10-11 14:15
创建了帖子
2022-10-11 14:10
社区公告
暂无公告