您当前的位置:网站首页 > 高校驿站 > 校园传真 >

西安交大青年教师在大规模函数型数据领域取得新进展

2023-08-17 12:05  来源:西安交通大学  字号:T|T

在大数据时代下,随着互联网、云存储等技术的高速发展,实际分析处理中遇到的数据规模越来越大。尽管大规模函数型数据可以给我们带来海量信息,但是其对计算资源有着更高的需求,所需的计算时间更长,这也极大地提升了计算成本,影响数据分析的时效性、可操作性。因此如何解决大规模函数型数据分析时,遇到的存储空间和计算效率等方面的难题是大数据时代下函数型数据分析的一个重要问题。

近日,针对上述问题,西安交通大学经济与金融学院青年教师刘华博士、上海财经大学统计与管理学院教授尤进红博士和加拿大西蒙弗雷泽大学(Simon Fraser University)教授Jiguo Cao博士进行了深入的研究。他们首次把子抽样思想应用到函数型数据分析,开发出适应于函数型广义回归模型的最优抽样方法Functional L-Optimality SubsamplingFLoS,以此来实现减少计算时间、克服内存不足等问题的目标。除此之外,作者还通过理论和一系列的数值模拟来说明了该抽样方法的准确性和有效性。

科研人员把提出的最优抽样方法FLoS用于分析器官移植数据案例,该数据收集了几十万名肾脏器官移植接受者在接受器官移植手术时的信息,并记录了这些移植手术接受者在术后每次随访的信息,因此其是一个数据量非常庞大的且包含函数型数据的数据集。他们想要用接受者术后的肾小球过滤率曲线来判断移植手术能否成功并且预估他们在术后的大致寿命。通过分析与对比,他们发现基于FLoS方法抽取到的最优子样本得到的抽样估计和全样本下的估计几乎完全一致,进一步验证了该最优抽样方法的准确性和有效性。

近日,上述研究成果以《大规模函数型广义回归模型下的最优抽样方法FLoS》(Functional L-Optimality Subsampling for Functional Generalized Linear Models with Massive Data)为题发表在机器学习和人工智能领域国际顶级期刊Journal ofMachine Learning Research(简称JMLR)上。刘华是第一作者,西安交通大学经济与金融学院是第一署名单位。JMLR由麻省理工学院出版社(MIT Press)出版,依托于麻省理工学院的计算机科学与人工智能实验室(MIT CSAIL: MIT Computer Science & Artificial Intelligence Lab) 是国际上公认的计算机领域顶级期刊之一,主要刊登机器学习与人工智能领域的高质量前沿研究成果。

原文链接为:https://www.jmlr.org/papers/v24/22-0614.html

    相关文章
    西安交大科研人员在研究空气污染的社会经济影响方面取得新进展

    在全面深化改革的关键时期,社会稳定是国家最根本的需求和生存发展的基…[阅读]

    西安交通大学2022年度“王宽诚育才奖”评选结果揭晓

    近日,西安交通大学2022年度“王宽诚育才奖”评选结果揭晓,经个人申请、单位推荐及专家评选,化学学院丁书江等10位教师获评。 “王宽诚育才奖”评选的重点聚焦在坚持一线教学,态度严谨认真,…[阅读]

    暑期坚守:交大学子青春奋进在路上

    烈日炎炎,热浪滚滚。暑假期间,奋斗不息成为交大学子的关键词,他们放弃休息时间在校园开展科研、学习与服务工作,在拼搏中充实自我,在钻研中贡献力量。他们以奋斗激扬青春风采,忙碌的身影构…[阅读]

    西安交通大学学生微宣讲团与乌鲁木齐高新区(新市区)举行西北高校青年铸牢中华民族共同体意识宣讲联盟宣讲实践基地揭牌仪式

    8月9日,西安交通大学学生微宣讲团同新疆维吾尔自治区乌鲁木齐高新区(新市区)共同开展“同心共筑中国梦”西北高校青年铸牢中华民族共同体意识宣讲联盟宣讲实践基地揭牌仪式。 高新区(新市区…[阅读]

    西安交通大学在咸政府机关见习大学生座谈会举行

    8月11日上午,咸阳市政府领导与“向西向咸阳”政府见习实践团队举行座谈会。咸阳市副市长蒋彬凤、市政府副秘书长尚小刚、市政府办公室副主任李军、市政府政务公开办主任张振宇,西安交通大学团…[阅读]