【东大新闻网12月17日电】(通讯员 金灵 戴忱 摄影 张子荣)12月12日下午,东南大学统计与数据科学学院特邀报告会在南京举办。8位统计与数据科学领域专家做主题报告,涵盖本领域的最新研究成果、技术应用和发展趋势。来自北京大学、香港理工大学、上海交通大学等高校以及科研院所和业界的专家学者、统计与数据科学领域师生代表等到现场学习交流,共同探讨统计与数据科学前沿问题。
南方科技大学讲席教授荆炳义先作了题为 “Molecular Docking via Diffusion Models”的报告,讨论了如何使用基于扩散理论的生成式模型进行分子对接,展示了人工智能方法在药物研发中发挥的重要作用。
西南财经大学首席教授,统计研究中心主任林华珍在其演讲“Spatial Effect Detection Regression for Large Scale Spatio-Temporal Covariates”中,针对一类非标准空间效应变化问题,提出了一种新的空间效应回归检测模型,新模型降低了对数据量的依赖并提高了预测精度,在理论研究和实际应用上都具有良好前景。
密西根大学教授Peter Song作了题为“Understanding N+1=? From Lens of Public Health”的报告,从公共卫生的视角探讨了统计学对学科发展的影响,特别指出统计学和数据科学理论方法在老龄化研究领域大有用武之地。
清华大学丘成桐数学科学中心教授杨宇红作了题为“On A Synergistic Learning Phenomenon in Nonparametric Domain Adaptation”的报告,他分享了在迁移学习领域的最新研究成果,他们的研究发现了非参数域适应过程中的协同学习现象,推广了这个主题已有的理论结果,对于迁移学习方法的实际应用提供了有力的理论支撑。
法国国立统计与经济管理学院教授Cristina Butucea作了题为“Dynamic Topic Model”的报告,她深入浅出地介绍了主题模型研究进展和应用前景,该模型不仅能应用于自然语言处理(NLP)领域,还广泛的应用于协同过滤、社会网络分析以及群体遗传学等多个学科领域。对于主题模型,她创新性地提出了一种基于向量自回归过程的参数估计方法,在合理假设的基础上,给出了估计误差的非渐近界限,为主题模型在相关领域的应用建立了坚实的理论基础。
哈佛大学副教授Tracy Ke以“Estimation of the Number of Spiked Eigenvalues in a Covariance Matrix by Bulk Eigenvalue Matching Analysis”为题进行了报告,这项研究中尖峰特征值数量的估计是一个核心问题,报告人提出了一个两步法策略,第一步使用整体特征值来估计该分布的参数,第二步利用这些参数来辅助尖峰特征值的估计,取得了良好的估计效果。该方法已成功应用于肺癌微阵列数据集和1000个基因组数据集的深度分析中,展现了其在生物信息学和医学统计领域的巨大应用潜力。
北京大学讲席教授、数学科学学院概率统计系主任姚方作了题为“Semiparametric M-estimation using Overparameterized Neural Networks”的报告,他详细介绍了一种新的基于过参数化神经网络的半参数M-估计理论框架,并深入分析了参数估计在一般损失函数下的最优收敛性和渐近正态性,这项研究为深度学习算法的可用性和有效性提供了理论依据,具有重要理论意义。
东北师范大学教授郑术蓉以“Difference between Large Statistical Model and Small Statistical Model”为题作了报告。报告探讨了大统计模型与小统计模型之间在检验功效和因子分析等方面的区别,通过仿真和实例展示了两者在性能上的显著差异,并深入剖析了造成这些差异的原因。这项研究不仅为统计模型规模效应提供了理论阐释,也为模型选择和应用提供了重要的参考依据。
供稿:发展规划与学科建设处
(责任编辑:翟梦杰 审核:宋健刚)