中国科学院自动化研究所研究员、博士生导师曾大军从事学术研究近30年来,一直致力于以计算手段辅助解决传统上属于管理学领域的问题。他的研究成果为电商平台、社交媒体设计评估自动推荐算法,新冠疫情大数据分析、预测与建模工作等提供了有力支撑。
归国15载,他运用大数据解析和人工智能技术,结合传统的管理科学理念以及运筹建模思路,应对来自电子商务、媒体融合、社会安全、公共卫生和应急管理等多个领域的挑战,探索出一条具有广泛适应性的应用需求驱动创新发展之路,并多次为解决重大安全问题及应对突发事件建言献策。
“未来管理科学的发展,如果没有大量真实数据作支撑、没有人工智能手段来赋能,我们可能会失去很多研究机会,失去在社会上产生更大影响力的机遇。”获得2021年“中国竞彩网管理学杰出贡献奖”的曾大军希望今后能有更多青年人才关注“社会计算”和“决策智能”领域,并致力于推动与国家战略需求相匹配的人才培养模式。
另辟蹊径,将复杂网络引入自动推荐算法
曾大军的学术贡献,代表性地体现在他对自动推荐算法的创新上。
当今社会,人们通过算法来挖掘新的商业价值,捕捉新的商业模式。利用自动推荐算法,商家定向投放广告,平台做个性化推送,用户接收有效资讯,商家和平台又通过积累用户数据来了解市场需求……“算法经济”已经成为数字经济的重要组成部分。
自动推荐算法的初衷,就是在海量信息时代,降低信息搜寻与交易成本。
同事曹志冬仍记得,2008年,博士毕业不久的他第一次与曾大军交流,后者就谈到互联网大规模的数据将对现代社会产生巨大影响和作用。
过去几十年里,国内外学者已经创造了上千种推荐算法,积累了厚重的文献。起初,学者们将主要精力放在创新单个算法,使它能够根据用户的历史信息和行为,更准确地捕捉单个用户的喜好,以此为依据推荐更合适的产品或产品组合。
曾大军则另辟蹊径。他琢磨的问题是,既然单个用户的兴趣有很大随机性,那为什么推荐算法还能够产生效用?相比在前人基础上做出一个更好的算法,他更倾向于探索在什么情况下、什么算法是管用的,算法本身还能够有什么样的应用潜力?
他就此改变了以往的垂直研究路径,从横向切入,研究个体之间、个体与群体之间以及群体间的交互行为,并且抓住了当时复杂网络理论发展的契机,设计出一种基于网络分析的推荐算法框架。
这个框架能够统一描述多种推荐算法,并适应不同的数据特征。一些新的推荐模型和算法就在这个框架的基础上,自然而然地“生长”出来了。
“通过引入复杂网络,曾教授的算法能够捕捉到具有共性的一群人的喜好,能够利用相似用户的反馈信息,加快(算法)个性化学习的速度,并实现对用户潜在兴趣的挖掘。”中科院自动化所高级工程师祖全楠说。
仅就自动推荐系统领域的成果,曾大军在《管理科学》(Management Science)、《国际计算机学会信息系统汇刊》(ACM TOIS)等管理学与计算机科学领域的国际顶级期刊上发表了多篇论文。
多年来,曾大军在扎实的学术基础上不断寻求突破,逐渐成长为活跃在科研一线、有重要影响力的杰出中青年学者。
他长期活跃在国际学术前沿,曾担任电气与电子工程师协会(IEEE)智能交通系统学会主席、国际运筹学和管理科学界最有影响力的组织INFORMS的人工智能分会主席,人工智能和智能系统领域顶级期刊《IEEE智能系统》(IEEE Intelligent Systems)主编等。
他因在“协同计算和安全信息学”方面的贡献,于2015年当选IEEE会士、在2017年当选美国科学促进会(AAAS)会士。AAAS是世界上最大的科学和工程学协会联合体,代表科学研究最高水平的《科学》杂志即是该学会的出版物。
跨学科思维、国际化视野、问题导向,成就高学术站位
学术生涯早期,曾大军的研究侧重于分布式人工智能和多智能体系统。他提出的具有协同性和自适应性的信息处理和决策框架,是国际上该领域首批原创性研究成果之一。
多智能体技术是20世纪90年代人工智能领域的前沿,核心思路是将多个有一定感知、自主决策和执行能力的计算单元,也就是智能体,组织成一个有机整体,来解决单个智能体无法胜任的难题。
曾大军与合作者提出的分层多智能体架构解决了异质智能体之间跨任务适应学习、能力灵敏组装等难题,成为相关领域一个基础性的参考规范;他将贝叶斯学习在国际上首次引入多智能体自动谈判博弈,开发了能代表用户参与经济决策的智能体模型。
带着跨学科的思维、国际化的视野,始终坚持问题导向,这是曾大军高学术站位的基石。在他学术生涯的起点,交叉学科的天然优势就已经奠定。
1985年,14岁的曾大军考入中国科技大学少年班。彼时,经济管理与系统科学系在改革开放的大背景下应运而生,蓬勃发展。曾大军敏锐地捕捉到本专业与计算机的联系,选择了在计算机系辅修。
他在美国卡内基-梅隆大学先后攻读工业管理硕士、博士学位。他参加的博士生项目,就是工业管理学院与机器人研究所联合培养的。
1998年获博士学位后,他在亚利桑那大学研究、工作。2006年回国,在中科院自动化所工作至今,现担任中科院自动化所副所长、复杂系统管理与控制国家重点实验室副主任。
一同担任复杂系统管理与控制国家重点实验室副主任的侯增广研究员介绍,曾大军在数个国际国内学术组织做了很多大数据和人工智能应用方面的服务和组织工作,承担了多项科技部、国家自然科学基金委员会和中科院等单位的重要项目,多个项目结题评估获得了“特优”等高度评价。
回国后不久,曾大军就把网络开源信息、安全信息学等科技前沿的思想和方法,引入国内的团队。作为本土培养的学者,曹志冬认为自己从曾大军广阔的国际视野中受益匪浅:“像社会计算、安全信息学,刚听说时觉得这些名字非常怪异,但现在它们已经成为撬动我国数据智能、文理工交叉学科领域的很重要的创新方向了。现在很多社会学科领域的学者,都在积极参与计算社会科学的创新研究。事实上2008年的时候,我们团队就已经在这个新兴领域‘开疆拓土’了。”
“立足国家重大需求,寻求科研突破,是科学家天然的责任”
科学界常说,搞科研“既要顶天、也要立地”,顶的是原始创新的天,立的是实践应用的地,是要“把论文写在祖国的大地上”。
“曾老师从来没有以发表什么样的论文作为导向,而是说,这些研究成果要跟咱们的社会发展需求紧密相关,要跟国家的重大需求以及企业的需求紧密相关。”曹志冬说。
2020年1月20日,曾大军团队开始与合作单位一起,收集新冠肺炎疫情相关数据,通过对比非典疫情数据,研究病毒传播特征与扩散能力,分析研判动态疫情形势,寻求为疫情应急管理与决策提供支持。
疫情突发,检测手段和医疗资源有限,疫情早期的数据报告也存在缺失或不准确。当时,团队将人口流动数据纳入了分析模型,利用中国大陆地区除湖北以外的确诊患者数量,来推测武汉及湖北地区实际感染的规模。
在2月初,团队就对武汉市、湖北省以及全国感染人数进行了预测。后来证实模型是比较准确的,这对疫情防控与政策制定起到了借鉴作用。
事实上,曾大军团队与各级疾控中心合作已超过15年。期间,大数据与人工智能手段得到大量运用,增强了公共卫生监测预警的能力,尤其是提高了对传染态势早期预警的敏感性和对风险研判的准确度。
曾大军也是我国早期从管理学领域交叉参与传染病相关研究的重要学者,是传染病信息学的重要创建者和贡献者。他主编了由Springer出版的传染病信息学领域的第一本英文专著《传染病信息学:公共卫生症候群监测与生物防御》(Infectious Disease Informatics:Syndromic Surveillance for Public Health and Bio-Defense),现已被翻译成中文,成为国内的研究生教材。
抓住了社交媒体兴起的契机,曾大军的建树不仅在公共卫生领域,后来还扩展到打击电信诈骗、网络犯罪、促进媒体融合等主题上。
由曾大军主持研发的全球媒体云平台,能够帮助新闻单位了解稿件的传播力和影响力,用量化手段评估,稿件发布后有多少人引用?在网民中引发了哪些讨论?网民们是否认同报道的思路和角度?
而随着应用场景的扩张和技术的进步,全球媒体云平台将有望为媒体记者发现社会问题、寻找选题等提供支持。
在曾大军看来,科学家精神不仅意味着治学严谨,更要求带有问题导向。
“在国家关注的重点问题和领域中,我们如何提炼出有科学意义的、有深度的、需要从科研上突破的关键点?这是科学家天然的责任。”
曾大军的团队中,已经能够形成一个“基础研究-应用-基础研究”的有益循环。在一些关键领域,团队既能够提炼出科学问题,直接为国家服务,又能及时反馈致力于理论研究的成员,提出在现有状态下需要攻关的问题和重点,从而在后续阶段获取更丰富的理论指导。
祖全楠说,在团队里,曾大军在技术研发和应用转化过程中充当着纽带。他既能够看到应用上的技术短板,又能够敏锐把握技术在落地过程中的方法和路径。在一些国家重大工程项目上,他都在发挥实质性的领导作用。
“要读到200篇论文,才会对研究问题有感觉”
科研要下苦功。至少读200篇文献,是曾大军为学生设定的基础门槛。他形容这是“非常痛苦但有价值的学习过程”,因为他坚信,奇思妙想是构建在对国内外已有科研成果的深度理解之上的。
“文献读不到位,怎么能说自己了解国际前沿了呢?不做够调研,既没有感觉,也没有证据支撑自己想出来的问题,那必然是一个空问题,”郑晓龙说。他从2006年起跟随曾大军攻读博士学位,目前也是自动化所的一名研究员。
他回忆自己在学生时代对此不以为然。经历多了以后,才深刻理解这是导师在多年的学术实践中摸索出来的经验。“如果没有大量阅读作为基础,沾沾自喜发现的科学问题,也许是天方夜谭;也许是问题不够深入,自己以为是问题,其实不是问题;也可能,前人已经就这个问题做了很多研究了。”
读文献之外,郑晓龙依然像导师那样,保持着亲自处理一线工作的习惯。“处理数据、写算法这些事儿,得靠练。三天不练手生了,怎么指导学生?”
在读博士生闫鹏介绍了导师一再强调的阅读方法:“要以作者的心态,带着问题读文献,去假想,如果让我做这项研究,我会怎么做?以此来对比别人的论文是怎么写的、研究是怎么做的,在对比中学习。”
科研能力培养之外,曾大军更注重提高学生的学术品位。
“他会鼓励我们,不甘于做修修补补的工作,要勇于开拓创新,勇闯无人区,做原创性的科研工作。”闫鹏说,他就是被导师的思维魅力和学术站位所吸引的,这让他更坚定了从事科研工作的志向。
曾大军常跟学生和团队成员说,少外求、多内求,做人做事一定要实在,每一步都要做踏实。
郑晓龙觉得,这种长期习惯和由内而外形成的气质,会给周围人带来感染力,团队就会形成共同追求事业的愿景和向心力。尽管研究很辛苦,经常没日没夜,但团队成员们合力解决棘手问题,都觉得还挺有趣。“一定是发自内心地喜欢,才能坐得住冷板凳。”
团队的自信,当然也来自于曾大军脉络清晰的管理以及对整体任务的明确细分。
在科研上,超前想法不易被人认可,遇到困难一时寻不到思路也都很正常,但依靠坦诚而深入的讨论,从可操作的地方下手,像更新算法那样“小步迭代”,层层推进,依然会有“柳暗花明又一村”的时刻。
未来,曾大军打算继续把科研重点放在决策智能上:如何能在复杂的场景中,用智能方法、人机混合等技术,提升决策科学性?如何能在国家关注的重点领域、产业发展的关键节点上,最大限度地挖掘数据价值、将智能决策的价值更好地落地?
回国15年来,曾大军欣喜地见到国家整体科研实力的迅速发展。在他熟悉的管理科学领域,他看到国际权威杂志中,由中国学者完成的工作越来越多,“说明国家这些年的投入已经见到很好的效果”。
他不断提倡科研要回归本质,要对研究问题有兴趣、有理解,由科学家自发地探索、牵引,逐步提高全社会对原创性成果的关注。
“科研不是竞技场。我们需要多关注整体能力的提升,规划远景目标。”在他看来,中国的科研事业、产业已经有了自己的发展逻辑、发展脉络和发展轨迹。“我们不闭门造车,也不去跟风。我们需要有战略定力。”
他相信,凭借多方积累,中国科学家群体将取得更多突破,“全面开花”。