蚂蚁计算存储首席架构师何昌华讲解图计算技术

文章正文
发布时间:2024-07-17 23:33

央广网乌镇9月27日消息(记者 万玉航)新一代黑科技如何精准识别洗钱行为?反欺诈、能源安全、疫情防控……这些看似不相关的场景竟然可以使用同一套核心基础系统软件?9月26日,2021年世界互联网领先科技成果在乌镇揭晓,全球共14个技术项目获奖。其中,蚂蚁集团联合清华大学自主研发的“大规模图计算系统GeaGraph”项目获奖。

在世界互联网大会现场,央广网记者采访了蚂蚁集团计算存储首席架构师何昌华,请他详细介绍了这一专业系统的技术原理和应用场景。何昌华告诉记者,图计算目前在金融风控的应用实践中,使团伙识别率提高了接近100倍,案件审理的效率提升了90%以上。该技术与国网全球能源互联网研究院合作电网拓扑分析中的实践应用,从数亿个节点中识别故障,保障电网的稳定运行。

大规模图计算何以成为全球尖端科技前沿领域

什么是图计算?何昌华告诉记者,图论起源于18世纪欧拉对哥尼斯堡七桥问题的研究,近年来在众多数学家、计算机科学家共同努力下,成为了可以解决很多实际问题的底层能力。“图计算是一种利用图形结构描述事物联系的数据建模方式,包括了图相关的建模、存储,利用人工智能的方法,可以挖掘出更多、更深层的关系。”何昌华说。

相较传统的关键数据库,大规模图计算可以对欺诈行为做到深度识别。早在十几年前,清华大学就开始进行大规模图计算课题的研究。2015年初,蚂蚁集团开始组建图数据库团队,并于2016年发布了第一个图数据库版本GeaBase。近年来,从支付宝大改版到新春红包再到双11,GeaBase迎来了业务的绽放期,成为支付宝核心链路上非常重要的一环。

经过双方数年来在技术上的强项组合,全站的图计算系统已基本上支持了蚂蚁集团各种业务风控能力,在数字支付、数字服务、数字金融等核心业务中,显著提升了风险行为的实时识别和调查分析效率。

目前,高性能图计算系统GeaGraph可以在万亿边图上进行实时查询,在国际标准图数据库测试中位列第一,是世界第二名7.6倍,处理规模和性能均达到了国际领先水平。

未来大规模图计算还有哪些应用场景

“我们在复杂的用户交易行为中已经印证了大规模图计算的高效性能,未来,这种技术在电信、医疗、制造、能源等领域有着广阔的应用价值和前景。我们坚持技术成熟一个开放一个,期待接下来能把这套技术共享到更多行业。”何昌华表示。

在回答记者关于这项技术的大规模应用存在哪些难点的问题时,何昌华坦言,不同场景的应用需要一定程度的定制和算法的调整,这对合作方的能力背景有一定的要求。另外,跨主体之间的数据如何编织成一张共同的图,还涉及到对算力的挑战,以及数据隐私保护等问题,这是更前沿的课题。

据介绍,“大规模图计算系统GeaGraph”目前所有代码都是自主研发的,是完整的全站技术系统。此前,中国工程院院士、清华大学计算机系教授郑纬民曾表示,基础软件领域的国产化不应只是低水平的替代,更不应该只是开源软件的换皮,要学会“从头构建先进的系统软件”。“GeaGraph给了我们一个很好的例子:产、学、研结合,高校和科技领先企业共同突破技术难关并将其规模化应用。这种模式已经在硅谷得到验证,如能在国内顺利运行和复制推广,有望大大加快我国解决基础软件领域的卡脖子问题的进度,逐步构建出源于中国的先进基础软件集。”