人工智能 频道

AI华人科学家张本宇解密蚂蚁 “共享智能”技术

      网上搜索张本宇,你可以找到无数高大上的标签,AI华人科学家中排名前十的大牛;曾就职谷歌、Facebook;深耕人工智能领域20年,手握154项美国专利,在国际一流期刊及会议上发表的45篇论文已被引用超过1万次。

蚂蚁共享智能实验室首席科学家张本宇

  甚至还有一张西装革履,交叉握手于胸前,面朝镜头露出标准职业笑容的封面硬照。撕去标签,离开网络,真实世界里的张本宇,穿着随意,就像身边普通的程序员,看上去远比78年出生的实际年龄小。

  从1999年他在北大攻读人工智能硕士算起,正式踏上AI的征程。20年过去了,荣辱沉浮,恩怨俱散,他仍是最初那个追着数据跑的少年。

AI老兵的新战场

  我试图让本宇描述下入职蚂蚁金服后的高光时刻。他回忆一会,很遗憾的告诉我,没有什么高光时刻,但有一幕深深印在他脑海里。

  那是去年12月18日,圣诞节前一周,他从硅谷的家中出发,坐11小时飞机,抵达上海后换机场高速前往杭州,汽车驶进西溪路556号,一幢极具现代化气息的“之”字形建筑赫然出现,门口立着五个大字“蚂蚁Z空间”。

  很快,本宇出现在一间名为“恒长钱庄”的办公室,和20余名同事一起等待CTO宣布共享智能事业部成立。

  他回忆起上一次来杭州,专程来跟管理层对接共享智能的相关事项。却赶上上海雷暴,飞机迫降在韩国,“好事多磨”那是他惊魂未定时跳出的第一反应。

  如今,他和20多张年轻朝气的脸庞在镜头前微笑合影,用仪式记录事业部成立,他又想到四个字“新的起点”。

  这些新同事都是二三十岁的年轻人,他们来自人工智能、大数据、数据技术等不同部门,Base在杭州、北京、上海的都有。他们的集合就像一次全科手术,汇聚方方面面的专家,给心肌梗塞的病人开刀,病因是数据不畅造成的血栓,“共享智能”则成了手术刀。

  什么是共享智能,本宇举了个例子,有A,B,C三家企业,这三家企业各有利润,都不想被披露出来。当行业协会找到他们,想要通过他们的数据计算出行业的平均利润,以进一步指导行业发展。

  此时,无论哪一家都不肯让步,因为披露数据等于自亮家底,会直接反映各家的真实情况,不能让竞争对手知道。但死抱着数据不开放,无异于把数据变成上岸票价昂贵的孤岛,消亡于自由开放的信息海洋。

  而且,很多时候,数据的管理者和使用者并不是数据的所有者。一旦在数据共享的过程中,发生数据泄露,被对方滥用,那数据的管理者不仅仅是商业利益受到侵犯,它很可能也没有尽到数据管理的责任。

  从欧盟的GDPR开始,到美国CCPA,到中国的数据安全法、网络安全法、个人信息保护法都对这种数据管理失责,和数据滥用,提出了严格的规范。所以各大数据方,出于保护商业利益、法律风险、舆论风险各方面考虑,都在收紧数据共享,从而形成了大数据孤岛。

  而蚂蚁金服提出的共享智能,就是为解决数据协作需求与隐私泄露和数据滥用之间矛盾的技术解决方案,不直接共享数据的情况下,连通大数据孤岛,实现多方数据可用不可得。

  早在2016年,蚂蚁金服就开始致力于共享智能的技术研发,并在蚂蚁金服内部及合作伙伴方的智能信贷、智能风控等业务领域中率先应用。这一次共享智能以事业部的形式单独成立,意味着新的号角吹响。

  未来,本宇将和他的这个团队,在一座座数据孤岛间奋力划桨,登岸建“高铁”,链接起数据新世界。

  41岁的本宇就站在那里,深情的目光望过去,都是自己21岁时的影子。

竹城少年初长成

  1978年,张本宇出生在江西吉安,一座竹城。吉安文化发达,因而有“一门九进士”“五里三状元”的美誉。本宇一家就很会读书,父母分别毕业于同济和北大,对孩子的教育方式是散养。

  幼年的本宇,每月定期收到一笔来自父母的“购书资金”,他可以买任何他想看的书。在学习方面,本宇不走寻常路,上语文课做英语作业,上英语课做化学作业,上化学课就看小说。他不爱刷题,崇尚高效不重复,不喜欢枯燥重复的劳动。

  决定从事人工智能相关的工作,结缘于一款名为“人工生命”的小游戏。人工生命是一个在二维矩形世界模拟生命演化过程的游戏,每个方格居住着一个活着的或死了的细胞,细胞的生死取决于相邻八个方格中细胞的数量。

  玩家作为这个世界的上帝,随意设定某个方格细胞的死活,以观察对生命的影响。在本宇手里,他通过编写程序,让这些细胞演化成一只小鸟,沿着一定规则向前飞。

  这款游戏十分接近生命最真实的运行情况,可以看做一个以生命的运算方式运行的计算机,使用了人工智能中的概念。这个概念让少年本宇着迷,在填报高考志愿时,他义无反顾地选择了北京大学的计算机专业。

  1995年,本宇如愿进入北大。1999年,他在北大攻读了人工智能硕士,正式踏上AI的征程。

  2002年,24岁的本宇毕业后去了微软亚洲研究院(MSRA)。在MSRA的6年里共发表45篇论文,前三年致力于搜索、广告、推荐这几个互联网核心方向上的AI算法,后三年参与负责大规模分布式存储、计算与AI框架的研发。

  从2008年开始,本宇期望能将学术付诸实践,走了普罗大众看来“一路开挂”的事业路:在北京看完奥运会后先是跑到硅谷,就职于Google,从事搜索广告优化。

  2年后,加入初具雏形的Facebook社交帝国,其大量可用于AI研究的社交数据深深吸引了他,并一路啸聚群雄,攻城掠地,带领团队开发了Facebook中占据利润来源90%以上的信息流广告业务,感受一把准创业氛围。

  2013年,移动互联网迅速崛起,Google成立新项目Google Now,试图在手机中加入真正的智能,本宇又被挖回Google Now项目,负责推荐平台与算法。AI诞生于数据,纵观本宇的工作经历,几乎就是追着数据跑,哪里的数据多,哪里的数据有价值,他就去哪里。

  但是,随着AI行业落地的广度与深度的发展,数据安全与AI之间的矛盾也愈发明显。本宇明白,数据像石油一样金贵的时代,数据不仅是各类大数据应用的基础,其质量和数量影响着人工智能模型效果。当今各种应用产生并收集了大量的数据,同时也是使用数据的大户。随着AI模型能力和算力的提升,各种应用场景对各种异构、异源数据的使用效率也在飞速提升。

  数据的广泛使用在提升应用效果的同时也引发了蚂蚁金服对于数据安全性的担忧。蚂蚁金服保存着用户的资金和其它数据,容不得半点闪失。因此,在共享智能里,关于数据安全的研究是重中之重。因此,2019年,本宇接受蚂蚁金服的邀请,加入共享智能的团队,继续AI的探索。

  目前,共享智能有四个基石性的研究方向,分别是多方安全计算,可信执行环境,差分隐私,以及联邦学习。

  多方安全计算和可信执行环境侧重解决计算过程中的数据安全问题,差分隐私侧重保护计算结果里的隐私泄露,而联邦学习擅长解决大数据孤岛带来的人工智能算法收敛性及效率问题。单独的一个方向并不能解决多方数据可用不可得的问题,共享智能的研究既包括推动这四个基础方向的进步,又包括对这四个方向的融合创新,从而提供满足不同实际需求的多种产品与服务。

  白天,本宇和硅谷当地的同事,构思技术的边界,一旦发现国际最新的技术动态,立刻钻研拓阔知识储备的边界;到了晚上通过钉钉和国内的同学交流,国内的算法团队会反馈大量业务场景需求上来,他将迅速引入最新技术落地。

  他和他的团队要建造跨越数据孤岛的高铁,这不仅意味着安全、规范上的高标准,让参与方对数据看不见、拿不走,更加意味着数据将比以前发挥更大的作用,也就是用得好。他最想对共享智能的同学说两点:一是要从业务出发,让业务为客户创造更好的价值;二是要用技术上最合理的方法,来帮助实现第一条。

  前几天,本宇无意中看到一则新闻,人工生命游戏发明者,英国数学家约翰·康威,因新冠肺炎,于4 月 11日上午在普林斯顿逝世。

  一时间他错愕在屏幕前,这个引导他进入AI世界的前辈就这样在2020年的春天悄然离去,他回忆起少年时第一次接触到这款游戏的心情,那只编写的小鸟似乎还在某个角落飞。他在iOS上专门寻找到这个游戏,专门玩了一会,用这种方式悼念约翰·康威。

  旧神已死,新神将至,人间终会迎来下一轮万物生长,不管是技术,还是人。

2
相关文章