第四范式胡时伟GMIC演讲:平台建设是企业破解AI落地难的关键

2018-04-28

 

4月26日,全球最大规模的移动互联网行业盛会——2018全球移动互联网大会(Global Mobile Internet Conference 简称GMIC)在京召开。适逢创办十周年,GMIC以“‘AI’生万物”为主题,吸引了红杉资本全球执行合伙人沈南鹏、加州大学伯克利分校教授Michael. Jordan、Facebook人工智能团队首席AI科学家Yann LeCun、创新工场董事长兼首席执行官李开复等数百位国内外行业精英,畅谈AI的发展与未来。第四范式联合创始人、首席架构师胡时伟在GMIC大会上,发表了题为“AI的价值、落地方案与系统建设”的主题演讲,针对AI在企业应用中的种种问题给出了解决思路,同时强调,平台建设是企业破解AI落地难的关键。

 

破解AI落地困境

 

进入2018年以来,“人工智能步入落地之年” 的声音不绝于耳。AI不再是概念,而是全面进入到企业的战略规划层中。纵观整个行业,更为关注产业落地的AI公司逐渐脱颖而出。金融、医疗、教育、互联网等领域内的企业也正在逐步将机器学习、人脸识别等AI技术与自身业务融合。

 

 

然而,AI在企业落地的过程中,却面临着诸多问题。部分企业纷纷将重点转移到算法、技术框架等AI基础能力的研究上,但是这些研究却很难转化为实际的业务价值。除此之外,业务问题定义不明确、做不出好指标模型、模型投产后效果差等高频问题同样成为了AI在企业中落地的“绊脚石”。

 

针对这些问题,胡时伟为企业开出了“药方”:第一,掌握体系化构建AI应用的方法论,从人才储备、系统融合、流程升级、业务分析等自上而下的步骤去整体规划及部署。从最根本的需求出发,而不是选择从容易的问题开始做。例如,数据缺失就收集数据,场景缺失则去探索场景等,以便在AI的竞争中夺得先机。第二,除了以API形式购买成型服务之外,还需要拥有利用自主数据提升核心业务的能力,只有这样,才能使核心业务在AI时代具备竞争优势。第三,建设AI应用的开发、测试、运维等技术工具,同算法和计算能力结合,形成完整的全流程机器学习平台。依靠平台的统一架构快速实现业务及数据闭环,从而批量开发出效果好、运行稳、质量优的AI应用。

 

落地的背后,更要注重自主安全可控

 

现阶段,企业基于开源的人工智能框架去开发AI应用是非常普遍的做法。然而,胡时伟认为,采用开源的方式优势固然明显,但背后却隐藏着诸多隐患。例如,技术选型对不成熟开源产品的过分依赖;缺少企业级环境测试及业务经验;安全、版本稳定方面欠缺考虑;对企业信息安全和数据资产安全带来多重风险,其中包括License随版本变更的法律风险、后门植入和代码质量风险、AI特有的模型受攻击风险等等。

 

因此,企业在构建AI体系时,自主、安全、可控是重中之重。秉承这一原则,“第四范式先知”包含自主研发的底层算法及分布式计算框架,其源代码安全受到严格保护。同时提供完整的长期技术支持服务体系,通过对产品和技术的定期稳定迭代为企业客户提供可靠支撑。

 

第四范式根据多年的行业实践经验,提出了企业级的AI平台架构,将数据、算法、线上服务、监控等功能以完善的体系化架构进行支撑。除此之外,“第四范式先知”还极为注重平台的测试及兼容性,以企业级软件标准构建测试中心团队,覆盖安全、接口、集成、场景、安全等方面的测试,并针对常见的软硬件环境进行兼容性测试。

 

AI的核心价值在于机器智能

 

AI的核心价值便是利用数据,让机器自动产生智能。在胡时伟看来,该过程与人类获得知识、做出决策的过程类似。著名的“库伯学习圈”理论,将人学习的过程总结为“行动、经验、反思、理论”四个阶段。机器同样是基于过去的知识与经验,经过无数次的思考与进步,最终输出一个最优策略,所需的材料统称为“BRAIN”:在机器的“学习”过程中,需要为它创造学习环境,业内称之为过程数据(Big-data)、反馈数据(Response);其次,机器的“思考”过程需要匹配合适的算法(Algorithm)、以及能够满足数据量的计算资源(Infrastructure);最后,要将AI的决策应用到具体的生产环境中(Needs),从而提升业务效果。整体上来看,闭环的高维机器学习系统以及持续不断的自主学习是“智能”的最大核心。

 

此前,第四范式基于“BRAIN”及“学习圈”理论,利用“第四范式先知”为金融、互联网、健康医疗等众多行业用户提供核心业务的机器智能决策支持,为企业带来了实际的价值提升。以反欺诈为例,对比于总数在千条之内的专家规则,第四范式基于高维度机器学习模型设计的反欺诈特征体系,在总量超过25亿维的特征集上进行探索,最终发现有效特征8000万维。同等情况下,业务效果比专家规则要提升数倍到数十倍之多。

 

最后,胡时伟强调,企业要构建自主可控的AI能力,是一件综合性的系统工程,需要从数据闭环建设、系统稳定性与安全性、团队能力培养、数据与计算能力资产统一管理等多个层面努力和投入。第四范式希望利用自身深厚的技术积累和行业落地经验,与企业一同前行,共建企业级的AI核心系统。