第四范式陈雨强:人工智能急需技术突破以解决产业问题

2016.9.21

第四范式陈雨强:人工智能急需技术突破以解决产业问题

【2016年9月21日,深圳】由“新京报·寻找中国创客”举办的”解码人工智能创业迷局“论坛于9月21日在深圳召开,李开复、毛大庆等导师级大咖与众多人工智能创业者,共同预见代表当今世界先进科技水平的“独角兽“项目。第四范式联合创始人、首席研究科学家陈雨强在”人工智能引领人类走向何方”主题论坛上表示,“AI+大数据”正在成为企业竞争标配,超高维的人工智能技术能为企业“弯道超车”提供突破口,未来每一个成功的公司都是一个人工智能公司。

陈雨强是全球第一个商用深度学习系统和全球最大的深度学习系统设计者,作为一位深耕AI工业应用多年的科学家,面对正在到来的AI时代他保持冷静。他表示机器学习的基本要素是“数据+模型+特征”,近期不断取得突破也是源于这三个因素:前所未有的大数据、更高维的机器学习模型和更高效的特征分析能力。然而,这些要素目前还有诸多技术难点有待突破。“对现在的机器学习来说,数据的时序性、模型的解释性、特征工程的复杂性等技术难题,仍是横在人工智能工业应用前的鸿沟。人工智能无所不能只是人们的过度想象。”

首先,就数据而言,目前主流的深度学习技术是以二维数据矩阵来进行训练的,在工业化的应用场景之中,还需要引入时序特征,从而构成三维数据。以银行业为例,根据业务目标对银行用户的某些历史行为自动总结并做出相应关联,这就需要机器能调用并深度理解“人+特征+历史时间轴”的三维数据组合。第四范式尝试以工业界的具体目标为导向,最大程度地枚举出全部pattern, 从而找到全面的历史特征,让数据三维立体化。

此外,在模型方面,只有人工智能的客户能够更好地理解模型原理,才会投入更大力度支持人工智能的工业应用,因此模型的可解释性,已经成为人工智能在产业界发展的必要前提。第四范式的科学家们希望模型易于理解、易于交互,来满足某些关键问题上要求输出和特定特征呈强线性关系的需求。

最后,在特征方面,复杂的特征工程要求企业能够提供较强的专家知识和经验,一个基本的AI应用需要由专家来提取700个特征,并不断根据业务目标进行排列与总结,这些都使得机器学习的在人力的投入上居高不下。人工智能的工业应用急需使机器具备更强大的特征提取能力,使得机器学习对专家的依赖性降低。通过领先的特征工程技术,第四范式正在扭转传统机器学习精力分配不合理的局面,将原本占比80%的特征工程工作量降低到20%,而将80%的精力安排在更有价值的模型调优上,提高机器学习的效率。

时下,尽管人工智能被寄予厚望,其中也不乏停留在空想阶段的“画饼”人工智能技术。而第四范式希望人工智能在高速发展的同时,可以以一种全局的、智能的、低耗的方式不断突破技术难题,让AI的商业价值落地于各行各业。例如第四范式推出的国内首个人工智能应用者开发平台“第四范式先知”,就将顶级科学家10余年人工智能研究和应用经验封装到产品中,极大降低了人工智能应用门槛。