助力企业迈向AI²时代,第四范式发布“AI Prophet AutoML”

2018.09.17

 

近年来,随着AI技术的不断成熟,企业纷纷往AI转型,逐步实现业务智能化,且从长远利益来看,企业更为偏向于自建AI应用。与语音、图像等感知类技术不同,企业若想在市场营销、供应链管理、风险控制、服务运营等高价值决策类场景下应用AI,则面临更大挑战。因此,如何降低企业构建AI应用的门槛与成本,实现企业智能化决策是现阶段亟需解决的问题。

 

9月17日, 2018世界人工智能大会在沪盛大开幕。作为AI领域的领军企业,第四范式发布了重磅产品——AI Prophet AutoML(自动机器学习)。该产品是一款低门槛、自动化的AI应用构建平台,基于“学习圈”理论构建机器学习闭环,助力企业低门槛规模化拥有自主可控的AI能力,帮助企业在营销整合、风险控制、客户体验、资源分配等多个高价值高难度决策类场景,做出更好的判断与决策。

 

      学习圈理论打破企业自建AI困局 迈向人工智能²(平方)时代

 

目前,企业AI应用主要分为感知类与决策类两个方向。在感知类问题中,AI化身为企业的眼睛和耳朵,从一定程度上,提高了企业的业务效率。而在决策类场景中,则需要AI变为业务中枢,帮助企业做出更加明智的决策,进一步帮助企业“降本增效”。

 

在实现智能化的道路上,企业经历了三个阶段。第一阶段为人工阶段,主要依靠业务专家的经验,提炼规律撰写专家规则,做出自动的判断,但因人类写出的规则维度较低,可以应对头部情况,而无法应对长尾情况。第二阶段为人工智能阶段,AI专家利用场景数据进行人工建模,用AI提炼规则作出决策。相较于专家规则,AI模型维度与效果均大幅提升。然而,企业想要真正拥有AI,又面临认知、数据、人才、工具、技术等多个门槛,阻碍了AI在企业中的落地。以人才为例,拥有AI专业背景知识与研究经验的人才年薪动则几百万,且非常稀缺,而培养一个合格的AI人才也需要6-10年的时间。

 

因此,若想推动AI的普及,降低企业应用门槛是重中之重。AutoML技术应运而生,企业智能化也迈向第三阶段——人工智能²时代,利用AI技术自动生成AI应用。其核心在于将企业的数据自动变为模型,大幅降低了AI应用门槛,使业务专家升级为AI应用者,解决AI人才短缺且无法规模化应用的问题。同时,基于自动特征工程,使模型维度较以往进一步提升,也有望实现更优的效果。目前,Google、微软、百度等AI巨头纷纷在该领域发力。

 

在第四范式看来,让机器产生智能与人思考学习的过程类似。此前,在人类心理学研究史上,有一个著名的“库伯学习圈”理论,该理论认为人类学习的过程是由“行动、经验、反思、理论”这四个阶段构成。简单来说,人们通过行动产生经验,再通过反思经验,学习,在新的行为发生时可找到最优决策。对应到AI上,“行动”是过程数据,“反馈”是反馈数据,“反思”是基于算法与计算资源基础之上的模型训练,最终形成的“经验”即模型应用。

 

此次发布的AI Prophet AutoML便是基于“库伯学习圈”理论所打造,将第四范式AI核心方法论以产品化的形式输出到企业中,大幅降低了企业应用AI的门槛,从而推动企业低成本、高效率的向AI靠拢。目前,第四范式的AutoML产品已经应用于金融、科研、医疗、互联网等多个行业,在营销、推荐、风控、广告、疾病预测等多个场景有优异表现。

 

全流程、全自动、低门槛产品助推企业实现智能化

   

众所周知,机器学习已在推荐系统、在线广告、金融市场分析等诸多领域取得了成功,但是在几乎所有的案例中,人类专家参与了机器学习的所有阶段。然而,这些任务的复杂性往往超出了非机器学习专家的能力范围。

 

AI Prophet AutoML的出现打破了这一困局,它通过简洁、易理解、易操作的方式覆盖了从模型调研到应用的机器学习全流程,打通了机器学习闭环,其中包括:收集数据、特征工程、调整模型超参数,评估模型性能、模型应用等环节。用户只需“收集行为数据、收集反馈数据、模型训练、模型应用”4步,无需深入理解算法原理和技术细节,即可实现全流程、端到端的AI平台构建。

 

保证全流程的同时,AI Prophet AutoML还将低门槛、自动化技术发挥到了极致。首先,AI Prophet AutoML支持行为数据与反馈数据的自动拼接,为后续的模型自动更新做好数据准备。在机器学习最具门槛的特征工程、算法选择、调参等环节,AI Prophet AutoML基于自主研发的AutoML技术,可自动分析数据,完成基本特征构造,再利用自动特征组合,提升模型效果,同时利用多算法自动完成调参、模型对比。在模型训练方面,AI Prophet AutoML可将前期探索出的最佳训练方案,一键上线模型自学习,同时周期性利用新数据进行模型自动更新,不断提升模型在实际应用中的效果。

 

除了流程上的简化,AI Prophet AutoML还针对企业应用进行了设计与优化。首先,该产品提供了数据、模型管理功能。以模型管理为例,在模型工厂中,可查看模型训练方案、正在运行的训练任务及运行次数、已训练完成的模型评估报告等。其次,在模型应用中,提供了批量预估与在线预估两种方式,并自动将预估请求回流为行为数据,实现数据闭环。AI Prophet AutoML还提供了贴近业务的Dashboard,包括运维指标监控(预估需求量、资源监控)、业务指标监控(正样本率、线上AUC)、模型指标监控(模型AUC、模型PK)等。此外,通过深度优化,AI Prophet AutoML具备高可用、高稳定性等企业级特性,为企业中规模化应用AI提供坚实保障。

 

与此前需要大量编码构建AI不同,AIProphet AutoML提供了“傻瓜式”的交互界面,让企业免去编码定义建模的过程,将开发AI应用的周期从以半年为单位缩短至周级别。在降低门槛的同时,AI ProphetAutoML还展现出了超高的模型水准。经在十余组的测试数据、以及疾病预测、金融反欺诈、互联网推荐等几十个实际业务场景的数据验证中,AI Prophet AutoML做出了接近甚至超过顶级数据科学家的模型效果。

 

创新技术造就产品卓越性能

 

作为人工智能领域的佼佼者,第四范式从很早便开始关注并深耕AutoML领域。通过从解决客户业务核心增长的角度出发,构建了反欺诈、个性化推荐等业务场景下的AutoML,并将其赋能给企业的普通开发人员。目前,第四范式已经研发了自动特征组合(FeatureGo)、自动时序特征(TemporalGo)、自动深度稀疏网络DSN(Deep Sparse Network)等AutoML支撑技术。

 

其中,FeatureGo算法实现了机器自动组合特征的功能,有效解决了人为添加组合特征门槛高、耗时长等问题,并增加了模型的可解释性。在实现特征组合的过程中,线性分形分类器(LFC)算法通过将连续特征多层次离散化,使特征具备一定的非线性表达能力。在GBDT(一种常见的非线性模型)不能应用于大规模离散特征场景的前提下,将非线性的特征加入到线性模型中,从而加强了特征描述的能力。从实际效果上看,LFC能够更好的捕捉细粒度特征,并在预测效果和计算稳定性上显著优于LR(Logistic Regression)。与此前高阶特征中,无效特征居多导致模型效果不升反降相比,FeatureGo以LFC在内的多项关键技术为基础,可自动选择有效的组合特征,亦能够明显提升后续模型效果。经测试,FeatureGo的特征组合最多能达到十阶以上,而人工的特征组合一般只能到达5到6阶。

 

此外,DSN更是为AutoML提供了强有力的支持。与Google Cloud AutoML仅支持深度学习模型不同,DSN将“宽”和“深”做了更全面的融合,算法底层是上千亿大小的自适应宽度稀疏网络,上层是一个非典型的深层次网络,既可以记住更多信息,又能刻画所有特征(包括宏观特征和微观特征)之间更复杂的关系。在参数规模上,DSN支持的参数规模已达到十万亿级,这意味着随着数据量的增大,模型效果还将有更大的提升空间。

 

作为企业自建AI的利器,AIProphet AutoML以先进的方法论及强大技术作为支撑,从根本上解决了企业AI应用落地难、挑战大的行业通病,在降低AI门槛的同时,大幅提升了AI的应用效率。未来,第四范式还将加大研发力度,全面扩充AI Prophet AutoML能力,进一步扩展AI的应用边界,普惠各行各业。