第四范式胡时伟出席2016亚马逊AWS峰会并发表演讲

2016.9.18

第四范式胡时伟出席2016亚马逊AWS峰会并发表演讲

近日,亚马逊2016 AWS技术峰会在京盛大开幕。国内外科技领军人物在AWS峰会上共同分享了银行、互联网、教育等多个领域前沿的创新技术服务。第四范式技术VP,首席系统架构设计师胡时伟出席峰会并发表主题演讲,从技术层面阐述了国内首个机器学习应用者开发平台——“第四范式先知”如何帮助客户实现价值提升。

随着大数据的积累和算法技术的进步,越来越多的公司希望借助机器学习来解决实际问题。虽然各大公司纷纷开源了自己的机器学习框架,但即便如此机器学习仍然非常“昂贵”。想要获得成功的机器学习解决方案,需要完成问题定义、特征工程、算法调优、模型评估、线上应用和模型迭代等多个环节。此外,机器学习门槛还体现在高水准的分布式架构和计算能力与数据流的上下游紧密结合,以及算法间无标准化实现等技术难题上。

在AWS峰会上,胡时伟介绍了第四范式为降低这一门槛所做的努力。第四范式研发了拥有完备工程基础的人工智能平台——“第四范式先知”(AI Prophet)。它聚集了数据免清洗、模型自学习、一键上线、弹性计算、实时数据流、智能数据集成、特征自动组合、面向 AI的计算框架、模型解读技术、个性化需求满足这10 大产品特征。“第四范式先知”平台能够自动化、智能化的实现机器学习全流程。以数据免清洗为例,大部分数据科学家有80%或更多的精力都花费在数据清洗上,而第四范式专利级的 “免清洗算法”功能,对于无效数据的容忍度极高,为AI“减负”。

胡时伟还指出,“第四范式先知”产品如此强大,得益于它背后的机器学习核心算法框架——通用分布式机器学习框架,简称GDBT。GDBT支持多算法充分并行化,在高效利用计算资源的同时提升模型训练的特征数量。实测表明,在大数据量(3125万条)测试条件下,GDBT的处理速度较Spark快416倍。

目前“第四范式先知”产品已经应用于差异化定价、智能营销、智能风控系统等业务中,在实践中帮助众多企业赢得优异的终端用户体验和更强的收益能力。其中的典型案例包括为某股份制商业银行搭建信用卡分期精准营销系统,通过收录千万级客户半年数据、数千万条短信营销记录、数亿条交易流水记录,采用100+特征栏位,其中80%为离散特征,60C全数据无采样训练,最终实现了响应率比专家模型提升超过50%。

第四范式的愿景是AI for everyone。让每个人都能分享人工智能的价值,这也是“第四范式先知”产品诞生的初衷。