构建企业AI"1+N "转型的磐石 第四范式SageOne企业级软硬一体AI集成系统发布

2019.6.20

 

 

6月20日,第四范式正式发布了企业级AI 软硬一体集成系统——SageOne,通过“软件定义计算”的软硬一体技术构建了企业AI闭环系统,贯通硬件基础设施、AI核心引擎、AI平台和AI业务应用的全价值链条,全面支撑企业AI "1+N "业务场景应用需求。第四范式本次发布了SageOne Advanced、SageOne Standard和SageOne WorkStation三大系列共7款产品,覆盖大中小企业中开发、投产和验证等全部场景应用。SageOne软硬一体集成系统具备低门槛、低TCO、高性能、高效率和规模化应用等特点,助力各行业企业解决“1”核心应用的极致业务效果和“N”规模化应用落地效率的难题。

 

面对企业AI全面转型需求,解决算力问题成为关键。“软件定义算力”已经成为行业共识和趋势。第四范式SageOne借助自研AI训练引擎、AI推理引擎和AI特征存储引擎三大引擎技术,针对硬件中的芯片、存储、网络等组件进行了重新定义,根据企业AI应用的实际情况进行了专用计算架构、资源管理和调度等进行深度优化和加速,为企业“1+N”AI应用提供充沛算力。

 

1)AI训练引擎——全面加速高维机器学习过程 以自研高维机器学习分布式框架GDBT和高维算法为基础,第四范自主研发的硬件加速卡——4Paradigm ATX800,采用20nm制程,算力达到1.5TFLOPS,内置FlashGBM加速系统,充分用内存和高速缓存带宽,支持自动优化训练超参数、高位特征计算过程I/O加速和高维GBDT训练加速等功能,在企业应用场景中表现出多达10倍的训练性能。

 

此外,第四范式和英特尔联合实验室一直探索最佳优化技术,并针对最新Cascade Lake-AP处理器的全新AVX512指令集、多核心及主频利用率和CLX AP微架构IO总线的利用率进行全面优化。

 

SageOne内置第四范式自主研发的高维、分布式网络通讯协议Swift,集成pRPC自研网络通信框架、零拷贝数据交换协议等AI领先通讯技术,结合基于CLX-AP架构的参数服务器集群,展现出业界领先机器学习性能表现。SageOne在高维特征计算过程I/O最大10X加速,高维稀疏场景模型训练比GPU提速5X以上,自研pRPC通信框架比百度bRPC和谷歌gRPC提速3-10X。

 

2)AI推理引擎——实现极速实时AI推理能力

 

SageOne内置自研实时特征计算引擎和模型预估引擎,为企业AI应用提供特征处理过程免开发上线、线下线上一致性保证、一键生成预估服务、异构模型统一服务等AI核心应用服务,结合非易失性存储的无限缓存和超低延迟内存存储等硬件技术,确保企业AI应用时具备海量时序特征计算和万亿维模型实时推理能力的同时,提供百万级并发实时请求支持和99.9%请求毫秒级响应的高并发业务极速响应服务。

 

3)AI特征存储引擎——打造超低延时在线AI数据治理

 

面向AI的数据治理是企业AI规模化落地的基础,针对企业中多源异构数据对接、离线在线数据一致性管理、回流数据自动标准及权限、审计等众多治理需求,SageOne借由自研内存时序数据库引擎的优势,具备毫秒级海量时序特征供给性能,并通过融合InfiniCache无限缓存等技术,实现自动切换存储介质优化TCO和RAFT一致性灾备与恢复等高性能企业级标准。SageOne利用超低延迟数据访问接口、超高数据吞吐传输通道和水平扩展动态扩容服务等突出能力,为企业AI应用构建了超低延迟在线数据治理能力。

 

“1”—高维算法+实时推理决策 提升企业核心业务的极致效果

 

企业核心场景的AI应用,每一个百分点的效果提升,对企业都至关重要。第四范式SageOne软硬一体集成系统具备高维、实时领先优势,更大限度助力企业释放核心业务潜能,让AI 应用紧随业务发展需求。

 

1)高维算法+海量数据

 

第四范式自主研发的高维机器学习算法,面对企业海量多源异构的数据场景,特征维度呈现指数级提升,同时带来模型的预测效果成倍提升,达到更精准的业务价值触达和业务收益。在金融、互联网和医疗行业AI应用中,高维为行业的核心业务效果提升50%-574%。

 

2) 实时AI推理决策

 

SageOne通过毫秒级数据响应和百万级吞吐量实时提升核心业务成效,让原本只能出现于“事后”的统计分析,转变成为“事中”实时业务决策AI应用。在企业核心场景的海量实时业务决策中,15个SageOne推理引擎节点都够支撑20亿维特征模型实时2万次并发请求,其中99.9%请求在100ms内响应,大幅提升实时决策在核心业务场景中的关键价值。

 

“N”—提升AI应用生产效率 打造企业AI规模化落地能力

 

面对众多的AI应用场景落地需求,很多企业都面临着“全面AI改造”,此时规模化落地能力成为企业智能化转型的关键。借助第四范式统一的方法论和SageOne的AI数据治理和充沛算力,企业可以快速完成AI 应用创新与规模化落地,快速赋能成百上千个业务应用。

 

1)统一方法论

 

第四范式以“库伯学习圈”理论为基础建立了闭环AI应用方法论,通过SageOne将AI应用构建简化为“行为数据采集、反馈数据采集、模型训练、模型应用”四个标准步骤,并借助第四范式领先的AutoML技术构建规模化的AI生产流水线,将AI应用上线平均周期从30人月降低至数十人天,大幅度节省了人力时间成本。

 

2)面向AI的数据治理

 

目前企业AI应用开发周期中数据准备占据了60%人天成本,要实现企业AI规模化高效落地需要建立一套完整的AI的数据治理系统。SageOne不仅具备能够存取PB级甚至更大量的日志的实时高性能存储能力,同时解决了企业数据采集访问双实时、全量原始数据 、线上线下一致性及利用回流数据自动标注等AI数据治理能力难题,突破制约AI规模化落地的数据瓶颈。

 

3) AutoML

 

AutoML是帮助企业AI走向规模化生产流水线的关键性技术。SageOne内置第四范式自研的AutoML算法,覆盖企业AI应用从数据准备、自动数据标注、自动模型选择、模型一键上线、模型迭代自学习等端到端的全栈流程,助力企业实现低门槛、高效率、大规模构建AI应用。

 

SageOne的性能表现,正在支撑大规模核心场景快速智能迭代。

 

面对越来越多企业AI “1+N”转型的迫切需求,第四范式发布SageOne 企业级AI 集成系统恰逢其时,不仅为企业实现“核心业务极致效果、大规模场景快速落地”形成全面有效支撑,同时带给企业更优能效和更高的投资回报率。目前,第四范式SageOne AI 集成系统服务于银行、保险、证券、零售、安防、能源、政务、媒体、互联网等多个领域,助力它们实现全面AI转型目标。