第四范式先知 Data Platform
通用AI数据治理平台

产品价值
大容量
无缝对接多源异构数据,支持海量数据分布式存储
大容量
高吞吐
系统支持Hadoop等主流分布式计算框架,百万级别吞吐量,支持水平扩展
高吞吐
低门槛
内置多个自研可视化算法工具,配备便捷方案调试的特征追踪工具
低门槛
高可用
内部微服务无状态化,自带网络负载均衡器,系统高可用且可水平伸缩
高可用
企业级
租户和用户权限隔离、工作区共享,安装部署和运维工具完善
企业级
产品功能
  • 数据集成
    close
    多源异构数据统一接入
    为结构化数据以及图像、文本等非结构化数据提供统一接入引擎,无缝对接主流数据仓库、关系型数据库;支持AI应用场景下的复合数据接入,包括标注图片集、样本和模型。
    时序数据分组管理
    通过数据分片存储技术,可按某个时间字段进行数据分片,时间切片可作为获取数据的依据,实现机器学习场景中对模型所需数据切片的快速定位。
  • 数据治理
    add
    全域数据统一治理
    第四范式先知 Data Platform为异构数据提供统一治理框架和元信息管理。同构数据通过数据组整合,借助数据域隔离,支持分业务、分场景管理数据,一横一纵两个维度全面提升大规模AI实践过程中的数据治理水平。
    数据全生命周期定位与追踪
    统一定位符(prn)构建企业数据的全局标识体系,实现快速定位数据以及追踪数据整个生命周期变化。
  • 模型管理
    close
    模型组与模型版本
    通过模型组,解决了自学习过程中一个模型多个版本所带来的管理问题。模型版本管理可帮助定位相同场景的不同模型快照。
    模型生产信息汇总
    模型生产过程中的相关评估报告汇总展示,帮助对模型做出准确、全方位评估。
    模型可视化、可解释
    直观、易懂的模型可视化和可解释功能,不仅可以助力建模工程师对模型进行分析优化,更为业务人员提供了理解模型工作原理的重要渠道,让模型的应用更透明、更可控。
    多种模型格式兼容
    支持开源和第三方模型的导入/导出、版本管理和上线部署等,帮助企业实现一站式模型资产管理,沉淀业务价值,提升管理效率。
  • 企业级特性
    close
    企业级数据权限体系
    租户与用户级别数据隔离,保护企业个体数据空间免受窃取和污染;工作区为单元数据共享,实现跨部门数据复用、知识迁移。
    可视化的任务管理面板
    支持按场景、标签、名称等方式检索任务;集中式标识体系,任务、数据统一定位。
    分布式数据任务调度系统
    分布式任务管理引擎,统一调度数据作业;离线批处理与实时流处理一站管理。