透明、高效地为机器学习准备特征数据

万维探索特征平台,是一个基于开源理念开发的,数据特征开发的全流程框架平台。
该平台融合了特征的生成、存储和在线服务三个完整生命周期的最佳开发实践。

统一、友好的特征加工流程,将让您的日常工作更加高效
  • 特征在git存储库中以文件进行管理
  • 通过将CI/CD流程集成到特征生命周期,部署到生产环境时更加稳定可靠
  • 在部署到生产环境之前对特征进行单元测试
    application_feature_query = FeatureQuery(
        feature_list=sc.application_feature_names,
        key=sc.loan_id,
    )
    settings = ObservationSettings(
        observation_path=observation_path, 
        event_timestamp_column="timestamp", 
        ...
    )
    client.get_offline_features(
        observation_settings=settings,
        feature_query=[application_feature_query],
        ...
    )
特征和加工算法集中展示,团队之间能轻松共享
  • 分模块的特征管理,方便分享复用
  • 特征计算逻辑一目了然
  • 全流程可视化,轻松上手
可视化的特征展示和监控界面,是给审计和监管部门的展示窗口
  • 数据源列表
  • 全部特征和计算逻辑可审计
  • 血缘关系,更轻松追踪
大数据集群的加工方式,从容面对业务的快速增长
  • 基于spark计算引擎
  • 基于hadoop存储和集群执行
  • 优越的缓存机制,快速完成特征加工任务
特征质量随时监控,轻松应对业务变化
  • 观察功能可用性和新鲜度
  • 监视机器学习管道的运行状况并自动解决可能生成过时特征数据的问题
  • 计算和存储成本可视化
基于开源社区,服务商中立的解决方案
  • 代码开源,随时审计
  • 吸纳行业优秀的解决方案,随时升级
  • 员工技术经验持续积累