yuanyimeng - Page 1 - 有赞技术团队

16 Sep 2022

Spark App 血缘解析方案

一、背景随着数据仓库的数据量的增长，数据血缘( Data Lineage or Data Provence ) 对于数据分析来说日益重要，通过数据血缘可以追溯表-表，表-任务，任务-任务的上下游关系，用来支撑问题数据溯源，孤岛数据下线的需求。目前已经基于 ANTLR 语法解析支持了 SQL 任务的血缘解析，而 Spark App 任务的血缘仍然是通过人工配置方式进行。我们希望能够将…

21 Jun 2022

一、前言模型部署作为算法工程落地的最后一公里，其天然对算法团队而言具有较高的复杂性，不仅要考虑如何高效地部署、管理不同框架模型，还需要考虑分布式服务的负载均衡、故障容错、可扩展性、资源隔离、限流、核心指标监控等问题。这些都极大的依赖于工程团队的能力，不是算法团队的强项，如何解决这最后一公里，让焦点聚焦在模型开发上，是模型部署服务模块需要解决的问题。二、原有架构 2.1 架构设计在有赞算法平台Sunfish包含算法训练和模型部署两部分，模型部署的模块称为ABox（小盒子）…

yuanyimeng 2

Spark App 血缘解析方案

有赞算法平台之模型部署演进