宋轶群 - Page 1 - 有赞技术团队

25 Mar 2019

DataX在有赞大数据平台的实践

一、需求有赞大数据技术应用的早期，我们使用 Sqoop 作为数据同步工具，满足了 MySQL 与 Hive 之间数据同步的日常开发需求。随着公司业务发展，数据同步的场景越来越多，主要是 MySQL、Hive 与文本文件之间的数据同步，Sqoop 已经不能完全满足我们的需求。在2017年初，我们已经无法忍受 Sqoop 给我们带来的折磨，准备改造我们的数据同步工具。当时有这么些很最痛的需求：…

10 Aug 2018

有赞数据仓库背景业务系统使用mysql数据库，有统一的DDL规范和SQL规范数据仓库基于Hive构建业务快速变化，员工数量持续增加第一版：手工维护的表格在有赞大数据平台发展初期，业务量不大，开发者对业务完全熟悉，从ETL到统计分析都可以轻松搞定，当时没有想过要做一个元数据系统。随着公司规模扩大，开始有专职的数据分析师，作为大数据平台的新用户，希望能够记录和查看核心表的信息。最简单的方法就是去业务数据库里查看注释，但是一方面业务数据库的注释不全或不准，另一方面分析师的视角和开发者不同，需要从不同角度去描述表或字段，比如完整的枚举值含义、业务统计口径等。于是有了第一版的数据字典，手工维护一系列核心的业务表和统计报表，…

14 Jul 2017

基于storm的实时计算应用实践

有赞使用storm已经有将近3年时间，稳定支撑着实时统计、数据同步、对账、监控、风控等业务。订单实时统计是其中一个典型的业务，对数据准确性、性能等方面都有较高要求，也是上线时间最久的一个实时计算应用。通过订单实时统计，描述使用storm时，遇到的准确性、性能、可靠性等方面的问题。订单实时统计的演进第一版：流程走通在使用storm之前，显示实时统计数据一般有两种方案：在数据库里执行count、sum等聚合查询，是简单快速的实现方案，但容易出现慢查询。在业务代码里对统计指标做累加，…

宋轶群 3

DataX在有赞大数据平台的实践

有赞数据仓库元数据系统实践

基于storm的实时计算应用实践