- Toss Insurance 是在 Toss 想要创新的各种金融领域中,专注于‘保险’领域的创新而成立的公司。
- Toss Insurance 数据/基础设施团队确保保险领域内数据的可靠性与一致性。
- 由于保险业的特性,我们处理合同、佣金、客户行为和承保数据,数据质量直接影响客户信任和合规性。
- 保险数据不仅仅是简单的数字,这构成了减少客户风险的决策依据。我们的团队确保数据始终准确并快速地传达到同事。
1. 数据建模与 DW 建设
- 依据 Toss Insurance DW 标准,设计与运作负责域(IA 销售、合同、佣金、客户)的标准数据集市。
- 致力于实现单一事实来源,保持和管理数据集市,以便同事可以基于相同的数据标准做出决策。
- 设计出符合规范化数据库设计原则和 DW(面向主题、集成、非易失性、时间变化)特征的结构。
- 明确区分标准区域数据集市(Conformed Mart)与消费区域数据集市(Data Mart)的运作。
2. 数据质量管理(DQ)
- 构建数据一致性验证逻辑,并实现 DQ 监控自动化。
- 根据保险领域特征,执行数据异常检测(合同错误、佣金不一致、重复合同等)。
- 通过元数据管理系统对数据集市的定义、列说明和计算逻辑进行文档化,并保持最新状态。
3. 管道与安全
- 开发与运作基于 Airflow 的批量管道。
- 通过数据安全性审查实施个人数据(PII)掩码和访问控制。
- 鉴于保险业的特点,支持符合监管报告和 IFRS 会计标准的数据输出。
4. 与开发者的协作
- 从服务开发阶段开始,与后端开发者共同审查日志设计和数据模型,提出分析要求。
- 与数据分析师、销售支持团队、运营团队及平台团队合作,定义指标及处理数据请求。
- 必须熟练使用 SQL 达到高级水平。欢迎能够清晰编写复杂聚合查询、窗口函数和子查询的申请者。
- 需要理解数据库规范化原则和数据仓库设计模式(星型架构、雪花架构)。
- 作为数据建模师,需能够清晰定义领域概念,并设计出简单明了的数据结构。
- 需要具备将商业请求转换成数据结构的沟通能力。
- 需要主动发现数据质量问题并提出解决方案的能力。
主要技术栈
- 必须: SQL(MySQL / Oracle)、Apache Airflow、Git
- 加分: Python、dbt、PySpark、Tableau、Snowflake
- Python 初级以上(能编写 Airflow DAG 和理解他人代码的水平)更佳。
- 有使用 dbt(数据构建工具)进行数据转换的经验优先。
- 有使用 PySpark 等分布式处理环境的经验优先。
- 有使用 Snowflake 等云数据仓库的经验优先。
- 有使用 Tableau 进行可视化/报告的经验更佳。
- 如果有从数据收集/加载到分析/可视化的完整设计与运作经验更佳。
- 理解 AARRR 漏斗分析框架者优先。
- 保险/金融行业知识(合同、佣金、索赔、风险)或相关数据工作经验者优先。
- 有大规模数据处理(超过数亿条记录)经验者优先。
- 了解 IFRS 17 会计标准中保险数据特性者优先。
申请 > 职位面试 > 文化契合度面试 > 薪资谈判 > 背景调查 > 最终录用
1. 请务必确认以下事项:
- 工作地点在首尔特别市九老区经济路662号(新道林洞,D Cube City塔的37层)。
- 按照相关法律,残疾人和国家保护对象在申请时享有优先权。
- 如果在简历和提交文件中发现虚假信息,或工作经历中确认有纪律处分,可能会导致雇佣被取消。
- 根据 Toss Insurance 的内部规定,禁止雇佣的人员或符合不合格条件的人可能会被取消雇佣。
2. 建议您这样撰写简历:
- 如果您在 DW 构建或数据集市设计方面有经验,请明确您贡献的具体部分。
- 请用数字表达您负责的数据规模(行数、表数、处理周期)。
- 请具体描述您发现和解决数据质量问题的案例。
- 建议描述与其他角色(开发人员、分析师、业务团队)的协作方式。
- 请写出申请该职位的原因以及对 Toss Insurance 领域的兴趣背景。
- 请重点关注影响和学习要点,而不是单纯列举经验。