- Toss Insurance es una empresa creada con el objetivo de innovar en el área de "seguros", uno de los diversos ámbitos financieros en los que Toss busca la innovación.
- El equipo de datos/infraestructura de Toss Insurance se asegura de que los datos en todo el dominio de seguros sean confiables y consistentes.
- Dada la naturaleza del negocio de seguros, los datos de contratos, comisiones, comportamiento del cliente y riesgos tienen un impacto directo en la confianza del cliente y la conformidad.
- Los datos de seguros no son solo números; son la base para tomar decisiones que disminuyan el riesgo del cliente. Nuestro equipo se asegura de que esos datos sean siempre precisos y se transmitan rápidamente a los colegas.
Responsabilidades principales
1. Modelado de Datos y Construcción de DW
- Basado en las pautas estándar de DW de Toss Insurance, diseñamos y operamos el Data Mart estándar para el dominio responsable (IA Ventas, Contrato, Comisión, Cliente).
- Mantenemos y administramos el Data Mart para que nuestros compañeros puedan tomar decisiones basadas en los mismos datos, buscando un Single Source of Truth.
- Diseñamos una estructura que refleja los principios de diseño de bases de datos normalizadas y las características de DW (Orientado al Tema, Integrado, No Volátil, Variable en el Tiempo).
- Hacemos una clara distinción entre el Data Mart de área estándar (Conformed Mart) y el Data Mart de consumo.
2. Gestión de la Calidad de Datos (DQ)
- Desarrollamos lógicas de verificación de la coherencia de datos y automatizamos la monitorización de DQ.
- Llevamos a cabo una detección de anomalías de datos adecuada a las características del dominio de seguros (errores de contrato, discrepancias de comisiones, contratos duplicados, etc.).
- Documentamos la definición del Data Mart, las descripciones de columnas y la lógica de cálculo a través de un sistema de gestión de metadatos, manteniendo el estado actualizado.
3. Pipeline y Seguridad
- Desarrollamos y operamos pipelines por lotes sobre la base de Airflow.
- Realizamos revisiones de seguridad de datos y gestionamos derechos de acceso, como el enmascaramiento de información personal (PII).
- Debido a las características del sector de seguros, apoyamos la creación de entregables de datos de acuerdo con los requisitos de informes reglamentarios y estándares contables IFRS.
4. Colaboración con Desarrolladores
- Desde el inicio del desarrollo de un nuevo servicio, revisamos el diseño de registros y el modelo de datos junto con los desarrolladores de servidores y proponemos requisitos de análisis.
- Colaboramos con Data Analysts, el equipo de soporte de ventas, el equipo de operaciones y el equipo de plataforma para gestionar definiciones de indicadores y solicitudes de datos.
- SQL debe dominarse a un nivel avanzado. Buscamos candidatos que puedan escribir consultas de agregado complejas, funciones de ventana y subconsultas de manera comprensible.
- Es necesario entender los principios de normalización de bases de datos y los patrones de diseño de Data Warehouse (Star Schema, Snowflake Schema).
- Como modelador de datos, se requiere definir claramente los conceptos del dominio y diseñar una estructura de datos comprensible y clara.
- Es necesaria la capacidad de comunicación para traducir las solicitudes comerciales en estructuras de datos.
- Se requiere iniciativa para descubrir y proponer soluciones a los problemas de calidad de datos.
Stack tecnológico necesario
- Obligatorio: SQL (MySQL / Oracle), Apache Airflow, Git
- Preferido: Python, dbt, PySpark, Tableau, Snowflake
- Tener conocimientos en Python al menos a nivel intermedio (capaz de escribir DAGs de Airflow y entender el código de otros) sería una ventaja.
- Se valora la experiencia en transformación de datos utilizando dbt (Data Build Tool).
- Se valora la experiencia en entornos de procesamiento distribuido como PySpark.
- Se valora la experiencia con almacenes de datos en la nube como Snowflake.
- Se agradecerá la experiencia en visualización/informes utilizando Tableau.
- Se valorará la experiencia en el diseño y operación desde la recopilación de datos hasta el análisis y la visualización de A a Z.
- Se valorará el entendimiento del marco de análisis AARRR Funnel.
- Se valora el conocimiento en el dominio de seguros/finanzas (contratos, comisiones, reclamaciones, riesgos) o experiencia relacionada con datos.
- Se valora la experiencia en el procesamiento de grandes volúmenes de datos (más de cientos de millones).
- Es deseable tener conocimiento de las características de datos de seguros dentro de las normas contables IFRS 17.
Recepción de documentos > Entrevista de trabajo > Entrevista de adecuación cultural > Negociación de beneficios > Verificación de referencias > Oferta final
1. Por favor, verifique lo siguiente
- El lugar de trabajo está en el 37º piso de D-Cube City, 662 Gyeongin-ro, Guro-gu, Seúl.
- Las personas con discapacidad y los beneficiarios de asistencia estatal tienen preferencia al postularse, de acuerdo con la ley aplicable.
- Si se descubren declaraciones falsas en el currículum o en los documentos presentados, o si se confirman medidas disciplinarias en la experiencia laboral, la contratación puede ser cancelada.
- Las personas que están prohibidas de ser contratadas de acuerdo con las políticas de Toss Insurance o que tienen motivos de inadmisibilidad pueden tener su contratación cancelada.
2. Se recomienda elaborar el currículum de la siguiente manera
- Si tiene experiencia en la construcción de DW o en el diseño de Data Mart, indique las partes específicas en las que contribuyó.
- Exprese la escala de los datos que manejó (número de filas, número de tablas, frecuencia de procesamiento) en cifras.
- Especifique casos concretos en los que haya detectado y resuelto problemas de calidad de datos.
- Describa la forma en que colaboró con otras profesiones (desarrolladores, analistas, equipos de negocios).
- Escriba la razón por la que postula para este puesto y el trasfondo que le ha llevado a interesarse en el dominio de Toss Insurance.
- En lugar de simplemente enumerar experiencias, concéntrese en el impacto y los puntos de aprendizaje.