Quay lại Blog
Team & OrganizationCập nhật: 1 tháng 2, 202611 phút đọc

Xây dựng Data Team: Roles, Hiring, và Org Structure

Framework xây dựng Data Team theo stage: Startup (2-3 người, 4-7M VND/tháng) → Enterprise (15+, 40-150M). 6 vai trò, 3 mô hình tổ chức, hiring playbook VN, và salary benchmarks ITviec 2025-2026.

Nguyễn Minh Tuấn

Nguyễn Minh Tuấn

Principal Data Architect

Building Data Team - Roles, Hiring, and Org Structure
#Data Team#Hiring#Data Engineer#Data Analyst#Data Scientist#Organization#Team Structure#Career

Tóm tắt

  • 6 vai trò data: Data Engineer, Analytics Engineer, Data Analyst, Data Scientist, ML Engineer, Data Architect — đừng expect 1 người làm hết
  • Quy mô team: Startup (1 generalist) → Series A (2-3) → Growth (5-8) → Enterprise (15-50+)
  • Cấu trúc tổ chức: Mô hình hybrid (platform trung tâm + analysts phân tán) tốt nhất
  • Lương VN 2025-2026: Junior DE 15-25M → Senior 40-70M → Staff 60-100M+ VND/tháng
  • Xây vs Thuê: Mô hình kết hợp (nội bộ chủ chốt + đối tác chuyên môn) thường tối ưu nhất

Tại sao xây dựng Data Team lại khó

Theo khảo sát Gartner 2024 với 479 CDAOs, thiếu hụt kỹ năng và nhân sự là rào cản lớn nhất ngăn cản team Data & Analytics hoạt động hiệu quả. Tại Việt Nam, nhu cầu tuyển dụng data/AI tăng 42.1% so với cùng kỳ trong Q3-2025 theo ITviec.

Tình huống phổ biến: Bạn đăng tin tuyển "Data Scientist" với yêu cầu build ML models, phân tích dữ liệu, tạo dashboard, xây pipeline, thiết lập hạ tầng — tức là mô tả 3-4 vai trò khác nhau cho 1 người. Kết quả: không tuyển được ai đủ năng lực.

Bài này giúp bạn hiểu rõ từng vai trò, sizing phù hợp theo stage, chọn org structure, và tuyển dụng hiệu quả tại Việt Nam. Nếu bạn đang xây lộ trình thăng tiến cho team, đây là bước nền tảng.


6 vai trò trong Data Team

Bảng so sánh tổng quan

Vai tròCông việc chínhKỹ năng then chốtLương VN (VND/tháng)
Data EngineerPipelines, hạ tầngSQL, Python, Airflow, Cloud15-70M+
Analytics Engineerdbt transformations, modelingSQL (expert), dbt, Git20-60M
Data AnalystInsights, dashboardsSQL, BI tools, business acumen12-50M
Data ScientistML models, dự đoánPython, ML, thống kê25-100M+
ML EngineerTriển khai ML productionSoftware eng, MLOps, Docker35-100M+
Data ArchitectThiết kế hệ thốngArchitecture, 8-15 năm KN50-150M+

Data Engineer

Xây dựng và duy trì data pipeline, hạ tầng dữ liệu. Trích xuất từ nhiều nguồn, chuyển đổi (ETL/ELT), tải vào warehouse/lake, duy trì chất lượng và tối ưu hiệu suất.

# Ví dụ: Airflow DAG for daily ETL
from airflow import DAG
from airflow.providers.postgres.operators.postgres import PostgresOperator

dag = DAG('daily_sales_etl', schedule_interval='0 2 * * *')

extract = PostgresOperator(
    task_id='extract_orders',
    postgres_conn_id='prod_db',
    sql='SELECT * FROM orders WHERE date = {{ ds }}'
)

transform = SparkOperator(
    task_id='transform_orders',
    application='transform_sales.py'
)

load = SnowflakeOperator(
    task_id='load_to_warehouse',
    sql='COPY INTO sales FROM @stage/sales.parquet'
)

extract >> transform >> load

Khi nào tuyển: Khi có trên 5 nguồn dữ liệu, ETL thủ công không còn đáp ứng.

Theo ITviec 2025-2026, Data Engineer 3-4 năm kinh nghiệm đạt trung bình 56.9 triệu VND/tháng — Junior 15-25M, Mid 25-45M, Senior 40-70M, Staff 60-100M+.

Analytics Engineer

Chuyển đổi raw data thành clean, modeled data sẵn sàng cho phân tích. Viết dbt models, data modeling (Kimball, Data Vault), kiểm tra chất lượng dữ liệu.

-- dbt model: models/marts/fct_daily_revenue.sql
WITH orders AS (
    SELECT * FROM {{ ref('stg_orders') }}
),
order_items AS (
    SELECT * FROM {{ ref('stg_order_items') }}
)
SELECT
    DATE(o.created_at) AS revenue_date,
    o.country,
    COUNT(DISTINCT o.order_id) AS orders,
    SUM(oi.price * oi.quantity - oi.discount) AS net_revenue
FROM orders o
JOIN order_items oi ON o.order_id = oi.order_id
GROUP BY 1, 2

Khi nào tuyển: Khi có 50+ dbt models, Data Engineers quá tải với logic transformation. Lương: 20-60M VND/tháng.

Data Analyst

Phân tích dữ liệu, trả lời câu hỏi kinh doanh (Tại sao doanh thu giảm?), tạo dashboards (Tableau, Looker, Power BI), định nghĩa metrics, trình bày insights cho stakeholders.

Khi nào tuyển: Ngay khi có data platform — Analysts mang lại insights → ROI nhanh nhất. Lương: 12-50M VND/tháng.

Data Scientist

Xây ML models (dự đoán churn, segmentation, dự báo nhu cầu), chạy A/B tests, phân tích nâng cao.

Khi nào tuyển: Khi có use cases ML rõ ràng — đừng tuyển chỉ vì "ngầu" mà không có bài toán thực tế. Lương: 25-100M+ VND/tháng.

ML Engineer

Triển khai và scale ML models lên production (APIs, batch inference), giám sát model drift, feature pipelines, MLOps.

Khi nào tuyển: Khi có ML models cần production deployment. Lương: 35-100M+ VND/tháng.

Data Architect

Thiết kế kiến trúc (lakehouse, data mesh), đánh giá công nghệ, đặt chuẩn mực quản trị, cố vấn cho engineers. Cần 8-15 năm kinh nghiệm.

Khi nào tuyển: Team trên 10 người, nhiều dự án, cần tầm nhìn dài hạn. Lương: 50-150M+ VND/tháng.


Quy mô team theo giai đoạn

Startup (10-50 nhân viên, Seed)

Team: 1 Data Generalist (15-40M VND/tháng)

Làm basic ETL (Python scripts), SQL + BI (Metabase), reporting cho founders. Tools đơn giản: Postgres + Metabase + Python scripts. Không nên tuyển Data Scientist đắt đỏ khi chưa có đủ dữ liệu.

Series A (50-200 nhân viên)

Team: 2-3 người (budget 60-120M VND/tháng)

  • 1 Data Engineer: Warehouse (BigQuery/Snowflake), Airbyte/Fivetran, dbt cơ bản
  • 1-2 Data Analysts: Dashboards, phân tích ad-hoc, làm việc với Product/Marketing

Tools: Modern Data Stack — BigQuery, Airbyte, dbt, Looker.

Growth Stage (200-500 nhân viên, Series B-C)

Team: 5-8 người (budget 150-300M VND/tháng)

  • 2-3 Data Engineers (1 senior, 1-2 mid/junior)
  • 1 Analytics Engineer
  • 2-3 Data Analysts (embedded trong Product, Marketing, Ops)
  • 1 Data Scientist (nếu có ML use cases rõ ràng)

Bắt đầu tách sub-teams: Platform team (Engineers + AE) và Embedded Analysts.

Enterprise (500+ nhân viên)

Team: 15-50+ người (budget 400M-1.5 tỷ VND/tháng)


Cấu trúc tổ chức: 3 mô hình

Theo McKinsey, công ty áp dụng chiến lược data-driven có khả năng thu hút khách hàng cao gấp 23 lần và cải thiện lợi nhuận gấp 19 lần. Chọn đúng cấu trúc tổ chức là yếu tố quan trọng để đạt kết quả này.

Mô hình tập trung (Centralized)

Một Data Team phục vụ toàn công ty. Ưu điểm: hiệu quả cao, chuẩn mực nhất quán, dễ quản lý. Nhược điểm: nút thắt cổ chai, chậm khi requests xếp hàng. Dùng khi: team nhỏ (dưới 5 người).

Mô hình phân tán (Embedded)

Data people nằm trong từng bộ phận kinh doanh. Ưu điểm: nhanh, hiểu sâu business context. Nhược điểm: trùng lặp, không nhất quán metrics. Dùng khi: tổ chức lớn (trên 500 người) với văn hóa data trưởng thành.

Mô hình Hybrid (khuyến nghị)

Team trung tâm xây hạ tầng chung (warehouse, pipelines, core dbt models). Analysts phân tán sử dụng platform, tạo phân tích riêng cho từng team.

Ưu điểm: Tốt nhất cả 2 — analysts gần business (nhanh, có context), engineers xây platform chung (hiệu quả, nhất quán). Bắt đầu tập trung khi team nhỏ, chuyển hybrid khi scale. Đọc thêm về self-service analytics để giảm nút thắt.


Tuyển dụng tại Việt Nam

Thị trường hiện tại

Nhu cầu data/AI tại Việt Nam tăng mạnh: vị trí Python tăng 36.1% YoY, data/AI/ML tăng 42.1% trong Q3-2025 theo ITviec. Kinh tế số Việt Nam dự kiến đạt $50 tỷ vào 2026 theo Vietnam Briefing.

Thách thức chính: (1) Thiếu hụt senior — engineers giỏi nhận 5-10 lời mời/tháng; (2) Lạm phát lương 15-25%/năm cho data/AI roles; (3) Cạnh tranh với công ty remote trả USD.

Nguồn tuyển dụng

  • TopDev.vn, ITviec.com: Tốt nhất cho tech roles
  • LinkedIn: Cho senior/chuyên biệt
  • Giới thiệu nội bộ: Tỷ lệ thành công cao gấp 3 lần, thưởng $500-1,000
  • Meetups: Data Engineering Vietnam, PyData Saigon

Quy trình sàng lọc

Bước 1 — CV (10 phút): Có GitHub/portfolio? Thực hành công cụ liên quan? Dấu hiệu cảnh báo: nhảy việc dưới 1 năm liên tục, không có dự án.

Bước 2 — Bài tập kỹ thuật (1-2 giờ, làm ở nhà): Ví dụ cho DE: build ETL pipeline từ CSV → Postgres → daily revenue report. Đánh giá: chất lượng code, SQL, xử lý lỗi, tài liệu.

Bước 3 — Phỏng vấn kỹ thuật (1 giờ): Thảo luận bài tập, SQL live coding, thiết kế hệ thống.

Bước 4 — Phỏng vấn hành vi (30 phút): Cộng tác, học hỏi, phù hợp văn hóa.


Xây dựng nội bộ vs đối tác

Mô hình Hybrid (khuyến nghị)

Xem phân tích chi tiết trong bài Outsourcing vs In-house Data Team.

Mô HìnhChi Phí/ThángChất LượngTốc Độ
Toàn bộ nội bộ (5 người)200-300M VNDCaoChậm (tuyển dụng 3-6 tháng)
Toàn bộ offshore120-180M VNDTrung bìnhTrung bình
Hybrid (nội bộ + đối tác)150-220M VNDCao nhấtNhanh nhất

Core in-house (1-3 người): Hiểu business sâu, duy trì platform dài hạn, available cho urgent issues.

Đối tác chuyên môn: Xây platform ban đầu (3-6 tháng), dự án chuyên sâu (ML, Architecture), mentorship cho team nội bộ.


Case Study: E-commerce Startup → Series B

Công ty: Startup thương mại điện tử tại TP.HCM

Seed (năm 0): 0 data people, founder làm báo cáo thủ công 10 giờ/tuần.

Seed (năm 1): Tuyển 1 Data Analyst (25M/tháng). Kết quả: 15+ dashboards, founders tiết kiệm 8 giờ/tuần.

Series A (năm 2): Tuyển 1 Senior Data Engineer (40M/tháng). Build warehouse (BigQuery), Airbyte (10 sources), dbt (50+ models). Query performance cải thiện 10 lần, data freshness từ 24h xuống 1h.

Series B (năm 3): Team 5 người (1 DE, 1 AE, 3 DA). Hybrid structure: platform trung tâm + embedded analysts. Budget: 150M/tháng. Kết quả: 200+ dbt models, 100+ dashboards, self-service analytics giảm ad-hoc requests 70%. 50+ A/B tests/năm, conversion rate tăng 25%.

ROI: Team 1.8 tỷ VND/năm, enabled decisions dẫn đến tăng trưởng doanh thu 50 tỷ+.


Chiến lược giữ chân nhân tài

Nhân tài data tại Việt Nam có tenure trung bình chỉ 1.5-2 năm. Lý do nghỉ: lương cao hơn ở chỗ khác (+20-30%), tech stack cũ, thiếu cơ hội phát triển.

6 chiến thuật:

  1. Lương cạnh tranh: Benchmark hàng năm (ITviec, TopDev), trả ở phần tư thứ 3 (top 25%), bao gồm bonus 10-20% và equity cho startup
  2. Tech stack hiện đại: dbt, Airflow, Snowflake, BigQuery — engineers muốn công cụ build được resume
  3. Cơ hội phát triển: Career ladder rõ ràng (Junior → Principal), learning budget $1K-2K/năm, mentorship
  4. Linh hoạt: Remote/hybrid là non-negotiable, flexible hours
  5. Công nhận: Shoutouts hàng tháng, ownership dự án end-to-end
  6. Văn hóa: Blameless post-mortems, psychological safety, data-driven culture

Kết luận

Khuyến nghị theo stage

Startup (Seed-Series A): Tuyển 1 Data Analyst trước (quick wins), thêm DE khi trên 5 data sources. Cân nhắc đối tác chuyên môn build platform 3-6 tháng, team nội bộ duy trì.

Growth (Series B-C): Build 5-8 người (2-3 DE, 1 AE, 2-3 DA). Hybrid structure (platform trung tâm + embedded analysts). Tuyển architect khi team trên 10 người.

Enterprise: Multiple specialized teams (Platform, Analytics, DS, Governance). Career ladder IC + Manager mạnh. Retention là ưu tiên số 1.

Bước tiếp theo

Chưa biết team cần gì? Làm Data Maturity Assessment miễn phí — đánh giá 6 chiều bao gồm Đội ngũ & Kỹ năng.

Cần justify budget? Tính ROI Data Platform — ước tính chi phí và lợi ích, 3 phút, số liệu VN thực tế.

Muốn build Data Team? Liên hệ Carptech để tư vấn team assessment, org design, hiring support, và data platform build. Xem thêm dịch vụ Data Strategy & GovernanceData Engineering & Infrastructure.

Đăng ký nhận bài viết mới

Nhận thông báo khi chúng tôi publish bài viết mới về Data Platform, Analytics và AI.

Có câu hỏi về Data Platform?

Đội ngũ chuyên gia của Carptech sẵn sàng tư vấn miễn phí về giải pháp phù hợp nhất cho doanh nghiệp của bạn. Đặt lịch tư vấn 60 phút qua Microsoft Teams hoặc gửi form liên hệ.

✓ Miễn phí 100% • ✓ Microsoft Teams • ✓ Không cam kết dài hạn