Quay lại Blog
Analytics16 phút đọc

AI-generated analytics: tương lai của BI khi ChatGPT có thể phân tích dữ liệu

Khám phá cách gen AI và LLMs đang thay đổi phân tích dữ liệu với text-to-SQL, AI co-pilots. Đâu là hype, đâu là thực tế, và vai trò mới của data analyst

Đặng Quỳnh Hương

Đặng Quỳnh Hương

Senior Data Scientist

Minh họa AI tạo biểu đồ phân tích từ câu hỏi bằng ngôn ngữ tự nhiên
#AI Analytics#Generative AI#ChatGPT#Text-to-SQL#Business Intelligence#LLM

"Tôi cần xem revenue của tháng này so với tháng trước, breakdown theo product category."

Trong quá khứ, câu này sẽ dẫn đến một chuỗi hành động: bạn ping data analyst trên Slack, chờ họ viết SQL query, chờ họ tạo visualization, rồi họ gửi screenshot dashboard cho bạn qua email. Toàn bộ process này có thể mất vài giờ, thậm chí vài ngày nếu data team đang bận.

Nhưng hôm nay, bạn có thể paste câu hỏi đó vào ChatGPT, upload file CSV dữ liệu của bạn, và trong vài giây, bạn có cả code Python để phân tích lẫn biểu đồ visualization đẹp mắt. Hoặc tốt hơn nữa, bạn có thể hỏi trực tiếp trong Power BI hoặc Looker với Copilot, và AI sẽ tự động query data warehouse và tạo chart ngay trong tool.

Chào mừng bạn đến với kỷ nguyên AI-generated analytics.

Trong bài viết này, chúng ta sẽ khám phá cách generative AI và large language models đang thay đổi căn bản cách chúng ta phân tích dữ liệu. Chúng ta sẽ xem các công cụ đang available, benefits thực tế, limitations quan trọng, và quan trọng nhất - vai trò của data analyst sẽ thay đổi như thế nào trong future này.

Sự trỗi dậy của text-to-SQL và text-to-chart

Ý tưởng "hỏi dữ liệu bằng ngôn ngữ tự nhiên" không phải mới. Các công ty như ThoughtSpot và Tableau đã theo đuổi vision này trong nhiều năm với natural language search.

Nhưng previous attempts thường hạn chế. Chúng chỉ work với một tập hợp câu hỏi predefined, cần extensive training data cho mỗi dataset, và thường produce results không chính xác.

Sự khác biệt bây giờ là large language models như GPT-4, Claude, Gemini có khả năng understand context một cách flexible hơn nhiều. Chúng có thể:

Hiểu ý định - không chỉ match keywords mà thực sự understand người dùng muốn gì, ngay cả khi câu hỏi được phrase một cách không formal hoặc ambiguous.

Generate SQL chính xác - chuyển câu hỏi tự nhiên thành SQL queries phức tạp với joins, aggregations, window functions.

Tạo visualization - không chỉ trả về data mà còn suggest và tạo ra chart type phù hợp nhất để trả lời câu hỏi.

Explain kết quả - cung cấp narrative summary about những gì data đang show, không chỉ là một đống numbers.

Sự kết hợp của những capabilities này tạo ra một step change trong accessibility của data analysis.

Các công cụ AI analytics đang thay đổi ngành

Hãy xem các tools và platforms đang lead cuộc revolution này.

ChatGPT code interpreter và data analysis

Tính năng Code Interpreter (giờ gọi là Advanced Data Analysis) trong ChatGPT Plus cho phép bạn upload files (CSV, Excel, JSON) và ask questions về data.

Ví dụ thực tế:

  • Upload file sales data, hỏi "Which products are trending up this quarter?"
  • ChatGPT viết Python code để analyze, run nó, rồi generate charts
  • Bạn có thể follow-up: "Now show me by region" và nó sẽ adjust analysis

Điểm mạnh:

  • Rất flexible, work với bất kỳ data nào
  • Code được generate transparent, bạn có thể xem và verify
  • Good cho ad-hoc analysis và exploration

Điểm yếu:

  • Chỉ work với files nhỏ (upload size limit)
  • Không kết nối được với live database
  • Mỗi analysis là independent, không có persistence
  • Security concerns khi upload sensitive data lên OpenAI servers

Microsoft Copilot trong Power BI

Microsoft đã integrate Copilot sâu vào Power BI, cho phép business users:

Generate reports từ prompts - "Create a sales dashboard showing YTD performance by product line" và Copilot sẽ tự động chọn visuals, arrange layout, apply filters.

Explain insights - Click vào bất kỳ chart nào và hỏi "Why did revenue drop in Q3?" Copilot analyze underlying data và provide narrative explanations.

Create measures với natural language - Thay vì viết DAX formula, bạn có thể nói "Show me average order value for repeat customers" và Copilot sẽ generate correct DAX.

Summarize reports - Tạo executive summary text của entire dashboard tự động.

Điểm mạnh:

  • Tích hợp native trong tool mà business users đã familiar
  • Work trực tiếp với data warehouse không cần extract
  • Governed - respect existing security và data models

Điểm yếu:

  • Chỉ available cho Power BI (vendor lock-in)
  • Requires E5 license (expensive)
  • Quality phụ thuộc vào semantic model có được setup tốt không

Google Duet AI trong Looker

Google cũng không chịu thua với Duet AI integration trong Looker:

Natural language queries - Hỏi questions và Duet AI generate LookML và SQL queries.

Auto-suggest explorations - Based on user behavior, AI suggest interesting cuts và dimensions để explore.

Generate dashboards - Describe business need và Duet AI tạo ra dashboard template với relevant tiles.

Điểm mạnh:

  • Leverage Google's strong NLP capabilities
  • Work với BigQuery's scale

Điểm yếu:

  • Còn khá mới, features đang roll out gradually
  • Yêu cầu LookML knowledge để customize properly

ThoughtSpot Sage

ThoughtSpot đã bet vào AI-powered search từ đầu, và Sage là gen AI layer của họ.

Conversational analytics - Không chỉ one-shot queries mà có thể có multi-turn conversations về data.

Auto-generated insights - AI tự động discover anomalies, trends, correlations trong data và surface chúng proactively.

Natural language data preparation - Ask AI để clean, transform, join datasets.

Điểm mạnh:

  • Purpose-built cho AI-driven analytics từ ground up
  • Intuitive interface cho non-technical users

Điểm yếu:

  • Riêng biệt platform, cần migration từ existing BI tools
  • Pricing có thể expensive

Các open-source solutions

Ngoài các enterprise platforms, có nhiều open-source projects:

LangChain SQL agents - Frameworks để build custom text-to-SQL applications.

Vanna AI - Open-source Python package cho text-to-SQL sử dụng LLMs.

PandasAI - Natural language interface cho Pandas dataframes.

Điểm mạnh:

  • Free và customizable
  • Có thể self-host để avoid data leaving network
  • Flexible integration với existing stack

Điểm yếu:

  • Requires technical expertise để setup và maintain
  • Không có enterprise support
  • Quality có thể inconsistent

Lợi ích thực tế của AI analytics

Vậy những công cụ này mang lại giá trị gì? Không phải chỉ là hype?

Dân chủ hóa data ở level mới

Đây là impact lớn nhất. Previously, để get insights từ data, bạn cần:

  • Biết SQL để query data warehouse
  • Hiểu data model để know tables nào join với nhau thế nào
  • Có technical skills để create visualizations
  • Understand statistics để interpret results correctly

Bây giờ, một business user không technical có thể simply ask questions và get answers. Không cần wait cho data team. Không cần take courses về SQL.

Ví dụ cụ thể từ một công ty e-commerce: trước đây, campaign manager phải request data từ analytics team. Turnaround time là 2-3 ngày. Với AI-powered self-service analytics, họ có thể tự explore campaign performance real-time. Time to insight giảm từ days xuống seconds.

Tăng tốc độ analysis

Ngay cả với data analysts chuyên nghiệp, AI tools speed up workflow đáng kể.

Thay vì manually write SQL queries cho từng question, analyst có thể use AI để generate initial queries, rồi refine. Thay vì manually pick chart types, AI suggest appropriate visualizations. Thay vì type up findings, AI generate draft narratives.

Một senior analyst tại một fintech startup shared: "Copilot helps me với 60-70% boilerplate work. Tôi spend more time on actual thinking - framing right questions, interpreting nuances, making recommendations - rather than syntax."

Giảm tải cho data teams

Data teams ở nhiều companies bị overwhelm với ad-hoc requests. Một survey from industry cho thấy analytics teams spend 40-50% time responding to "Can you pull this number for me?" requests.

AI-powered self-service có thể handle một phần lớn các simple, repetitive queries này. Data team có thể focus vào high-value work: building data platform, improving data quality, designing metrics frameworks, conducting deep analyses.

Lower barrier to entry

Trước đây, để join một data team, bạn cần strong technical background. Bây giờ, domain expertise có thể become equally important. Một marketing expert với strong business acumen nhưng limited SQL skills có thể become productive nhanh hơn nhiều với AI co-pilots.

Điều này mở rộng talent pool và allows domain experts contribute trực tiếp vào analytics efforts.

Hạn chế và rủi ro - hype vs reality

Tuy nhiên, không phải tất cả đều là sunshine and rainbows. Có những limitations và risks nghiêm trọng cần aware.

AI "hallucinations" - nguy cơ lớn nhất

Vấn đề lớn nhất với LLMs là chúng có thể "hallucinate" - tạo ra outputs trông có vẻ reasonable nhưng actually incorrect.

Trong context của data analysis, điều này cực kỳ nguy hiểm. AI có thể:

  • Generate SQL query trông right nhưng có subtle logic error
  • Produce numbers confident nhưng based on wrong calculations
  • Misinterpret schema và join wrong tables
  • Create visualizations misleading (wrong chart type, wrong axis scale)

Ví dụ thực tế: một công ty retail sử dụng AI-generated query để calculate revenue growth. Query trông okay nhưng missed một điều kiện filter về returned orders. Kết quả overstated growth by 15%. Họ almost made major inventory decisions based on sai số này.

Lesson: Never trust AI output blindly. Always verify critical analyses, especially before making important decisions.

Thiếu context về business domain

AI có thể generate technically correct SQL, nhưng nó không understand business context.

Ví dụ: bạn hỏi "What's our conversion rate?" AI sẽ calculate số orders chia cho số visitors. Nhưng nó không biết rằng trong company của bạn, "conversion" được define là paid customers, excluding trial users. Hoặc nó không biết rằng có một đợt technical issue trong period bạn analyze, làm skew numbers.

Một data analyst với domain knowledge sẽ know những nuances này. AI thì không.

Vấn đề security và compliance

Khi bạn paste data hoặc ask questions về data lên ChatGPT hoặc các công cụ cloud-based AI, bạn potentially exposing sensitive information.

Concerns include:

  • Training data - provider có thể use interactions của bạn để train future models
  • Data leakage - sensitive business metrics có thể inadvertently shared
  • Compliance violations - PDPA, GDPR requirements về data residency và processing

Đây là lý do nhiều enterprises ban OpenAI và các external AI services, hoặc chỉ allow self-hosted alternatives.

Microsoft và Google argue rằng enterprise plans của họ guarantee data không được used for training và comply với security standards. Nhưng vẫn có concerns về trust và control.

Quality phụ thuộc vào data foundation

AI analytics tools chỉ good như underlying data. Nếu data warehouse của bạn có data quality issues, ambiguous column names, lack of documentation, AI sẽ struggle.

Ví dụ: một table có column tên "status" với values 1, 2, 3, 4. AI không thể know 1 là "pending", 2 là "approved", etc. unless có documentation clear.

Ironically, để AI analytics work well, bạn cần invest heavily vào data governance, metadata management, semantic layers - exactly những việc mà nhiều companies neglect vì muốn rush vào "sexy" AI stuff.

Over-reliance và skill atrophy

Có một risk là business users trở nên completely reliant vào AI và lose ability để critical thinking about data.

Nếu bạn always trust AI's answer mà không verify, không understand methodology, không question assumptions, bạn sẽ make bad decisions khi AI sai (và nó sẽ sai).

Tương tự, nếu data analysts rely too heavily vào AI-generated code mà không understand nó, skill của họ sẽ atrophy over time. They become glorified prompt engineers rather than true analysts.

Tương lai - AI như một "co-pilot", không phải autopilot

Vậy với tất cả benefits và limitations này, future của analytics sẽ như thế nào?

Consensus hiện tại trong industry là AI sẽ không replace data analysts. Thay vào đó, nó sẽ augment và amplify capabilities của họ. AI là co-pilot, not autopilot.

Vai trò mới của data analyst

Thay vì spend time viết SQL và tạo charts, analysts sẽ focus vào:

Strategic thinking - Framing right questions. Không phải "What's revenue?" mà "Why revenue dropped và what can we do about it?"

Critical evaluation - Verifying AI-generated analyses. Checking cho logical errors, business context issues, statistical validity.

Domain expertise - Understanding business nuances mà AI không có. Connecting data insights với strategic initiatives.

Storytelling - Taking raw AI-generated findings và crafting compelling narratives for stakeholders. Data visualization và presentation skills become more important.

Governance và standards - Defining metrics, maintaining data dictionaries, ensuring consistency across company. Basically, creating foundation để AI work properly.

Một cách để nghĩ: nếu trước đây 80% time của analyst spent vào mechanics (viết code, cleaning data) và 20% vào thinking, future sẽ flip - 20% mechanics (assisted by AI) và 80% thinking.

Phát triển các skills mới

Data professionals cần adapt. Skills quan trọng trong AI era:

Prompt engineering - Biết cách communicate với AI effectively để get desired outputs.

AI literacy - Understanding how LLMs work, limitations của chúng, khi nào trust và khi nào skeptical.

Business acumen - Domain knowledge trở nên critical hơn pure technical skills.

Critical thinking - Ability để question, verify, validate outputs rather than accepting at face value.

Communication - Giải thích insights cho non-technical stakeholders, influence decisions.

Companies cần invest vào data literacy programs không chỉ cho data teams mà cho all business users để họ có thể use AI analytics tools safely và effectively.

Hybrid workflows

Best practice đang emerge là hybrid workflows kết hợp strengths của both human và AI:

Step 1: AI-assisted exploration - Business user hoặc analyst sử dụng natural language để quickly explore data, generate hypotheses.

Step 2: Human verification - Technical analyst verify logic, check cho anomalies, validate với domain experts.

Step 3: AI-assisted refinement - Use AI để scale analysis, test multiple scenarios, create visualizations.

Step 4: Human interpretation - Analysts interpret results trong business context, make recommendations, create narrative.

Step 5: AI-assisted distribution - Auto-generate reports, summaries, presentations. Human review before send.

Best practices để adopt AI analytics safely

Nếu organization của bạn muốn leverage AI analytics, đây là recommendations:

1. Start với use cases low-risk

Đừng immediately use AI-generated analysis cho critical business decisions. Start với exploratory analyses, reporting use cases mà stakes không high.

Gradually build trust và understanding về where AI works well và where nó struggles.

2. Implement verification processes

Establish rule: mọi AI-generated analysis phải được reviewed bởi một human trước khi used for decisions.

Create checklists:

  • Logic review - does SQL make sense?
  • Data validation - are numbers reasonable? Spot checks against known values
  • Business context - does interpretation make sense given what we know về business?

3. Invest trong data foundation

AI analytics sẽ không work well với messy data. Invest vào:

  • Data quality frameworks
  • Data catalog với rich metadata
  • Semantic layers defining business logic
  • Clear naming conventions và documentation

4. Address security và compliance

Nếu using external AI services:

  • Use enterprise plans với data protection guarantees
  • Avoid uploading sensitive data
  • Implement DLP (data loss prevention) policies

Better yet, consider self-hosted solutions hoặc platforms with on-premise deployment options.

5. Train your people

Both technical teams và business users cần training:

  • How AI analytics works (và limitations)
  • How to craft effective prompts
  • How to verify results
  • When to escalate to human experts

6. Create governance framework

Establish guidelines:

  • What types of analyses có thể done with AI independently?
  • What requires human review?
  • Who có authority để make decisions based on AI insights?
  • How to document AI-assisted work for audit purposes?

Case study: triển khai AI analytics tại fintech startup

Để minh họa cụ thể, đây là một case study.

Context

Một fintech startup ở Việt Nam với ~200 employees. Có một data team nhỏ 5 người, nhưng phục vụ toàn company. Backlog requests luôn ở 2-3 tuần.

Leadership muốn enable business teams self-serve, nhưng previous attempts với traditional BI tools failed vì learning curve quá cao.

Approach

Họ pilot Microsoft Fabric với Copilot (đã có Microsoft 365 nên add-on cost reasonable).

Phase 1: Setup foundation

  • Clean up data warehouse, standardize table names
  • Create semantic model với clear business definitions
  • Document common metrics trong data dictionary

Phase 2: Pilot với marketing team

  • Train 5 marketing analysts về Copilot
  • Define safe use cases (campaign reporting, customer segmentation)
  • Establish review process - senior analyst verify AI queries weekly

Phase 3: Expand gradual

  • Roll out to product team, then operations
  • Collect feedback, refine semantic model
  • Create library của common prompts và best practices

Results sau 6 tháng

Quantitative:

  • Ad-hoc request volume giảm 60%
  • Time từ question đến answer giảm từ 2-3 tuần xuống vài giờ
  • Business users satisfaction tăng từ 6/10 lên 8.5/10

Qualitative:

  • Marketing team có thể iterate nhanh hơn on campaigns
  • Product team make more data-informed feature decisions
  • Data team có time để work on real-time analytics initiatives

Challenges encountered

False confidence - initial users trust AI too much. Có incident where sai number almost sent to investors. Fixed bằng cách reinforce verification process.

Prompt quality varies - vague prompts lead to vague results. Created prompt templates và best practices guide.

Semantic model gaps - AI struggled với concepts không well-defined trong semantic layer. Continual improvement needed.

Overall, leadership considers pilot successful và expanding to entire company.

Kết luận

AI-generated analytics không phải hype, nó là real và đang rapidly maturing. Trong vài năm tới, khả năng ask questions về data bằng natural language và get instant answers sẽ become expected feature trong mọi BI tool.

Điều này là fundamentally good cho democratization of data. Nhiều người hơn có thể access insights. Decisions có thể được made faster và based on data.

Nhưng chúng ta cần aware về limitations. AI sẽ make mistakes. Nó lacks business context. Security và governance issues cần addressed.

Future không phải là AI thay thế data analysts. Nó là AI empowering analysts để focus vào higher-value work. AI handles boilerplate, analysts handle thinking. AI generates candidates, analysts verify và interpret.

Organizations muốn succeed cần:

  • Invest trong solid data foundation
  • Train people properly - both technical và AI literacy
  • Implement verification processes
  • Start small, learn, iterate

Nếu bạn làm đúng, AI analytics có thể transform how organization của bạn uses data. Nếu làm sai - rush vào without proper foundations và safeguards - có thể lead đến bad decisions và loss of trust trong data.

Bạn đang consider triển khai AI analytics cho organization của bạn? Carptech có thể giúp bạn assess readiness, build proper data platform foundation, và implement AI analytics một cách safe và effective. Liên hệ với chúng tôi để được tư vấn.

Có câu hỏi về Data Platform?

Đội ngũ chuyên gia của Carptech sẵn sàng tư vấn miễn phí về giải pháp phù hợp nhất cho doanh nghiệp của bạn. Đặt lịch tư vấn 60 phút qua Microsoft Teams hoặc gửi form liên hệ.

✓ Miễn phí 100% • ✓ Microsoft Teams • ✓ Không cam kết dài hạn