12/12/2025
🧠 Master Data Analysis with ChatGPT (in 12 minutes)
Nếu bạn có một dataset mới và không biết bắt đầu phân tích từ đâu, đây là một framework 3 bước giúp bạn hiểu dữ liệu – đặt câu hỏi đúng – và định hướng phân tích cực nhanh.
🔹 Step 1: Description (Hiểu dữ liệu)
Prompt 1
List all the columns in the attached spreadsheet and show me a sample of data from each column.
👉 Mục tiêu: biết dataset có gì, mỗi cột trông như thế nào.
Prompt 2
Take 5 more random samples of the data for each column to make sure you understand the format and type of information in each column.
👉 Tránh hiểu sai format (date, id, text, numeric).
Prompt 3
Run a data quality check on each column. Specifically look for:
Missing, null, or empty values (give me counts and percentages)
Unexpected formats or data types
Outliers or suspicious values
👉 Phát hiện lỗi dữ liệu trước khi phân tích sâu.
🔹 Step 2: Introspection (Đặt câu hỏi với dữ liệu)
Prompt 1
Tell me 10 interesting questions we could answer with this dataset and explain why each would be valuable.
👉 Biến dữ liệu thành insight, không phải chỉ là bảng số.
Prompt 2
For [these questions], tell me exactly which columns you'd need to use and whether the current data is sufficient to answer it.
👉 Kiểm tra: dữ liệu hiện tại có trả lời được câu hỏi không?
Prompt 3
What questions do you think someone would WANT to ask about this data but we CAN'T answer due to missing information?
👉 Nhận ra data gap (thứ mọi người muốn biết nhưng dữ liệu không có).
Joining two datasets
I just received this dataset from a colleague. Your task is to explore and explain the relationships between this new dataset with the original one and how they might be used to join data together.
👉 Xác định key join, grain, và rủi ro khi merge.
🔹 Step 3: Goal Setting (Tập trung đúng thứ)
Prompt
My goal is to understand specify your goal. Given this goal, which aspects of the data should we focus on?
👉 Không phân tích lan man. Chỉ nhìn vào thứ phục vụ mục tiêu.
⭐ Bonus: Nghĩ trước câu hỏi của người đọc
Prompt
What are the key questions someone reading my analysis would ask, and how should we proactively address them?
👉 Giúp bài phân tích thuyết phục, rõ ràng, và ít bị phản biện ngược.
📌 Tóm lại
Framework này giúp bạn:
Hiểu dữ liệu nhanh
Biết dữ liệu làm được gì / không làm được gì
Phân tích có mục tiêu
Dùng ChatGPT như một data analyst assistant, không phải máy trả lời chung chung
Nếu bạn làm Data / BI / Analytics, đây là bộ prompt nên bookmark.