LeaPrep · CFA Level I · Lý thuyết nền

Quant
revise.

Topic 1 · Quantitative Methods

Lý thuyết chi tiết theo chương trình CFA L1

Nguồn: SAPP · 11 module Quant
Chủ đề: 8 cụm · 3 slide/cụm
Đào sâu: Hypothesis Testing · 7 slide ứng dụng
Đối chiếu: 26 câu Mock 1 + 2

Khái niệm cốt lõi, công thức, bảng phân biệt và ví dụ từng bước

Quant · Lý thuyết chi tiết 01 / 31

Bản đồ kiến thức

Tám cụm Quant phủ trọn chương trình.

1. Rates & Returns · Lãi suất & lợi suấtCấu phần lãi suất, các thước đo lợi suất theo thời gian, và giá trị thời gian của tiền (TVM).
2. Statistical Measures · Đo lường thống kêXu hướng trung tâm, độ phân tán, rủi ro dưới mục tiêu, skewness, kurtosis và tương quan.
3. Probability & Expected Value · Xác suất & kỳ vọngQuy tắc xác suất, kỳ vọng có điều kiện, cây xác suất, Bayes và đếm tổ hợp.
4. Portfolio Mathematics · Toán danh mụcCovariance, correlation, phương sai danh mục và vai trò của tương quan trong đa dạng hóa.
5. Simulation & Distributions · Mô phỏng & phân phốiNormal vs lognormal, các phân phối lấy mẫu (t, χ², F), Monte Carlo và resampling.
6. Sampling & Estimation · Lấy mẫu & ước lượngPhương pháp lấy mẫu, định lý giới hạn trung tâm, standard error và khoảng tin cậy.
7. Hypothesis Testing · Kiểm định giả thuyếtQuy trình kiểm định, sai lầm loại I/II, power, chọn test và kiểm định độc lập.
8. Simple Linear Regression · Hồi quy tuyến tính đơnMô hình least squares, diễn giải hệ số, giả định phần dư, đo độ phù hợp và ANOVA.

Quant · Lý thuyết chi tiết 02 / 31

Chủ đề 1 · Khái niệm · SAPP M1–M2

Rates & Returns. Lãi suất & lợi suất

Lãi suất là gì

Một lãi suất có thể đọc theo ba góc: required rate of return (lợi suất yêu cầu), discount rate (suất chiết khấu) và opportunity cost (chi phí cơ hội của vốn).

Cấu thành lãi suất

Lãi suất danh nghĩa = real risk-free rate + bù lạm phát + bù default + bù liquidity + bù maturity. Với bond hạng cao, maturity premium thường là cấu phần lớn nhất.

Holding Period Return

HPR = (P₁ − P₀ + thu nhập) / P₀ là viên gạch của mọi thước đo lợi suất. Gộp nhiều kỳ bằng cách nhân các (1 + HPR) với nhau.

Số học vs hình học

Arithmetic mean ước lượng lợi suất kỳ vọng MỘT kỳ; geometric mean là lợi suất kép thực tế qua nhiều kỳ. Luôn có geometric ≤ arithmetic (bằng nhau khi mọi HPR giống nhau).

Money- vs time-weighted

MWR là IRR của dòng tiền, bị ảnh hưởng bởi thời điểm nhà đầu tư nạp/rút vốn. TWR loại bỏ tác động dòng tiền nên là chuẩn so sánh tay nghề quản lý quỹ (GIPS).

TVM & continuous

PV–FV–PMT–N–I/Y gắn nhau qua chiết khấu. Continuously compounded return = ln(1 + HPR). Định giá bond/equity = chiết khấu dòng tiền kỳ vọng; implied return là giải ngược I/Y.

Quant · Lý thuyết chi tiết 03 / 31

Chủ đề 1 · Công thức & phân biệt

Công thức lõi: Rates & Returns.

r = real RFR + bù lạm phát + default + liquidity + maturitylợi suất yêu cầu

(1 + nominal) = (1 + real)(1 + lạm phát)quan hệ Fisher đầy đủ

HPR = (P₁ − P₀ + I) / P₀lợi suất một kỳ nắm giữ

Geometric mean = [Π(1 + HPRᵢ)]^(1/n) − 1lợi suất kép nhiều kỳ

r_cc = ln(1 + HPR) = ln(P₁/P₀)gộp liên tục

trong đó P₀, P₁ = giá đầu kỳ / cuối kỳ · I = thu nhập trong kỳ (cổ tức, coupon) · n = số kỳ

Phân biệt cặp dễ lẫn

Arithmetic mean vs Geometric mean	Số học = kỳ vọng 1 kỳ; hình học = tăng trưởng kép thực tế. Geo ≤ Arith.
Money-weighted vs Time-weighted	MWR (=IRR) nhạy dòng tiền nhà đầu tư; TWR trung lập, chuẩn so sánh hiệu suất.
Nominal vs Real	Nominal đã gồm lạm phát; real đã trừ lạm phát (xấp xỉ qua Fisher).

Quant · Lý thuyết chi tiết 04 / 31

Chủ đề 1 · Ví dụ giải từng bước

Ví dụ: Rates & Returns.

ĐềTín phiếu kho bạc 12 tháng có quoted (nominal) rate 5.3%. Phần bù lạm phát kỳ vọng là 4.1%. Ước lượng real risk-free rate.

Quan hệ xấp xỉ: nominal ≈ real + lạm phát.
Suy ra: real ≈ nominal − lạm phát.
real ≈ 5.3% − 4.1%.

Đáp ánReal risk-free ≈ 1.2%

BẫyReal vs nominal: luôn TRỪ lạm phát. TWR mới là chuẩn đánh giá tay nghề, không phải MWR.

Quant · Lý thuyết chi tiết 05 / 31

Chủ đề 2 · Khái niệm · SAPP M3

Statistical Measures. Đo lường thống kê

Xu hướng trung tâm

Mean (bình quân cộng), median (giá trị giữa sau sắp xếp), mode (xuất hiện nhiều nhất). Với n chẵn, median = trung bình hai giá trị giữa. Quantile (tứ phân vị, bách phân vị) chia dữ liệu đã sắp xếp.

Độ phân tán

Range, MAD (độ lệch tuyệt đối bình quân), phương sai và độ lệch chuẩn. Mẫu chia (n − 1) để không chệch; tổng thể chia N.

Rủi ro một phía

Nhà đầu tư chỉ ngại phần lệch XẤU: target downside deviation (semideviation) chỉ tính các quan sát dưới mức mục tiêu, hữu ích khi phân phối lệch.

Coefficient of variation

CV = σ / mean: rủi ro trên mỗi đơn vị lợi suất, cho phép so sánh các tài sản khác đơn vị/quy mô. CV càng thấp càng tốt.

Skewness

Đo bất đối xứng. Lệch phải (dương): đuôi phải dài → mode < median < mean. Lệch trái (âm): ngược lại, mean < median < mode.

Kurtosis & tương quan

Chuẩn có kurtosis = 3; excess = kurtosis − 3. Leptokurtic (>0) đuôi mập, nhiều outlier. Correlation chuẩn hóa covariance về [−1, +1]; chỉ đo quan hệ TUYẾN TÍNH.

Quant · Lý thuyết chi tiết 06 / 31

Chủ đề 2 · Công thức & phân biệt

Công thức lõi: Statistical Measures.

s² = Σ(xᵢ − x̄)² / (n − 1)phương sai mẫu (chia n−1)

CV = σ / x̄rủi ro trên một đơn vị lợi suất

Excess kurtosis = kurtosis − 3> 0 leptokurtic (đuôi mập)

r = Cov(X,Y) / (σ_X · σ_Y)hệ số tương quan, ∈ [−1, +1]

trong đó x̄ = trung bình mẫu · σ, s = độ lệch chuẩn tổng thể / mẫu · Cov(X,Y) = hiệp phương sai hai biến

Phân biệt cặp dễ lẫn

Lệch phải (+) vs Lệch trái (−)	Phải: mode<median<mean (đuôi phải). Trái: mean<median<mode (đuôi trái).
Phương sai mẫu vs Phương sai tổng thể	Mẫu chia (n−1) cho ước lượng không chệch; tổng thể chia N.
Kurtosis = 3 vs Excess = 0	Bằng phân phối chuẩn (mesokurtic), KHÔNG phải đuôi mập.

Quant · Lý thuyết chi tiết 07 / 31

Chủ đề 2 · Ví dụ giải từng bước

Ví dụ: Statistical Measures.

ĐềMẫu giá quần jeans: $28, $36, $32, $30, $34, $32. Tính median.

Sắp xếp tăng dần: 28, 30, 32, 32, 34, 36.
n = 6 (chẵn) → median = trung bình hai giá trị giữa (vị trí 3 và 4).
Hai giá trị giữa đều là 32 → (32 + 32) / 2.

Đáp ánMedian = $32

BẫyCorrelation chỉ bắt quan hệ TUYẾN TÍNH; nhạy với outlier. Kurtosis = 3 là mesokurtic, không phải đuôi mập.

Quant · Lý thuyết chi tiết 08 / 31

Chủ đề 3 · Khái niệm · SAPP M4

Probability & Expected Value. Xác suất & kỳ vọng

Nền tảng xác suất

Random variable, outcome, event. Biến cố mutually exclusive (không chồng) và exhaustive (phủ hết). Xác suất a priori, empirical (tần suất) hay subjective.

Có điều kiện & đồng thời

P(A|B) là xác suất A khi đã biết B. Quy tắc nhân: P(AB) = P(A|B)·P(B). Hai biến cố độc lập khi P(A|B) = P(A).

Cộng & toàn phần

Quy tắc cộng: P(A∪B) = P(A) + P(B) − P(AB). Tổng xác suất toàn phần: P(A) = Σ P(A|Sᵢ)·P(Sᵢ) trên một bộ kịch bản loại trừ và vét cạn.

Giá trị kỳ vọng

E(X) = Σ pᵢ·xᵢ là trung bình có trọng số theo xác suất. Phương sai = Σ pᵢ·[xᵢ − E(X)]². Cây xác suất gắn nhánh kết quả với xác suất.

Định lý Bayes

Cập nhật niềm tin khi có bằng chứng mới: P(A|B) = P(B|A)·P(A) / P(B). Lỗi kinh điển là đảo nhầm P(A|B) thành P(B|A).

Đếm tổ hợp

Factorial n! sắp xếp toàn bộ. Permutation có thứ tự nPr; combination không thứ tự nCr = nPr / r!. Chọn đúng công cụ theo việc thứ tự có quan trọng hay không.

Quant · Lý thuyết chi tiết 09 / 31

Chủ đề 3 · Công thức & phân biệt

Công thức lõi: Probability & Expected Value.

E(X) = Σ pᵢ · xᵢkỳ vọng có trọng số

P(AB) = P(A|B) · P(B)quy tắc nhân

P(A∪B) = P(A) + P(B) − P(AB)quy tắc cộng

P(A|B) = P(B|A) · P(A) / P(B)định lý Bayes

nCr = n! / [(n − r)! · r!]tổ hợp không thứ tự

trong đó pᵢ = xác suất kịch bản i · xᵢ = giá trị / lợi suất kịch bản i · Sᵢ = các kịch bản loại trừ & vét cạn

Phân biệt cặp dễ lẫn

Permutation (nPr) vs Combination (nCr)	Permutation tính thứ tự; combination thì không. nCr = nPr / r!.
P(A\|B) vs P(B\|A)	Hai chiều điều kiện khác nhau; Bayes mới giúp đảo đúng giữa chúng.
Mutually exclusive vs Independent	Loại trừ: không cùng xảy ra. Độc lập: biết cái này không đổi xác suất cái kia.

Quant · Lý thuyết chi tiết 10 / 31

Chủ đề 3 · Ví dụ giải từng bước

Ví dụ: Probability & Expected Value.

ĐềROE phụ thuộc tăng trưởng kinh tế: 30% khả năng ROE = 15%, 50% khả năng = 9%, 20% khả năng = 0%. Tính ROE kỳ vọng.

E(ROE) = Σ pᵢ·xᵢ.
= 0.30·15% + 0.50·9% + 0.20·0%.
= 4.5% + 4.5% + 0%.

Đáp ánE(ROE) = 9%

BẫyCây xác suất: tổng các nhánh phải bằng 1. Bayes: đừng đảo nhầm P(A|B) với P(B|A).

Quant · Lý thuyết chi tiết 11 / 31

Chủ đề 4 · Khái niệm · SAPP M5

Portfolio Mathematics. Toán danh mục

Covariance

Cov(A,B) = Σ p·(Rₐ − E[Rₐ])(R_b − E[R_b]) đo mức hai tài sản biến động cùng chiều. Đơn vị khó diễn giải nên thường chuẩn hóa thành correlation.

Correlation

ρ = Cov(A,B) / (σₐ·σ_b) thuộc [−1, +1]. ρ càng thấp, lợi ích đa dạng hóa càng lớn vì số hạng chéo trong phương sai danh mục nhỏ đi.

Lợi suất danh mục

E(Rₚ) = Σ wᵢ·E(Rᵢ): bình quân gia quyền theo tỷ trọng. Nhưng rủi ro danh mục KHÔNG phải bình quân rủi ro các tài sản.

Phương sai danh mục

Với 2 tài sản: σₚ² = w₁²σ₁² + w₂²σ₂² + 2w₁w₂ρσ₁σ₂. Chính số hạng chéo (covariance) quyết định lợi ích đa dạng hóa, không phải phần phương sai riêng.

Các trường hợp giới hạn

ρ=+1: σₚ = w₁σ₁ + w₂σ₂ (không giảm rủi ro). ρ=−1: σₚ = |w₁σ₁ − w₂σ₂| (có thể về 0). ρ=0: bỏ số hạng chéo.

Mở rộng N tài sản

Số số hạng covariance tăng theo n(n−1); khi danh mục lớn, rủi ro hệ thống (covariance trung bình) chi phối, rủi ro riêng lẻ được phân tán gần hết.

Quant · Lý thuyết chi tiết 12 / 31

Chủ đề 4 · Công thức & phân biệt

Công thức lõi: Portfolio Mathematics.

Cov(A,B) = Σ p·(Rₐ − E[Rₐ])(R_b − E[R_b])hiệp phương sai

ρ = Cov(A,B) / (σₐ · σ_b)tương quan, ∈ [−1, +1]

σₚ = √(w₁²σ₁² + w₂²σ₂² + 2·w₁·w₂·ρ·σ₁·σ₂)độ lệch chuẩn danh mục 2 tài sản

trong đó wᵢ = tỷ trọng tài sản i · σᵢ = độ lệch chuẩn tài sản i · ρ = tương quan giữa 2 tài sản

Phân biệt cặp dễ lẫn

Covariance vs Correlation	Cov phụ thuộc đơn vị, khó so sánh; ρ chuẩn hóa về [−1,+1], so sánh được.
ρ = +1 vs ρ < +1	ρ=+1 chỉ là bình quân gia quyền của σ (không giảm rủi ro); ρ<1 mới có đa dạng hóa.
E(Rₚ) vs σₚ	Lợi suất danh mục là bình quân gia quyền; rủi ro thì KHÔNG (phụ thuộc covariance).

Quant · Lý thuyết chi tiết 13 / 31

Chủ đề 4 · Ví dụ giải từng bước

Ví dụ: Portfolio Mathematics.

ĐềChia đều vốn (w = 0.5 mỗi bên) vào 2 tài sản: σ₁ = 10%, σ₂ = 30%, tương quan hoàn hảo dương ρ = +1. Tính σₚ.

ρ = +1 → công thức rút gọn: σₚ = w₁σ₁ + w₂σ₂.
= 0.5·10% + 0.5·30%.
= 5% + 15%.

Đáp ánσₚ = 20%

Bẫyρ = +1 thì σₚ chỉ là bình quân gia quyền của σ, KHÔNG có lợi ích đa dạng hóa.

Quant · Lý thuyết chi tiết 14 / 31

Chủ đề 5 · Khái niệm · SAPP M6

Simulation & Distributions. Mô phỏng & phân phối

Normal vs lognormal

Lợi suất gộp liên tục giả định phân phối chuẩn; còn GIÁ tài sản được mô hình bằng lognormal vì giá không âm và phân phối lệch phải. ln(giá) thì phân phối chuẩn.

Phân phối lấy mẫu

Student t đuôi mập hơn chuẩn, dùng khi mẫu nhỏ / chưa biết σ tổng thể; df = n − 1. Chi-square và F dùng cho suy diễn về phương sai; đều phụ thuộc bậc tự do.

Monte Carlo

Sinh hàng nghìn kịch bản từ phân phối giả định cho biến đầu vào, dùng khi bài toán không có lời giải đóng (định giá quyền chọn phức tạp, VaR).

Hạn chế Monte Carlo

Kết quả chỉ tốt như giả định: tham số/phân phối bị misspecified thì sai; tốn tính toán và không cho insight giải tích như công thức đóng.

Bootstrap

Lấy mẫu lại CÓ HOÀN LẠI từ chính mẫu gốc, lặp nhiều lần để ước lượng phân phối của một thống kê (vd standard error). Một quan sát có thể bị rút lại nhiều lần.

Jackknife

Bỏ lần lượt MỘT quan sát mỗi vòng (leave-one-out), tính lại thống kê trên n−1 quan sát. Mang tính xác định, không ngẫu nhiên như bootstrap.

Quant · Lý thuyết chi tiết 15 / 31

Chủ đề 5 · Công thức & phân biệt

Công thức lõi: Simulation & Distributions.

Nếu ln(P) ~ Normal ⇒ P ~ Lognormalmô hình giá tài sản

df(t) = n − 1bậc tự do Student t

Bootstrap → resample WITH replacementngẫu nhiên, có hoàn lại

Jackknife → leave-one-out (n−1)xác định, bỏ 1 quan sát

trong đó n = cỡ mẫu · df = bậc tự do · P = giá tài sản

Phân biệt cặp dễ lẫn

Normal vs Lognormal	Lợi suất cc ~ chuẩn (đối xứng, có thể âm); giá ~ lognormal (≥0, lệch phải).
Bootstrap vs Jackknife	Bootstrap = có hoàn lại + ngẫu nhiên; jackknife = bỏ một quan sát + xác định.
Monte Carlo vs Resampling	MC sinh số từ phân phối giả định; resampling dùng lại chính dữ liệu gốc.

Quant · Lý thuyết chi tiết 16 / 31

Chủ đề 5 · Ví dụ giải từng bước

Ví dụ: Simulation & Distributions.

ĐềVới mỗi vòng lấy mẫu lại, điều gì xảy ra với quan sát vừa được rút?

Bootstrap: trả quan sát lại vào mẫu → có thể được rút lại ở lượt sau.
Jackknife: bỏ đúng 1 quan sát, dùng n−1 quan sát còn lại.
Monte Carlo: không dùng dữ liệu gốc mà sinh số từ phân phối giả định.

Đáp ánBootstrap = with replacement; Jackknife = leave-one-out

BẫyMô hình GIÁ bằng lognormal, không phải normal. Bootstrap rút có hoàn lại; jackknife bỏ đúng một quan sát mỗi vòng.

Quant · Lý thuyết chi tiết 17 / 31

Chủ đề 6 · Khái niệm · SAPP M7

Sampling & Estimation. Lấy mẫu & ước lượng

Phương pháp lấy mẫu

Simple random (xác suất bằng nhau), stratified (chia tầng rồi lấy theo tỷ lệ), cluster, convenience, judgmental. Stratified thường giảm sampling error so với lấy ngẫu nhiên đơn giản.

Sampling vs non-sampling

Sampling error là chênh lệch do mẫu khác tổng thể, giảm khi tăng n. Non-sampling (sai thiết kế, data snooping, survivorship/look-ahead bias) không tự mất khi tăng n.

Định lý giới hạn trung tâm

Với n đủ lớn (≥30), phân phối của trung bình mẫu xấp xỉ chuẩn BẤT KỂ phân phối gốc, với trung bình = μ và độ lệch = standard error.

Standard error

SE = σ/√n (hoặc s/√n khi chưa biết σ). Tăng n làm SE giảm → ước lượng chính xác hơn và kiểm định mạnh hơn (power cao hơn).

Điểm vs khoảng

Point estimate là một con số (vd x̄); confidence interval cho một dải kèm độ tin cậy. CI = điểm ± (giá trị tới hạn × SE); 95% dùng ≈1.96 với z.

Shortfall & safety-first

Shortfall risk là xác suất lợi suất dưới một ngưỡng mục tiêu. Roy safety-first chọn danh mục tối đa hóa SFRatio = (E[Rₚ] − R_target)/σₚ.

Quant · Lý thuyết chi tiết 18 / 31

Chủ đề 6 · Công thức & phân biệt

Công thức lõi: Sampling & Estimation.

SE = σ / √n (hoặc s / √n)sai số chuẩn của trung bình mẫu

CI = x̄ ± z(α/2) · SEkhoảng tin cậy cho μ

SFRatio = (E[Rₚ] − R_target) / σₚRoy safety-first

trong đó n = cỡ mẫu · σ, s = độ lệch chuẩn tổng thể / mẫu · R_target = mức lợi suất mục tiêu

Phân biệt cặp dễ lẫn

Sampling error vs Non-sampling error	Sampling giảm khi tăng n; non-sampling (bias thiết kế) thì không.
Point estimate vs Confidence interval	Điểm cho một số; khoảng cho dải ± kèm mức tin cậy.
Stratified vs Simple random	Chia tầng theo đặc tính trước khi lấy thường giảm sai số so với lấy thuần ngẫu nhiên.

Quant · Lý thuyết chi tiết 19 / 31

Chủ đề 6 · Ví dụ giải từng bước

Ví dụ: Sampling & Estimation.

ĐềTổng thể 20 điểm dữ liệu, lấy mẫu ngẫu nhiên đơn giản 10 điểm. Xác suất một điểm bất kỳ được chọn ĐẦU TIÊN?

Simple random: xác suất bằng nhau cho mọi điểm ở lượt đầu.
= 1 / N = 1 / 20.

Đáp án= 0.05

BẫyCLT cần n đủ lớn (≥30) thì trung bình mẫu mới ≈ chuẩn. Shortfall risk gắn với một TARGET cụ thể, không mặc định bằng 0.

Quant · Lý thuyết chi tiết 20 / 31

Chủ đề 7 · Khái niệm · SAPP M8–M9

Hypothesis Testing. Kiểm định giả thuyết

Quy trình 6 bước

Nêu H₀ và Hₐ, chọn test phù hợp, định mức ý nghĩa α, tính test statistic, so với critical value (hay p-value), rồi kết luận. Bác bỏ H₀ khi |stat| > critical value.

Một đuôi vs hai đuôi

Hₐ có dấu "≠" → hai đuôi; có dấu ">" hoặc "<" → một đuôi. H₀ luôn chứa dấu bằng. p-value là mức ý nghĩa nhỏ nhất mà tại đó vẫn bác bỏ được H₀.

Sai lầm loại I & II

Type I: bác bỏ H₀ đúng (xác suất = α). Type II: không bác bỏ H₀ sai (xác suất = β). Power = 1 − β. Hạ α làm tăng β nếu giữ nguyên n.

Chọn đúng test

t-test cho trung bình; F-test (= s₁²/s₂²) cho khác biệt PHƯƠNG SAI hai tổng thể chuẩn; chi-square cho phương sai một tổng thể; mẫu phụ thuộc dùng paired test trên trung bình các hiệu số.

Tăng power

Power = 1 − β; tăng cỡ mẫu n làm SE giảm → dễ phát hiện hiệu ứng thật (vd tương quan ≠ 0). Mức ý nghĩa chặt hơn (α nhỏ) đòi critical value lớn hơn.

Kiểm định độc lập

Test tương quan ρ=0: parametric dùng t-test; phi tham số dùng Spearman rank khi vi phạm giả định chuẩn. Bảng tần suất (contingency) dùng chi-square test of independence.

Quant · Lý thuyết chi tiết 21 / 31

Chủ đề 7 · Khung chọn test · SAPP M8–M9

Bạn test cái gì? → dùng test nào.

Toàn bộ Hypothesis Testing quy về một câu hỏi: đối tượng kiểm định là TRUNG BÌNH hay PHƯƠNG SAI, một hay hai tổng thể, mẫu độc lập hay ghép cặp. Trả lời được là chọn đúng test statistic.

Kiểm định gì	Điều kiện	Test statistic
Trung bình 1 tổng thể	σ đã biết / n lớn	z-test
Trung bình 1 tổng thể	σ chưa biết (hay gặp)	t-test · 1 mẫu
Chênh lệch 2 trung bình	2 mẫu ĐỘC LẬP	t-test · 2 mẫu
Trung bình của các hiệu	2 mẫu GHÉP CẶP	t-test · paired
1 phương sai tổng thể	so với mốc σ₀²	Chi-square (χ²)
2 phương sai tổng thể	có bằng nhau không	F-test

Quant · Lý thuyết chi tiết 22 / 31

Chủ đề 7 · Bốn loại test

Bốn loại test — so sánh nhanh.

	z-test	t-test	Chi-square	F-test
Kiểm định	Mean · σ biết	Mean · σ chưa biết	1 phương sai	2 phương sai
Test statistic	(x̄−μ₀)/(σ/√n)	(x̄−μ₀)/(s/√n)	(n−1)s²/σ₀²	s₁²/s₂²
Phân phối	Standard normal	Student t	Chi-square	F
Bậc tự do	—	n−1	n−1	n₁−1, n₂−1
Khi nào	σ known / n lớn	σ unknown	so 1 var với mốc	so 2 var

Quant · Lý thuyết chi tiết 23 / 31

Chủ đề 7 · t-test chia 3 kiểu

t-test — ba kiểu, chọn theo đề.

①

Single mean · 1 mẫu

Kiểm định trung bình MỘT tổng thể so với mốc μ₀.

t = (x̄ − μ₀) / (s/√n)df = n − 1

②

Difference of means · 2 mẫu độc lập

So sánh trung bình HAI nhóm độc lập (vd 2 quỹ khác nhau).

t = (x̄₁ − x̄₂) / √(s²ₚ/n₁ + s²ₚ/n₂)Phương sai bằng nhau → pooled, df = n₁+n₂−2. Khác nhau → Welch (df xấp xỉ).

③

Mean of differences · paired (phụ thuộc)

Hai quan sát trên CÙNG đối tượng (before/after, cùng kỳ).

t = d̄ / (s_d/√n)df = n − 1 · d̄ = trung bình các hiệu số

2 mẫu độc lập vs PairedTách rời, không ghép cặp → independent. Cùng đối tượng đo 2 lần → paired (test các HIỆU).

Pooled vs Unequal varPhương sai 2 nhóm bằng → pooled (df=n₁+n₂−2). Khác → Welch.

z-test vs t-testσ tổng thể biết / n rất lớn → z. σ chưa biết (dùng s) → t.

Quant · Lý thuyết chi tiết 24 / 31

Chủ đề 7 · Test về phương sai

Chi-square & F — test phương sai.

Chi-square (χ²) · 1 phương sai

Kiểm định phương sai MỘT tổng thể so với mốc σ₀² (vd rủi ro có vượt ngưỡng?).

χ² = (n − 1)·s² / σ₀²

df = n − 1 · phân phối lệch phải, ≥ 0 · không đối xứng

F-test · 2 phương sai

Kiểm định HAI phương sai có bằng nhau không (vd 2 quỹ rủi ro khác nhau?).

F = s²_lớn / s²_nhỏ

đặt variance LỚN lên tử để F ≥ 1 · df₁ = n_lớn−1, df₂ = n_nhỏ−1

Quant · Lý thuyết chi tiết 25 / 31

Chủ đề 7 · Ứng dụng · nhìn đề chọn test

Nhìn đề → chọn đúng test.

So sánh lợi suất trung bình của 2 quỹ ĐỘC LẬP, 36 & 40 tháng, σ chưa biết.

t-test · 2 mẫu độc lập

So sánh lợi suất danh mục TRƯỚC và SAU khi đổi chiến lược, cùng 24 tháng.

t-test · paired

Độ biến động (variance) của một quỹ có vượt mốc 16%² không?

Chi-square · 1 phương sai

Hai quỹ có mức rủi ro (variance) khác nhau không?

F-test · 2 phương sai

Quant · Lý thuyết chi tiết 26 / 31

Chủ đề 7 · Ví dụ giải từng bước

Ví dụ: paired t-test.

ĐềSo sánh trung bình lợi suất danh mục TRƯỚC vs SAU khi đổi chiến lược, đo trên cùng 12 tháng. Trung bình các hiệu d̄ = 0.8%, độ lệch chuẩn các hiệu s_d = 1.5%, n = 12. Test ở mức 5% hai đuôi.

Dữ liệu ghép cặp (cùng kỳ, before/after) → paired t-test, H₀: μ_d = 0.
t = d̄ / (s_d/√n) = 0.8 / (1.5/√12).
s_d/√n = 1.5/3.464 = 0.433 → t = 0.8/0.433 ≈ 1.85.
df = n−1 = 11; t_crit(5% hai đuôi, df=11) ≈ 2.20.
|t| = 1.85 < 2.20 → KHÔNG bác bỏ H₀.

Đáp ánChưa đủ bằng chứng chiến lược mới cải thiện lợi suất

Quant · Lý thuyết chi tiết 27 / 31

Chủ đề 8 · Khái niệm · SAPP M10

Simple Linear Regression. Hồi quy tuyến tính đơn

Mô hình & least squares

Y = b₀ + b₁X + ε. Least squares chọn b₀, b₁ để tối thiểu tổng bình phương phần dư (SSE). b₁ = Cov(X,Y)/Var(X) là độ dốc; đường hồi quy đi qua (x̄, ȳ).

Diễn giải hệ số

b₁ cho biết Y đổi bao nhiêu khi X tăng 1 đơn vị; b₀ là tung độ gốc (giá trị Y kỳ vọng khi X = 0). Suy diễn dùng t-test trên từng hệ số.

Hệ số xác định R²

R² = tỷ lệ % biến thiên của BIẾN PHỤ THUỘC được giải thích bởi biến độc lập. Trong hồi quy đơn, R² = (hệ số tương quan)².

ANOVA

Phân rã tổng biến thiên: SST = SSR + SSE. SSR (giải thích) và SSE (phần dư). R² = SSR/SST. F-test (= MSR/MSE) kiểm định ý nghĩa tổng thể của mô hình.

Giả định phần dư

Kỳ vọng 0, phương sai KHÔNG đổi (homoskedasticity), độc lập (không tự tương quan), phân phối chuẩn, và quan hệ X–Y tuyến tính. Residual plot giúp phát hiện vi phạm.

Standard error & dự báo

SEE (standard error of estimate) = √(SSE/(n−2)) đo độ phân tán quanh đường hồi quy; SEE nhỏ → mô hình khớp tốt. Dùng mô hình để dự báo Ŷ tại một X cho trước.

Quant · Lý thuyết chi tiết 28 / 31

Chủ đề 8 · Công thức & phân biệt

Công thức lõi: Simple Linear Regression.

Y = b₀ + b₁X + ε, b₁ = Cov(X,Y)/Var(X)mô hình & độ dốc

SST = SSR + SSEphân rã ANOVA

R² = SSR / SSTtỷ lệ biến thiên được giải thích

SEE = √[ SSE / (n − 2) ]sai số chuẩn của ước lượng

trong đó SST = tổng biến thiên (total) · SSR = biến thiên được giải thích (regression) · SSE = biến thiên phần dư (error)

Phân biệt cặp dễ lẫn

SSR (explained) vs SSE (residual)	SSR là phần mô hình giải thích; SSE là phần còn lại không giải thích.
R² vs SEE	R² đo tỷ lệ giải thích (càng cao càng tốt); SEE đo độ phân tán phần dư (càng nhỏ càng tốt).
Homoskedastic vs Heteroskedastic	Phương sai phần dư không đổi vs thay đổi theo X; hetero làm sai lệch suy diễn.

Quant · Lý thuyết chi tiết 29 / 31

Chủ đề 8 · Ví dụ giải từng bước

Ví dụ: Simple Linear Regression.

ĐềBảng ANOVA: explained variation (SSR) = 0.0135, unexplained variation (SSE) = 0.0640. Tính R².

SST = SSR + SSE = 0.0135 + 0.0640 = 0.0775.
R² = SSR / SST = 0.0135 / 0.0775.

Đáp ánR² ≈ 0.174 (≈ 17.4%)

BẫyPhần dư phải HOMOSKEDASTIC. SSR = explained, SSE = unexplained (residual). R² = (corr)² chỉ đúng trong hồi quy ĐƠN.

Quant · Lý thuyết chi tiết 30 / 31

Bẫy thường gặp

Tám cái bẫy Quant hay mất điểm.

Real ≠ nominal

Luôn trừ phần bù lạm phát khi đề hỏi real risk-free rate.

TWR ≠ MWR

Đánh giá tay nghề quản lý dùng time-weighted, không phải money-weighted.

Lệch phải = mode<median<mean

Suy ngược được skewness từ vị trí ba đại lượng.

ρ = +1 không giảm rủi ro

Chỉ ρ < 1 mới có lợi ích đa dạng hóa.

Giá → lognormal

Lợi suất cc ~ chuẩn, nhưng GIÁ tài sản mô hình bằng lognormal.

Bootstrap vs Jackknife

Bootstrap = có hoàn lại; jackknife = bỏ một quan sát mỗi vòng.

10% rồi mới tới 5%

Reject ở mức lỏng (10%) chưa chắc reject ở mức chặt (5%).

t = mean, F = variance

t cho khác biệt trung bình; F cho khác biệt phương sai.

Quant · Lý thuyết chi tiết 31 / 31

Ghi nhớ

Bốn điều mang theo vào phòng thi.

Học theo cụm

8 cụm phủ trọn 11 module; ôn từng cụm thay vì rời rạc.

Phân biệt cặp dễ lẫn

Arith/Geo, TWR/MWR, bootstrap/jackknife, t/F-test.

Thuộc công thức lõi

σ danh mục, R²=SSR/SST, E(X)=Σp·x, SE=σ/√n.

Bám mức ý nghĩa

Quyết định reject phụ thuộc α; 10% ≠ 5%; power = 1 − β.

Quantrevise.

Tám cụm Quant phủ trọn chương trình.

Rates & Returns. Lãi suất & lợi suất

Lãi suất là gì

Cấu thành lãi suất

Holding Period Return

Số học vs hình học

Money- vs time-weighted

TVM & continuous

Công thức lõi: Rates & Returns.

Ví dụ: Rates & Returns.

Statistical Measures. Đo lường thống kê

Xu hướng trung tâm

Độ phân tán

Rủi ro một phía

Coefficient of variation

Skewness

Kurtosis & tương quan

Công thức lõi: Statistical Measures.

Ví dụ: Statistical Measures.

Probability & Expected Value. Xác suất & kỳ vọng

Nền tảng xác suất

Có điều kiện & đồng thời

Cộng & toàn phần

Giá trị kỳ vọng

Định lý Bayes

Đếm tổ hợp

Công thức lõi: Probability & Expected Value.

Ví dụ: Probability & Expected Value.

Portfolio Mathematics. Toán danh mục

Covariance

Correlation

Lợi suất danh mục

Phương sai danh mục

Các trường hợp giới hạn

Mở rộng N tài sản

Công thức lõi: Portfolio Mathematics.

Ví dụ: Portfolio Mathematics.

Simulation & Distributions. Mô phỏng & phân phối

Normal vs lognormal

Phân phối lấy mẫu

Monte Carlo

Hạn chế Monte Carlo

Bootstrap

Jackknife

Công thức lõi: Simulation & Distributions.

Ví dụ: Simulation & Distributions.

Sampling & Estimation. Lấy mẫu & ước lượng

Phương pháp lấy mẫu

Sampling vs non-sampling

Định lý giới hạn trung tâm

Standard error

Điểm vs khoảng

Shortfall & safety-first

Công thức lõi: Sampling & Estimation.

Ví dụ: Sampling & Estimation.

Hypothesis Testing. Kiểm định giả thuyết

Quy trình 6 bước

Một đuôi vs hai đuôi

Sai lầm loại I & II

Chọn đúng test

Tăng power

Kiểm định độc lập

Bạn test cái gì? → dùng test nào.

Bốn loại test — so sánh nhanh.

t-test — ba kiểu, chọn theo đề.

Single mean · 1 mẫu

Difference of means · 2 mẫu độc lập

Mean of differences · paired (phụ thuộc)

Chi-square & F — test phương sai.

Chi-square (χ²) · 1 phương sai

F-test · 2 phương sai

Nhìn đề → chọn đúng test.

Ví dụ: paired t-test.

Simple Linear Regression. Hồi quy tuyến tính đơn

Mô hình & least squares

Diễn giải hệ số

Hệ số xác định R²

ANOVA

Giả định phần dư

Quant
revise.