LeaPrep · CFA Level I · Lý thuyết nền

Quant
revise.

Topic 1 · Quantitative Methods
LeaPrep fox mascot
Lý thuyết chi tiết theo chương trình CFA L1
Nguồn
SAPP · 11 module Quant
Chủ đề
8 cụm · 3 slide/cụm
Đào sâu
Hypothesis Testing · 7 slide ứng dụng
Đối chiếu
26 câu Mock 1 + 2
Khái niệm cốt lõi, công thức, bảng phân biệt và ví dụ từng bước
Quant · Lý thuyết chi tiết 01 / 31
Bản đồ kiến thức

Tám cụm Quant phủ trọn chương trình.

  1. 1. Rates & Returns · Lãi suất & lợi suấtCấu phần lãi suất, các thước đo lợi suất theo thời gian, và giá trị thời gian của tiền (TVM).
  2. 2. Statistical Measures · Đo lường thống kêXu hướng trung tâm, độ phân tán, rủi ro dưới mục tiêu, skewness, kurtosis và tương quan.
  3. 3. Probability & Expected Value · Xác suất & kỳ vọngQuy tắc xác suất, kỳ vọng có điều kiện, cây xác suất, Bayes và đếm tổ hợp.
  4. 4. Portfolio Mathematics · Toán danh mụcCovariance, correlation, phương sai danh mục và vai trò của tương quan trong đa dạng hóa.
  5. 5. Simulation & Distributions · Mô phỏng & phân phốiNormal vs lognormal, các phân phối lấy mẫu (t, χ², F), Monte Carlo và resampling.
  6. 6. Sampling & Estimation · Lấy mẫu & ước lượngPhương pháp lấy mẫu, định lý giới hạn trung tâm, standard error và khoảng tin cậy.
  7. 7. Hypothesis Testing · Kiểm định giả thuyếtQuy trình kiểm định, sai lầm loại I/II, power, chọn test và kiểm định độc lập.
  8. 8. Simple Linear Regression · Hồi quy tuyến tính đơnMô hình least squares, diễn giải hệ số, giả định phần dư, đo độ phù hợp và ANOVA.
Quant · Lý thuyết chi tiết 02 / 31
Chủ đề 1 · Khái niệm · SAPP M1–M2

Rates & Returns. Lãi suất & lợi suất

Lãi suất là gì

Một lãi suất có thể đọc theo ba góc: required rate of return (lợi suất yêu cầu), discount rate (suất chiết khấu) và opportunity cost (chi phí cơ hội của vốn).

Cấu thành lãi suất

Lãi suất danh nghĩa = real risk-free rate + bù lạm phát + bù default + bù liquidity + bù maturity. Với bond hạng cao, maturity premium thường là cấu phần lớn nhất.

Holding Period Return

HPR = (P₁ − P₀ + thu nhập) / P₀ là viên gạch của mọi thước đo lợi suất. Gộp nhiều kỳ bằng cách nhân các (1 + HPR) với nhau.

Số học vs hình học

Arithmetic mean ước lượng lợi suất kỳ vọng MỘT kỳ; geometric mean là lợi suất kép thực tế qua nhiều kỳ. Luôn có geometric ≤ arithmetic (bằng nhau khi mọi HPR giống nhau).

Money- vs time-weighted

MWR là IRR của dòng tiền, bị ảnh hưởng bởi thời điểm nhà đầu tư nạp/rút vốn. TWR loại bỏ tác động dòng tiền nên là chuẩn so sánh tay nghề quản lý quỹ (GIPS).

TVM & continuous

PV–FV–PMT–N–I/Y gắn nhau qua chiết khấu. Continuously compounded return = ln(1 + HPR). Định giá bond/equity = chiết khấu dòng tiền kỳ vọng; implied return là giải ngược I/Y.

Quant · Lý thuyết chi tiết 03 / 31
Chủ đề 1 · Công thức & phân biệt

Công thức lõi: Rates & Returns.

r = real RFR + bù lạm phát + default + liquidity + maturitylợi suất yêu cầu
(1 + nominal) = (1 + real)(1 + lạm phát)quan hệ Fisher đầy đủ
HPR = (P₁ − P₀ + I) / P₀lợi suất một kỳ nắm giữ
Geometric mean = [Π(1 + HPRᵢ)]^(1/n) − 1lợi suất kép nhiều kỳ
r_cc = ln(1 + HPR) = ln(P₁/P₀)gộp liên tục
trong đó P₀, P₁ = giá đầu kỳ / cuối kỳ · I = thu nhập trong kỳ (cổ tức, coupon) · n = số kỳ
Phân biệt cặp dễ lẫn
Arithmetic mean vs Geometric meanSố học = kỳ vọng 1 kỳ; hình học = tăng trưởng kép thực tế. Geo ≤ Arith.
Money-weighted vs Time-weightedMWR (=IRR) nhạy dòng tiền nhà đầu tư; TWR trung lập, chuẩn so sánh hiệu suất.
Nominal vs RealNominal đã gồm lạm phát; real đã trừ lạm phát (xấp xỉ qua Fisher).
Quant · Lý thuyết chi tiết 04 / 31
Chủ đề 1 · Ví dụ giải từng bước

Ví dụ: Rates & Returns.

ĐềTín phiếu kho bạc 12 tháng có quoted (nominal) rate 5.3%. Phần bù lạm phát kỳ vọng là 4.1%. Ước lượng real risk-free rate.
  1. Quan hệ xấp xỉ: nominal ≈ real + lạm phát.
  2. Suy ra: real ≈ nominal − lạm phát.
  3. real ≈ 5.3% − 4.1%.
Đáp ánReal risk-free ≈ 1.2%
BẫyReal vs nominal: luôn TRỪ lạm phát. TWR mới là chuẩn đánh giá tay nghề, không phải MWR.
Quant · Lý thuyết chi tiết 05 / 31
Chủ đề 2 · Khái niệm · SAPP M3

Statistical Measures. Đo lường thống kê

Xu hướng trung tâm

Mean (bình quân cộng), median (giá trị giữa sau sắp xếp), mode (xuất hiện nhiều nhất). Với n chẵn, median = trung bình hai giá trị giữa. Quantile (tứ phân vị, bách phân vị) chia dữ liệu đã sắp xếp.

Độ phân tán

Range, MAD (độ lệch tuyệt đối bình quân), phương sai và độ lệch chuẩn. Mẫu chia (n − 1) để không chệch; tổng thể chia N.

Rủi ro một phía

Nhà đầu tư chỉ ngại phần lệch XẤU: target downside deviation (semideviation) chỉ tính các quan sát dưới mức mục tiêu, hữu ích khi phân phối lệch.

Coefficient of variation

CV = σ / mean: rủi ro trên mỗi đơn vị lợi suất, cho phép so sánh các tài sản khác đơn vị/quy mô. CV càng thấp càng tốt.

Skewness

Đo bất đối xứng. Lệch phải (dương): đuôi phải dài → mode < median < mean. Lệch trái (âm): ngược lại, mean < median < mode.

Kurtosis & tương quan

Chuẩn có kurtosis = 3; excess = kurtosis − 3. Leptokurtic (>0) đuôi mập, nhiều outlier. Correlation chuẩn hóa covariance về [−1, +1]; chỉ đo quan hệ TUYẾN TÍNH.

Quant · Lý thuyết chi tiết 06 / 31
Chủ đề 2 · Công thức & phân biệt

Công thức lõi: Statistical Measures.

s² = Σ(xᵢ − x̄)² / (n − 1)phương sai mẫu (chia n−1)
CV = σ / x̄rủi ro trên một đơn vị lợi suất
Excess kurtosis = kurtosis − 3> 0 leptokurtic (đuôi mập)
r = Cov(X,Y) / (σ_X · σ_Y)hệ số tương quan, ∈ [−1, +1]
trong đó = trung bình mẫu · σ, s = độ lệch chuẩn tổng thể / mẫu · Cov(X,Y) = hiệp phương sai hai biến
Phân biệt cặp dễ lẫn
Lệch phải (+) vs Lệch trái (−)Phải: mode<median<mean (đuôi phải). Trái: mean<median<mode (đuôi trái).
Phương sai mẫu vs Phương sai tổng thểMẫu chia (n−1) cho ước lượng không chệch; tổng thể chia N.
Kurtosis = 3 vs Excess = 0Bằng phân phối chuẩn (mesokurtic), KHÔNG phải đuôi mập.
Quant · Lý thuyết chi tiết 07 / 31
Chủ đề 2 · Ví dụ giải từng bước

Ví dụ: Statistical Measures.

ĐềMẫu giá quần jeans: $28, $36, $32, $30, $34, $32. Tính median.
  1. Sắp xếp tăng dần: 28, 30, 32, 32, 34, 36.
  2. n = 6 (chẵn) → median = trung bình hai giá trị giữa (vị trí 3 và 4).
  3. Hai giá trị giữa đều là 32 → (32 + 32) / 2.
Đáp ánMedian = $32
BẫyCorrelation chỉ bắt quan hệ TUYẾN TÍNH; nhạy với outlier. Kurtosis = 3 là mesokurtic, không phải đuôi mập.
Quant · Lý thuyết chi tiết 08 / 31
Chủ đề 3 · Khái niệm · SAPP M4

Probability & Expected Value. Xác suất & kỳ vọng

Nền tảng xác suất

Random variable, outcome, event. Biến cố mutually exclusive (không chồng) và exhaustive (phủ hết). Xác suất a priori, empirical (tần suất) hay subjective.

Có điều kiện & đồng thời

P(A|B) là xác suất A khi đã biết B. Quy tắc nhân: P(AB) = P(A|B)·P(B). Hai biến cố độc lập khi P(A|B) = P(A).

Cộng & toàn phần

Quy tắc cộng: P(A∪B) = P(A) + P(B) − P(AB). Tổng xác suất toàn phần: P(A) = Σ P(A|Sᵢ)·P(Sᵢ) trên một bộ kịch bản loại trừ và vét cạn.

Giá trị kỳ vọng

E(X) = Σ pᵢ·xᵢ là trung bình có trọng số theo xác suất. Phương sai = Σ pᵢ·[xᵢ − E(X)]². Cây xác suất gắn nhánh kết quả với xác suất.

Định lý Bayes

Cập nhật niềm tin khi có bằng chứng mới: P(A|B) = P(B|A)·P(A) / P(B). Lỗi kinh điển là đảo nhầm P(A|B) thành P(B|A).

Đếm tổ hợp

Factorial n! sắp xếp toàn bộ. Permutation có thứ tự nPr; combination không thứ tự nCr = nPr / r!. Chọn đúng công cụ theo việc thứ tự có quan trọng hay không.

Quant · Lý thuyết chi tiết 09 / 31
Chủ đề 3 · Công thức & phân biệt

Công thức lõi: Probability & Expected Value.

E(X) = Σ pᵢ · xᵢkỳ vọng có trọng số
P(AB) = P(A|B) · P(B)quy tắc nhân
P(A∪B) = P(A) + P(B) − P(AB)quy tắc cộng
P(A|B) = P(B|A) · P(A) / P(B)định lý Bayes
nCr = n! / [(n − r)! · r!]tổ hợp không thứ tự
trong đó pᵢ = xác suất kịch bản i · xᵢ = giá trị / lợi suất kịch bản i · Sᵢ = các kịch bản loại trừ & vét cạn
Phân biệt cặp dễ lẫn
Permutation (nPr) vs Combination (nCr)Permutation tính thứ tự; combination thì không. nCr = nPr / r!.
P(A|B) vs P(B|A)Hai chiều điều kiện khác nhau; Bayes mới giúp đảo đúng giữa chúng.
Mutually exclusive vs IndependentLoại trừ: không cùng xảy ra. Độc lập: biết cái này không đổi xác suất cái kia.
Quant · Lý thuyết chi tiết 10 / 31
Chủ đề 3 · Ví dụ giải từng bước

Ví dụ: Probability & Expected Value.

ĐềROE phụ thuộc tăng trưởng kinh tế: 30% khả năng ROE = 15%, 50% khả năng = 9%, 20% khả năng = 0%. Tính ROE kỳ vọng.
  1. E(ROE) = Σ pᵢ·xᵢ.
  2. = 0.30·15% + 0.50·9% + 0.20·0%.
  3. = 4.5% + 4.5% + 0%.
Đáp ánE(ROE) = 9%
BẫyCây xác suất: tổng các nhánh phải bằng 1. Bayes: đừng đảo nhầm P(A|B) với P(B|A).
Quant · Lý thuyết chi tiết 11 / 31
Chủ đề 4 · Khái niệm · SAPP M5

Portfolio Mathematics. Toán danh mục

Covariance

Cov(A,B) = Σ p·(Rₐ − E[Rₐ])(R_b − E[R_b]) đo mức hai tài sản biến động cùng chiều. Đơn vị khó diễn giải nên thường chuẩn hóa thành correlation.

Correlation

ρ = Cov(A,B) / (σₐ·σ_b) thuộc [−1, +1]. ρ càng thấp, lợi ích đa dạng hóa càng lớn vì số hạng chéo trong phương sai danh mục nhỏ đi.

Lợi suất danh mục

E(Rₚ) = Σ wᵢ·E(Rᵢ): bình quân gia quyền theo tỷ trọng. Nhưng rủi ro danh mục KHÔNG phải bình quân rủi ro các tài sản.

Phương sai danh mục

Với 2 tài sản: σₚ² = w₁²σ₁² + w₂²σ₂² + 2w₁w₂ρσ₁σ₂. Chính số hạng chéo (covariance) quyết định lợi ích đa dạng hóa, không phải phần phương sai riêng.

Các trường hợp giới hạn

ρ=+1: σₚ = w₁σ₁ + w₂σ₂ (không giảm rủi ro). ρ=−1: σₚ = |w₁σ₁ − w₂σ₂| (có thể về 0). ρ=0: bỏ số hạng chéo.

Mở rộng N tài sản

Số số hạng covariance tăng theo n(n−1); khi danh mục lớn, rủi ro hệ thống (covariance trung bình) chi phối, rủi ro riêng lẻ được phân tán gần hết.

Quant · Lý thuyết chi tiết 12 / 31
Chủ đề 4 · Công thức & phân biệt

Công thức lõi: Portfolio Mathematics.

Cov(A,B) = Σ p·(Rₐ − E[Rₐ])(R_b − E[R_b])hiệp phương sai
ρ = Cov(A,B) / (σₐ · σ_b)tương quan, ∈ [−1, +1]
σₚ = √(w₁²σ₁² + w₂²σ₂² + 2·w₁·w₂·ρ·σ₁·σ₂)độ lệch chuẩn danh mục 2 tài sản
trong đó wᵢ = tỷ trọng tài sản i · σᵢ = độ lệch chuẩn tài sản i · ρ = tương quan giữa 2 tài sản
Phân biệt cặp dễ lẫn
Covariance vs CorrelationCov phụ thuộc đơn vị, khó so sánh; ρ chuẩn hóa về [−1,+1], so sánh được.
ρ = +1 vs ρ < +1ρ=+1 chỉ là bình quân gia quyền của σ (không giảm rủi ro); ρ<1 mới có đa dạng hóa.
E(Rₚ) vs σₚLợi suất danh mục là bình quân gia quyền; rủi ro thì KHÔNG (phụ thuộc covariance).
Quant · Lý thuyết chi tiết 13 / 31
Chủ đề 4 · Ví dụ giải từng bước

Ví dụ: Portfolio Mathematics.

ĐềChia đều vốn (w = 0.5 mỗi bên) vào 2 tài sản: σ₁ = 10%, σ₂ = 30%, tương quan hoàn hảo dương ρ = +1. Tính σₚ.
  1. ρ = +1 → công thức rút gọn: σₚ = w₁σ₁ + w₂σ₂.
  2. = 0.5·10% + 0.5·30%.
  3. = 5% + 15%.
Đáp ánσₚ = 20%
Bẫyρ = +1 thì σₚ chỉ là bình quân gia quyền của σ, KHÔNG có lợi ích đa dạng hóa.
Quant · Lý thuyết chi tiết 14 / 31
Chủ đề 5 · Khái niệm · SAPP M6

Simulation & Distributions. Mô phỏng & phân phối

Normal vs lognormal

Lợi suất gộp liên tục giả định phân phối chuẩn; còn GIÁ tài sản được mô hình bằng lognormal vì giá không âm và phân phối lệch phải. ln(giá) thì phân phối chuẩn.

Phân phối lấy mẫu

Student t đuôi mập hơn chuẩn, dùng khi mẫu nhỏ / chưa biết σ tổng thể; df = n − 1. Chi-square và F dùng cho suy diễn về phương sai; đều phụ thuộc bậc tự do.

Monte Carlo

Sinh hàng nghìn kịch bản từ phân phối giả định cho biến đầu vào, dùng khi bài toán không có lời giải đóng (định giá quyền chọn phức tạp, VaR).

Hạn chế Monte Carlo

Kết quả chỉ tốt như giả định: tham số/phân phối bị misspecified thì sai; tốn tính toán và không cho insight giải tích như công thức đóng.

Bootstrap

Lấy mẫu lại CÓ HOÀN LẠI từ chính mẫu gốc, lặp nhiều lần để ước lượng phân phối của một thống kê (vd standard error). Một quan sát có thể bị rút lại nhiều lần.

Jackknife

Bỏ lần lượt MỘT quan sát mỗi vòng (leave-one-out), tính lại thống kê trên n−1 quan sát. Mang tính xác định, không ngẫu nhiên như bootstrap.

Quant · Lý thuyết chi tiết 15 / 31
Chủ đề 5 · Công thức & phân biệt

Công thức lõi: Simulation & Distributions.

Nếu ln(P) ~ Normal ⇒ P ~ Lognormalmô hình giá tài sản
df(t) = n − 1bậc tự do Student t
Bootstrap → resample WITH replacementngẫu nhiên, có hoàn lại
Jackknife → leave-one-out (n−1)xác định, bỏ 1 quan sát
trong đó n = cỡ mẫu · df = bậc tự do · P = giá tài sản
Phân biệt cặp dễ lẫn
Normal vs LognormalLợi suất cc ~ chuẩn (đối xứng, có thể âm); giá ~ lognormal (≥0, lệch phải).
Bootstrap vs JackknifeBootstrap = có hoàn lại + ngẫu nhiên; jackknife = bỏ một quan sát + xác định.
Monte Carlo vs ResamplingMC sinh số từ phân phối giả định; resampling dùng lại chính dữ liệu gốc.
Quant · Lý thuyết chi tiết 16 / 31
Chủ đề 5 · Ví dụ giải từng bước

Ví dụ: Simulation & Distributions.

ĐềVới mỗi vòng lấy mẫu lại, điều gì xảy ra với quan sát vừa được rút?
  1. Bootstrap: trả quan sát lại vào mẫu → có thể được rút lại ở lượt sau.
  2. Jackknife: bỏ đúng 1 quan sát, dùng n−1 quan sát còn lại.
  3. Monte Carlo: không dùng dữ liệu gốc mà sinh số từ phân phối giả định.
Đáp ánBootstrap = with replacement; Jackknife = leave-one-out
BẫyMô hình GIÁ bằng lognormal, không phải normal. Bootstrap rút có hoàn lại; jackknife bỏ đúng một quan sát mỗi vòng.
Quant · Lý thuyết chi tiết 17 / 31
Chủ đề 6 · Khái niệm · SAPP M7

Sampling & Estimation. Lấy mẫu & ước lượng

Phương pháp lấy mẫu

Simple random (xác suất bằng nhau), stratified (chia tầng rồi lấy theo tỷ lệ), cluster, convenience, judgmental. Stratified thường giảm sampling error so với lấy ngẫu nhiên đơn giản.

Sampling vs non-sampling

Sampling error là chênh lệch do mẫu khác tổng thể, giảm khi tăng n. Non-sampling (sai thiết kế, data snooping, survivorship/look-ahead bias) không tự mất khi tăng n.

Định lý giới hạn trung tâm

Với n đủ lớn (≥30), phân phối của trung bình mẫu xấp xỉ chuẩn BẤT KỂ phân phối gốc, với trung bình = μ và độ lệch = standard error.

Standard error

SE = σ/√n (hoặc s/√n khi chưa biết σ). Tăng n làm SE giảm → ước lượng chính xác hơn và kiểm định mạnh hơn (power cao hơn).

Điểm vs khoảng

Point estimate là một con số (vd x̄); confidence interval cho một dải kèm độ tin cậy. CI = điểm ± (giá trị tới hạn × SE); 95% dùng ≈1.96 với z.

Shortfall & safety-first

Shortfall risk là xác suất lợi suất dưới một ngưỡng mục tiêu. Roy safety-first chọn danh mục tối đa hóa SFRatio = (E[Rₚ] − R_target)/σₚ.

Quant · Lý thuyết chi tiết 18 / 31
Chủ đề 6 · Công thức & phân biệt

Công thức lõi: Sampling & Estimation.

SE = σ / √n (hoặc s / √n)sai số chuẩn của trung bình mẫu
CI = x̄ ± z(α/2) · SEkhoảng tin cậy cho μ
SFRatio = (E[Rₚ] − R_target) / σₚRoy safety-first
trong đó n = cỡ mẫu · σ, s = độ lệch chuẩn tổng thể / mẫu · R_target = mức lợi suất mục tiêu
Phân biệt cặp dễ lẫn
Sampling error vs Non-sampling errorSampling giảm khi tăng n; non-sampling (bias thiết kế) thì không.
Point estimate vs Confidence intervalĐiểm cho một số; khoảng cho dải ± kèm mức tin cậy.
Stratified vs Simple randomChia tầng theo đặc tính trước khi lấy thường giảm sai số so với lấy thuần ngẫu nhiên.
Quant · Lý thuyết chi tiết 19 / 31
Chủ đề 6 · Ví dụ giải từng bước

Ví dụ: Sampling & Estimation.

ĐềTổng thể 20 điểm dữ liệu, lấy mẫu ngẫu nhiên đơn giản 10 điểm. Xác suất một điểm bất kỳ được chọn ĐẦU TIÊN?
  1. Simple random: xác suất bằng nhau cho mọi điểm ở lượt đầu.
  2. = 1 / N = 1 / 20.
Đáp án= 0.05
BẫyCLT cần n đủ lớn (≥30) thì trung bình mẫu mới ≈ chuẩn. Shortfall risk gắn với một TARGET cụ thể, không mặc định bằng 0.
Quant · Lý thuyết chi tiết 20 / 31
Chủ đề 7 · Khái niệm · SAPP M8–M9

Hypothesis Testing. Kiểm định giả thuyết

Quy trình 6 bước

Nêu H₀ và Hₐ, chọn test phù hợp, định mức ý nghĩa α, tính test statistic, so với critical value (hay p-value), rồi kết luận. Bác bỏ H₀ khi |stat| > critical value.

Một đuôi vs hai đuôi

Hₐ có dấu "≠" → hai đuôi; có dấu ">" hoặc "<" → một đuôi. H₀ luôn chứa dấu bằng. p-value là mức ý nghĩa nhỏ nhất mà tại đó vẫn bác bỏ được H₀.

Sai lầm loại I & II

Type I: bác bỏ H₀ đúng (xác suất = α). Type II: không bác bỏ H₀ sai (xác suất = β). Power = 1 − β. Hạ α làm tăng β nếu giữ nguyên n.

Chọn đúng test

t-test cho trung bình; F-test (= s₁²/s₂²) cho khác biệt PHƯƠNG SAI hai tổng thể chuẩn; chi-square cho phương sai một tổng thể; mẫu phụ thuộc dùng paired test trên trung bình các hiệu số.

Tăng power

Power = 1 − β; tăng cỡ mẫu n làm SE giảm → dễ phát hiện hiệu ứng thật (vd tương quan ≠ 0). Mức ý nghĩa chặt hơn (α nhỏ) đòi critical value lớn hơn.

Kiểm định độc lập

Test tương quan ρ=0: parametric dùng t-test; phi tham số dùng Spearman rank khi vi phạm giả định chuẩn. Bảng tần suất (contingency) dùng chi-square test of independence.

Quant · Lý thuyết chi tiết 21 / 31
Chủ đề 7 · Khung chọn test · SAPP M8–M9

Bạn test cái gì? → dùng test nào.

Toàn bộ Hypothesis Testing quy về một câu hỏi: đối tượng kiểm định là TRUNG BÌNH hay PHƯƠNG SAI, một hay hai tổng thể, mẫu độc lập hay ghép cặp. Trả lời được là chọn đúng test statistic.

Kiểm định gìĐiều kiệnTest statistic
Trung bình 1 tổng thểσ đã biết / n lớnz-test
Trung bình 1 tổng thểσ chưa biết (hay gặp)t-test · 1 mẫu
Chênh lệch 2 trung bình2 mẫu ĐỘC LẬPt-test · 2 mẫu
Trung bình của các hiệu2 mẫu GHÉP CẶPt-test · paired
1 phương sai tổng thểso với mốc σ₀²Chi-square (χ²)
2 phương sai tổng thểcó bằng nhau khôngF-test
Quant · Lý thuyết chi tiết 22 / 31
Chủ đề 7 · Bốn loại test

Bốn loại test — so sánh nhanh.

z-testt-testChi-squareF-test
Kiểm địnhMean · σ biếtMean · σ chưa biết1 phương sai2 phương sai
Test statistic(x̄−μ₀)/(σ/√n)(x̄−μ₀)/(s/√n)(n−1)s²/σ₀²s₁²/s₂²
Phân phốiStandard normalStudent tChi-squareF
Bậc tự don−1n−1n₁−1, n₂−1
Khi nàoσ known / n lớnσ unknownso 1 var với mốcso 2 var
Quant · Lý thuyết chi tiết 23 / 31
Chủ đề 7 · t-test chia 3 kiểu

t-test — ba kiểu, chọn theo đề.

Single mean · 1 mẫu

Kiểm định trung bình MỘT tổng thể so với mốc μ₀.

t = (x̄ − μ₀) / (s/√n)df = n − 1

Difference of means · 2 mẫu độc lập

So sánh trung bình HAI nhóm độc lập (vd 2 quỹ khác nhau).

t = (x̄₁ − x̄₂) / √(s²ₚ/n₁ + s²ₚ/n₂)Phương sai bằng nhau → pooled, df = n₁+n₂−2. Khác nhau → Welch (df xấp xỉ).

Mean of differences · paired (phụ thuộc)

Hai quan sát trên CÙNG đối tượng (before/after, cùng kỳ).

t = d̄ / (s_d/√n)df = n − 1 · d̄ = trung bình các hiệu số
2 mẫu độc lập vs PairedTách rời, không ghép cặp → independent. Cùng đối tượng đo 2 lần → paired (test các HIỆU).
Pooled vs Unequal varPhương sai 2 nhóm bằng → pooled (df=n₁+n₂−2). Khác → Welch.
z-test vs t-testσ tổng thể biết / n rất lớn → z. σ chưa biết (dùng s) → t.
Quant · Lý thuyết chi tiết 24 / 31
Chủ đề 7 · Test về phương sai

Chi-square & F — test phương sai.

Chi-square (χ²) · 1 phương sai

Kiểm định phương sai MỘT tổng thể so với mốc σ₀² (vd rủi ro có vượt ngưỡng?).

χ² = (n − 1)·s² / σ₀²
df = n − 1 · phân phối lệch phải, ≥ 0 · không đối xứng

F-test · 2 phương sai

Kiểm định HAI phương sai có bằng nhau không (vd 2 quỹ rủi ro khác nhau?).

F = s²_lớn / s²_nhỏ
đặt variance LỚN lên tử để F ≥ 1 · df₁ = n_lớn−1, df₂ = n_nhỏ−1
Quant · Lý thuyết chi tiết 25 / 31
Chủ đề 7 · Ứng dụng · nhìn đề chọn test

Nhìn đề → chọn đúng test.

So sánh lợi suất trung bình của 2 quỹ ĐỘC LẬP, 36 & 40 tháng, σ chưa biết.
t-test · 2 mẫu độc lập
So sánh lợi suất danh mục TRƯỚC và SAU khi đổi chiến lược, cùng 24 tháng.
t-test · paired
Độ biến động (variance) của một quỹ có vượt mốc 16%² không?
Chi-square · 1 phương sai
Hai quỹ có mức rủi ro (variance) khác nhau không?
F-test · 2 phương sai
Quant · Lý thuyết chi tiết 26 / 31
Chủ đề 7 · Ví dụ giải từng bước

Ví dụ: paired t-test.

ĐềSo sánh trung bình lợi suất danh mục TRƯỚC vs SAU khi đổi chiến lược, đo trên cùng 12 tháng. Trung bình các hiệu d̄ = 0.8%, độ lệch chuẩn các hiệu s_d = 1.5%, n = 12. Test ở mức 5% hai đuôi.
  1. Dữ liệu ghép cặp (cùng kỳ, before/after) → paired t-test, H₀: μ_d = 0.
  2. t = d̄ / (s_d/√n) = 0.8 / (1.5/√12).
  3. s_d/√n = 1.5/3.464 = 0.433 → t = 0.8/0.433 ≈ 1.85.
  4. df = n−1 = 11; t_crit(5% hai đuôi, df=11) ≈ 2.20.
  5. |t| = 1.85 < 2.20 → KHÔNG bác bỏ H₀.
Đáp ánChưa đủ bằng chứng chiến lược mới cải thiện lợi suất
Quant · Lý thuyết chi tiết 27 / 31
Chủ đề 8 · Khái niệm · SAPP M10

Simple Linear Regression. Hồi quy tuyến tính đơn

Mô hình & least squares

Y = b₀ + b₁X + ε. Least squares chọn b₀, b₁ để tối thiểu tổng bình phương phần dư (SSE). b₁ = Cov(X,Y)/Var(X) là độ dốc; đường hồi quy đi qua (x̄, ȳ).

Diễn giải hệ số

b₁ cho biết Y đổi bao nhiêu khi X tăng 1 đơn vị; b₀ là tung độ gốc (giá trị Y kỳ vọng khi X = 0). Suy diễn dùng t-test trên từng hệ số.

Hệ số xác định R²

R² = tỷ lệ % biến thiên của BIẾN PHỤ THUỘC được giải thích bởi biến độc lập. Trong hồi quy đơn, R² = (hệ số tương quan)².

ANOVA

Phân rã tổng biến thiên: SST = SSR + SSE. SSR (giải thích) và SSE (phần dư). R² = SSR/SST. F-test (= MSR/MSE) kiểm định ý nghĩa tổng thể của mô hình.

Giả định phần dư

Kỳ vọng 0, phương sai KHÔNG đổi (homoskedasticity), độc lập (không tự tương quan), phân phối chuẩn, và quan hệ X–Y tuyến tính. Residual plot giúp phát hiện vi phạm.

Standard error & dự báo

SEE (standard error of estimate) = √(SSE/(n−2)) đo độ phân tán quanh đường hồi quy; SEE nhỏ → mô hình khớp tốt. Dùng mô hình để dự báo Ŷ tại một X cho trước.

Quant · Lý thuyết chi tiết 28 / 31
Chủ đề 8 · Công thức & phân biệt

Công thức lõi: Simple Linear Regression.

Y = b₀ + b₁X + ε, b₁ = Cov(X,Y)/Var(X)mô hình & độ dốc
SST = SSR + SSEphân rã ANOVA
R² = SSR / SSTtỷ lệ biến thiên được giải thích
SEE = √[ SSE / (n − 2) ]sai số chuẩn của ước lượng
trong đó SST = tổng biến thiên (total) · SSR = biến thiên được giải thích (regression) · SSE = biến thiên phần dư (error)
Phân biệt cặp dễ lẫn
SSR (explained) vs SSE (residual)SSR là phần mô hình giải thích; SSE là phần còn lại không giải thích.
vs SEER² đo tỷ lệ giải thích (càng cao càng tốt); SEE đo độ phân tán phần dư (càng nhỏ càng tốt).
Homoskedastic vs HeteroskedasticPhương sai phần dư không đổi vs thay đổi theo X; hetero làm sai lệch suy diễn.
Quant · Lý thuyết chi tiết 29 / 31
Chủ đề 8 · Ví dụ giải từng bước

Ví dụ: Simple Linear Regression.

ĐềBảng ANOVA: explained variation (SSR) = 0.0135, unexplained variation (SSE) = 0.0640. Tính R².
  1. SST = SSR + SSE = 0.0135 + 0.0640 = 0.0775.
  2. R² = SSR / SST = 0.0135 / 0.0775.
Đáp ánR² ≈ 0.174 (≈ 17.4%)
BẫyPhần dư phải HOMOSKEDASTIC. SSR = explained, SSE = unexplained (residual). R² = (corr)² chỉ đúng trong hồi quy ĐƠN.
Quant · Lý thuyết chi tiết 30 / 31
Bẫy thường gặp

Tám cái bẫy Quant hay mất điểm.

!

Real ≠ nominal

Luôn trừ phần bù lạm phát khi đề hỏi real risk-free rate.

!

TWR ≠ MWR

Đánh giá tay nghề quản lý dùng time-weighted, không phải money-weighted.

!

Lệch phải = mode<median<mean

Suy ngược được skewness từ vị trí ba đại lượng.

!

ρ = +1 không giảm rủi ro

Chỉ ρ < 1 mới có lợi ích đa dạng hóa.

!

Giá → lognormal

Lợi suất cc ~ chuẩn, nhưng GIÁ tài sản mô hình bằng lognormal.

!

Bootstrap vs Jackknife

Bootstrap = có hoàn lại; jackknife = bỏ một quan sát mỗi vòng.

!

10% rồi mới tới 5%

Reject ở mức lỏng (10%) chưa chắc reject ở mức chặt (5%).

!

t = mean, F = variance

t cho khác biệt trung bình; F cho khác biệt phương sai.

Quant · Lý thuyết chi tiết 31 / 31
Ghi nhớ

Bốn điều mang theo vào phòng thi.

Học theo cụm
8 cụm phủ trọn 11 module; ôn từng cụm thay vì rời rạc.
Phân biệt cặp dễ lẫn
Arith/Geo, TWR/MWR, bootstrap/jackknife, t/F-test.
Thuộc công thức lõi
σ danh mục, R²=SSR/SST, E(X)=Σp·x, SE=σ/√n.
Bám mức ý nghĩa
Quyết định reject phụ thuộc α; 10% ≠ 5%; power = 1 − β.

Sẵn sàng.

Giờ làm mock-1 & mock-2 / quant · lesson.leaprep.com