Một lãi suất có thể đọc theo ba góc: required rate of return (lợi suất yêu cầu), discount rate (suất chiết khấu) và opportunity cost (chi phí cơ hội của vốn).
Lãi suất danh nghĩa = real risk-free rate + bù lạm phát + bù default + bù liquidity + bù maturity. Với bond hạng cao, maturity premium thường là cấu phần lớn nhất.
HPR = (P₁ − P₀ + thu nhập) / P₀ là viên gạch của mọi thước đo lợi suất. Gộp nhiều kỳ bằng cách nhân các (1 + HPR) với nhau.
Arithmetic mean ước lượng lợi suất kỳ vọng MỘT kỳ; geometric mean là lợi suất kép thực tế qua nhiều kỳ. Luôn có geometric ≤ arithmetic (bằng nhau khi mọi HPR giống nhau).
MWR là IRR của dòng tiền, bị ảnh hưởng bởi thời điểm nhà đầu tư nạp/rút vốn. TWR loại bỏ tác động dòng tiền nên là chuẩn so sánh tay nghề quản lý quỹ (GIPS).
PV–FV–PMT–N–I/Y gắn nhau qua chiết khấu. Continuously compounded return = ln(1 + HPR). Định giá bond/equity = chiết khấu dòng tiền kỳ vọng; implied return là giải ngược I/Y.
r = real RFR + bù lạm phát + default + liquidity + maturitylợi suất yêu cầu(1 + nominal) = (1 + real)(1 + lạm phát)quan hệ Fisher đầy đủHPR = (P₁ − P₀ + I) / P₀lợi suất một kỳ nắm giữGeometric mean = [Π(1 + HPRᵢ)]^(1/n) − 1lợi suất kép nhiều kỳr_cc = ln(1 + HPR) = ln(P₁/P₀)gộp liên tục| Arithmetic mean vs Geometric mean | Số học = kỳ vọng 1 kỳ; hình học = tăng trưởng kép thực tế. Geo ≤ Arith. |
| Money-weighted vs Time-weighted | MWR (=IRR) nhạy dòng tiền nhà đầu tư; TWR trung lập, chuẩn so sánh hiệu suất. |
| Nominal vs Real | Nominal đã gồm lạm phát; real đã trừ lạm phát (xấp xỉ qua Fisher). |
Mean (bình quân cộng), median (giá trị giữa sau sắp xếp), mode (xuất hiện nhiều nhất). Với n chẵn, median = trung bình hai giá trị giữa. Quantile (tứ phân vị, bách phân vị) chia dữ liệu đã sắp xếp.
Range, MAD (độ lệch tuyệt đối bình quân), phương sai và độ lệch chuẩn. Mẫu chia (n − 1) để không chệch; tổng thể chia N.
Nhà đầu tư chỉ ngại phần lệch XẤU: target downside deviation (semideviation) chỉ tính các quan sát dưới mức mục tiêu, hữu ích khi phân phối lệch.
CV = σ / mean: rủi ro trên mỗi đơn vị lợi suất, cho phép so sánh các tài sản khác đơn vị/quy mô. CV càng thấp càng tốt.
Đo bất đối xứng. Lệch phải (dương): đuôi phải dài → mode < median < mean. Lệch trái (âm): ngược lại, mean < median < mode.
Chuẩn có kurtosis = 3; excess = kurtosis − 3. Leptokurtic (>0) đuôi mập, nhiều outlier. Correlation chuẩn hóa covariance về [−1, +1]; chỉ đo quan hệ TUYẾN TÍNH.
s² = Σ(xᵢ − x̄)² / (n − 1)phương sai mẫu (chia n−1)CV = σ / x̄rủi ro trên một đơn vị lợi suấtExcess kurtosis = kurtosis − 3> 0 leptokurtic (đuôi mập)r = Cov(X,Y) / (σ_X · σ_Y)hệ số tương quan, ∈ [−1, +1]| Lệch phải (+) vs Lệch trái (−) | Phải: mode<median<mean (đuôi phải). Trái: mean<median<mode (đuôi trái). |
| Phương sai mẫu vs Phương sai tổng thể | Mẫu chia (n−1) cho ước lượng không chệch; tổng thể chia N. |
| Kurtosis = 3 vs Excess = 0 | Bằng phân phối chuẩn (mesokurtic), KHÔNG phải đuôi mập. |
Random variable, outcome, event. Biến cố mutually exclusive (không chồng) và exhaustive (phủ hết). Xác suất a priori, empirical (tần suất) hay subjective.
P(A|B) là xác suất A khi đã biết B. Quy tắc nhân: P(AB) = P(A|B)·P(B). Hai biến cố độc lập khi P(A|B) = P(A).
Quy tắc cộng: P(A∪B) = P(A) + P(B) − P(AB). Tổng xác suất toàn phần: P(A) = Σ P(A|Sᵢ)·P(Sᵢ) trên một bộ kịch bản loại trừ và vét cạn.
E(X) = Σ pᵢ·xᵢ là trung bình có trọng số theo xác suất. Phương sai = Σ pᵢ·[xᵢ − E(X)]². Cây xác suất gắn nhánh kết quả với xác suất.
Cập nhật niềm tin khi có bằng chứng mới: P(A|B) = P(B|A)·P(A) / P(B). Lỗi kinh điển là đảo nhầm P(A|B) thành P(B|A).
Factorial n! sắp xếp toàn bộ. Permutation có thứ tự nPr; combination không thứ tự nCr = nPr / r!. Chọn đúng công cụ theo việc thứ tự có quan trọng hay không.
E(X) = Σ pᵢ · xᵢkỳ vọng có trọng sốP(AB) = P(A|B) · P(B)quy tắc nhânP(A∪B) = P(A) + P(B) − P(AB)quy tắc cộngP(A|B) = P(B|A) · P(A) / P(B)định lý BayesnCr = n! / [(n − r)! · r!]tổ hợp không thứ tự| Permutation (nPr) vs Combination (nCr) | Permutation tính thứ tự; combination thì không. nCr = nPr / r!. |
| P(A|B) vs P(B|A) | Hai chiều điều kiện khác nhau; Bayes mới giúp đảo đúng giữa chúng. |
| Mutually exclusive vs Independent | Loại trừ: không cùng xảy ra. Độc lập: biết cái này không đổi xác suất cái kia. |
Cov(A,B) = Σ p·(Rₐ − E[Rₐ])(R_b − E[R_b]) đo mức hai tài sản biến động cùng chiều. Đơn vị khó diễn giải nên thường chuẩn hóa thành correlation.
ρ = Cov(A,B) / (σₐ·σ_b) thuộc [−1, +1]. ρ càng thấp, lợi ích đa dạng hóa càng lớn vì số hạng chéo trong phương sai danh mục nhỏ đi.
E(Rₚ) = Σ wᵢ·E(Rᵢ): bình quân gia quyền theo tỷ trọng. Nhưng rủi ro danh mục KHÔNG phải bình quân rủi ro các tài sản.
Với 2 tài sản: σₚ² = w₁²σ₁² + w₂²σ₂² + 2w₁w₂ρσ₁σ₂. Chính số hạng chéo (covariance) quyết định lợi ích đa dạng hóa, không phải phần phương sai riêng.
ρ=+1: σₚ = w₁σ₁ + w₂σ₂ (không giảm rủi ro). ρ=−1: σₚ = |w₁σ₁ − w₂σ₂| (có thể về 0). ρ=0: bỏ số hạng chéo.
Số số hạng covariance tăng theo n(n−1); khi danh mục lớn, rủi ro hệ thống (covariance trung bình) chi phối, rủi ro riêng lẻ được phân tán gần hết.
Cov(A,B) = Σ p·(Rₐ − E[Rₐ])(R_b − E[R_b])hiệp phương saiρ = Cov(A,B) / (σₐ · σ_b)tương quan, ∈ [−1, +1]σₚ = √(w₁²σ₁² + w₂²σ₂² + 2·w₁·w₂·ρ·σ₁·σ₂)độ lệch chuẩn danh mục 2 tài sản| Covariance vs Correlation | Cov phụ thuộc đơn vị, khó so sánh; ρ chuẩn hóa về [−1,+1], so sánh được. |
| ρ = +1 vs ρ < +1 | ρ=+1 chỉ là bình quân gia quyền của σ (không giảm rủi ro); ρ<1 mới có đa dạng hóa. |
| E(Rₚ) vs σₚ | Lợi suất danh mục là bình quân gia quyền; rủi ro thì KHÔNG (phụ thuộc covariance). |
Lợi suất gộp liên tục giả định phân phối chuẩn; còn GIÁ tài sản được mô hình bằng lognormal vì giá không âm và phân phối lệch phải. ln(giá) thì phân phối chuẩn.
Student t đuôi mập hơn chuẩn, dùng khi mẫu nhỏ / chưa biết σ tổng thể; df = n − 1. Chi-square và F dùng cho suy diễn về phương sai; đều phụ thuộc bậc tự do.
Sinh hàng nghìn kịch bản từ phân phối giả định cho biến đầu vào, dùng khi bài toán không có lời giải đóng (định giá quyền chọn phức tạp, VaR).
Kết quả chỉ tốt như giả định: tham số/phân phối bị misspecified thì sai; tốn tính toán và không cho insight giải tích như công thức đóng.
Lấy mẫu lại CÓ HOÀN LẠI từ chính mẫu gốc, lặp nhiều lần để ước lượng phân phối của một thống kê (vd standard error). Một quan sát có thể bị rút lại nhiều lần.
Bỏ lần lượt MỘT quan sát mỗi vòng (leave-one-out), tính lại thống kê trên n−1 quan sát. Mang tính xác định, không ngẫu nhiên như bootstrap.
Nếu ln(P) ~ Normal ⇒ P ~ Lognormalmô hình giá tài sảndf(t) = n − 1bậc tự do Student tBootstrap → resample WITH replacementngẫu nhiên, có hoàn lạiJackknife → leave-one-out (n−1)xác định, bỏ 1 quan sát| Normal vs Lognormal | Lợi suất cc ~ chuẩn (đối xứng, có thể âm); giá ~ lognormal (≥0, lệch phải). |
| Bootstrap vs Jackknife | Bootstrap = có hoàn lại + ngẫu nhiên; jackknife = bỏ một quan sát + xác định. |
| Monte Carlo vs Resampling | MC sinh số từ phân phối giả định; resampling dùng lại chính dữ liệu gốc. |
Simple random (xác suất bằng nhau), stratified (chia tầng rồi lấy theo tỷ lệ), cluster, convenience, judgmental. Stratified thường giảm sampling error so với lấy ngẫu nhiên đơn giản.
Sampling error là chênh lệch do mẫu khác tổng thể, giảm khi tăng n. Non-sampling (sai thiết kế, data snooping, survivorship/look-ahead bias) không tự mất khi tăng n.
Với n đủ lớn (≥30), phân phối của trung bình mẫu xấp xỉ chuẩn BẤT KỂ phân phối gốc, với trung bình = μ và độ lệch = standard error.
SE = σ/√n (hoặc s/√n khi chưa biết σ). Tăng n làm SE giảm → ước lượng chính xác hơn và kiểm định mạnh hơn (power cao hơn).
Point estimate là một con số (vd x̄); confidence interval cho một dải kèm độ tin cậy. CI = điểm ± (giá trị tới hạn × SE); 95% dùng ≈1.96 với z.
Shortfall risk là xác suất lợi suất dưới một ngưỡng mục tiêu. Roy safety-first chọn danh mục tối đa hóa SFRatio = (E[Rₚ] − R_target)/σₚ.
SE = σ / √n (hoặc s / √n)sai số chuẩn của trung bình mẫuCI = x̄ ± z(α/2) · SEkhoảng tin cậy cho μSFRatio = (E[Rₚ] − R_target) / σₚRoy safety-first| Sampling error vs Non-sampling error | Sampling giảm khi tăng n; non-sampling (bias thiết kế) thì không. |
| Point estimate vs Confidence interval | Điểm cho một số; khoảng cho dải ± kèm mức tin cậy. |
| Stratified vs Simple random | Chia tầng theo đặc tính trước khi lấy thường giảm sai số so với lấy thuần ngẫu nhiên. |
Nêu H₀ và Hₐ, chọn test phù hợp, định mức ý nghĩa α, tính test statistic, so với critical value (hay p-value), rồi kết luận. Bác bỏ H₀ khi |stat| > critical value.
Hₐ có dấu "≠" → hai đuôi; có dấu ">" hoặc "<" → một đuôi. H₀ luôn chứa dấu bằng. p-value là mức ý nghĩa nhỏ nhất mà tại đó vẫn bác bỏ được H₀.
Type I: bác bỏ H₀ đúng (xác suất = α). Type II: không bác bỏ H₀ sai (xác suất = β). Power = 1 − β. Hạ α làm tăng β nếu giữ nguyên n.
t-test cho trung bình; F-test (= s₁²/s₂²) cho khác biệt PHƯƠNG SAI hai tổng thể chuẩn; chi-square cho phương sai một tổng thể; mẫu phụ thuộc dùng paired test trên trung bình các hiệu số.
Power = 1 − β; tăng cỡ mẫu n làm SE giảm → dễ phát hiện hiệu ứng thật (vd tương quan ≠ 0). Mức ý nghĩa chặt hơn (α nhỏ) đòi critical value lớn hơn.
Test tương quan ρ=0: parametric dùng t-test; phi tham số dùng Spearman rank khi vi phạm giả định chuẩn. Bảng tần suất (contingency) dùng chi-square test of independence.
Toàn bộ Hypothesis Testing quy về một câu hỏi: đối tượng kiểm định là TRUNG BÌNH hay PHƯƠNG SAI, một hay hai tổng thể, mẫu độc lập hay ghép cặp. Trả lời được là chọn đúng test statistic.
| Kiểm định gì | Điều kiện | Test statistic |
|---|---|---|
| Trung bình 1 tổng thể | σ đã biết / n lớn | z-test |
| Trung bình 1 tổng thể | σ chưa biết (hay gặp) | t-test · 1 mẫu |
| Chênh lệch 2 trung bình | 2 mẫu ĐỘC LẬP | t-test · 2 mẫu |
| Trung bình của các hiệu | 2 mẫu GHÉP CẶP | t-test · paired |
| 1 phương sai tổng thể | so với mốc σ₀² | Chi-square (χ²) |
| 2 phương sai tổng thể | có bằng nhau không | F-test |
| z-test | t-test | Chi-square | F-test | |
|---|---|---|---|---|
| Kiểm định | Mean · σ biết | Mean · σ chưa biết | 1 phương sai | 2 phương sai |
| Test statistic | (x̄−μ₀)/(σ/√n) | (x̄−μ₀)/(s/√n) | (n−1)s²/σ₀² | s₁²/s₂² |
| Phân phối | Standard normal | Student t | Chi-square | F |
| Bậc tự do | — | n−1 | n−1 | n₁−1, n₂−1 |
| Khi nào | σ known / n lớn | σ unknown | so 1 var với mốc | so 2 var |
Kiểm định trung bình MỘT tổng thể so với mốc μ₀.
t = (x̄ − μ₀) / (s/√n)df = n − 1So sánh trung bình HAI nhóm độc lập (vd 2 quỹ khác nhau).
t = (x̄₁ − x̄₂) / √(s²ₚ/n₁ + s²ₚ/n₂)Phương sai bằng nhau → pooled, df = n₁+n₂−2. Khác nhau → Welch (df xấp xỉ).Hai quan sát trên CÙNG đối tượng (before/after, cùng kỳ).
t = d̄ / (s_d/√n)df = n − 1 · d̄ = trung bình các hiệu sốKiểm định phương sai MỘT tổng thể so với mốc σ₀² (vd rủi ro có vượt ngưỡng?).
χ² = (n − 1)·s² / σ₀²Kiểm định HAI phương sai có bằng nhau không (vd 2 quỹ rủi ro khác nhau?).
F = s²_lớn / s²_nhỏY = b₀ + b₁X + ε. Least squares chọn b₀, b₁ để tối thiểu tổng bình phương phần dư (SSE). b₁ = Cov(X,Y)/Var(X) là độ dốc; đường hồi quy đi qua (x̄, ȳ).
b₁ cho biết Y đổi bao nhiêu khi X tăng 1 đơn vị; b₀ là tung độ gốc (giá trị Y kỳ vọng khi X = 0). Suy diễn dùng t-test trên từng hệ số.
R² = tỷ lệ % biến thiên của BIẾN PHỤ THUỘC được giải thích bởi biến độc lập. Trong hồi quy đơn, R² = (hệ số tương quan)².
Phân rã tổng biến thiên: SST = SSR + SSE. SSR (giải thích) và SSE (phần dư). R² = SSR/SST. F-test (= MSR/MSE) kiểm định ý nghĩa tổng thể của mô hình.
Kỳ vọng 0, phương sai KHÔNG đổi (homoskedasticity), độc lập (không tự tương quan), phân phối chuẩn, và quan hệ X–Y tuyến tính. Residual plot giúp phát hiện vi phạm.
SEE (standard error of estimate) = √(SSE/(n−2)) đo độ phân tán quanh đường hồi quy; SEE nhỏ → mô hình khớp tốt. Dùng mô hình để dự báo Ŷ tại một X cho trước.
Y = b₀ + b₁X + ε, b₁ = Cov(X,Y)/Var(X)mô hình & độ dốcSST = SSR + SSEphân rã ANOVAR² = SSR / SSTtỷ lệ biến thiên được giải thíchSEE = √[ SSE / (n − 2) ]sai số chuẩn của ước lượng| SSR (explained) vs SSE (residual) | SSR là phần mô hình giải thích; SSE là phần còn lại không giải thích. |
| R² vs SEE | R² đo tỷ lệ giải thích (càng cao càng tốt); SEE đo độ phân tán phần dư (càng nhỏ càng tốt). |
| Homoskedastic vs Heteroskedastic | Phương sai phần dư không đổi vs thay đổi theo X; hetero làm sai lệch suy diễn. |
Luôn trừ phần bù lạm phát khi đề hỏi real risk-free rate.
Đánh giá tay nghề quản lý dùng time-weighted, không phải money-weighted.
Suy ngược được skewness từ vị trí ba đại lượng.
Chỉ ρ < 1 mới có lợi ích đa dạng hóa.
Lợi suất cc ~ chuẩn, nhưng GIÁ tài sản mô hình bằng lognormal.
Bootstrap = có hoàn lại; jackknife = bỏ một quan sát mỗi vòng.
Reject ở mức lỏng (10%) chưa chắc reject ở mức chặt (5%).
t cho khác biệt trung bình; F cho khác biệt phương sai.