research2026-04-208 分鐘閱讀

CEO 上電視到底會不會推股價?一個 selection bias 問題。

factor-investing event-study selection-bias rklb quantitative-research

Brendan Chen | 2026 年 4 月

敘事

「Peter Beck 昨天上了 CNBC,Rocket Lab 當天漲了 3%。」

任何一個高調的 CEO 媒體露面之後,fintwit 跟 YouTube 上都會出現一堆這種句子。隱含的因果故事乾淨又爽:CEO 上了電視 → retail 跟進 → 股價漲。一個可以量測的「露面 → 價格」效果。

問題是這個隱含的因果幾乎確定是反過來的——或至少被嚴重混淆(confounded)。CEO,尤其是小型成長股的創辦人 CEO,不是隨機時間上 CNBC 的。他們是因為有東西可以講才上:新一次發射里程碑、一個新的客戶合約、一次漂亮的財報 beat、一個新產品發表。「Beck 上電視 → 股價漲」很難跟「有好消息 → Beck 出來講 AND 股價漲」分得開。

這就是 event study 裡最經典的 selection bias 問題。我想知道的是:把那些本來就會帶動股價的 catalyst 都剝掉之後,CEO「單純上電視」這件事本身,還有沒有獨立的因果效果? 所以我圍繞這個問題做了研究 pipeline 的第一版。

這是早期階段的結果。方法論是 work 的。樣本數太小不足以下結論。但它浮出來的 pattern 正好是 selection bias 假說成立時你會預期看到的。

研究設計

標的: RKLB(Rocket Lab USA),2021-08-25 IPO,~4.6 年的 post-IPO 日資料。

追蹤對象:

Peter Beck — CEO、創辦人(P1)
Adam Spice — CFO(P1)
Frank Klein — COO(P2)
Sandy Tirtey — Senior Director(P2)

Richard Hunter 已離職,排除。

7 個 collectors:

Prices — Yahoo Finance 每日 OHLCV,包含 RKLB、SPY、ARKX(太空 ETF),跟 robustness 用的同業名單(LMT、LHX、BA、ASTS、ACHR)。
Catalysts — SEC 8-K Item 2.02 財報公告(控制「有沒有好消息」的獨立變數)。
Social heat — 公開來源的每日討論量。
Twitter — Beck 相關提及,Nitter + snscrape(這次沒實際 live 跑)。
YouTube — CNBC / Bloomberg 等主流頻道的露面,走 YouTube Data API v3。
News — GDELT(沒 GCP key,graceful skip)。
Podcast — Listen Notes(沒 key,graceful skip)。

Event study 方法論:

CAPM(Method 2)跟 Two-Factor SPY + ARKX(Method 3)併列當 primary abnormal return model。
Method 1(raw return vs market)當 sanity check。
Event window:每個 event 的 CAR[-1, +1]。
Estimation window:event 前滾動 120 個交易日。

Selection bias 控制:

獨立的 catalysts.csv,收齊所有 RKLB 的 Item 2.02 財報日期(全樣本 19 筆)。
每個 event 都標 context 標籤:proactive(Beck 主動去露面)、reactive(財報相關的媒體日)、routine(日常 PR)。
「Clean events」filter:event 跟任何 catalyst 至少隔 3 個交易日。這是如果真的有殘餘的 CEO-exposure 效果的話,它應該乾淨浮出來的 subset。

方法論亮點:two-factor model

在還沒開始做 event study 之前,光是 market model 本身就有一個我沒預期到的發現。

標準 CAPM:

α = +0.002,  β_SPY = 2.019

看起來就是一個正常的高 beta 成長股。但 RKLB 是純 pure-play 太空公司,太空 sector 有自己的獨特動能(發射排程、政府合約客戶集中度、DoD 預算風險),跟大盤 S&P 500 幾乎沒什麼關係。所以我把 ARKX(ARK Space Exploration & Innovation ETF)加進去當第二個 factor:

Two-Factor:  α = +0.002,  β_SPY = -0.958,  β_ARKX = +2.367

一旦把太空 sector 顯式控制進去,RKLB 對大盤的 β 其實是負的,而幾乎所有的波動度都由 sector beta 解釋、而且是 ~2.4 倍。RKLB 不是一檔大盤股,它是一個 2.4x 槓桿的太空 sector 純曝險。

這對 event study 有兩個實務後果:

CAPM 算出來的 abnormal return 會系統性地把 sector 動能誤算進 event window。
Two-factor model 才是對的 lens。下面所有 CAR 報的都是 Method 3。

Pipeline 踩雷

資料 pipeline 上浮出來幾個值得記的事,有些跟方法論本身也有關:

SEC CIK 打錯。 我寫的 implementation plan 裡 RKLB 的 CIK 寫成 0001819810,但那其實是 Redwire (RDW) 的 CIK。第一次 catalyst scrape 把 Redwire 的財報抓進我的 RKLB 檔案裡了。真正的 CIK 是 0001819994。人工 review 時抓到、修掉、重跑。提醒自己:連自己 plan 裡「權威」識別碼也要用跟對待外部資料一樣的懷疑態度去看。
Reddit PRAW 不能用了。 Reddit 現在實質上把沒 auth 的 PRAW 關掉了——request 會被導去 Researcher Program 的 gate。改用公開的 RSS endpoint (/r/{sub}/top.rss?t={filter}&limit=100),掃 5 個 time window(all/year/month/week/day)加上 post-ID dedupe。失掉 comment count 跟 score,但每日 post 量還在。
YouTube 雜訊。 第一版 YouTube collector 只用 Beck 的名字加 disambiguation phrase 去搜,拉回來 282 筆 candidates——絕大多數是第三方 reaction 影片、analysis 頻道、clickbait 二次剪輯。加上 (a) 走 people registry 裡原本就存在的 youtube_channel_filter 欄位做 channel whitelist、(b) title blacklist(3+ 連續全大寫非縮寫、常見 reaction/clickbait 字眼)、(c) 頻道訂閱數 ≥ 10k 之後,set 縮成 11 筆乾淨的 CNBC/Bloomberg 露面。精度大升、recall 明顯掉——這是預期中的 trade-off,下階段第一件事就是擴 whitelist。

第一版結果

強烈警語: N = 11 個 clean event,4.6 年期間。Underpowered。下面的數字是方向性的,不是結論性的。第一版的目的是檢查方法論能不能浮出 selection-bias 假說成立時你預期看到的 pattern。

CAR[-1, +1] 依 subset 切(Two-Factor model)

| Subset | N | Mean CAR | p-value | |---|---|---|---| | All events | 10 | +4.0% | 0.38 | | Beck only | 7 | +6.1% | 0.36 | | Beck — proactive | 4 | −3.9% | 0.34 | | Beck — tier 1 | 7 | +6.1% | 0.36 | | Beck — clean (離 catalyst ≥3 天) | 4 | −3.9% | 0.34 |

核心發現

把我加粗的那兩列跟上面的「Beck only」對比看:

全部 Beck 露面:+6.1% abnormal return。 看起來很 bullish。「CEO 上電視 → 股價漲。」
乾淨的 Beck 露面(遠離財報):−3.9% abnormal return。 反過來了。

這正是 selection-bias 假說預測的東西。表面上「Beck 露面 → 股價漲」的那個無條件訊號,幾乎全部是由那些聚集在財報日附近的露面貢獻的。把所有離 earnings catalyst 三個交易日以內的露面都剝掉之後,殘餘效果翻號。Beck 在沒有明顯 news catalyst 的時候上 CNBC,3 天平均 abnormal return 反而是微負的。

如果這個 pattern 用更大的樣本還撐得住,那解釋基本上會是:「CEO 上電視會推股價」這個頭條其實根本不是 CEO-exposure 效果,它是 earnings beat 效果同時顯現在兩個變數上。CEO 露面是消息的下游標記,不是獨立的股價驅動因子。

關鍵警語

N = 4。p = 0.34。 這個 clean-Beck sign flip 方向上有趣、跟理論預期一致,但我對它的統計信心是零。N=4 底下你需要約莫 2σ 的移動才會讓 p < 0.05,而這邊的 magnitude(3 天 -3.9%,對比 RKLB 日波動度 ~5%)離那個門檻很遠。這是方法論生成的 hypothesis,不是方法論確認過的 hypothesis。

Heat vs price(Granger)

另外單獨驗了 Reddit 討論量(reddit_rocketlab_posts)在日 lag 1 到 10 之間對 RKLB 日報酬有沒有領先或落後關係。

reddit_rocketlab_posts → returns:min-p = 0.195
returns → reddit_rocketlab_posts:min-p = 0.339

兩個方向都沒有顯著。r/RocketLab 的 Reddit 討論量本身對 RKLB 日報酬沒有可偵測的領先/落後關係。這是我在好幾個 retail sentiment vs price 的研究裡都看過的一個小型複製:單看 Reddit aggregate volume,對單檔 mid-cap 來說沒有可交易的前瞻資訊。

這代表什麼 + 下一步

這代表什麼

在第一版、扛著上面所有 sample size 警語的前提下,資料跟一個假說是一致的:觀察到的「CEO 露面 → 股價動」的相關性,幾乎全部是 selection-bias 的產物。一旦把聚集在 earnings 跟其他 catalyst 附近的露面過濾掉,「純 CEO 曝光」event 附近的平均 abnormal return 充其量是零、甚至有點負。

這個結果本身就有意思,因為它反駁了 retail investing 裡一個很常見的隱含 model——認為「管理層能見度」本身就是一個推股價的 event。對 RKLB,在這個樣本上,不是這樣。方法論照設計跑出來:它把 selection bias 在推什麼的那個 pattern 精準地還給我們。

下一步

下一輪迭代的優先序全都圍繞樣本數:

擴 YouTube channel whitelist — 加 Yahoo Finance、CNBC Mad Money、CNBC Prime、Fortune、Motley Fool、WIRED、The Verge。應該可以把 event 從 11 拉到 30-50。
加替代 search query — 除了 "Peter Beck",再搜 "Rocket Lab CEO"、"Rocket Lab interview"。可以再拿一批高品質的 candidate。
跑 Google Trends — 用 pytrends 把 4.6 年 stitched 起來跑完。可以多一條 heat series 跟 Reddit 併看。
Bloomberg Terminal 手動補 — 20-30 筆我記得的重大露面(conference、非 Bloomberg/CNBC 的 podcast、Forbes 報導)直接加到 curated events 檔案。

Takeaway

在 event study 裡要把相關性跟因果分開,必須做顯式的 selection-bias 控制,不是有好意就夠。「CEO 露面,股價動」這個敘事幾乎可以確定內含真實的 selection bias——而對 RKLB 這個第一版來說,一旦把它控制掉,「單純 CEO 上電視」的殘餘效果看起來很小、可能是微負、統計上跟零沒有差別。

這個結論撐不撐得到 N = 40、N = 100,是一個經驗問題。能回答它的 scaffolding 現在已經都搭起來了。

這是 work-in-progress 的研究筆記,不是投資建議。上面所有數字都來自 11 筆 curated YouTube event 加 19 筆 SEC catalyst 的第一版 run;樣本明確 underpowered,結論是「要拿去驗的假說」,不是「可以拿來行動的結論」。