科技關聯因子專利數據再挖掘_第1頁
科技關聯因子專利數據再挖掘_第2頁
科技關聯因子專利數據再挖掘_第3頁
科技關聯因子專利數據再挖掘_第4頁
科技關聯因子專利數據再挖掘_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、國投瑞銀目錄 HYPERLINK l _TOC_250012 1、 從專利數據到科技動量 5 HYPERLINK l _TOC_250011 、 專利 IPC 分類情況概述 5 HYPERLINK l _TOC_250010 、 科技動量因子 7 HYPERLINK l _TOC_250009 、 科技動量因子:收益顯著性較弱 8 HYPERLINK l _TOC_250008 、 科技動量領先因子 11 HYPERLINK l _TOC_250007 、 兩種構造方式因子表現差異明顯 11 HYPERLINK l _TOC_250006 2、 科技動量因子的改進 14 HYPERLINK l

2、 _TOC_250005 、 利用技術行業集中度:改進效果一般 14 HYPERLINK l _TOC_250004 、 結合專利關聯度的改進方法 16 HYPERLINK l _TOC_250003 、 結合專利關聯度的科技動量因子:有顯著改善 18 HYPERLINK l _TOC_250002 、 剝離常見風格因子后:穩定性提升 20 HYPERLINK l _TOC_250001 3、 風險提示 21 HYPERLINK l _TOC_250000 4、 參考文獻 21圖目錄圖 1:A 股上市公司分年度IPC 一級分類部數量統計圖 6圖 2:A 股各中信一級行業IPC 一級分類部數量堆

3、積柱狀圖 6圖 3:A 股上市公司單個專利平均二級分類大類平均數量 7圖 4:Tech_Momemtum_fmgb_5Y 因子 IC 序列 10圖 5:Tech_Momemtum_fmgb_5Y 因子多頭超額收益(第一組) 10圖 6:Tech_Momemtum_fmgb_5Y 與主要大類因子相關性 10圖 7:Tech_Mean_Rev_V1_fmgb_5Y 因子相關性 12圖 8:Tech_Mean_Rev_V2_fmgb_5Y 因子相關性 12圖 9:Tech_Momemtum_fmgb_5Y、Tech_Mean_Rev_V1_fmgb_5Y 和 Tech_Mean_Rev_V2_fmg

4、b_5Y 因子值分布比較. 12圖 10:Tech_Mean_Rev_V2_fmgb_5Y 因子 IC 序列 13圖 11:Tech_Mean_Rev_V2_fmgb_5Y 因子多頭超額收益(第一組) 13圖 12:回滾過去一年分類號 A47 和 A61 在A 股各中信一級行業上的專利個數分布 14圖 13:中國石化各專利分類數量占比柱狀圖 17圖 14:Improved_Tech_Mean_Rev_fmgb_5Y 因子 IC 序列 19圖 15:Improved_Tech_Mean_Rev_fmgb_5Y 因子多空收益與多頭超額收益(第一組) 19圖 6:Improved_Tech_Mean

5、_Rev_fmgb_5Y 與主要大類因子相關性 19表目錄表 1:A 分類部專利詳細二級大類含義表 5表 2:因子回測框架 8表 3:科技動量因子測試結果 9表 4:Tech_Momemtum_fmgb_5Y 因子收益表現 10表 5:兩種構造下的科技動量領先因子測試結果 11表 6:Tech_Mean_Rev_V2_fmgb_5Y 因子收益表現 13表 7:改進的各科技動量因子命名表 15表 8:改造后的科技動量因子與科技動量領先因子測試結果 15表 9:改進的各科技動量因子命名表 18表 10:結合專利關聯度的科技動量因子與科技動量領先因子測試結果 18表 11:結合專利關聯度的科技動量因

6、子與科技動量領先因子收益表現 18表 12:中性化的因子列表 20表 10:中性化后結合專利關聯度的科技動量因子與科技動量領先因子測試結果 20表 11:中性化后結合專利關聯度的科技動量因子與科技動量領先因子收益表現 20在報告專利數據中有哪些 Alpha?多因子系列報告之三十一中,我們利用從專利數據庫中直接提取的專利信息,構造了有效的專利因子。但報告構造的專利因子只停留在每個公司自身的專利水平和研發水平,沒有考慮到相同研發水平公司間存在的股價關聯性,以及不同分類的專利產生的收益溢出效應。不同公司的科研成果并不是獨立的,一項科技進步的溢出效應將會影響科技關聯度較高的一系列公司,這種效應將影響相

7、關公司的基本面,并最終反應在股價中。本篇報告將繼續在專利數據基礎上,考慮相同專利屬性公司間的股價聯動關系,以及不同分類專利帶來的不同收益溢出效應,從更多的角度構造和挖掘專利數據中包含的具有選股能力的因子。1、從專利數據到科技動量、專利IPC 分類情況概述在報告專利數據中有哪些 Alpha?多因子系列報告之三十一中,我們通過每個公司在過去一段時間的專利 IPC 號(國際專利分類號)總數,構建了專利 IPC 號總數專利因子,相比于其他專利因子,專利 IPC 號總數專利因子的 IC、IC_IR 等指標也有較好的表現,說明專利數據中的 IPC 號能夠為投資者提供一個較為有效的角度對專利數據進行分析。I

8、PC 號是唯一國際通用的專利文獻分類和檢索工具,得到國際認證的專利將獲得 IPC 號,一個專利的技術內容,往往涉及好幾個分類的內容,因而可能有多個分類號。國際專利分類系統按照技術主題設立類目,把整個技術領域分為 5 個不同等級,在第一等級中一共有 8 種不同的分類部:A(人類必需品)、B(作業、運輸)、C(化學、冶金)、D(紡織、造紙)、E(固定建筑物)、F(機械工程、照明、加熱、武器、爆破)、G(物理)、H(電學)。在每個一級分類部下,又對應著不同的二級分類大類,一共有 145 個二級分類大類。以 A 分類部下的二級分類大類為例,下表給出了 A 分類部下的二級分類大類情況。表 1:A 分類部

9、專利詳細二級大類含義表IPC 二級分類號含義A01 A21 A22 A23 A24 A41 A42 A43 A44 A45 A46A47農業;林業;畜牧業;狩獵;誘捕;捕魚 焙烤;制作或處理面團的設備;焙烤用面團屠宰;肉品處理;家禽或魚的加工其他類不包含的食品或食料;及其處理煙草;雪茄煙;紙煙;吸煙者用品服裝 帽類制品鞋類服飾縫紉用品;珠寶手攜物品或旅行品 刷類制品家具;家庭用的物品或設備;咖啡磨;香料磨;一般吸塵器A61A62 A99醫學或獸醫學;衛生學救生;消防本部其他類目中不包括的技術主題資料來源:國家知識產權局, 圖 1 給出了 2010 年以來,所有 A 股上市公司每一年 IPC 一

10、級分類部的專利數量統計情況,每一個一級分類部的專利數量都在逐年遞增,其中 B 分類部和 F 分類部的專利數量多于其他分類部,而 A 分類部、D 分類部和 E分類部的專利數量較少。圖 1:A 股上市公司分年度 IPC 一級分類部數量統計圖A B C D E F G H2019201820172016201520142013201220112010050000100000150000200000250000300000350000400000450000500000資料來源:通聯數據, ,注:截至 2019 年 12 月 31 日 單位:例圖 2 給出了 2010 年以來,A 股各行業 IPC 一

11、級分類部的專利數量統計情況,每一行業在不同類別的專利上都有所側重,但專利總量較多的幾個行業在每一個專利類別上都有所涉獵。圖 2:A 股各中信一級行業 IPC 一級分類部數量堆積柱狀圖ABCDEFGH500000450000400000350000300000250000200000150000100000500000資料來源:通聯數據, ,注:截至 2019 年 12 月 31 日左軸單位:例一個專利可以映射到同一個 IPC 類別下的多個維度,一個專利的技術內容,往往涉及好幾個分類的內容,因而可能有多個分類號,圖 3 給出了單個專利二級分類大類的平均數量變化情況,可以看到,單個專利擁有的二級分

12、類大類的平均數量在 1.4 到 1.9 之間波動,近年來,單個專利的平均二級分類大類數量有所增加,這表明中國 A 股上市公司的專利質量在逐年增加,專利的實用性逐漸提高。圖 3:A 股上市公司單個專利平均二級分類大類平均數量21.91.81.71.61.51.41.31.22010-062011-062012-062013-062014-062015-062016-062017-062018-062019-06資料來源:通聯數據, ,注:2010-01-01 至 2019-12-31、科技動量因子現如今,公司業務線非常復雜,很多時候兩家公司的主營業務收入來源的區別,導致公司股價的關聯性難以被發掘

13、。從產品研發和創新領域來看,兩個致力于科技研發和創新的公司有著更深層次的關聯,Lee et al. (2019)給出了擁有強技術關聯性的公司回報具有可預測性的證據。具體來說,一個具有一定研發實力和專利實力的上市公司的股票回報,相對于與其擁有類似專利水平公司的股價回報,表現出了可預期的滯后性。一個核心技術公司的同類公司獲得了更高(更低)的回報,那么它在接下來的幾個月里也會獲得更高(更低)的回報。科技關聯度可以找出被行業以及上下游產業鏈忽視的公司之間的關系。為了研究公司之間是否擁有類似的專利水平,我們首先需要構造公司之間的科技關聯度。從本篇報告的上一部分可以看出,IPC 分類號的數量和分布,能夠用

14、來表現一個公司專利覆蓋度和專利研發實力。我們利用 IPC 二級分類大類來構建公司之間的科技關聯度,參照相關系數的計算方法,科技關聯度的定義如下:, =(, )1/2( )1/2, ,其中:,表示公司在時刻統計得到的,在過去一段時間各個分類上的專利個數,是一個維數為1 145的向量,表示公司和公司在時刻的科技關聯度上述公式表示了兩個公司在不同專利類別上的關聯度,兩個公司的科技關聯度越高,表示它們擁有類似的專利研發水平,它們股價的相關性也將更為顯著。基于此,我們利用科技關聯度和公司股價的收益率構建了科技動量因子:_,= , , ,其中:,表示公司在時刻過去一個月的股票收益率.簡單來說,我們賦予除公

15、司以外的每個 A 股的股價收益率不同的權重,與公司擁有更高科技關聯度的公司被賦予更高的權重,并求和,得到了公司在時刻的科技動量因子。通過對專利數據庫的觀察,我們發現,外觀設計類別的專利不具有和其他類別專利相同的IPC 分類號,這是因為外觀設計在國外屬于設計(design)范疇,因此采用另外的分類方式。所以,和我們第一篇報告中專利因子的構造方式相同,我們通過滾動統計不同時間長度上的專利數量來構建科技關聯度,分別在不同的專利類別上構造科技動量因子。各因子的命名方式為 Tech_Momentum_xx_yy:xx 表示專利類型:all 表示所有專利類型,fmgb 表示發明公布,fmsq表示發明授權,

16、wgsj 表示外觀設計;yy 表示統計時長:1Y 表示一年,3Y 表示三年,5Y 表示五年。1.2.1、科技動量因子:收益顯著性較弱在測試科技動量因子的預測能力等有效性指標時,考慮到因子的覆蓋度和行業偏離度等因素,本文后續所有的因子測試的測試框架將沿用報告專利數據中有哪些Alpha?多因子系列報告之三十一中相同的測試框架:表 2:因子回測框架專利因子回測框架回測時間區間2011 年 1 月 1 日至 2020 年 3 月 31 日回測股票池屬于機械、電子、電力設備及新能源、通信、基礎化工、家電、鋼鐵、計算機、汽車、建材、醫藥、建筑、有色金屬、輕工制造、國防軍工、石油石化 16 個一級行業的股票

17、(剔除選股日 ST/PT 股票;剔除上市不滿一年的股票;剔除選股日由于停牌等因素無法買入的股票)調倉頻率月度調倉IC 指標IC 為行業和市值中性化后,與下一期股票收益率的秩相關系數分組方式每月最后一個交易日收盤后,根據本月所有未被剔除的股票數據計算因子值,行業內根據因子值從小到大排序將股票等分為 5 組,分別計算每組股票的歷史回測收益及多空組合收益。多頭超額收益多頭超額收益為行業內分組后,因子值最低的第一組的收益(等權加權)相對基準的超額收益,基準為因子測試股票池的等權組合。交易費率因子測試階段暫不考慮交易費用資料來源: 表 3:科技動量因子測試結果由下表可見,本節構建的科技動量 Tech_M

18、omentum 因子在收益預測能力和穩定性上的表現均較為一般。值得關注的一點是,科技動量因子有兩個特征與前一報告中的結論略有差異:基于發明公布類型專利的科技動量因子表現相對較好;時間維度上,基于滾動 5 年的專利數據的因子表現較好,且時間維度上的單調性較好。由于科技動量因子中,關鍵指標是科技關聯度指標,,需要較為完整和專利數據覆蓋才能更精確的衡量不同公司之間的專利關聯度,因此時間維度上需要更久的數據,同時發明公布類型的專利數量也是顯著高于其他類型專利的。IC meanIC positive perIC stdIRTech_Momemtum_all_1Y1.49%55%10.13%0.15Tec

19、h_Momemtum_all_3Y1.66%56%10.83%0.15Tech_Momemtum_all_5Y1.71%58%11.25%0.15Tech_Momemtum_fmgb_1Y1.17%50%9.92%0.12Tech_Momemtum_fmgb_3Y1.79%58%10.20%0.18Tech_Momemtum_fmgb_5Y1.84%58%10.34%0.18Tech_Momemtum_fmsq_1Y0.90%50%9.15%0.10Tech_Momemtum_fmsq_3Y1.11%59%9.49%0.12Tech_Momemtum_fmsq_5Y1.44%57%9.74%0

20、.15Tech_Momemtum_syxx_1Y0.46%55%8.33%0.06Tech_Momemtum_syxx_3Y1.23%55%9.57%0.13Tech_Momemtum_syxx_5Y1.45%56%9.80%0.15資料來源:通聯數據, ,注:2011-01-01 至 2020-03-31我 們 以 IC_IR 最 高 的 5 年 期 發 明 公 布 科 技 動 量 因 子Tech_Momemtum_fmgb_5Y 為例,其歷史 IC 時間序列上的穩定性相對較弱。圖 4:Tech_Momemtum_fmgb_5Y 因子 IC 序列圖 5:Tech_Momemtum_fmgb_

21、5Y 因子多頭超額收益(第一組)1.81.61.41.210.80.60.30.20.10-0.1-0.201/201106/201111/201104/201209/201202/201307/201312/201305/201410/201403/201508/201501/201606/201611/201604/201709/201702/201807/201812/201805/201910/2019-0.3資料來源: 資料來源: ,注:基準為股票池等權(詳見表 2Tech_Momemtum_fmgb_5Y 因子的多空年化收益為 4.80%,多空收益夏普比為 1.02,多頭年化超額收

22、益為 4.70%。因子選股收益穩定性較為一般。表 4:Tech_Momemtum_fmgb_5Y 因子收益表現Tech_Momemtum_fmgb_5Y多空年化收益4.80%多空收益夏普比1.02多空收益最大回撤-8.3%多頭年化超額收益4.70%多頭收益信息比0.87多頭收益最大回撤-37%資料來源:通聯數據, ,注:2011-01-01 至 2020-03-31考慮到Tech_Momemtum_fmgb_5Y 因子中使用到了相關股票過去一個月的收益率,我們這里考察該因子與包括動量因子在內的主要大類因子之間 IC 序列的相關性。由下圖可見 Tech_Momemtum_fmgb_5Y 因子與大

23、部分因子的相關性極低,僅與 1 個月動量因子有微弱的相關性,相關性為 0.21。圖 6:Tech_Momemtum_fmgb_5Y 與主要大類因子相關性OP_Q_YOYMomentum_1M Momentum_24M Momentum_12MROE_TTM STD_1M TURNOVER_1MFC_MCBP_LRLn_MCVSTD_1M-0.2-0.100.10.20.30.4資料來源:通聯數據, ,注:2011-01-01 至 2020-03-31、科技動量領先因子在得到公司間的科技關聯度后,除了可以從“動量”的角度來構建因子,我們也同樣考慮從“收益領先性” 或者也可以理解為“均值回復” 的

24、角度來構造因子。科技動量領先因子的構造方式有兩種,分別為:_1= , , , ,_2,= (, , ,) ,第一種構造方法中,我們在科技動量因子的基礎上,直接減去公司自身的股票收益率,差值大小表示公司股價與全市場相似股票之間是否存在明顯的滯后關系。第二種構造方法中,在加權時每次都減去公司本身在時刻過去一個月的股票收益率,使得每一次加權時都比較公司股價是否與專利水平相似公司存在明顯的滯后關系。這兩種構造方法的原理都是,若差值越大,表示專利水平相似公司的股價收益率高于公司,公司股價仍然具有上漲空間,若這一差值越小甚至為負,表示公司的收益已經高于相似公司,股價不再具有上漲空間。但第一種方法存在明顯弊

25、端,這一構造方法可能會導致構造的科技動量領先因子與傳統動量因子存在明顯的負相關關系,我們將通過具體的回測結果來對兩種構造方法進行比對。我們同樣通過滾動統計不同時間長度上的專利數量來構建科技關聯度,分別在不同的專利類別上構造科技動量領先因子。各因子的命名方式為 Tech_Mean_Rev_V1_ xx_yy 和 Tech_Mean_Rev_V2_ xx_yy:xx 表示專利類型:all 表示所有專利類型,fmgb 表示發明公布,fmsq表示發明授權,wgsj 表示外觀設計;yy 表示統計時長:1Y 表示一年,3Y 表示三年,5Y 表示五年。1.3.1、兩種構造方式因子表現差異明顯1.2 節中我們

26、發現當涉及到科技關聯度指標時,使用滾動 5 年的發明公布專利數量所構造的因子的表現相對較好,因此后文中我們將主要展示該類因子的相關改進因子的測試結果。表 5:兩種構造下的科技動量領先因子測試結果IC meanIC positive perIC stdIRTech_Mean_Rev_V1_fmgb_5Y4.10%64%9.77%0.42Tech_Mean_Rev_V2_fmgb_5Y2.41%61%9.64%0.25資料來源:通聯數據, ,注:2011-01-01 至 2020-03-31僅從因子 IC 和 IC_IR 指標來看,Tech_Mean_Rev_V1_fmgb_5Y 因子的預測能力表

27、現更出色,但下圖因子相關性測試的結果中表明,該因子與一個月動量因子(Momentum_1M)之間存在極高的相關性,相關性達到-0.68。圖 7:Tech_Mean_Rev_V1_fmgb_5Y 因子相關性圖 8:Tech_Mean_Rev_V2_fmgb_5Y 因子相關性OP_Q_YOYMomentum_1M Momentum_24M Momentum_12MROE_TTM STD_1M TURNOVER_1MFC_MCBP_LRLn_MC VSTD_1MOP_Q_YOYMomentum_1M Momentum_24M Momentum_12MROE_TTM STD_1M TURNOVER_1

28、MFC_MC BP_LRLn_MC VSTD_1M-0.8-0.6-0.4-0.200.20.4資料來源:通聯數據, ,注:2011-01-01 至2020-03-31-0.4-0.3-0.2-0.100.10.20.30.4資料來源:通聯數據, ,注:2011-01-01 至2020-03-31與1 個月動量因子之間的高相關性表明Tech_Mean_Rev_V1_fmgb_5Y因子的收益大部分是由因子計算公式:_1= , , , ,中減號右邊的,貢獻的,因子收益大部分由股票的反轉效應提供,并無法很好的體現科技動量領先指標所希望體現的信息。圖 9:Tech_Momemtum_fmgb_5Y、T

29、ech_Mean_Rev_V1_fmgb_5Y 和 Tech_Mean_Rev_V2_fmgb_5Y 因子值分布比較資料來源:通聯數據, ,注:2020-02-28從上圖中可以看出,Tech_Mean_Rev_V1_fmgb_5Y 的構造方式明顯改變了 Tech_Momemtum_fmgb_5Y 因子的量級,使得因子值更加接近于 1 個月動量因子的量級,因子的分布情況也與科技動量因子有很大差異。而 Tech_Mean_Rev_V2_fmgb_5Y 在保持因子量級不變的前提下結合均值回復效應,因子的分布情況和科技動量因子更加接近。我 們 以 IC_IR 最 高 的 5 年 期 發 明 公 布 科

30、 技 動 量 因 子 Tech_Mean_Rev_V2_fmgb_5Y 為例,其歷史 IC 時間序列上的穩定性相對較好,月度勝率由 Tech_Momemtum_fmgb_5Y 的 58%提高至了 61%。圖 10:Tech_Mean_Rev_V2_fmgb_5Y 因子 IC 序列 圖 11:Tech_Mean_Rev_V2_fmgb_5Y 因子多頭超額收益(第一組)2.52.32.11.91.71.51.31.10.90.70.50.30.250.20.150.10.050-0.05-0.1-0.15-0.201/201106/201111/201104/201209/201202/20130

31、7/201312/201305/201410/201403/201508/201501/201606/201611/201604/201709/201702/201807/201812/201805/201910/2019-0.25資料來源: 資料來源: ,注:基準為股票池等權(詳見表 2Tech_Mean_Rev_V2_fmgb_5Y 因子的多空年化收益為 6.00%,多空收益夏普比為 1.41,多頭年化超額收益為 8.50%,多頭收益的信息比為 1.64,相較于原始的科技動量因子Tech_Momemtum_fmgb_5Y 各項表現均有顯著提升。表 6:Tech_Mean_Rev_V2_fm

32、gb_5Y 因子收益表現Tech_Momemtum_fmgb_5YTech_Mean_Rev_V2_fmgb_5Y多空年化收益4.80%6.00%多空收益夏普比1.021.41多空收益最大回撤-8.3%-3.90%多頭年化超額收益4.70%8.50%多頭收益信息比0.871.64多頭收益最大回撤-37%-9.22%資料來源:通聯數據, ,注:2011-01-01 至 2020-03-31綜合上述結論,Tech_Mean_Rev_V2_fmgb_5Y 因子在構造上更為合理,且相比原始科技動量因子有了較為顯著的改善效果,因此,我們將科技動量 領先因子的定義方式確定為 Tech_Mean_Rev_V

33、2 的定義方式。后 文 中 的 科 技 動 量 領 先 因 子 Tech_Mean_Rev 均 默 認 為 Tech_Mean_Rev_V2 的構造方式。2、科技動量因子的改進、利用技術行業集中度:改進效果一般在科技動量因子和科技動量領先因子的構造過程中,我們默認每個公司的股價變化相比于同類型的公司是滯后的,但在實際中這一滯后現象并不會在每個公司的股票上完全出現,這會給我們構造的因子帶來一定誤差。雖然通過均值回復的方式我們減小了這一誤差,但從回測結果中可以看出,因子的穩定性依然有待提升。我們將從技術行業集中度(technology-specificity)的角度,對每個公司的信息滯后水平進行評

34、價打分,構建基于技術行業集中度的科技動量因子和科技動量領先因子。Lee et al. (2019)給出了技術行業集中度影響股價滯后水平的兩個解釋:一種解釋是,當核心公司的技術行業集中度更高時,科技公司的回報只是包含了更多關于公司估值的信息。另一種解釋是,因為重點科技公司的行業集中度很高,投資者更有可能低估同類科技公司回報率的全部價值含意。所以高技術行業集中度會導致較慢的或不太完整的信息傳遞,使得公司更有可能發生收益的滯后性,使得科技動量因子更具有可信度。在構建技術行業集中度時,我們首先構建不同專利類別的行業集中度。我們統計得到不同二級分類專利號過去一年在不同行業上的分布情況,如圖 12 給出了

35、在時間點 2020 年 3 月 31 日,回滾過去一年統計得到的分類號 A47和 A61 在各行業上的專利個數分布情況,縱坐標軸采用對數刻度。從圖中可以看出,由于這兩個分類的專利都屬于人類必需品專利分類部,所以在各行業上的分布情況相近,但依然有所區別,更多的行業擁有分類號為 A61 的專利。圖 12:回滾過去一年分類號 A47 和 A61 在 A 股各中信一級行業上的專利個數分布100001000100101A47 A61資料來源:通聯數據, ,注:2020-03-31定義每個分類號的專利在各個行業上的專利個數的標準差,為全市場每個類別專利的專利集中度。對于每一個公司,我們分別計算公司在過去一

36、年的所有類型專利的數量,并與專利集中度進行加權求和,就可以計算出一個公司在過去一年的技術行 業集中度_,。公司的技術行業集中度越高,表明這一公司越有可能發生信息滯后現象,為了使得不同公司的技術行業集中度權重加和為 1,我們對技術行業集中度 進行單位化,定義公司在時刻的技術行業集中度權重為:_,= _, . _,我們分別通過以下方式,構造基于技術行業集中度的科技動量因子和科技動量領先因子:_= , , _, ,= (, , ,) _ ,因子含義命名方式基于技術行業集中度的科技動量因子Tech_Spec_Momentum_Factor_xx_yy基于技術行業集中度的科技動量領先因子Tech_Spe

37、c_Mean_Rev_Factor_xx_yy基于技術行業集中度的各因子的命名方式,如下表:表 7:改進的各科技動量因子命名表,資料來源: xx 表示專利類型:all 表示所有專利類型,fmgb 表示發明公布,fmsq表示發明授權,wgsj 表示外觀設計;yy 表示統計時長:1Y 表示一年,3Y 表示三年,5Y 表示五年。仍然以 5 年期發明公布專利數據構造的因子為例,改造后的基于技術行業集中度的科技動量因子和科技動量領先因子測試結果如下:表 8:改造后的科技動量因子與科技動量領先因子測試結果IC meanIC positive perIC stdIRTech_Momentum_fmgb_5Y

38、1.84%58%10.34%0.18Tech_Spec_Momentum_fmgb_5Y1.31%59%9.92%0.13Tech_Mean_Rev_fmgb_5Y2.41%61%9.64%0.25Tech_Spec_Mean_Rev_fmgb_5Y2.02%62%9.12%0.22資料來源:通聯數據, ,注:2011-01-01 至 2020-03-31結合技術行業集中度的科技動量因子和科技動量領先因子在IC 和IC_IR的表現上出現下滑,因子勝率和穩定性上則有一定程度的提高。整體上看, Tech_spec 因子的改進效果較為一般。、結合專利關聯度的改進方法在構建科技關聯度時,我們認為不同分

39、類的專利之間是獨立的,但實際上不同的專利類別,特別是同一分類部下的專利類別之間有可能也存在著關聯。為了在構建科技關聯度時考慮不同專利類別間的關聯,Nguyen et al. (2020)提供了一種新的構建科技關聯度的方法。在每個時刻,除了可以構造科技關聯度,我們還可以用相同的方法構建專利關聯度:, =(, )1/2( )1/2,其中,,表示分類號在時刻統計得到的,在過去一段時間各個 A 股上的專利個數,是一個維數為1 上市公司數量的向量。,表示分類號和分類號在時刻的專利關聯度。在得到專利關聯度后,我們通過以下的公式來構建改進的科技關聯度:, _, =( )1/2(, )1/2其中:, ,是由,

40、構成的維數為145 145的專利關聯度矩陣._,為基于專利關聯度計算得到的公司和公司在時刻的科技關聯度。上述公式的直觀解釋是,在計算兩個不同公司之間的科技關聯時,我們考慮不同類別的專利之間也有相互影響的可能。上述公式可以改寫為:(, 1/2) (1/2 )_, =( )1/2( )1/2, ,其中,, 1/2同樣為一個維數為1 145的向量,每一個位置上的元素除了公司本身的專利數量,還加上了由公司其他專利類型數量帶來的影響。圖 13:中國石化各專利分類數量占比柱狀圖0.25中國石化原始專利數量占比中國石化考慮專利相關性后的專利數量占比0.20.150.10.050010203040506070

41、8090100110120資料來源:通聯數據, ,注:2020-03-31,橫軸為不同專利二級分類上圖給出了在 2020 年 3 月 31 日統計得到的,中國石化過去 5 年各二級分類專利單位化數量情況。可以看到,原始的專利數量更為集中,考慮專利分類間的相關性之后,專利數量更加分散,與原始數量較多專利相關性比較大的幾個分類專利,數量有所提升。需要說明的是,如果不同類別的專利之間相互獨立,那么是一個單位矩陣,_,便等于,。在計算得到基于專利關聯度的科技關聯度后,我們便可以對本篇報告第一部分和第二部分構造的因子進行改進,具體的計算公式如下:_,= _, , _,_,= (_, , ,) _,_=

42、_, , _ _,_,= (_, , ,) _ _,改進的各科技動量因子的命名方式如下表:,因子含義命名方式表 9:改進的各科技動量因子命名表改進的科技動量因子Improved_Tech_Momentum_Factor_xx_yy改進的科技動量領先因子Improved_Tech_Mean_Rev_Factor_xx_yy改進的基于技術行業集中度的科技動量因子改進的基于技術行業集中度的科技動量領先因子資料來源: Improved_Tech_Spec_Momentum_Factor_xx_yy Improved_Tech_Spec_Mean_Rev_Factor_xx_yyxx 表示專利類型:al

43、l 表示所有專利類型,fmgb 表示發明公布,fmsq表示發明授權,wgsj 表示外觀設計;yy 表示統計時長:1Y 表示一年,3Y 表示三年,5Y 表示五年。、結合專利關聯度的科技動量因子:有顯著改善仍然以 5 年期發明公布專利數據構造的因子為例,結合專利關聯度的科技動量因子和科技動量領先因子測試結果如下:表 10:結合專利關聯度的科技動量因子與科技動量領先因子測試結果IC meanIC positive perIC stdIRTech_Momentum_fmgb_5Y1.84%58%10.34%0.18Improved_Tech_Momentum_fmgb_5Y2.12%57%11.92%

44、0.18Tech_Spec_Momentum_fmgb_5Y1.31%59%9.92%0.13Improved_Tech_Spec_Momentum_fmgb_5Y1.72%60%12.42%0.13Tech_Mean_Rev_fmgb_5Y2.41%61%9.64%0.25Improved_Tech_Mean_Rev_fmgb_5Y2.55%59%11.22%0.23Tech_Spec_Mean_Rev_fmgb_5Y2.02%62%9.12%0.22Improved_Tech_Spec_Mean_Rev_fmgb_5Y3.18%61%12.12%0.26資料來源:通聯數據, ,注:2011

45、-01-01 至 2020-03-31Improved_Tech_Spec_Mean_Rev_fmgb_5Y 因子 IC 均值達到 3.18%, IC_IR 為 0.26,是上述幾種改造方式中表現最佳的。同時上述幾種改造方式下的因子的多空收益和多頭收益表現如下表所示:表 11:結合專利關聯度的科技動量因子與科技動量領先因子收益表現Improved_Tech_Moment Improved_Tech_Spec_M Improved_Tech_Mean_R Improved_Tech_Spec_Mum_fmgb_5Yomentum_fmgb_5Yev_fmgb_5Yean_Rev_fmgb_5Y多

46、空年化收益5.70%4.33%7.50%10.21%多空收益夏普比1.200.981.671.12多空收益最大回撤-9.21%-12.35%-6.12%-13.90%多頭年化超額收益6.50%5.34%10.61%9.80%多頭收益信息比1.231.022.111.62多頭收益最大回撤-21.02%-19.00%-9.01%-12.22%資料來源:通聯數據, ,注:2011-01-01 至 2020-03-31Improved_Tech_Mean_Rev_fmgb_5Y 因子分組表現優異,其多空年化收益為 7.50%,多空收益夏普比為 1.67,同時因子多頭組合年化超額收益為10.61%,多頭

47、組合信息比 2.11,因子收益穩定性較強,是上述幾種改造方式中收益表現最為出色的因子。因此下文我們主要展開分析 Improved_Tech_Mean_Rev_fmgb_5Y 因子的各方面表現以及與其他大類因子相關性上的表現:具體分析結合專利關聯度的 5 年期發明公布科技動量領先因子(Improved_Tech_Mean_Rev_fmgb_5Y)的預測能力和多頭收益能力。因子的預測能力較為穩定,從 IC 序列來看,因子 2014 年至今的 IC 表現較為穩定。圖 14:Improved_Tech_Mean_Rev_fmgb_5Y 因子 IC序列圖 15:Improved_Tech_Mean_Re

48、v_fmgb_5Y 因子多空收益與多頭超額收益(第一組) Long_Shorttop_relative0.330.22.50.120-0.1-0.21.510.51/1/20116/1/201111/1/20114/1/20129/1/20122/1/20137/1/201312/1/20135/1/201410/1/20143/1/20158/1/20151/1/20166/1/201611/1/20164/1/20179/1/20172/1/20187/1/201812/1/20185/1/201910/1/2019-0.302011201220132014201520162017201820192020資料來源: 資料來源: ,注:基準為股票池等權(詳見表 2結 合 專 利 關 聯 度 的 5 年 期 發 明 公 布 科 技 動 量 領 先 因 子(Improved_Tech_Mean_Rev_fmgb_5Y)的多空收益較為穩定,多空收益的夏普比高達 1.67。圖 16:Improved_Tech_Mean_Rev_fmgb_5Y 與主要大類因子相關性OP_Q_Y

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論