《中国工业经济》DID前沿:交错DID及异质性-稳健估计量,附Stata代码
《中国工业经济》2023年第1期有1篇关于交错DID及异质性—稳健DID的前沿DID论文,具体分享如下:
论文原文及其附件代码自行前往《中国工业经济》官网下学习:
http://ciejournal.ajcass.org/Magazine/Show?id=84863
参考文献
- 沈坤荣,林剑威,傅元海.网络基础设施建设、信息可得性与企业创新边界[J].中国工业经济.2023.1:57-75.
论文摘要 - 推进以网络基础设施为代表的数字基础设施建设,既是当前稳增长的重要举措,也为激发企业创新活力提供了“新基遇”。本文把研究维度进一步拓展到企业的异质性创新行为,探讨网络基础设施如何促进企业选择开发新技术,即拓展企业的创新边界。基于匹配整合的企业微观数据研究发现,网络基础设施建设显著促进了企业创新边界的拓展,在考虑内生性问题及各种稳健性检验后结论依然成立;同时,网络基础设施也促进了企业创新质量和创新效率的提升。从影响机制看,网络基础设施降低了市场信息不对称,提高了企业的市场信息可得性;网络基础设施使得企业获得更多的技术溢出,提高了技术信息可得性。并且,网络基础设施有利于技术溢出突破行政边界和地理距离的限制,相比于交通基础设施,能够更大程度地扩大企业获取技术溢出的范围。异质性分析发现,对于互联网化水平较高的企业和大型企业,以及处在技术变化较慢行业和企业分布密度较低的城市的企业,网络基础设施促进企业拓展创新边界的作用更强。本文的研究对如何利用新基建和数字技术赋能企业创新进而促进经济高质量发展具有重要启示。
论文关键词 - 网络基础设施;异质性创新;技术溢出;数字技术
实证背景 - 国务院于 2013 年发布《“宽带中国”战略及实施方案》,并 在 2014 年、2015 年和 2016 年先后认定了三批“宽带中国”试点城市。“宽带中国”战略有力推动了 网络基础设施的整体建设和升级。以“宽带中国”战略的推进作为一项准自然实验,检验了 “宽带中国”战略带来的网络基础设施水平的提升对企业拓展创新边界的影响,为研究结论提供了进一步的支撑证据。
使用数据 - 考虑到“宽带中国”战略在 2014 年开始才推出第一批试点,而本文所使用的主要数据为截止至 2013 年的中国工业企业数据,因此,与当前大多数使用“宽带中国”战略作为研究内容的文献 相同,本文在此使用的数据为上市公司数据。依照同样的做法,本文将专利数据与上市公司进行 匹配,并识别计算得到上市公司每年申请的新技术领域专利数量。为保证样本间的可比性,本文 剔除了金融业、保险业、房地产业、教育以及零售批发业等行业的样本,并剔除了 ST、*ST、PT 以及数据缺失的企业样本,样本期为 2009-2017 年。
模型构建 - 为检验“宽带中国”战略对企业拓展创新边界的影响,本文构建如下交错双重差分模型:
图片
变量介绍
- 其中,被解释变量 innov 同样表示衡量企业创新的相关指标,在此为企业新技术领域专利数 量加 1 后的对数值
- broadband 为根据“宽带中国”试点政策构造的指示变量,城市 c 在入选 为试点城市的当年及之后年份取值为 1,否则为 0。
- 参考已有相关研究,X 为企业和城市层面的控 制变量,与正文相同,既包括人均 GDP、产业结构、交通基础设施水平等城市层面的变量,也包 括企业规模、研发投入占比、股权结构、净资产收益率、资产负债率等表征企业特征的变量。
- 同 时,本文还控制了省份—年份的交互固定效应以及行业—年份的交互固定效应,以控制来自省份 层面和行业层面的影响因素对结果的干扰。同样,αi 为企业固定效应, λt 为年份固定效应。εit为随机误差项。
估计结果
图片
结果解释
附表 5 第(1)列首先报告了双向固定效应模型的估计结果,估计系数在 5%水平上显著为正, 意味着以“宽带中国”表示的网络基础设施建设显著促进了企业新领域专利数量的增加。
考虑到 处理效应异质性可能导致双向固定效应模型的估计产生潜在偏误,本文进一步根据 Callaway and Sant’ Anna(2021)的方法计算了“异质性—稳健”估计量,附表 5 第(2)列报告了以“未受处理组” 为控制组、以所有组所有时期为估计的组别—时期处理效应结果,尽管该方法会在计算过程中丢 失大量样本,但其估计结果显示,平均处理效应仍然显著为正。
完整命令
reghdfe patent_new did $control , absorb(id year#province year#sic_da) cluster(id)
(dropped 628 singleton observations)
(MWFE estimator converged in 13 iterations)
HDFE Linear regression Number of obs = 7,603
Absorbing 3 HDFE groups F( 11, 1603) = 1.84
Statistics robust to heteroskedasticity Prob > F = 0.0426
R-squared = 0.5847
Adj R-squared = 0.4157
Within R-sq. = 0.0047
Number of clusters (id) = 1,604 Root MSE = 0.7966
(Std. err. adjusted for 1,604 clusters in id)
------------------------------------------------------------------------------
| Robust
patent_new | Coefficient std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
did | .1298855 .0574112 2.26 0.024 .0172766 .2424945
gdp | -6.63e-07 8.19e-07 -0.81 0.418 -2.27e-06 9.43e-07
road | -.0061418 .0084765 -0.72 0.469 -.0227681 .0104844
highrail | .0020894 .0083714 0.25 0.803 -.0143306 .0185094
airport | -.1405601 .1627545 -0.86 0.388 -.459794 .1786739
rdspend | .004758 .0039467 1.21 0.228 -.0029833 .0124992
sharehold | .0666924 .3453499 0.19 0.847 -.6106923 .7440772
roa | -.0318536 .0285641 -1.12 0.265 -.0878805 .0241733
leverage | .0758731 .1598949 0.47 0.635 -.2377519 .3894981
size | .0830696 .0312542 2.66 0.008 .0217663 .144373
lnage | -.1029675 .0570214 -1.81 0.071 -.2148119 .0088769
_cons | .1044914 .6220923 0.17 0.867 -1.115708 1.324691
------------------------------------------------------------------------------
Absorbed degrees of freedom:
---------------------------------------------------------+
Absorbed FE | Categories - Redundant = Num. Coefs |
-----------------+---------------------------------------|
id | 1604 1604 0 *|
year#province | 234 0 234 |
year#sic_da | 360 9 351 |
---------------------------------------------------------+
* = FE nested within cluster; treated as redundant for DoF computation
. csdid patent_new $control , ivar(id) time(year) gvar(policy_year) method(dripw) agg(simple)
No never treated observations found. Using Not yet treated data
Panel is not balanced
Will use observations with Pair balanced (observed at t0 and t1)
......xx......xxxxxxxxxx
Difference-in-difference with Multiple Time Periods
Number of obs = 2,962
Outcome model : least squares
Treatment model: inverse probability
------------------------------------------------------------------------------
| Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
ATT | .3079178 .1794665 1.72 0.086 -.0438302 .6596657
------------------------------------------------------------------------------
Control: Not yet Treated
See Callaway and Sant'Anna (2021) for details.