金融科技研究中常见的 80 个工具变量整理
金融科技研究中常见的 80 个工具变量整理
在金融科技相关实证研究中,内生性问题是一个绕不开的核心问题。由于金融科技发展水平可能同时受到地区经济基础、企业特征、金融资源配置、政策环境等因素影响,单纯使用普通回归往往难以准确识别其因果效应。
为了解决遗漏变量、反向因果和测量误差等问题,许多文献采用了工具变量法。一个合适的工具变量通常需要满足两个基本条件:一是与核心解释变量具有较强相关性;二是尽可能不直接影响被解释变量,即满足外生性要求。
本文根据 CSSCI 期刊文本中与“金融科技”相关的研究,整理了 80 个常见工具变量,供大家在论文选题、模型设计和实证分析时参考。
需要说明的是,工具变量不能机械套用,具体是否适合某一研究主题,还需要结合研究对象、数据层级、理论机制和有效性检验进行判断。
一、常见工具变量类型
从已有文献来看,金融科技研究中的工具变量大致可以分为以下几类:
1. 滞后项类工具变量
这类工具变量使用金融科技水平的一期或多期滞后值,逻辑是过去的金融科技发展会影响当前金融科技水平,但对当前结果变量的直接影响相对较弱。
例如:
- 金融科技水平滞后一期
- 地区金融科技发展水平滞后一期
- 金融科技滞后两期项
- 金融科技一阶差分项
2. 地理距离类工具变量
金融科技在中国的发展具有明显的空间集聚特征,杭州、北京、深圳、上海等城市常被视为金融科技或数字经济发展的重要中心。因此,不少研究使用样本地区到这些城市的距离作为工具变量。
例如:
- 企业所在地到杭州的球面距离
- 银行总部所在城市到杭州的距离
- 家庭所在城市到杭州的距离
- 省会城市到上海、杭州的距离
- 城市到北京、杭州、深圳的平均距离
3. 邻近地区金融科技水平类工具变量
这类变量利用空间溢出效应构造工具变量。基本逻辑是,邻近省份或城市的金融科技发展会影响本地区金融科技水平,但一般不会直接影响本地区企业或银行的微观结果。
例如:
- 接壤省份金融科技发展水平均值
- 邻近城市金融科技水平
- 接壤城市金融科技发展水平均值
- 同省内其他地级市金融科技指数均值
- GDP 最接近的其他城市金融科技水平均值
4. 互联网与通信基础设施类工具变量
金融科技的发展高度依赖互联网、移动通信、宽带接入等基础设施。因此,互联网普及率、移动电话用户数、宽带接入数等变量常被用于刻画金融科技发展的基础条件。
例如:
- 互联网普及率
- 互联网覆盖率
- 移动电话用户数
- 宽带用户接入数
- 家庭移动电话覆盖率
- 归一化处理后的互联网接入用户数
5. 历史基础设施与 Bartik 工具变量
部分文献使用历史邮电基础设施与全国金融科技发展趋势构造交互项,形成 Bartik 类工具变量。这类变量的优势在于利用历史差异与外部冲击相结合,增强识别的合理性。
例如:
- 1984 年人均邮电业务量 × 金融科技发展水平
- 1984 年固定电话数 × 全国互联网投资额
- 1984 年邮电业务量 × 全国互联网投资额
- 金融科技发展的 Bartik 工具变量
6. 地区教育、人才与信息行业基础类工具变量
金融科技发展与地区教育水平、信息技术人才储备和数字产业基础有关。因此,一些研究也使用教育、工资、信息行业从业人员比例等变量作为工具变量。
例如:
- 高等教育人数比例
- 受教育年限
- 高考招生人数
- 信息行业从业人员比重
- 银行总部所在城市人均工资水平
二、金融科技研究中 80 个工具变量汇总
| 序号 | 工具变量 | 参考文献 |
|---|---|---|
| 1 | 各省 1984 年人均邮电业务量与金融科技的交互项 | 空间视角下金融科技赋能绿色金融发展研究 |
| 2 | 接壤省份金融科技发展水平的均值 | 金融科技、影子银行与中小企业融资成本 |
| 3 | 金融科技水平的滞后一期 | 金融科技促进了区域金融发展与金融服务收敛吗? |
| 4 | 线上交易活跃度 | 金融科技合作与中小银行贷款市场竞争力 |
| 5 | 企业所在地到杭州的球面距离;金融科技发展的 Bartik 工具变量 | 金融科技、市场化程度与企业数字化转型 |
| 6 | 金融科技的滞后一期 | 金融科技、OFDI 与经济高质量发展——基于“双循环”相互促进的视角 |
| 7 | 金融科技技术层面指标 | 科技赋能提升金融支持实体经济效率了吗?——基于金融供求结构视角 |
| 8 | 邻省金融科技发展水平和高等教育人数比例 | 金融科技与企业非效率投资——基于内部创新能力与外部市场公平竞争的视角 |
| 9 | 全国金融科技公司数量增长率 × 滞后一期地区金融科技公司数量对数 | 金融科技与公共研发补贴政策的实施绩效 |
| 10 | 企业所在地区与浙江杭州的地理距离 | 金融科技赋能与结构性货币政策有效性——基于有调节的中介模型检验 |
| 11 | 企业所在地区移动电话用户数、互联网宽带接入数、金融科技水平滞后一期 | 金融科技创新会影响企业费用粘性吗? |
| 12 | 互联网普及率 | 金融科技、特许权价值与银行风险承担 |
| 13 | 银行总部所在城市互联网普及率和信息行业从业人员比重 | 金融科技发展对银行系统性风险的影响:理论机制与经验证据 |
| 14 | 互联网普及率 | 金融科技对绿色信贷的影响研究——来自商业银行的经验证据 |
| 15 | 接壤城市金融科技发展水平的均值 | 金融科技与中小微企业信贷获取——基于新三板企业的实证研究 |
| 16 | 互联网普及率、北大数字普惠金融指数二次项 | 金融科技与商业银行盈利:路径分析与实证检验 |
| 17 | 银行总部所在城市人均工资水平、银行总部所在城市与杭州的球面距离 | 金融科技、银行风险容忍度与流动性囤积 |
| 18 | 归一化处理后的互联网接入用户数 | 金融科技与影子银行业务——基于商业银行理财产品的实证检验 |
| 19 | 企业所在省份受教育年限和接壤省份金融科技发展水平 | 金融科技与非效率投资:结构特征、调节效应与监管效果 |
| 20 | 金融科技滞后一期、地区网点数量 | 金融科技、目标相容与小微信贷供给——基于区域问卷调查的微观银行证据 |
| 21 | 各省域城市移动电话用户数 | 金融科技与企业债务违约风险——影响效果、机制识别与异质性特征 |
| 22 | 互联网普及率 | 金融科技与商业银行竞争性负债 |
| 23 | 与样本支行距离最近的五大国有商业银行支行金融科技投入水平 | 金融科技投入与不良贷款风险缓释——来自北京 230 家银行支行的微观证据 |
| 24 | 1984 年末邮电局数量 × 省内其他城市金融科技水平均值 | 通往绿色创新之路:金融科技如何影响企业绿色创新 |
| 25 | 金融科技发展的 Bartik 工具变量 | 金融科技、收入不平等与多维相对贫困脆弱性 |
| 26 | 家庭移动电话覆盖率 | 金融科技与银行行为——基于流动性创造视角 |
| 27 | 与企业所在地级市 GDP 最接近的 3 个其他地级市金融科技指数均值 | 金融科技对中小企业创新的影响 |
| 28 | 滞后一期地区金融科技水平;全国互联网投资额与 1984 年固定电话数、邮电业务量的交互项 | 金融科技发展如何影响制造业服务化?——来自中国上市公司的经验证据 |
| 29 | 互联网普及率 | 非银行金融科技与上市公司借贷成本——竞争压力还是信息溢出? |
| 30 | 互联网普及率 | 金融科技、经济政策不确定性与企业金融化 |
| 31 | 互联网普及率 | 金融科技发展与企业员工收入——来自中国制造业上市公司的证据 |
| 32 | 省份所有接壤省份金融科技发展水平的均值 | 金融科技与创新投入——基于宏观市场化进程与微观企业透明度的双重视角 |
| 33 | 与企业所在城市接壤的地级市金融科技发展水平均值 | 银行金融科技与企业社会责任:挤出还是平衡? |
| 34 | 省会城市与北京、杭州、深圳的平均球面距离 × 当年全国金融科技发展水平均值 | 共同富裕目标下金融科技是否促进了乡村产业振兴 |
| 35 | 滞后一期地区金融科技发展水平 | 金融科技与银行信用风险:加剧还是降低 |
| 36 | Bartik 工具变量、各地级市金融科技公司数量 | 老龄化与家庭金融脆弱性——数字金融赋能下的应对路径研究 |
| 37 | 企业所在省内 GDP 最接近其注册地的 3 个其他地级市金融科技发展水平均值 | 银行金融科技、商业信用与民营企业出口——基于中国地级市面板数据的实证分析 |
| 38 | 过去 3 年银行与科技企业合作数量的平均水平 | 金融科技布局、银行信贷风险与经营绩效——来自商业银行与科技企业战略合作的证据 |
| 39 | 银行到杭州的距离和非银行金融科技普及率 | 商业银行数字化转型与劳动力需求:创造还是破坏? |
| 40 | 北京大学数字普惠金融指数滞后一期 | 金融科技如何促进共同富裕:理论机制和经验证据 |
| 41 | 互联网普及率 | 金融科技对我国产业结构优化与产业升级的影响 |
| 42 | 滞后一期地方金融科技区位熵及滞后一期金融科技中心溢出 | 金融科技如何影响绿色发展——基于动能转换和地理结构的经验证据 |
| 43 | 企业所在地区到杭州的球面距离 × 企业所在地区大型银行网点机构数 | 金融科技发展如何影响股票错误定价? |
| 44 | 省会城市距离上海市和杭州市的距离 | 金融科技与区域经济协调发展研究 |
| 45 | 滞后一期地区金融科技发展水平 | 金融科技与上市商业银行全要素生产率的研究——基于三阶段 SBM-DEA 模型 |
| 46 | 所在省份金融科技公司数量 | 基于文本分析的商业银行金融科技测度及赋能效果检验 |
| 47 | 所属城市其他地区金融科技水平 | 金融科技会影响农村金融机构贷款的信用结构吗 |
| 48 | 同一省份内去除本地级市后的其他地级市平均金融科技指数 | 金融科技与银行信贷配置效率——我国 143 家商业银行的经验证据 |
| 49 | 省内 GDP 最接近企业注册地的 3 个其他城市金融科技发展水平均值 | 金融科技与出口产品质量——来自中国上市公司的经验证据 |
| 50 | 金融科技相关百度新闻数量 | 金融科技的风险管理赋能:基于中国银行业的经验研究 |
| 51 | 相邻省份金融科技发展水平的均值 | 金融科技、经营风险与企业成长——“预防性储蓄”还是“投资效应”? |
| 52 | 相邻地区金融科技发展水平均值、滞后一期地区金融科技水平 | 金融科技发展是否削弱了国内市场分割?——来自消费品市场和资本品市场的证据 |
| 53 | 互联网普及率 | 金融科技、风险传染与银行业系统性风险 |
| 54 | 邻近城市金融科技水平 | 金融科技与制造业企业创新 |
| 55 | 互联网普及率 | 金融科技、中小银行小微企业信贷供给与风险 |
| 56 | 邻近城市金融科技水平 | 金融科技与商业银行经营绩效——基于风险承担的中介效应分析 |
| 57 | 滞后一期地区金融科技发展水平 | 金融科技、强环境规制与区域工业绿色发展 |
| 58 | 企业所在地级市到杭州的距离 | 金融科技有助于提升企业投资效率吗?——基于中国 A 股上市企业的实证研究 |
| 59 | 省内 GDP 最接近企业注册地的 3 个其他地级市金融科技发展速度均值 | 金融科技如何影响企业创新?——来自中国上市公司的证据 |
| 60 | 邻边城市金融科技进步的平均值 | 金融科技进步与农户机会型创业动机:抑制还是促进 |
| 61 | 高考招生人数 | 金融科技投入能够增进银行业绩吗?——基于不良贷款风险的视角 |
| 62 | 滞后一期地区金融科技发展水平 | 监管促进了金融科技的普惠效应吗? |
| 63 | 滞后一期地区金融科技发展水平 | 金融科技创新对实体经济增长的影响研究 |
| 64 | 家庭所处地级市与杭州市的球面距离 | 金融科技发展能提高农村家庭幸福感吗?——基于幸福经济学的研究视角 |
| 65 | 家庭所在城市到杭州距离自然对数的相反数 | 金融科技、家庭信贷约束与财富积累——基于中国家庭微观数据的实证研究 |
| 66 | 滞后一期地区金融科技发展水平 | 金融科技创新与城市环境污染 |
| 67 | 金融科技滞后两期项和一阶差分项 | 中国金融科技发展对资本市场信息效率的影响研究 |
| 68 | 互联网普及率 | 金融科技发展能抑制公司违规吗 |
| 69 | 金融科技和货币政策工具变量的交互项 | 金融科技与货币政策有效性:数量型与价格型工具的比较研究 |
| 70 | 互联网覆盖率、滞后一期金融科技指数 | 金融科技对中小企业成长的影响及机制分析 |
| 71 | 省级层面的金融科技指数 | 金融科技对制造业企业嵌入全球价值链的影响研究——基于世界银行调查数据的实证分析 |
| 72 | 互联网普及率 | 金融科技对商业银行经营绩效的影响:挤出效应还是技术溢出效应? |
| 73 | 省内 GDP 最接近企业注册地的 3 个其他地级市金融科技发展水平均值 | 金融科技与企业全要素生产率——“赋能”和信贷配给的视角 |
| 74 | 滞后一期地区金融科技发展水平 | 金融科技、市场势力与银行风险 |
| 75 | 滞后一期地区金融科技发展水平 | 金融科技、生产率悖论与银行盈利能力 |
| 76 | 互联网普及率 | 互联网金融、存款竞争与银行流动性创造 |
| 77 | 互联网普及率 | 金融科技与分析师市场 |
| 78 | 东中西部金融科技指数平均值 | 金融科技、资源配置效率与经济增长——基于中国金融科技门槛作用的分析 |
| 79 | 接壤城市金融科技发展水平平均值 | 金融科技与企业创新——新三板上市公司的证据 |
| 80 | 互联网普及率及其增长率 | 金融科技对传统银行行为的影响——基于互联网理财的视角 |
三、使用建议
在实证研究中使用这些工具变量时,建议重点关注以下几点:
第一,工具变量要与金融科技发展水平具有理论和经验上的相关性,不能只是形式上相关。
第二,要说明工具变量为什么不会直接影响被解释变量,而是主要通过金融科技这一核心解释变量发挥作用。
第三,在模型中应报告第一阶段回归结果、弱工具变量检验、过度识别检验等内容,以增强研究结论的可信度。
第四,不同研究对象适合的工具变量并不相同。例如,研究企业创新、银行风险、家庭金融、地区经济发展时,工具变量的选择逻辑需要分别论证。
总体来看,金融科技领域的工具变量主要围绕历史通信基础、互联网基础设施、地理距离、空间邻近效应、滞后项和 Bartik 工具变量展开。这些思路对后续研究具有较强的参考价值。
欢迎大家补充更多金融科技、数字金融、数字普惠金融相关研究中的工具变量做法。
