一、传统征信数据的局限性
传统征信体系以银行信贷记录为核心,在评估企业与个人信用风险时存在几个明显局限:
- 覆盖盲区:大量中小企业和个体工商户缺乏银行信贷记录,传统征信无法有效评估其信用状况
- 滞后性:信贷违约记录通常在逾期数月后才进入征信系统,风险信号存在明显滞后
- 维度单一:主要反映金融负债情况,对经营纠纷、合同违约、劳动争议等非金融风险信号覆盖不足
- 更新频率低:部分征信数据更新周期较长,难以反映主体近期的风险变化
裁判文书数据作为替代数据(Alternative Data),能够有效弥补上述不足,为风控决策提供更立体的风险视角。
二、裁判文书数据作为替代数据的优势
相比传统征信数据,裁判文书数据在金融风控场景中具有以下独特优势:
- 覆盖面广:只要主体曾涉及诉讼,无论是否有银行信贷记录,均可在裁判文书中留下痕迹
- 信号丰富:涉诉类型(合同纠纷、劳动争议、知识产权)本身即是风险信号,不同案由对应不同的风险维度
- 时间跨度长:我们的数据覆盖1985年至2025年,可构建主体的长期司法风险画像
- 公开可查:数据来源于依法公开的法律文书,合规性有保障,可直接用于商业决策
三、具体应用场景
贷前审查
在信贷审批流程中,将借款人(企业或个人)的涉诉记录纳入评估维度。重点关注:近3年内涉诉次数、作为被告的案件比例、涉案金额规模、是否存在执行案件(执行案件通常意味着主动履行能力不足)。
实践中,涉诉频率高、执行案件多的主体,其贷款违约率显著高于无涉诉记录的主体,这一规律在多家金融机构的内部验证中得到印证。
企业尽调
在投融资、并购、供应商准入等场景中,对目标企业进行司法风险排查。除企业本身外,还应关注其法定代表人、实际控制人、主要股东的个人涉诉情况,以及关联企业的司法风险。
典型风险信号包括:短期内密集出现的合同纠纷(可能预示经营困难)、劳动争议案件激增(可能预示人员动荡)、知识产权纠纷(可能影响核心资产价值)。
供应链风险识别
对供应链上下游企业进行批量司法风险扫描,识别高风险节点。当核心供应商出现大量涉诉记录时,可提前预警供应中断风险,为采购策略调整提供依据。
风控模型特征工程
将裁判文书数据转化为机器学习模型的输入特征,常用特征包括:
- 近1年/3年/5年涉诉次数
- 作为原告/被告的案件比例
- 涉案金额总量与均值
- 案件类型分布(民事/刑事/行政/执行)
- 主要案由类别(合同纠纷、借贷纠纷、劳动争议等)
- 涉诉趋势(近期是否明显增加)
- 胜诉/败诉比例(需 NLP 提取)
这些特征与传统征信特征组合使用,通常能显著提升风控模型的区分度(AUC)。
四、数据字段说明
我们提供的裁判文书结构化数据集包含以下核心字段,可直接用于风控场景:
| 字段名 | 说明 | 风控用途 |
|---|---|---|
| case_id | 案号 | 去重与关联 |
| judgment_date | 裁判日期 | 时间窗口特征 |
| case_type | 案件类型 | 风险类型分类 |
| cause | 案由 | 风险维度识别 |
| region | 所属地区 | 地区风险画像 |
| court_level | 法院级别 | 案件严重程度 |
| amount | 涉案金额(NLP提取) | 风险敞口量化 |
| result | 判决结果(NLP提取) | 胜诉率特征 |
涉案金额、判决结果等字段需通过 NLP 技术从文书全文中提取,我们提供定制化的字段补充服务,详见数据处理能力说明。
五、合规说明
裁判文书数据来源于人民法院依法公开的法律文书,属于依法公开的公共信息。将其用于金融风控决策,需注意以下合规要点:
- 数据使用应符合《个人信息保护法》相关规定,避免将个人涉诉信息用于与风控无关的场景
- 风控决策不应单纯依赖涉诉记录,应与其他数据维度综合评估
- 建议在用户协议中明确告知数据使用范围