大数据风控必看,挖掘学历数据中暗藏的还款意愿及还款能力
市场上80%以上的信贷产品或信用卡,在申请人填写基本信息时都会需要填写学历情况,银行信用卡部门还会根据学历等级来设置进件门槛及额度标准。
那学历情况对于消费金融行业风控部门设置进件门槛或风控规则权重处于什么位置?行业内多数风控除了学历信息也到处在找学籍信息,学历和学籍信息可以透露借款人的哪些情况?这些情况如何在风控环节进行体现?本文将逐一讲解。
(来源网络)
一、学历与学籍是什么 学历 指求学的经历,曾在哪些学校肄业或毕业,或获得某种学位或证书。因此,报考某主考院校的自考,并获得了毕业证的自考生可以在学信网上查到自己的学历信息。
国家承认的学历在初等方面有小学、初中、普通高中(包括中职),在高等教育方面有专科、本科、硕士研究生、博士研究生四个层次。经国家主管教育部门批准具有举办学历教育资格的普通高等学校(含培养研究生的科研单位),成人高等学校所颁发的学历证书,国家予以承认。
通过自学考试,由国务院自学考试委员会授权各省(自治区、直辖市)自学考试委员会颁发的自学考试毕业证书,国家同样予以承认。
(学历查询报告样式)
学籍 是指一个学生属于某学校的一种法律上的身份或者资格。
根据《普通高等学校学生管理规定》,按照国家招生规定录取的新生,持录取通知书,到校办理入学手续,复查合格者予以注册,取得学籍。复查不合格者,由学校区别情况,予以处理,直至取消入学资格。
未经省级招生部门录取的学生,不管其在校学习时间多长,均无学籍。即使修业期满,成绩合格,也不能获得国家承认的普通高等教育学历证书。
(学籍查询报告样式)
二、学历及学籍来源-学信网 学历及学籍数据主要由中国高等教育学生信息网(简称“学信网”)统管,而学信网由全国高等学校学生信息咨询与就业指导中心(以下简称“中心”)主办。
学信网依托中心建立的集高校招生、学籍学历、毕业生就业和全国高校学生资助信息一体化的大型数据仓库,开通“阳光高考”信息平台、学籍学历信息管理平台、中国研究生招生信息网、全国高校学生资助信息管理平台、内地高校面向港澳台招生信息网等平台,开通学历查询系统、在线验证系统、硕士研究生网上报名和录取检查系统、硕士研究生招生调剂服务系统、全国高校学生资助管理系统、学历认证网上办公系统等20余个信息系统。
学籍查询范围 国家承认的各类高等教育在籍学生的学籍注册信息(不含自考),以及2001年以来的学籍档案(已离校学生在籍期间的学籍注册信息)。
学籍查询服务仅提供给学生本人,需实名注册后进入学信档案使用。
学历查询范围 2001年以来国家承认的各类高等教育学历证书电子注册信息(含学历证明书)。包括研究生、普通本专科、成人本专科(注册进度)、网络教育(注册进度)、开放教育、高等教育自学考试(注册进度)以及高等教育学历文凭考试(注册进度)等
截至2018年底,学信网数据仓库累积各类数据总量已接近14.5亿,且仍在不断增长中。其中包括:
1. 报名数据:硕士研究生(2005年以来)、普通本专科(2000年以来)、成人本专科(2000年以来)、网络教育(2008年以来)的报名数据累计24980万人次;
2. 报名照片:硕士研究生(2006年以来)、普通本专科(2009年以来)、成人本专科(2012年以来)的报名照片累计14344万张;
3. 成绩数据:硕士研究生(2000年以来)的入学考试成绩、普通本专科(2000年以来)的高考成绩、成人本专科(2000年以来)的高考成绩数据累计22121万人次;
4. 录取数据:博士、硕士研究生(2001年以来)、普通本专科(1999年以来)、成人本专科(2000年以来)、网络教育(2004年以来)的录取数据累计20412万人次;
5. 学籍数据:博士、硕士研究生、普通本专科、成人本专科、网络教育、开放教育等高等教育当前在校学生的学籍数据5088万人次;
6. 学历数据:各类高等教育毕业生1991年以来的学历数据累计18046万人(包括博士研究生、硕士研究生、普通本专科、成人本专科、网络教育、开放教育、自学考试、学历文凭考试);【市场的接口主要查询,能查询到的为这部分群体学历数据】
7. 学历照片:各类高等教育毕业生2002年以来的学历照片累计16772万张(包括博士研究生、硕士研究生、普通本专科、成人本专科、网络教育、开放教育、自学考试、学历文凭考试);
8. CET成绩:2011年以来的大学英语四、六级成绩数据累计13194万人次;
9. 就业数据:博士、硕士研究生、普通本专科2004年以来的就业数据累计8254万人次。【学信网的就业数据应该是根据学籍材料挂靠机构的类型判断的,可信度和参考价值应该不大】
(来源:学信网)
大学类:(大专、本科,研究生、自考、成考)的毕业证可以上学信网。
中专技校毕业证书查询,可以到省级提供的官方地址查询,也可以向当地教育局、学校提供查询鉴定。
【由于专科以下的学历,鲜有途径查询,所以专科以下学历的客户大多填写学历时为了提高资质,不管有无上过学,都会填写高中学历,高中学历是部分金融产品的最低学历进件标准】
目前开通网上查询的地区 北京、吉林、黑龙江、江西、河南、湖北、湖南、广东、海南、陕西、甘肃、新疆
未开通网上查询地区
天津、河北、山西、内蒙古、辽宁、上海、江苏、浙江、安徽、福建、山东、广西、重庆、四川、贵州、云南、西藏、青海、宁夏
三、以学历数据为基础的产品形态 1. 学历及学籍信息API 原则上只有直连学信网才有的接口产品,学籍由于有学生民族信息,非常敏感,因此对外的基本只有学历信息。市场价2元/条。【对接难点在于接入方的资质及场景合规性问题】
2. 学历学籍爬虫接口 直连很难,但难不倒各技术公司,只要用户授权,能抓的信息都可以抓取回来。但市场上金融机构都不怎么喜欢使用。市场价0-0.3元/条。
【技术难点不大,难点在于爬虫接口都是用户有感知的,一般在学历前可能有其他的需授权接口,这样会影响产品体验,用户主动授权意愿不强,需要友好引导用户。当然那些急需用钱的人除外,能下款什么都可以配合。但由于监管政策问题,无直连渠道的机构也只能采用这个爬虫接口去识别是否在读学生。】
这2种产品主要的字段详情分别是:
学籍字段
性别、真实姓名、民族、出生日期、身份证、考生号、学号、院校名称、分校、系、专业、班级、层次、学制(4/3/2.5(年))、学历类别、学习形式、入学时间、学籍状态、离校时间、头像
学历字段
性别、真实姓名、入学时间、毕业时间、学历类别、学历层次、毕业学校、是否结业、毕业、专业、学习形式、身份证、出生日期、校长姓名、学制、发证日期、辅修开始时间、辅修结束时间、辅修学校、辅修专业、证书编号、头像
然后一些维度还有细分的字段:
层次
专科、专科(高职)、本科、硕士研究生、博士研究生
学习形式
业余、全日制、函授、夜大学、开放教育、普通全日制、电视教育、网络教育、脱产、远程教育、非全日制
学历类别
成人、普通、研究生、开放教育、成人高等教育、普通高等教育、网络教育、高等教育学历文凭考试、高等教育自学考试