一、根据人行征信,搭建一套人行特征库,要求: 1、枚举特征的类型,可以有多层分类 2、每类特征中,写2-5个指标的中英文名,对其中的1个写伪代码指标逻辑和sql逻辑 二、选择在用的特征自己写sql取出指标值,和特征出参进行比对 三、特征衍生有哪些方法,谈谈自己的想法
时间: 2023-04-04 13:03:34 浏览: 132
我可以回答这个问题。人行特征库的类型可以分为个人基本信息、信用信息、财务信息、行为信息等。其中,个人基本信息包括姓名、身份证号、性别、年龄等;信用信息包括信用卡额度、逾期次数、欠款金额等;财务信息包括收入、支出、负债等;行为信息包括消费习惯、社交圈等。
以信用信息为例,其中的指标可以包括信用卡额度、逾期次数、欠款金额等。其中,逾期次数的伪代码指标逻辑可以是:
if (逾期次数 > 0) {
return 1;
} else {
return 0;
}
对应的SQL逻辑可以是:
SELECT COUNT(*) FROM credit_info WHERE overdue_times > 0;
在选择在用的特征自己写SQL取出指标值时,可以使用类似以下的SQL语句:
SELECT credit_limit, overdue_times, debt_amount FROM credit_info WHERE user_id = '123456';
然后将取出的指标值与特征出参进行比对,以判断该用户的信用情况。
特征衍生的方法有很多,可以使用聚类、主成分分析、决策树等方法进行特征提取和降维。我的想法是,可以使用深度学习中的自编码器进行特征提取,将原始特征映射到一个低维空间中,从而提高特征的表达能力和分类效果。
相关问题
二代人行征信数据:帮我加工一个衍生特征:在贷机构数
好的,我可以帮您加工一个衍生特征:在贷机构数。在进行二代人行征信数据分析时,可以通过以下步骤计算这个特征:
1. 首先,获取个人的征信报告数据,包括贷款记录、信用卡使用记录等。
2. 对于每个个人,统计他们在贷款记录中出现的贷款机构数量。可以通过查看不同贷款记录中的贷款机构名称或ID来实现。
3. 计算每个个人的在贷机构数,即贷款记录中的贷款机构数量。
这样,您就可以得到每个个人的在贷机构数作为衍生特征,用于进一步的数据分析和建模。
请注意,由于我是一个AI模型,我无法直接操作您的数据。上述步骤仅供参考,具体实施需要根据您的实际数据和分析需求进行调整。
二代人行征信数据:帮我加工一个衍生特征:在贷机构数,sql
若您希望通过 SQL 查询语言来加工二代人行征信数据,可以尝试以下 SQL 查询来计算在贷机构数的衍生特征:
```sql
SELECT
borrower_id,
COUNT(DISTINCT loan_institution) AS loan_institution_count
FROM
loan_records
GROUP BY
borrower_id;
```
上述查询假设您的贷款记录存储在名为 `loan_records` 的表中,其中包含 borrower_id(借款人ID)和 loan_institution(贷款机构)等字段。通过对贷款记录进行分组,并使用 `COUNT(DISTINCT loan_institution)` 来计算每个借款人不同贷款机构的数量。
请根据您的实际数据表名和字段名进行调整。这只是一个示例查询,具体的 SQL 查询语句可能因数据库类型和数据结构而异。