金融科技系智慧金融系列讲座第八十二期
《汉纪十九》:“匈奴呼韩邪单于来朝;二月,归国。始,郅支单于以为呼韩邪兵弱,降汉,不能复自还,即引其众西,欲攻定右地。又屠耆单于小弟本侍呼韩邪,亦亡之右地,收两兄馀兵,得数千人,自立为伊利目单于;道逢郅支,合战,郅支杀之,并其兵五万馀人。郅支闻汉出兵谷助呼韩邪,即遂留居右地;自度力不能定匈奴,乃益西,近乌孙,欲与并力,遣使见小昆弥乌就屠。乌就屠杀其使,发八千骑迎郅支。郅支觉其谋,勒兵逢击乌孙,破之;因北击乌揭、坚昆、丁令、并三国。数遣兵击乌孙,常胜之。坚昆东去单于庭七千里,南去车师五千里,郅支留都之。”
“班固赞曰:孝宣之治,信赏必罚,综核名实。政事、文学、法理之士,咸精其能。至于技巧、工匠、器械,自元、成间鲜能及之。亦足以知吏称其职,民安其业也。遭值匈奴乖乱,推亡固存,信威北夷,单于慕义,稽首称籓。功光祖宗,业垂后嗣,可谓中兴,侔德殷宗、周宣矣!”
从金融科技的发展情况来看,新进老师很多,这些老师们普遍能力强,学识扎实,且同时承担多项教学和管理职能,所以万不能从单一的指标来评价这些老师。希望这些老师通过不断努力,给系部带来新的气象。
本次讲座《基于XGBoost和社交网络分析的客户流失预测方法》由周萌博士带来。本期的研究主要从四个方面展开,分别是研究背景,XGBoost算法,社交网络分析和模型与结果。周萌博士提到,近年来,互联网行业发展迅速,市场逐渐饱和,从增量市场转向存量市场,获取新用户的成本越来越高。因此,对于防止客户流失的关注程度受到更多重视。GBDT(梯度提升决策树)是常用的机器学习算法之一,而XGBoost对于GBDT算法的改进。Boosting是一类可将弱分类器提升为强分类器的算法,属于集成学习范畴。Boosting方法通过分步迭代的方式来构建模型,在迭代每一步构建的弱分类器都是为了弥补已有模型的不足。XGBoost算法可以看成是由K棵树组成的加法模型,通过加法模型的学习使用前向分布算法。从一个常量预测开始,每次学习一个新的函数。因此,需要重新计算目标函数。最终通过采用精确贪心算法来生成决策树的每个节点。从社交网络的属性来看,变量可以分为两类:个体变量和社会网络变量。个体变量分为用户基本信息和用户行为变量。社会网络变量分为社交网络同质性——人们倾向于与自己具有相似行为特征的个体成为朋友。同时,周萌博士还提出社交网络结构由节点和边组成,与一个节点连结的边数目称为节点的度。还可以用图的邻接矩阵记录邻居节点,用户邻居节点包括流失和未流失的邻居节点,可以计算邻居节点流失率。最后通过比较LR、SVM、RF和XGBoost四种方法,可以发现XGBoost的优势。
周萌博士给我们提供的XGBoost方法在第一次所主讲的XGBoost方法从数据上和方法上有了不同,希望系部的老师能够通过不断推动研究,带动教学,从而利人的同时也提升自己。
(供稿:曹焕)