当前位置: 首页 > news >正文

银行业数据科学家的 6 条经验教训

img

一个扎心的现实教训是:数据科学并不像你所期望的那样

原本希望在计算机科学、统计学和机器学习领域工作。运用新方法获得独特见解,实现一切自动化。简而言之,最终成了这个职业炒作的牺牲品。

我想和你们分享一下。希望我们能够摆脱炒作,提高你对数据科学家工作的理解。

第 1 课:逻辑回归大有裨益

我的工作涉及建立信用风险和欺诈模型。这些都是有影响力的模型。它们被用于大规模自动化贷款。我说的是每年价值数十亿的应用程序。你可能会认为,在如此高的风险下,会从事先进的机器学习。你错了。

我专门使用逻辑回归来构建模型。我并不是唯一一个这样做的人。从银行业到保险业,金融界的很多领域都依赖回归。为什么?

因为这些模型有效。

回归模型的表现已经足够好了。它们也被银行广泛理解和接受。要采用一种新算法,它不仅要优于回归。改进还必须证明解释算法的努力是合理的。

通过回归分析,我最终得到了具有 8 到 10 个特征的模型。每个特征都必须得到彻底解释。非技术同事必须同意他们捕捉到了现实中存在的关系。

回归分析很简单。黑盒模型会更难解释。当然,可以使用[SHAP](Python 中的 SHAP 简介)或[PDP


http://www.mrgr.cn/news/34795.html

相关文章:

  • jmeter常用配置元件介绍总结之逻辑控制器
  • 【论文复现】基于标签相关性的多标签学习
  • 基于表格滚动截屏(表格全部展开,没有滚动条)
  • Python 的 Pygame 库,编写简单的 Flappy Bird 游戏
  • 【数据分享】中国食品工业年鉴(1984-2023) PDF
  • MySQL与Oracle对比及区别
  • 详解常见排序
  • hbase之布隆过滤器
  • 【自动驾驶】基于车辆几何模型的横向控制算法 | Pure Pursuit 纯跟踪算法详解与编程实现
  • RPA + 生成式AI
  • 搜索二叉树
  • 【GitLab】安装和使用
  • 【高性能内存池】基本框架 + 固定长度内存池实现 1
  • 一篇讲透:Wi-Fi定位、基站定位!
  • ①大缓存ModbusRTU485数据集中采集器寄存器线圈重映射从站并发采集Modbus 串口RS485 转 RS485
  • C# 路径算法之Floyd-Warshall算法
  • C++存储数据单位转换输出字符串
  • 【STM32开发笔记】移植AI框架TensorFlow到STM32单片机【上篇】
  • 【小米手机无法连接电脑】一般问题和驱动MTP问题的结局ue
  • 职场人生之面试避雷
  • 软考高级:软件系统经济可行性-开发成本、运营成本、有形收益、无形收益区分
  • 跨域问题、同源策略、CORS机制、Nginx解决跨域问题(AI问答,仅供参考)
  • 15年408-数据结构
  • 软考高级:中台相关知识 AI 解读
  • GEE APP:Best Available Pixel (BAP)APP Landsat系列最佳影像的筛选应用
  • 如何在Java应用中实现数据同步:基于数据库触发器与消息队列的方案