锐哥@ 2023-03-04 12:43 采纳率: 80%
浏览 19
已结题

面试相关问题的分享有劳解答

1.使用sql处理过上亿级别的项目吗?
2.你的项目贷前预测中的特征怎么选择(我的回答是和甲方业务部门进行沟通),之后反问为什么不用特征重要性进行选择,如果和甲方的业务部门进行沟通就有人为权重在里面了
3.pyspark用过吗?
4.风控模型出来后甲方会用吗?甲方会反馈效果吗?放款量有多大?坏账从建模之前到建模之后的效果怎么样?还会调这个模型吗?还会有新的样本进来吗?
5.有什么与业务相关的经验吗?就是你做了个东西业务反馈很好,有这种经验吗?
备注我是转行的没有相关工作经验,希望有相关工作经验的小伙伴帮忙解答,谢谢

  • 写回答

2条回答 默认 最新

  • 全能技术 2023-03-11 15:02
    关注

    处理上亿级别的项目是一个比较常见的问题,解决的方法有很多,例如分布式存储、数据库分库分表、索引优化、查询语句优化、硬件升级等等。具体的处理方法需要根据具体情况而定。

    特征选择是建模过程中非常重要的一步,而选择哪些特征是需要结合业务领域知识以及数据分析的结果来进行的。特征重要性是一个常用的指标,但也有其局限性。甲方业务部门的意见非常重要,因为他们对业务领域有更深入的了解,他们的意见可以帮助数据科学家更好地进行特征选择和建模。

    Pyspark是Spark的Python API,主要用于分布式计算,可以处理大规模数据。如果要处理大规模数据或进行分布式计算,使用Pyspark可以大大提高计算效率和速度。

    风控模型建立后需要进行实际的应用和效果检验。甲方会根据模型的效果和实际业务需求来决定是否使用,放款量和坏账率也会影响甲方的决策。建模之后的效果需要进行实际的监测和调整,不断优化模型效果。同时,新的数据也需要不断地加入模型,以不断提升模型的准确性。

    与业务相关的经验可以帮助数据科学家更好地理解业务需求,从而更好地进行数据分析和建模。如果你曾经参与过类似的项目,可以分享你的经验和见解,帮助团队更好地进行项目开展。如果没有相关的经验,也可以通过与业务部门的沟通和了解来更好地理解业务需求。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月19日
  • 已采纳回答 3月11日
  • 创建了问题 3月4日

悬赏问题

  • ¥15 为什么我运行这个网络会出现以下报错?CRNN神经网络
  • ¥20 steam下载游戏占用内存
  • ¥15 CST保存项目时失败
  • ¥15 树莓派5怎么用camera module 3啊
  • ¥20 java在应用程序里获取不到扬声器设备
  • ¥15 echarts动画效果的问题,请帮我添加一个动画。不要机器人回答。
  • ¥15 Attention is all you need 的代码运行
  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题