特征衍生主要指的是通过既有数据进行新特征的创建。总体来说,特征衍生有两类方法,其一是通过深入的数据背景和业务背景分析,进行人工字段合成,这种方法创建的字段往往具有较强的业务背景与可解释性,同时也会更加精准、有效的提升模型效果,但缺点是效率较慢,需要人工进行分析和筛选,称为手工特征衍生。其二则是抛开业务背景,直接通过一些简单暴力的工程化手段批量创建特征,然后从海量特征池中挑选有用的特征带入进行建模,这种方法简单高效,但存在衍生字段过多,有效特征没有衍生的问题,称为批量特征衍生。 特征衍生的相关方法更像是人们在长期实践过程中总结出来的方法论,这些方法切实有效,但没有一套能够完整统一的理论体系来“框住”这些方法。此外由于模型场景的复杂多变,特征衍生需要结合综合数据体量、数据规律、现有算力等因素进行考虑,所以这边主要介绍特征衍生的一些方法。
车主认证主体是以H5形式存在的,目前投放在多端,包括:哈啰App、车主App、货运车主App、支付宝小程序、微信小程序、H5外投页面,存在多端场景调用拍摄能力的需求。
在普惠顺风车订单系统中,一旦司机和乘客建立订单关系后,若其中任何一方发起取消订单的请求,将触发判责算法,该算法将输出确定订单取消责任的一方。
在用车saas化推广兼容小品牌用车的过程中,由于用户交互、接口数据、业务流程在主品牌与小品牌之间存在差异性,导致代码分叉过多,影响可读性与可编辑性;两侧用车能力存在部分混入,造成运行时代码过大;单一场景迭代容易干扰其他端侧用车能力;后续还会拓展到端外用车,上述问题会继续放大。
哈啰街猫移动团队在支撑业务发展过程中,已有的多媒体基础能力存在一些问题/瓶颈: 猫屋直播 - 三方直播sdk,在MTK芯片的机型上存在兼容问题(hevc硬解报错),导致直播流无法播放,用户无法使用app的核心功能 音视频流合成、滤镜 - 需要能够灵活的支持用户去触发对猫屋直播流的截取、合成、添加滤镜等,使用系统多媒体Api,在可扩展性,流处理效率,兼容性,以及滤镜的支持上,都存在问题 视频转码 - 猫友圈上传的用户视频,需要对其做转码后发布,转码最大的问题是,源视频的格式和参数是不确定的(Android),如果只用系统多媒体Api去处理,会存在各种各样的兼容性问题,结果要么是转码失败,要么视频发布后,其他端的用户观看异常 所以需要自研多媒体框架去解决/优化上述问题,以便后续能够更好的支撑业务发展。