本文就目前较为冷门的一些数据任务优化手段做了简单的分析和总结,内容相对比较零散,不会聚焦常用的优化手段(比如小文件合并,数据倾斜等的优化等),只是对一些相对不太常见,但是在研发中又比较重要且有效的方式进行简单的一些沉淀,希望大家批评指正!