本文共 453 字,大约阅读时间需要 1 分钟。
总结前面性能优化相关文章,列出Spark开发性能优化的一般步骤
前述文章包括:
思路如下:
第3、4点属于事后优化,即线上任务出现问题后进行定位、解决,Spark Core 性能优化之内存模型 一文加深 对 Spark 内存的理解,以便更加从容的解决 spark 性能问题
个人觉得,相比于Flink任务,Spark需要开发任务对Spark内存等方面有更为深入的理解,方能应付线上出现的一系列问题,而Flink这方面则简便许多,尤其是在背压方面,Flink帮运维省去了大部分精力
转载地址:http://juxxi.baihongyu.com/