行业资讯
AI news by Smartone AI
Shuffle核心概念、Shuffle调优及故障排除
Spark调优之Shuffle调优本节开始先讲解Shuffle核心概念;然后针对HashShuffle、SortShuffle进行调优;接下来对map端、reduce端调优;再针对Spark中的数据倾斜问题进行剖析及调优;最后是Spark运行过程中的故障排除
Spark性能调优-RDD算子调优篇
Spark调优之RDD算子调优不废话,直接进入正题!1. RDD复用在对RDD进行算子时,要避免相同的算子和计算逻辑之下对RDD进行重复的计算,如下图所示:RDD的重复计算对上图中的RDD计算架构进行
深度解析Spark底层执行原理(建议收藏)
Spark简介Apache Spark是用于大规模数据处理的统一分析引擎,基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量硬件之上,形成集群
基于Spark的数据分析实践
转载本文需注明出处:微信公众号EAWorld,违者必究。引言:Spark是在借鉴了MapReduce之上发展而来的,继承了其分布式并行计算的优点并改进了MapReduce明显的缺陷。Spark主要包含
有冇SmartoneAI
2020收录工具
13712文章
2M访客
热门网址
AIGC热点
热点
-
19打开,有戏
时间线
10
281
301
343
热门标签
热门工具
腾讯混元大模型
腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
像素蛋糕PixCake
简单易用的AI图像精修工具
豆包
字节跳动最新推出的免费AI对话助手
Grok
马斯克旗下xAI推出的人工智能助手
讯飞智文
科大讯飞推出的免费AI PPT生成工具
Apple Store
扫码加公众号
本站内容源自互联网,如有内容侵犯了你的权益,请联系删除相关内容,联系邮箱:youmao@neone.com.cn
© 2010 - 2024 | 沪ICP备16045468号-5