博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hive 调优
阅读量:7053 次
发布时间:2019-06-28

本文共 1805 字,大约阅读时间需要 6 分钟。

列出调优参数列表

-- group by,join 数据倾斜set hive.groupby.skewindata=true; --如果是group by过程出现倾斜 应该设置为trueset hive.skewjoin.key=100000; --这个是join的键对应的记录条数超过这个值则会进行分拆,值根据具体数据量设置set hive.optimize.skewjoin=true;--如果是join 过程出现倾斜 应该设置为true-- 控制map数量set mapred.min.split.size.per.node; -- 一个节点上split的至少的大小set mapred.min.split.size.per.rack; -- 一个交换机下split至少的大小set mapred.max.split.size; -- 一个split最大的大小set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat -- map端做combineset spark.hadoop.mapreduce.input.fileinputformat.split.maxsize=67108864; --spark控制map数量set spark.hadoop.mapreduce.input.fileinputformat.split.minsize=67108864; --spark控制map数量-- 控制reduce数量 (计算reducer数的公式很简单N=min( hive.exec.reducers.max ,总输入数据量/ hive.exec.reducers.bytes.per.reducer ))set mapred.reduce.tasks; -- 强制指定reduce的任务数量set hive.exec.reducers.bytes.per.reducer; -- 每个reduce任务处理的数据量,默认为1000^3=1Gset hive.exec.reducers.max; -- 每个任务最大的reduce数,默认为999-- map 端聚合set hive.map.aggr = true; -- 是否在 Map 端进行聚合,默认为 Trueset hive.groupby.mapaggr.checkinterval = 100000; -- 预先取n条聚合检查set hive.map.aggr.hash.min.reduction=0.5; -- 如果聚合后的条数/checkinterval>0.5,则不再聚合-- 小文件合并set hive.merge.mapfiles = true -- 是否和并 Map 输出文件,默认为 Trueset hive.merge.mapredfiles = false -- 是否合并 Reduce 输出文件,默认为 Falseset hive.merge.size.per.task = 256*1000*1000 -- 合并文件的大小-- mapreduce运行时JVM内存set mapreduce.map.memory.mb = 4096set mapreduce.reduce.memory.mb = 4096-- spark参数调优set spark.executor.memroy=3G; -- 设置executor运行内存set spark.yarn.executor.memoryOverhead=??? -- 设置堆外内存大小set spark.driver.memory=14G; -- XT调整driver内存set spark.executor.memory=4G; -- 调整executor内存set spark.executor.cores=2; -- 调整executor核数set spark.sql.shuffle.partitions=4000; -- 调整并发度set spark.dynamicAllocation.maxExecutors=2000; -- 调整最大资源使用量复制代码

具体可参考https://www.cnblogs.com/xd502djj/p/3799432.html

你可能感兴趣的文章
ios开发FMDB导入SQLCipher加密数据库
查看>>
为什么你的代码如此难以理解(转)
查看>>
php安全编程—sql注入攻击
查看>>
JSP简单的练习-功能标签
查看>>
TreeMap cannot be cast to java.lang.Comparable
查看>>
Eclipse和PyDev搭建完美Python开发环境(Windows篇)
查看>>
Extjs4.2布局——layout: accordion(Ext.layout.container.Accordion)
查看>>
OC ARC之循环引用问题(代码分析)
查看>>
Windows/Centos安装GO语言环境
查看>>
C/C++函数指针声明
查看>>
iOS 苹果开发证书失效的解决方案(Failed to locate or generate matching signing assets)
查看>>
24款最好的jQuery日期时间选择器插件
查看>>
记2016腾讯 TST 校招面试经历,电面、笔试写代码、技术面、hr面,共5轮
查看>>
我是一个线程(转)
查看>>
ORACLE 11G用于有效期
查看>>
Java float保留两位小数或多位小数
查看>>
access order by 判断是否除数为0
查看>>
高仿微信新消息提示音功能
查看>>
Atitit.antlr实现词法分析
查看>>
zmNgFrameWork 架构升级ng1.5和md5静态资源缓存方案【angular1.x】
查看>>