




kok电子竞技权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
kok电子竞技:文档简介
1、Apache HBase徐培成是分布式面向列的数据库,构建在hadoop之上,类似于google的big table,对海量结构化数据的快速随机访问.是hadoop生态系统的一部分。提供随机实时读写。HBase简介master-slave主从结构table从竖直方向进行切割,分成若干个区域。由每个regionserver进行处理。master server(ms)a.负责指派region给rs.通过zk获得task的帮助b.处理跨rs的region的负载均衡问题。c.从繁忙服务到空闲服务器之间的数据转载。d.通过裁定负载均衡判断集群的状态。HBase架构4.region被切割的表,跨rs。4.
2、region server(rs)和client通信处理数据操作处理它下面的所有region的读写请求。通过阀值决定region size.HBase架构下载hbase-1.2.3.tar.gztar环境变量HBASE_HOME=/soft/hbasePATH=.:/soft/hbase/binHBase安装localconf/hbase-site.xmlhbase.rootdir=file:/home/ubuntu/hbase伪分布conf/hbase-site.xmlhbase.rootdir=file:/home/ubuntu/hbasedfs.replication=1HBase配置f
3、ull distributedconf/hbase-site.xmlhbase.rootdir=hdfs:/s100:8020/hbasedfs.replication=3hbase.cluster.distributed=perty.clientPort=2181hbase.zookeeper.quorum=s101,s102,perty.dataDir=/hbase/zkHBase配置full distributedconf/regionservers.xmls101s102s103分发hbase配
4、置HBase配置启动$start-dfs.sh/只需要hdfs支持,$start-hbase.sh/启动集群$stop-hbase.sh/停止集群$hbase shell/进入hbase shellHBase启动启动 /hmaster /hregionserverHBase webUI启动$hbase shell/进入shell$hbasehelp/查看帮助$hbasehelp comand/查看命令帮助$hbasecreate t1,NAME=cf1/创建表$hbasedelete .$hbaseget .$hbasescan .$hbasedisable t1$hbasedrop t1HB
5、ase shell操作HBase TTL-原生扫描HBaseConfiguration/加载hbase-site.xmlConfiguration conf = HBaseConfiguration.create();conn = ConnectionFactory.createConnection(conf);admin = conn.getAdmi();conn.getTable(TableName.valueOf(t1);HBase Client APIHbase和HadoopHA集成配置HBASE_CLASSPATH/soft/hbase/conf/hbase-env.shexport
6、 HBASE_CLASSPATH=$HBASE_CLASSPATH:/soft/hadoop/etc/hadoop创建hdfs-site.xml符号连接$ln -s /soft/hadoop/etc/hadoop/hdfs-site.xml /soft/hbase/conf/hdfs-site.xmlHBase与Hadoop HA集成Hbase和HadoopHA集成修改hbase.rootdir的目录/soft/hbase/conf/hbase-site.xmlhbase.rootdir hdfs:/mycluster/hbase将以上步骤分发处理。HBase与Hadoop HA集成见备注。H
7、Base二次索引HBase的RowKey设计原则rowkey长度原则rowkey是一个二进制码流,可以是任意字符串,最大长度 64kb ,实际应用中一般为10-100bytes,以byte 形式保存,一般设计成定长。建议越短越好,不要超过16个字节,原因如下:目前操作系统都是64位系统,内存8字节对齐,控制在16个字节,8字节的整数倍利用了操作系统的最佳特性。HBase RowKey设计原则HBase的RowKey设计原则rowkey散列原则如果rowkey按照时间戳的方式递增,不要将时间放在二进制码的前面,建议将rowkey的高位采用散列字段处理,由程序随机生成,低位放时间字段,这样将提高数
8、据均衡分布在每个RegionServer,以实现负载均衡的几率。如果不进行散列字段处理,首字段直接使用时间信息,所有的数据都会集中在一个RegionServer上,这样在数据检索的时候负载会集中在个别的RegionServer上,造成热点问题,会降低查询效率。HBase RowKey设计原则HBase的RowKey设计原则rowkey唯一原则必须在设计上保证其唯一性,rowkey是按照字典顺序排序存储的,因此,设计rowkey的时候,要充分利用这个排序的特点,将经常读取的数据存储到一块,将最近可能会被访问的数据放到一块。HBase RowKey设计原则HBase的RowKey设计原则什么是热点
9、HBase中的行是按照rowkey的字典顺序排序的,这种设计优化了scan操作,可以将相关的行以及会被一起读取的行存取在临近位置,便于scan。然而糟糕的rowkey设计是热点的源头。 热点发生在大量的client直接访问集群的一个或极少数个节点(访问可能是读,写或者其他操作)。设计良好的数据访问模式以使集群被充分,均衡的利用。为了避免写热点,设计rowkey使得不同行在同一个region,但是在更多数据情况下,数据应该被写入集群的多个region,而不是一个。HBase RowKey设计原则HBase的RowKey设计原则盐析(salt)这里所说的加盐不是密码学中的加盐,而是在rowkey的
10、前面增加随机数,具体就是给rowkey分配一个随机前缀以使得它和之前的rowkey的开头不同。分配的前缀种类数量应该和你想使用数据分散到不同的region的数量一致。加盐之后的rowkey就会根据随机生成的前缀分散到各个region上,以避免热点。HBase RowKey设计原则HBase的RowKey设计原则哈希哈希会使同一行永远用一个前缀加盐。哈希也可以使负载分散到整个集群,但是读却是可以预测的。使用确定的哈希可以让客户端重构完整的rowkey,可以使用get操作准确获取某一个行数据HBase RowKey设计原则HBase的RowKey设计原则反转第三种防止热点的方法时反转固定长度或者数
11、字格式的rowkey。这样可以使得rowkey中经常改变的部分(最没有意义的部分)放在前面。这样可以有效的随机rowkey,但是牺牲了rowkey的有序性。反转rowkey的例子以手机号为rowkey,可以将手机号反转后的字符串作为rowkey,这样的就避免了以手机号那样比较固定开头导致热点问题HBase RowKey设计原则HBase的RowKey设计原则时间戳反转一个常见的数据处理问题是快速获取数据的最近kok电子竞技本,使用反转的时间戳作为rowkey的一部分对这个问题十分有用,可以用Long.Max_Value - timestamp追加到key的末尾,例如keyreverse_timestamp ,key 的最新值可以通过scan key获得key的第一条记录,因为HBase中rowkey是有序的,第一条记录是最后录入的数据。见注解!HBase RowKey设计原则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
kok电子竞技:最新文档
- 中级财务会计学知到课后答案智慧树章节测试答案2025年春湖南工学院
- 四川工业科技学院《景观设计(1)》2023-2024学年第一学期期末试卷
- 西南民族大学《化工机械强度与振动》2023-2024学年第二学期期末试卷
- 洛阳理工学院《组织学与胚胎学(B)》2023-2024学年第二学期期末试卷
- 四川省资阳市2025届五kok电子竞技数学第二学期期末调研试题含答案
- 海南健康管理职业技术学院《中国古代文学A(V)》2023-2024学年第二学期期末试卷
- 大同煤炭职业技术学院《个案工作实务》2023-2024学年第二学期期末试卷
- 广州华商学院《药理学实验A》2023-2024学年第二学期期末试卷
- 古诗词中炼字的好处
- 工程质量控制中的常见问题与解决方案
- 《台海危机》课件
- 部编kok电子竞技小学语文一kok电子竞技下册第三单元大单元教学设计教材分析
- MOOC 数据库系统(中):建模与设计-哈尔滨工业大学 中国大学慕课答案
- 2024年湖南食品药品职业学院单招职业技能测试题库及答案解析
- 2024年江苏医药职业学院单招职业技能测试题库及答案解析
- 2024年全国高考物理电学实验真题(附答案)
- 保育员基本素养知识讲座
- 2024宁波枢智交通科技有限公司招聘笔试参考题库附带答案详解
- 乳腺疏通课件
- 《5G无线网络规划与优化》 课件 罗晖 第4-6章 5G行业应用-5G无线网络优化
- 药物指导健康宣教
评论
0/150
提交评论