• Hbase2.0的Java API

    以表的操作和单条记录的增删改查为基础。批量操作,需要进行进一步封装。import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.*;import org.apache.hadoop.hbase.client.*...

    2023-11-20 18:51:14
  • HBase在淘宝主搜寻的Dump中的性能调优

    c_a_3();HBase在淘宝主搜索的Dump中的性能调优目前HBase已经运用于淘宝主搜索的全量和增量的数据存储,有效的减低的数据库的压力,增强了业务扩展的能力。Dump系统的特点是要求在短时间内处理大量数据,对延时要求高。在实施这个项目过程中,我们积累了一些优化的实践,抛砖引玉,供大家参考。环...

    2023-11-20 10:58:26
  • HBase JAVA API使用(2.1.0-cdh6.2.0) 1 Maven HBase Test Project

    集群版本:CDH6.2.0集群Hadoop版本:Hadoop 3.0.0-cdh6.2.0集群HBase版本:2.1.0-cdh6.2.0操作系统:macOS 10.15.5IntelliJ IDEA 版本:IntelliJ IDEA 2019.2.3 (Ultimate Edition)1.1 安...

    2023-11-17 19:28:37
  • Spark如何写入HBase/Redis/MySQL/Kafka

    一些概念一个partition 对应一个task,一个task 必定存在于一个Executor,一个Executor 对应一个JVM.Partition 是一个可迭代数据集合Task 本质是作用于Partition的线程问题Task 里如何使用Kafka Producer 将数据发送到Kafka呢。...

    2023-11-16 18:46:24
  • [中转] HBase 在淘宝的应用和优化

    c_a_3();[转发] HBase 在淘宝的应用和优化 转发:http://www.iteye.com/magazines/83本文来自于NoSQLFan联合作者@koven2049,他在淘宝从事Hadoop及HBase相关的应用和优化。对Hadoop、HBase都有深入的了解,本文就是其在...

    2023-11-14 22:24:59
  • php透过thrift读取hbase数据之scanner学习

    c_a_3();php通过thrift读取hbase数据之scanner学习 在使用scannerWithStop方法时遇到一个问题,代码如下:$tableName = "table";$beginRow = 0000001;$endRow = 0000003;$column = "colum...

    2023-11-14 14:50:23
  • hbase 运用经验

    c_a_3();hbase 使用经验 hbase  使用经验。1、单条rowkey下虽然能支持百万列,但是建议不要这么做,因为真正一个rowkey下挂了这么多数据时会在两个地方出现问题,一是查询时单行记录数据量过大,client超时;第二个问题是regionserver做compact的过程...

    2023-11-12 23:11:21
  • Hbase 基础知识收拾

    c_a_3();Hbase 基础知识整理 1、扫描操作scan 可以输入startRow和stopRow参数,其中 起始行包括在内,而终止行是不包括在内的,用区间表示就是【startRow,stopRow).  2、Region的rowKey也是 前开后闭模式【startRow,stopRow)....

    2023-11-10 19:06:59
  • 1006-HBase操作实战(JAVA API形式)

    c_a_3();1006-HBase操作实战(JAVA API模式)一、准备阶段开发环境:hadoop: hadoop -2.4.0hbase: hbase -0.94.11-securityeclipse:Juno Service Release 2二、创建 hbasedemo项目1、通过 Ecl...

    2023-11-10 16:48:50
  • 《Hbase权威指南》深入学习hbase架构(一):LSM-Tree

    c_a_3();《Hbase权威指南》深入学习hbase架构(1):LSM-Tree     hbase内部是使用Log-Structured Merge-Tree说索引的,即LSM-tree,当然是为hbase做过优化的。    LSM-tree是一个优秀的算法,思想来源于日志文件系统,本身...

    2023-11-08 20:58:51
  • HBase 架构101 –预写日记系统 (WAL)

    c_a_3();HBase 架构101 –预写日志系统 (WAL)原文:http://www.larsgeorge.com/2010/01/hbase-architecture-101-write-ahead-log.html什么是预写日志WAL? 之前的文章我们简单介绍了HBase的存储结构。其...

    2023-11-08 21:03:33
  • Hbase储存架构(整理)

    c_a_3();Hbase存储架构(整理) 一、 Hbase存储框架  图1  Hbase存储架构图  1、  结构HBase中的每张表都通过行键按照一定的范围被分割成多个子表(HRegion),默认一个HRegion超过256M就要被分割成两个,由HRegionServer管理,管理哪些HRegi...

    2023-11-08 20:54:03
  • 撰稿人带你剖析大数据存储HBase特性

    c_a_3();笔者带你剖析大数据存储HBase特性《笔者带你剖析大数据存储HBase特性》 前言如今在软件开发领域,谈及大数据已经是家常便饭。笔者相信在未来几年内,大数据的运算和存储一定会成为企业关注的核心。在此普及一个概念,什么级别的数据才能称之为大数据?如果你存储在DB中的数据达到了PB或者单...

    2023-11-08 20:54:21
  • HBase储存架构

    c_a_3();HBase存储架构http://hi.baidu.com/hontlong/blog/item/c397e32a43f9cc23d52af179.htmlHBase存储架构英文原文:http://www.larsgeorge.com/2009/10/hbase-architectur...

    2023-11-08 20:58:45
  • HBASE表设计

    1. 表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到这 个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的reg...

    2023-11-08 20:26:12
  • HBase性能调优

    因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正。配置优化zookeeper.session.timeout默认值:3分钟(180000ms)说明:RegionSer...

    2023-11-08 20:25:54
  • HBase写数据

    1 多HTable并发写创建多个HTable客户端用于写操作,提高写数据的吞吐量,一个例子:static final Configuration conf = HBaseConfiguration.create(); static final String table_log_name = “use...

    2023-11-08 20:25:42
  • HBase压缩

       Hbase有两种压缩 策略:minor和major。Minor compactions通常选择几个临近的小的storefiles把他们重写成一个。Minors 不会丢掉已删除或者过期的cells,只有major compactions才会做这些。有时一次Minor compactions将会选...

    2023-11-08 20:25:36
  • Hive与HBase的区别

    从使用方面讲Hive是一个构建在Hadoop平台上的数据仓库,可以将结构化的数据文件映射为一张数据库表。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化成Map/Reduce。HBase 是基于HDFS平台的Key/Value类型的NoSql数据...

    2023-11-08 19:28:15
  • Hbase配备和开发中的几个注意事项

    c_a_3();Hbase配置和开发中的几个注意事项在配置Hadoop和Hbase的过程中,虽然官方网站上有很多丰富的文档,但是常常仍然会有一些细枝末节的问题,成为阻碍项目配置成功以及后续开发的绊脚石。下面就记录几个Hbase配置以及开发过程中需要注意的事项:(1)修改节点主机名的问题在配置文件中使...

    2023-11-08 19:18:59