Hadoop学习全程记要——hive入门

Hadoop学习全程记录——hive入门
hive是Facebook的产品,很不错。
官方文档:http://wiki.apache.org/hadoop/Hive/GettingStarted有很详细说明。

基本上根据文档能对hive快速入门。在使用过程中可能会出现以下问题:

当执行下面命令时:
$ $HIVE_HOME/bin/hive

可能会出现Invalid maximum heap size: -Xmx4096m提示。

那是因为hive默认hadoop heap size为4096m。如果出现这个提示,你需要修改hadoop heap size的大小。方法如下:

1.执行命令。
$ sudo gedit $HIVE_HOME/bin/ext/util/execHiveCmd.sh


2.在打开的sh文件中修改HADOOP_HEAPSIZE的值(如将默认的4096改为1024),保存,退出。


  # increase the threashold for large queries
  HADOOP_HEAPSIZE=4096 

改为
  # increase the threashold for large queries
  HADOOP_HEAPSIZE=1024