这里简单的说几个hadoop里的命令,不至于搭建完这个后不知道该干嘛了!
$ pwd
/home/hadoop/hadoop
格式化分布式文件系统
$ bin/hadoop namenode –format
启动hadoop的守护进程
$ bin/start-all.sh
停止hadoop的守护进程
$ bin/stop-all.sh
可用jps查看守护进程是否启动
/usr/local/jdk1.7.0_03/bin/jps
为了方便后边的演示,我在这里新建几个文件及目录!
$ mkdir input
$ cd input/
$ echo "hello, ykyx00" > file1
$ echo "hello, hadoop" > file2
将input 目录复制到hdfs的根目录,并重命名为in,out为处理完成后输出目录(执行之前out必须为空,否则会出错)
$ bin/hadoop dfs -put input in
$ bin/hadoop jar hadoop-examples-1.0.1.jar wordcount in out
列出文档中的文件
$ bin/hadoop dfs -ls in
-rw-r--r-- 1 hadoop supergroup 14 2012-04-03 12:10 /user/hadoop/in/file1
-rw-r--r-- 1 hadoop supergroup 14 2012-04-03 12:10 /user/hadoop/in/file2
查看hdfs文件内容
$ bin/hadoop dfs -cat in/file1
hello, ykyx00
删除文件
bin/hadoop dfs –rm in/file1
删除目录
$bin/hadoop dfs -rmr in/input (加入在hdfs的in目录下有个input的目录)
当hdfs目录中的文件file1下载到本地,并重命名为test
$ bin/hadoop dfs -get in/file1 test
管理与更新命令:
报告hdfs的基本统计信息
$ bin/hadoop dfsadmin –report
进入安全模式(安全模式下文件系统不允许修改)
$ bin/hadoop dfsadmin -safemode enter
Safe mode is ON
退出安全模式(需要等待17秒生效)
$ bin/hadoop dfsadmin -safemode leave
Safe mode is OFF
启动负载均衡
$ bin/start-balancer.sh