常用的hadoop操作,hadoop操作指令

　　在这篇文章中，我们默认认为大数据环境已经由运维人员配置好直接可以使用。

　　假设大数据的安装目录HADOOP_HOME为/home/admin/hadoop。

　　启动与关闭

　　启动大数据

　　1.进入HADOOP_HOME目录。

　　2.执行垃圾箱/开始-全部。嘘

　　关闭大数据

　　1.进入HADOOP_HOME目录。

　　2.执行垃圾箱/全停。嘘

　　大数据使用的是HDFS，能够实现的功能和我们使用的磁盘系统类似。并且支持通配符，如*。

　　查看文件列表

　　查看分布式文件系统中/用户/管理员/亚伦目录下的文件。

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fs-ls/用户/管理员/亚伦

　　这样，我们就找到了分布式文件系统中/用户/管理员/亚伦目录下的文件了。

　　我们也可以列出分布式文件系统中/用户/管理员/亚伦目录下的所有文件（包括子目录下的文件)。

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fs-LSR/用户/管理员/亚伦

　　创建文件目录

　　查看分布式文件系统中/用户/管理员/亚伦目录下再新建一个叫做纽迪尔的新目录。

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fs-mkdir/用户/管理员/aaron/新目录

　　删除分布式文件系统中/用户/管理员/亚伦目录下一个名叫需要删除的文件

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fs-RM/user/admin/aaron/需要删除

　　删除分布式文件系统中/用户/管理员/亚伦目录以及该目录下的所有文件

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fs-rmr/用户/管理员/亚伦

　　上传一个本机/home/admin/newFile的文件到分布式文件系统中/用户/管理员/亚伦目录下

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fsput/home/admin/new file/user/admin/aaron/

　　下载分布式文件系统中/用户/管理员/亚伦目录下的新文件文件到本机/home/admin/newFile中

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fsget/user/admin/aaron/new file/home/admin/new file

　　我们可以直接在分布式文件系统中直接查看文件，功能与类是猫类似

　　查看分布式文件系统中/用户/管理员/亚伦目录下的新文件文件

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop fscat/home/admin/new文件

　　数据处理作业操作

　　提交数据处理作业

　　原则上说，Hadoop所有的数据处理作业都是一个冲突包。

　　运行一个/home/admin/hadoop/job.jar的数据处理作业

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop jar/home/admin/Hadoop/job。jar[jobMainClass][jobArgs]

　　杀死某个正在运行的工作

　　假设作业身份为：job_201005310937_0053

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/Hadoop job-kill job _ 2010 05 310937 _ 0053

　　更多大数据的命令

　　上面介绍的这些大数据的操作命令是我们最常用的。如果你希望了解更多，可以按照如下的方式获取命令的说明信息。

　　1.进入HADOOP_HOME目录。

　　2.执行sh bin/hadoop

　　我们可以看到更多命令的说明信息：

　　用法：hadoop [ - config confdir]命令

　　其中命令是下列之一：

　　命名节点-格式格式化深度优先搜索文件系统

　　次要名称运行深度优先搜索辅助节点

　　命名节点运行深度优先搜索命名节点

　　datanode运行DFS数据节点

　　DFS管理员运行深度优先搜索管理客户端

　　检查运行深度优先搜索文件系统检查实用程序

　　满量程运行通用文件系统用户客户端

　　平衡器运行集群平衡实用程序

　　jobtrackerrun MapReduce作业跟踪器节点

　　管道运行管道作业

　　运行一个数据处理任务跟踪器节点

　　作业操作数据处理作业

　　队列获取有关作业队列的信息

　　版本打印版本

　　运行一个冲突文件

　　递归复制文件或目录

　　存档-存档名称名称src * dest创建大数据归档文件

　　daemonlogget/设置每个守护进程的日志级别

　　或者

　　类名运行名为类名的类

　　大多数命令在没有参数的情况下调用时都会打印帮助。

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

常用的hadoop操作,hadoop操作指令

相关文章阅读

去评论

去顶部