DFS简介与Shell管理命令是什么

技术DFS简介与Shell管理命令是什么这篇文章给大家介绍DFS简介与Shell管理命令是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一、HDFS基本概述1、HDFS描述大数据领域一直面对的两

本文向您介绍了DFS以及什么是Shell管理命令。内容非常详细。感兴趣的朋友可以参考一下,希望对你有所帮助。

一、HDFS基本概述

1、HDFS描述

大数据领域一直面临两大核心模块:数据存储和数据计算。作为最重要的大数据存储技术,HDFS具有高容错性、稳定性和可靠性。HDFS(Hadoop-distributed-file-system),这是一个分布式文件系统,用于存储文件和通过目录树定位文件;设计的初衷是管理数百台服务器和磁盘,让应用程序可以像普通文件系统一样存储大规模文件数据。适合一次写入多次读出的场景,不支持文件修改,适合数据分析。

2、基础架构

DFS简介与Shell管理命令是什么

HDFS采用主/从架构,有两个核心组件,命名节点和数据节点。

NameNode

负责文件系统的MetaData管理,即文件路径名、数据块ID、存储位置等信息,配置复制策略处理客户端读写请求。

DataNode

执行文件数据的实际存储和读写操作,每个数据节点存储一部分文件数据块,整个文件分布存储在整个HDFS服务器集群中。

Client

客户端,通过文件分段上传HDFS时,客户端将文件逐个划分为Block,然后上传;从名称节点获取文件的位置信息;与数据节点通信以读取或写入数据;客户端通过一些命令访问或管理HDFS。

Secondary-NameNode

它不是NameNode的热备盘,但分担了NameNode的工作负载,比如定期合并Fsimage和Edits,推送到NameNode;在紧急情况下,它可以帮助恢复名称节点。

3、高容错性

DFS简介与Shell管理命令是什么

数据块、文件/用户/same ERP/数据/part-0、副本备份集为2、存储块id分别为1和3的多副本存储示意图;文件/用户/same ERP/数据/part-1,副本备份设置为3,存储的块id分别为2、4和5;任何一台服务器宕机后,每个数据块中至少存在一个备份服务,不会影响对文件的访问,提高整体容错能力。

HDFS的文件物理存储在块中,块大小可以通过参数dfs.blocksize进行配置,如果块设置太小,寻址时间会增加。如果块太大,从磁盘传输数据的时间会很慢。HDFS块的大小设置主要取决于磁盘传输速率。

二、基础Shell命令

1、基础命令

检查Hadoop下的相关Shell操作命令。

[root @ hop 01 Hadoop 2.7]# bin/Hadoop fs

[root @ hop 01 Hadoop 2.7]# bin/hdfsdfsdfs是fs的实现类。

2、查看命令描述

[root @ hop 01 Hadoop 2.7]# Hadoop-helps3、递归创建目录

[root @ hop 01 Hadoop 2.7]# Hadoop fs-mkdir-p/hopdir/my file4、查看目录

[root @ hop 01 Hadoop 2.7]# Hadoop fs-ls/

[root @ hop 01 Hadoop 2.7]# Hadoop-ls/hopdir5、剪贴文件

Hadoop fs-movefromLocal/opt/hopfile/Java . txt/hopdir/my file

# #查看文件

Hadoop fs-ls/hopdir/my file6、查看文件内容

# #查看全部

Hadoop fs-cat/hopdir/my file/Java . txt

# #查看结尾

7、追加文件内容

8、拷贝文件

copyFromLocal命令与put命令相同

Hadoop fs-copy from LocaL/opt/hopfile/c . txt/hopdir9、HDFS文件拷贝到本地

Hadoop fs-CopyToLocal/hopdir/my file/Java . txt/opt/hopfile/10、HDFS内拷贝文件

Hadoop fs-CP/hopdir/my file/Java . txt/hopdir11、HDFS内移动文件

12、合并下载多个文件

基本命令get与copyToLocal命令具有相同的效果。

13、删除文件

14、查看文件夹信息

Hadoop fs-du-s-h/hopdir/my file15、删除文件夹

bin/hdfsdfs-RM-r/hopdir/file 0703关于dfs,有哪些Shell管理命令?希望如此。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/83271.html

(0)

相关推荐

  • 美国服务器:为什么跨境电商建站首选美国服务器

    技术美国服务器:为什么跨境电商建站首选美国服务器如果您拥有一个跨境电商独立网站,而且收益还不错,那么您的网站每时每刻都有离线的风险,如果机房的抗攻击和抗流量的能力不够强而导致网站崩溃的话,会让您付出严重的代价。对于这些网

    礼包 2021年10月19日
  • 数据库迁移需要多长时间

    技术数据库迁移需要多长时间这篇文章将为大家详细讲解有关数据库迁移需要多长时间,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。什么是数据库迁移?数据库迁移是从一个数据库到另一个数据库的任何

    攻略 2021年10月26日
  • 怎样分析图数据库

    技术怎样分析图数据库怎样分析图数据库,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。下面主要讨论图数据库背后的设计思路、原理还有一些适用的场景,以及在生产环境

    攻略 2021年12月2日
  • 如何解决SpringBoot Actuator潜在的OOM问题

    技术如何解决SpringBoot Actuator潜在的OOM问题这篇文章主要介绍如何解决SpringBoot Actuator潜在的OOM问题,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!此问题

    攻略 2021年11月30日
  • java bean与ejb有哪些区别

    技术java bean与ejb有哪些区别这篇文章主要为大家展示了“java bean与ejb有哪些区别 ”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“java bean与ej

    攻略 2021年12月3日
  • 如何分析大数据中的网络协议

    技术如何分析大数据中的网络协议这篇文章将为大家详细讲解有关如何分析大数据中的网络协议,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。一、什么是协议协议,相当于正常交流必须掌

    攻略 2021年12月9日