• 2022-06-19
    数据复制主要是在数据写入和数据恢复的时候发生,HDFS数据复制是使用流水线复制的策略,请阐述该策略的细节。
  • 当客户端要往HDFS写入一个文件,这个文件首先被写入本地,然后切成若干个块,每个块向集群中的名称节点发起写请求。名称节点选择一个数据节点列表返回给客户端,客户端首先将数据写入列表中的第一个数据节点,同时把列表传给第一个数据节点,第一个数据节点收到数据后写入本地,把收到的数据和列表传给第二个数据节点,以此类推,列表中的数据节点形成一条数据复制的流。

    举一反三

    内容

    • 0

      NAS上用快照技术恢复数据,实际上是()。 A: 复制回来了数据 B: 解压了数据 C: 复制回来了数据的指针 D: 解密了数据的指针

    • 1

      【多选题】关于复制数据下列说法正确的是()。 A. 在复制数据时用户可以只复制数值而不复制公式 B. 用户可以利用鼠标拖动来复制数据 C. 在复制数据时不能进行运算 D. 在复制数据时无法复制批注

    • 2

      在HDFS写数据过程中,冗余副本采用以下哪个 方式存储在不同的数据节点中。 A: 流水线复制 B: 多线程 C: 三副本 D: 流水线控制

    • 3

      使用Excel复制数据,

    • 4

      按照备份系统中数据是否与生产系统同步,数据复制可以分成同步数据复制和异步数据复制。