hadoop之hdfs架构详解

本文主要从两个方面对hdfs进行阐述,第一就是hdfs的整个架构以及组成,第二就是hdfs文件的读写流程。 一、HDFS概述      标题中提到hdfs(Hadoop Distribute File System)...

2023-12-24 75 阅读

HDFS(hadoop分布式文件管理系统)

HDFS结构 概述:是Hadoop项目的核心子项目。是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上 pc server高容错性 :...

2023-12-24 75 阅读

HDFS详解

1、HDFS 是做什么的 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发...

2023-12-24 98 阅读

Hive的原理和基本用法

一、Hive的概述   1、Hive的定义      Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL进行数据读取、写入和管理。 &n...

2023-12-24 100 阅读

Hive的基本概念

一、Hive基本概念 1.什么是Hive? hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载。可以存储、查询和分析存储在Hadoop中的大规模数据。 hive数据仓库工具能将结构化...

2023-12-24 97 阅读

Hive 1、什么是Hive,Hive有什么用

   一、什么是Hive   Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规...

2023-12-24 94 阅读

Kafka-为什么选择kafka(kafka的优点)

Kafka-为什么选择kafka(kafka的优点) 多个生产者 kafka可以无缝的支持多个生产者,不管客户端在使用单个主题还是多个主题。所以它很适合用来从多个前端系统手机数据,并以同一的格式对外提...

2023-12-24 88 阅读

kafka事务原理与使用

项目要求使用kafka的事务,遇到了一些问题,研究了下kafka的事务机制记录一下。 kafka事务是为了实现: Exactly Once即正好一次语义 操作的原子性 有状态操作的可恢复性     ka...

2023-12-24 91 阅读

kafka消费者详解

一、消费者组                                               &n...

2023-12-24 87 阅读

kafka简介

对于kafka的架构原理我们先提出几个问题?   1.Kafka的topic和分区内部是如何存储的,有什么特点?   2.与传统的消息系统相比,Kafka的消费模型有什么优点?   3.Kafka如何实现分布式...

2023-12-24 100 阅读