Hive文件格式(表stored as 的五种类型)

hive文件存储格式包括以下几类: 1、TEXTFILE 2、SEQUENCEFILE 3、RCFILE 4、ORCFILE(0.11以后出现) 5、PARQUET 1、其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据...

2022-12-10 254 阅读

kudu原理

参考:官网:https://kudu.apache.org/docs/index.html 原理: https://blog.csdn.net/nosqlnotes/article/details/79496002 emr: https://help.aliyun.com/document_detail/141545.html?spm=5...

2022-12-10 232 阅读

impala 建表时报错,不支持中文

1.错误信息 (1366, "Incorrect string value: '\\xE6\\x8E\\x88\\xE6\\x9D\\x83...' for column 'search' at row 1")   (1)查看元数据hive库中的编码格式       (2...

2022-12-10 339 阅读

apache Apache KUDU 安装搭建

Apache KUDU 安装搭建节点规划节点 角色node1 Master Server、Tablet Servernode2 Master Server、Tablet Servernode3 Kudu Client、Tablet Servernode4 Master Server配置NTP时钟同步所有结...

2022-12-10 381 阅读

Hive数据导入导出的几种方式

一,Hive数据导入的几种方式 首先列出讲述下面几种导入方式的数据和hive表。 导入: 本地文件导入到Hive表; Hive表导入到Hive表; HDFS文件导入到Hive表; 创建表的过程中从其他表导入; 通过...

2022-12-10 284 阅读

csv数据导入kudu

1. csv文件另存为txt文件2. hive中建临时表create table test_table_1( id STRING, name STRING) row format delimited fields terminated by '\t'STORED AS TEXTFILE; 3. 加载txt数...

2022-12-10 271 阅读

spring springboot整合mybatis采用druid连接池对mysql,hive双数据源整合并打包

准备maven依赖,包括mybatis,springboot,大数据连接,MySQL依赖,druid等 <!---配置CDH仓库地址--><repositories> <repository> <id>cloudera&l...

2022-12-10 422 阅读

jdbc JDBCTemplate的使用

一、jar包的准备 还需要c3p0相关的包 如果使用的是 c3p0 jdbcTemplate 相关jar包5个 + c3p0 2个 + MySql驱动 1个 = 8个jar 如果使用的是 druid jdbcTemplate 相关jar包5个 + druid 1个 + MyS...

2022-12-10 429 阅读

spring SpringBoot集成Sqoop1.4.6实现关系型数据库与Hive数据库的数据相互同步

在你服务器上安装测试好hive、hadoop、hbase、sqoop这些要用的工具(不会自行百度/Google),目前Sqoop有两个版本分别是sqoop1:1.4.x和sqoop2:1.99.x(这里为什么不选用sqoop2原因自行百度...

2022-12-10 324 阅读

azkaban使用--schedule定时任务

1.schedule azkaban的schedule内部就是集成的quartz,而 quartz语法就是沿用linux crontab,crontab可照本文第2点 此处以此project(azkaban使用--传入动态参数)为例,设置为每五分钟跑一次 ...

2022-12-10 479 阅读