推荐专题：

自闭症康复网 > Hive利用增量表更新全量表

Hive利用增量表更新全量表

时间：2019-07-16 20:06:15

相关推荐

Hive利用增量表更新全量表

需求

要求将只存在于u1而不存在于u2的的ID记录全部插入u2中，并用u1中的记录更新u2中相同ID的记录。

不要被题目误导了,这个应该先更新数据,然后再插入,不要被题目的顺序误导

数据源

drop table u1;create table if not exists u1(id int,name string)row format delimitedfields terminated by ',';drop table u2;create table if not exists u2(id int,name string)row format delimited fields terminated by ',';load data local inpath '/data/u1.txt' into table u1;load data local inpath '/data/u2.txt' into table u2;

数据集

u1文件中的数据如下：1,a2,b3,c4,d7,y8,uu2文件中的数据如下：2,bb3,cc7,yy9,pp

实现SQL

--要求将只存在于u1而不存在于u2的的ID记录全部插入u2中，并用u1中的记录更新u2中相同ID的记录。with a as (select u1.id,case when u2.id is not null then u2.name else u1.name end `name`from u1left join u2 on u1.id = u2.idunionselect id, namefrom u2)insertoverwritetableu2select *from a;

确认结果

select * from u2;+----+----+|id |name|+----+----+|NULL|NULL||1 |a ||2 |bb ||3 |cc ||4 |d ||7 |yy ||8 |u ||9 |pp |+----+----+

总结

更新数据的时候往往union和join都要用上,join用于更新全量表的旧数据,union用于追加增量数据先更新再追加,重复的不要紧,union会去重

如果觉得《Hive利用增量表更新全量表》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

hive增量表和全量表_基于 Flink + Hive 构建流批一体准实时数仓

2019-01-12

全量表/增量表/快照表

2023-10-11

拉链表增量表全量表

2019-02-06

全量表改成增量表数据过程

2019-04-17

最近发布

患上自闭症后的症状到底有哪些呢

2024-09-07

自闭症的主要特征问

2024-09-07

自闭症是由哪些原因引起的

2024-09-07

自闭症表现详解：认识与理解的关键因素

2024-09-07

自闭症诊断的多种方法探讨

2024-09-07

自闭症儿童与游戏：为何他们常常难以参与？

2024-09-07

找到突破自闭症的方法：助力孩子走出自闭之路

2024-09-07

09月与自闭症患者组队打球十余年他忽然发现对方竟是同父异母的哥哥！

2024-09-07

自闭症会出现哪些常有的症状

2024-09-07

儿童自闭症的潜在病因探究

2024-09-07

推荐专题

自闭症孩子日常活动自闭症认物不行普洱市自闭症机构自闭症仿说干预自闭症女儿韩国电影名字预防怀孕孩子自闭症新西兰自闭症教育衡阳自闭症医院可爱自闭症图片卡通自闭症元神调理自闭症的孩子最终出路自闭症会导致内向敏感吗 2岁儿童自闭症测试想带自闭症儿子自闭症儿童证书介绍