Spark SQL操作JSON字段的小技巧-巨人网络通讯

企业400电话

微网小程序

AI电话机器人

电商代运营

全部栏目

企业400电话网络优化推广 AI电话机器人呼叫中心网站建设商标✡知产微网小程序电商运营彩铃•短信增值拓展业务

Spark SQL操作JSON字段的小技巧

前言

介绍Spark SQL的JSON支持，这是我们在Databricks中开发的一个功能，可以在Spark中更容易查询和创建JSON数据。随着网络和移动应用程序的普及，JSON已经成为Web服务API以及长期存储的常用的交换格式。使用现有的工具，用户通常会使用复杂的管道来在分析系统中读取和写入JSON数据集。在Apache Spark 1.1中发布Spark SQL的JSON支持，在Apache Spark 1.2中增强，极大地简化了使用JSON数据的端到端体验。

很多时候，比如用structure streaming消费kafka数据，默认可能是得到key,value字段，key是偏移量，value是一个byte数组。很可能value其实是一个Json字符串。这个时候我们该如何用SQL操作这个json里的东西呢？另外，如果我处理完的数据，我想写入到kafka,但是我想把整条记录作为json格式写入到Kafka,又该怎么写这个SQL呢？

get_json_object

第一个就是get_json_object，具体用法如下：

select get_json_object('{"k": "foo", "v": 1.0}','$.k') as k

需要给定get_json_object 一个json字段名（或者字符串），然后通过类似jsonPath的方式去拿具体的值。
这个方法其实有点麻烦，如果要提取里面的是个字段，我就要写是个类似的东西，很复杂。

from_json

具体用法如下：

select a.k from (
select from_json('{"k": "foo", "v": 1.0}','k STRING, v STRING',map("","")) as a
)

这个方法可以给json定义一个Schema,这样在使用时，就可以直接使用a.k这种方式了，会简化很多。

to_json

该方法可以把对应字段转化为json字符串，比如：

select to_json(struct(*)) AS value

可以把所有字段转化为json字符串，然后表示成value字段，接着你就可以把value字段写入Kafka了。是不是很简单。

处理具有大量字段的JSON数据集

JSON数据通常是半结构化、非固定结构的。将来，我们将扩展Spark SQL对JSON支持，以处理数据集中的每个对象可能具有相当不同的结构的情况。例如，考虑使用JSON字段来保存表示HTTP标头的键/值对的数据集。每个记录可能会引入新的标题类型，并为每个记录使用一个不同的列将产生一个非常宽的模式。我们计划支持自动检测这种情况，而是使用map类型。因此，每行可以包含Map，使得能够查询其键/值对。这样，Spark SQL将处理具有更少结构的JSON数据集，推动了基于SQL的系统可以处理的那种查询的边界。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

JS利用map整合双数组的小技巧分享
JavaScript的一些小技巧分享
11个Javascript小技巧帮你提升代码质量(小结)
9个JavaScript日常开发小技巧
JavaScript编码小技巧分享
JavaScript前端开发时数值运算的小技巧
处理JavaScript值为undefined的7个小技巧
JS 逻辑判断不要只知道用 if-else 和 switch条件判断(小技巧)
javascript json对象小技巧之键名作为变量用法分析
js 对象使用的小技巧实例分析
JavaScript中的一些实用小技巧总结
JavaScript实用代码小技巧
JS 中可以提升幸福度的小技巧(可以识别更多另类写法)
让你5分钟掌握9个JavaScript小技巧
JavaScript小技巧带你提升你的代码技能

上一篇：neo4j安装配置入门教程
下一篇：使用sqlplus创建DDL和DML操作技巧

相关文章

Spark SQL操作JSON字段的小技巧

前言介绍Spark SQL的JSON支持，这是我们在Databricks中开发的一个功能，可以在Spark中更容易查询和创建JSON数据。随着网络和移动应用程序的普及，JSON已经成为Web服务API以及长期存储的常用Spark,SQL,操作,JSON,字段,的,...

400电话哪家便宜北京400电话客服外包公司靠谱吗？值得信

400电话是全国统一的网络虚拟电话，所以安装时不需要任何硬件设施，可以绑定企业固...

廊坊教育电话软件如何办理,电话呼叫软件-优质服务

廊坊教育电话软件如何办理,电话呼叫软件传统的电销行业痛点较为突出，随着互联网时...

呼叫中心系统的知识库功能介绍

对于呼叫中心系统的功能，不同的呼叫中心厂商提供的功能肯定是不同的，但是依然有...

怎么开通400电话（如何开400电话）

怎么开通400电话（如何开400电话） “怎么开通400电话”这个问题，在现代企业中已经成...

莆田市电话机器人（莆田市电话机器人厂家）

本篇文章给大家谈谈莆田市电话机器人，以及莆田市电话机器人厂家对应的知识点，希...

地图上找不到公司怎么回事？好多商铺地图上找不到怎么

定位器发回的经纬数字在地图上找不到，怎么回事啊？应该是数据格式不匹配，你那数...

全网通外呼系统（全网通外呼系统有哪些）

本文目录一览：1、网络电话外呼体系哪个好？2、什么是网络电话外呼体系？3、智能外...

php更新cookie内容的详细方法

cookie 是由服务器发送到浏览器的变量。cookie 通常是服务器嵌入到用户计算机中的小文...

龙图协助联通(河北)地图标注技术突破

年后第二周，联通（河北）电子地图标注产业电子化项目出现瓶颈，龙图派出近30人研...

都江堰ai电话机器人管理平台（都江堰的座机号码）

本文目录一览：1、电话销售外呼系统软件2、湖北电销企业早读:电话机器人不只会帮忙...

盐城防封电销系统厂家汇港通科技有限公司

汇港通科技团队组建于2018年，是一家专注于中小企业精准营销和企业管理服务解决方案...

400电话的实际功效

南通语音外呼系统报价（南京电话外呼系统）

今天给各位分享南通语音外呼系统报价的知识，其中也会对南京电话外呼系统进行解释...

不会封号的电销电话，防封号外呼软件

不会封号的电销电话，防封号外呼软件总体来说，电销很难找到不封号的软件，如...

ASP注册登陆实例代码

数据库位置：data/data.mdb 数据库表：user idnamepwdwentidaan conn.asp % db="data/data.mdb"'数据库存...

Spark SQL操作JSON字段的小技巧

前言介绍Spark SQL的JSON支持，这是我们在Databricks中开发的一个功能，可以在Spark中更容易查询和创建JSON数据。随着网络和移动应用程序的普及，JSON已经成为Web服务API以及长期存储的常用Spark,SQL,操作,JSON,字段,的,...

© 2016-2020 巨人网络通讯版权所有

《增值电信业务经营许可证》苏ICP备15040257号-8

Spark SQL操作JSON字段的小技巧 Spark,SQL,操作,JSON,字段,的,