Pig是一个基于Hadoop的大规模数据分析平台,它为复杂的海量数据并行计算提供了一个简单的操作和编程接口。
相似题目
-
电子支付的工作环境是基于一个封闭的系统平台。
-
网上支付的工作环境是基于一个开放的系统平台(Internet)之中。
-
Hadoop是当前大数据平台的事实标准,下列对Hadoop的描述中正确的是()。
-
微博是一个基于用户关系信息分享、传播以及()的平台
-
增强型近地警告系统(EGPWS),它基于一个全球地形数据库,该数据库可以提供的信息是()
-
Oracle和ChinaByte将联手在中国推广电子商务,其中Oracle将为ChinaByte提供完全基于Internet的技术平台,包括业界第一个100%的Internet数据库(),为ChinaByte开展电子商务提供可靠的基础。
-
传统支付的工作环境是基于一个开放的系统平台。
-
电子支付的工作环境是基于一个开放的系统平台。
-
百度是一个基于自然语言搜索技术的用户互动型问答平台。
-
( )是一个基于自然语言搜索技术的用户互动型问答平台。
-
基于 Hadoop 技术,用来存储半结构化 / 非结构化数据的数据库属于( )。
-
HBase是基于Hadoop的一个分布式数据库,关于HBase,下列说法正确的是()
-
传统支付是基于一个开放的平台(因特网)进行。( )
-
单机串行处理1G,URL数据需要10分钟,Hadoop平台并行处理只需要1分钟,那么加速比为()
-
作为新一代信息技术与智能制造深度融合的产物,工业互联网的目的旨在结合软件和大数据分析,重构全球工业,将人、数据及机器各种元素互联起来,大规模提升工业制造的生产力。它通过系统构建网络、平台、安全三大功能体系,打造人、机、物全面互动的新型网络基础设施,形成了智能化发展的新兴业态和应用模式;通过工业数据的全面深度感知、实施传输交换、快速计算处理和高级建模分析,实现了智能控制、运营优化和生产组织方式的变革
-
数据服务目录建设的主要目标:基于大数据平台,按照数据服务产品线, 采用应用驱动、迭代更新的模式,对数据资产信息进行全面梳理,逐步构建一个面向用户、统一规范、全面准确的数据服务目录视图()
-
BC-Hadoop产品基于最新开源Hadoop的版本是()
-
基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储的组件有()
-
Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等。以下关于Fusininsight资源分布监控说法正确的有()
-
Hadoop平台中,要查看 YARN服务中一个appication的信息,通常需要使用什么命令()
-
Hadoop是目前广泛应用的大数据处理分析平台。在Hadoop1.0.0版本之前,Hadoop并不存在安全认证一说。认集群内所有的节点都是可靠的,值得信赖的。用户与服务器进行交互时并不需要进行验证。导致在恶意用户装成真正的用户或者服务器入侵到Hadoop集群上,恶意的提交作业篡改分布式存储的数据伪装成NameNo安康头发Task Tracker接受任务等。在Hadoop2.0中引入Kerberos机制来解决用户到服务器认证问题,Kerberos认证过程不包括()
-
基于hadoop的大数据处理生态中,HBASE是一种什么组件?()
-
Hadoop集群规模很大时,数据的分布情况非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做负载均衡等,fusionInsight资源分布监控说法正确的是?()
-
基于Hadoop的应用编程中,spark,DataFrame和RDD最大的区别()。