当前位置:学术参考网 > hive优点论文参考文献
Hive【78】–该文献是Facebook数据基础设施研究小组撰写的一篇学术论文,介绍了Hive的来龙去脉(注:Hive是一个建立于Hadoop上的数据仓库基础构架。它用来进行数据的提取、转化和加载(即Extract-Transform-Load,ETL),它是一种可以存储、查询和分析存储在Hadoop中的大规模数据的…
北京交通大学毕业设计(论文)开题报告主要参考文献:(1)TomWhite著,曾大聃,周傲英译,《Hadoop权威指南》[专著],北京:清华大学出版社,2010(2)陈勇[著],《基于hadoop平台的通信数据分布式查询算法的设计与实现》[硕士学位论文],北京
张全红(榆林职业技术学院)【摘要】大数据就是用数据化的思维和先进的处理技术相融合,来探索海量数据之间的关系,可以说,大数据是互联网发展到一定阶段的产物,其已经被广泛的应用到各行各业当中。本文
毕业设计(论文)-4-多自由度机械手臂硬件设计2.1机械臂的要求1.承载能力足:手臂是支承手腕的部件,设计时不仅要考虑抓取物体的重量或携带工具的重量,还要考虑运动时的动载荷及转动惯性。.2.刚度高:为了防止臂部在运动过程中产生过大的变形...
Chukwa广州大学华软软件学院某某企业数据分析系统设计Chukwa是基于Hadoop的大集群监控系统,是开源的数据搜集系统。.通过HDFS来存储数据,并依赖MapReduce来处理数据。.2.2Hadoop在互联网的应用淘宝淘宝Hadoop集群现在超过1700个节点,服务于用于整个阿里巴巴...
协同过滤算法是一种较为著名和常用的推荐算法,它基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品进行推荐。.也就是常见的“猜你喜欢”,和“购买了该商品的人也喜欢”等功能。.它的主要实现由:.根据和你有共同喜好的...
Anti-HIVEP3抗体(ab121229)DatasheetSubmitanAbreviewQ&A(1)数据表具体的参考文献实验方案发表研究结果有使用ab121229?请让我们知道,以便我们可以引用本数据...
摘要主要从MapReduce作业调度和Hive性能调优两个方面对Hive的性能优化进行研究.对于MapReduce主要从编程模型切入,分析其执行过程,并从map端、reduce端进行参数调优.接着从...
OptimizationBasedOnHiveWenChen,YeSubmittedinpartialfulfillmentoftherequirementsforthedegreeofMasterofEngineering^SupewisedbyIIIProfessorTao,ZhengSoft...
hive.limit.optimize.limit.file---设置最大的采样样本数缺点:有可能部分数据永远不会被处理到六.本地模式对于小数据集,为查询触发执行任务消耗的时间>实际执行job的时间,因此...
--可以通过设置属性hive.exec.mode.local.auto的值为true,来让hve在适当的时候自动启动这个优化,也可以将这个配置写在$HOME/.hiverc文件中。--当一个job满足如下条件才能真正使用本地模式:...
本章将为大家解答以下问题:基于Hadoop的Hive工具的...如何用Hive进行数据查询。Hive的内置函数。如何用Hive实现电商的自动推荐。如何进行Sqoop的应用开发。Hive...
【摘要】:现有MapReduce工作流中作业之间需将计算结果物化到HDFS(Hadoopdistributedfilesystem),大量磁盘I/O导致其效率较低.基于现有代表性工作Hive,提取并保存MapReduce...
[17]ThusooA,SarmaJS,JainN,etal.Hive-apetabytescaledatawarehouseusingHadoop[J].2010,41(3):996-1005.[18]KhanM,JinY,LiM,etal...
建议将stringcast(casbigint)再进行比较。附:参考文献hive中数据类型的转化CAST-云+社区-...
(1)实时数据采集工具Flume:Flume是一个分布式、高可靠和高可用的海量日志采集、聚合和传输的系统,它可以用来采集文件、socket等各种形式的数据,又可以快速将采集到的数...