频道栏目
首页 > 安全 > 云计算 > 正文
  • 15分钟熟悉HBaseShell命令

    15分钟熟悉HBaseShell命令

    关键词: 命令 

  • Hadoop提取KPI进行海量Web日志

    Hadoop提取KPI进行海量Web日志分析。Web日志包含着网站最重要的信息,通过日志分析,我们可以知道网站的访问量,哪个网页访问人数最多,哪个网页最有价值等。一般中型的网站(10W的PV以上),每天会产生1G以上Web日志文件。

    关键词: 海量  日志 

  • OracleVM+centos7.1+o

    OracleVM+centos7 1+openstackkilo多结点安装教程---neutron的安装(2)。声明:最近在进行openstack的kilo版本的安装,发现现有的网络教程非常少,而且多数教程并不能安装成功,故写此教程。openstack的安装较为复杂,本教程并不能保证在不同环境下也能将其安装成功。

    关键词: 结点  教程 

  • OracleVM+centos7.1+o

    OracleVM+centos7 1+openstackkilo多结点安装教程---neutron的安装(3)。声明:最近在进行openstack的kilo版本的安装,发现现有的网络教程非常少,而且多数教程并不能安装成功,故写此教程。

    关键词: 结点  教程 

  • Spark版本定制版3-通过案例对Spa

    Spark版本定制版3-通过案例对SparkStreaming透彻理解三板斧之三。本讲内容基于Spark 1 6 1版本(在2016年5月来说是Spark最新版本)讲解。

    关键词: 三板斧  案例  版本 

  • Hadoop学习之网络爬虫+分词+倒排索

    Hadoop学习之网络爬虫+分词+倒排索引实现搜索引擎案例。

    关键词: 习之  爬虫  索引  案例  搜索引擎  网络 

  • ElasticSearch(三)--文档

    ElasticSearch(三)--文档。面向对象编程语言流行的原因之一是,可以用对象表示和处理现实生活中那些有潜在关系和复杂结构的实体.到目前为止,这种方式还不错。

    关键词: 文档 

  • HiveQL基本操作整理

    HiveQL基本操作整理。

    关键词: 基本操作 

  • 在Kaggle手写数字数据集上使用Spa

    在Kaggle手写数字数据集上使用SparkMLlib的朴素贝叶斯模型进行手写数字识别。

    关键词: 数字  模型  数据  贝叶斯 

  • Hadoop之仿写搜索引擎

    Hadoop之仿写搜索引擎。这篇文章,可能比较长,如果你觉得写得好可以把它看完,希望对你有所帮助。

    关键词: 搜索引擎 

  • HadoopJoin

    HadoopJoin。Reduce端join,适合于两个大表 Map端join,适合一个大表和一个小表,小表放到 Distribute Cache里面 semi join 当join只用到其中一个表中的一小部分时。

    关键词:

  • MapReduce中的join算法-re

    MapReduce中的join算法-reduce端join。在海量数据的环境下,不可避免的会碰到join需求, 例如在数据分析时需要连接从不同的数据源中获取到数据。假设有两个数据集:气象站数据库和天气记录数据库,并考虑如何合二为一。

    关键词: 算法 

  • Java中Comparable和Comp

    Java中Comparable和Comparator的辨析。在对集合元素进行比较时一般使用TreeSet。对于简单的数据类型,TreeSet可以直接进行比较。但是对于复杂的数据类型,比如自己定义的数据类型或者类,就需要自己设置比较方法与比较规则了,这时就需要用到Comparable和Comparator了。

    关键词:

  • windows下pycharm开发spa

    windows下pycharm开发spark。

    关键词:

  • ganglia集群的搭建与hadoop集

    ganglia集群的搭建与hadoop集群的搭建。Ganglia是UCBerkeley发起的一个开源监视项目,设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量数据(如处理器速度、内存使用量等)的名为gmond的守护进程。

    关键词: 集群 

  • Java核心技术(六)——接口

    Java核心技术(六)——接口。后面的博文,我们将开始Java的常用高级技术学习。接口技术,主要用来描述类具有什么样的功能,而并不给出每个功能的具体实现。一个类可以实现(implement)一个或多个接口,并在需要接口的地方,随时使用实现了相应接口的对象。

    关键词: 接口  核心  技术 

  • tomcat启动时候报错java.lan

    tomcat启动时候报错java lang ClassCastException。

    关键词: 时候 

  • 参考资源限制方法两种

    参考资源限制方法两种。资源限制针对 docker daemon ( 不针对 contrainer )。资源限制针对 docker contrainer (针对 contrainer 及 contrainer 下所有的进程 )。

    关键词: 方法  资源 

  • Kafka的安装及测试

    Kafka的安装及测试。

    关键词:

  • 第93讲:SparkStreamingu

    第93讲:SparkStreamingupdateStateByKey案例实战和内幕源码。第一部分:updateStateByKey它的主要功能是随着时间的流逝,在Spark Streaming中可以为每一个key可以通过CheckPoint来维护一份state状态,通过更新函数对该key的状态不断更新。

    关键词: 内幕  实战  源码  案例 

排行
热门
论坛推荐

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站