《曾国藩家书》读书笔记-修身篇
liuxuecheng 2年前 (2020-09-27) 480浏览 0评论
来阿里两年多,眼看服务器要到期了,博客也荒废了好久。最近读了挺久《曾国藩家书》,写点读书笔记吧。 接触这本书,还是家里长辈极力推荐。说实话对于晚清的历史、人物我其实不太感兴趣,尤其曾国藩等处于晚清乃至中国历史比较尴尬的一段时间,在潜意识里觉得把一个偌...
liuxuecheng 2年前 (2020-09-27) 480浏览 0评论
来阿里两年多,眼看服务器要到期了,博客也荒废了好久。最近读了挺久《曾国藩家书》,写点读书笔记吧。 接触这本书,还是家里长辈极力推荐。说实话对于晚清的历史、人物我其实不太感兴趣,尤其曾国藩等处于晚清乃至中国历史比较尴尬的一段时间,在潜意识里觉得把一个偌...
liuxuecheng 4年前 (2018-10-25) 5122浏览 1评论
生成jar、source-jar、和doc-jar的三个maven插件 <build> <plugins> <plugin> <groupId>org.a...
liuxuecheng 4年前 (2018-10-16) 7329浏览 0评论
1.背景 需求是使用sqoop导出HDFS上的数据到MySQL,理论上来说是个很简单的需求,写了个如下的sqoop脚本: sqoop export \ --connect jdbc:mysql://host:port/db \ --username ...
liuxuecheng 4年前 (2018-07-26) 12592浏览 0评论
1.背景 使用hive的动态分区(dynamic partition)时,如果最终生成的分区数比较多,会出现jvm直接内存(direct buffer memory)溢出的情况,导致分区作业失败。假如有一张订单表t_order_tmp,里面有个字段c...
liuxuecheng 4年前 (2018-07-19) 8167浏览 4评论
1.背景 当前业务使用TextFile存储日志,每天增量5T左右,集群存储空间有限,且使用TextFile日志的扩展性非常差,因此想到使用protocol buffer序列化数据,后续传输及处理使用二进制。百度+google了一圈发现没有现成案例,所...
liuxuecheng 4年前 (2018-07-19) 4719浏览 0评论
在本地安装hadoop可以很方便的连接eclipse等工具调试hadoop源码或者是自己写的yarn应用,下面讲一下如何安装。 1.下载文件 (1)下载hadoop,建议2.x版本(这里使用的是hadoop2.5.2)并解压到本地目录。 (2)下载h...
liuxuecheng 4年前 (2018-07-18) 9103浏览 0评论
1.简介 Avro是一个数据序列化系统,它有以下特性: (1)丰富的数据结构。 (2)一种紧凑、快速的二进制文件格式。 (3)存放持久化数据的容器文件。 (4)远程过程调用。 (5)支持动态语言、使用schema生成代码。 2.引入pom 在加入以下...
liuxuecheng 4年前 (2018-07-14) 6837浏览 0评论
log4j2 是log4j的升级版,在功能和性能上都有很大的提升。 1.常用组件 1.1 Appenders Appender负责将LogEvents传递到目的地。 每个Appender都必须实现Appender接口。 大多数Appender继承自A...
liuxuecheng 4年前 (2018-06-29) 5936浏览 0评论
1.flume安装与配置 (1)官网下载:http://flume.apache.org/download.html 并解压到自己的目录 (2) 配置环境变量: 新建FLUME_HOME,变量值为flume的安装目录。 编辑系统变量p...
liuxuecheng 4年前 (2018-06-29) 3360浏览 0评论
总结一下有关两个指针的算法题。这里的指针起游标的作用,一般用在处理字符串或者数组的相关问题上。有两个指针从头尾向中间移动,也有从头到尾一前一后一起移动。 1.求一个字符串的最大不重复子串的长度 一种接近暴力求解的方法就是遍历所有可能的子串组合,然后找...