『LESSON 5』
资源优化经验计算一、引擎:选用最优的引擎,推荐spark,spark比hive平均节约60%二、缓存:最大限度地用广播/缓存(如mapjoin),性能可提高数倍三、为了节约下游消耗,上游表的优化手段:1. text表转orc,适合下游读取个别字段的使用场景2. 去除多余维度提高聚合度,减少存储的数据
前言总结一下自己平时常用的iTerm快捷键,当是备忘也好,后续会不定期更新。iTerm2 快捷键快捷键作用说明command + f搜索&查找,如果输入搜索内容后,按下 tab 键,就会 iTerm 自动帮选中搜索关键词,并且自动的帮我们复制到了剪贴板中。如果输入的是 shift+ta
原理把所有的映射构建一个Tire树,然后用ac自动机匹配替换代码public class AhoCorasickAutomaton { /*AC自动机的根结点,根结点不存储任何字符信息*/ private final Node root; /*待查找的目标字符串集合*/ pr