-
不能错过!超全Anaconda(Python整合包)导修(图文详解)
全文共2653字,预计学习时长10分钟Anaconda是一个供数据科学家、IT专家,和商业领袖使用的数据科学平台,是Python、R语言等的一个发行版。针对数据科学,它有超过300个软件包,因此它迅速攀升为最好的数据平台之一。本篇导修将会探讨如何运用Anaconda帮助Python编程。以下是本文要...
02月22日[经验文章]浏览:8
-
-
-
什么是 Druid_什么是druid
Apache Druid 是一个实时分析型数据库,旨在对大型数据集进行快速查询和分析(“OLAP” 查询 。Druid 最常被当做数据库,用以支持实时摄取、高查询性能和高稳定运行的应用场景。 例如,Druid 通常被用来作为图形分析工具的数据源来提供数据,或当有需要高聚和高并发的后端 API。 同时...
02月22日[经验文章]浏览:7
-
-
-
浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构
导读:浙江霖梓早期使用 CDH 产品套件搭建了大数据系统,面临业务逻辑冗余、查询效率低下等问题,基于 Apache Doris 进行整体架构与表结构的重构,并基于湖仓一体和查询加速展开深度探索与实践,...
02月22日[经验文章]浏览:7
-
基于 Doris + Paimon 打造实时/离线一体化湖仓架构
早期架构及痛点下图是早期的 CDH 架构示意图,MySQL 数据通过 Sqoop 全量导入至 Hive,埋点数据通过 Java 程序清洗后进入 Flume 的 source 端,并最终 sink 到 Hive 的分区表中,离线数仓任务的 ETL 由 Hive 执行,批处理作业则通过 Spark SQ...
02月22日[经验文章]浏览:9
-
十几年前的一段20天项目经历往事_一个项目干十年
时间转眼过去一年多了 ,我离开 H公司也已经一年多了 。往事不堪回首 ,世事也总是以成败论英雄的 ,因为我知道前面的一个接口项目先后导致 3个人离职 ,2个人被处罚 ;而这个项目只有我一个人 ,在项目割接的当天我总算不辱使命完成了 ;我既是成功者 ,也是失败者 ;我证明了自己是可以笑着离开H公司的...
02月22日[经验文章]浏览:5
-