Data工程

显示2个结果中的1-2个

分享

Apache Spark高性能数据处理优化技术

Apache Spark是一个分析引擎,可以处理非常大的数据集. 本指南揭示了使用PySpark优化其性能的策略.

11分钟阅读继续阅读
Necati Demir博士

Necati Demir博士

数据工程师的非传统数据存储指南

随着大数据和数据科学的兴起, 存储和检索已成为数据使用和分析的关键管道组件. 近年来,新的数据存储技术不断涌现. 但问题是:你应该选择哪一个? 哪一个最适合数据工程?

在本文中, Toptal数据科学家胡厚崑比较了数据工程背景下的三种主要存储技术.

7分钟阅读继续阅读
胡厚崑

胡厚崑

世界级的文章,每周发一次.

输入您的电子邮件,即表示您同意我们的 隐私政策.

加入总冠军® 社区.