spark共74篇
Spark 凭什么成为最火的大数据计算引擎?| 极客时间-卡咪卡咪哈-一个博客

Spark 凭什么成为最火的大数据计算引擎?| 极客时间

原标题:Spark 凭什么成为最火的大数据计算引擎?| 极客时间 现在,几乎所有公司都离不开推荐、广告、搜索这 3 类业务场景,因此 Spark 也相应成了大多数互联网公司的标配: 美团在 2014 年就引...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈11个月前
014712
YARN资源分配,没有比这说的更清楚的了-卡咪卡咪哈-一个博客

YARN资源分配,没有比这说的更清楚的了

让你彻底搞明白YARN资源分配 - 知乎 (zhihu.com)本篇要解决的问题是:Container是以什么形式运行的?是单独的JVM进程吗?YARN的vcore和本机的CPU核数关系?每个Container能够使用的物理内存和虚...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0997
AI大模型团队Colossal-AI破局创新,火热招募中!-卡咪卡咪哈-一个博客

AI大模型团队Colossal-AI破局创新,火热招募中!

公司简介 潞晨科技致力于解放 AI 生产力,通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等自研技术,打造面向大模型时代的通用深度学习系统 Colossal-AI ,高效促进 AI 大模型...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈11个月前
0975
与 Hadoop 对比,如何看待 Spark 技术?-卡咪卡咪哈-一个博客

与 Hadoop 对比,如何看待 Spark 技术?

Hadoop 首先看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。HDFS,在由普通PC组成的集群上提供...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
09013
Spark: 基本架构及原理-卡咪卡咪哈-一个博客

Spark: 基本架构及原理

Spark(一): 基本架构及原理 Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hado...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
08911
大数据开发:Hadoop、Spark、Flink三大框架对比-卡咪卡咪哈-一个博客

大数据开发:Hadoop、Spark、Flink三大框架对比

目前来说,大数据领域最为活跃的三个计算框架,当属Hadoop、Spark以及Flink这三者。三个框架在不同的大数据处理场景当中,表现各有优势,因此也常常被拿来做比较。今天我们也来做个对比,看看Ha...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈11个月前
08810