成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Spark
关注
0
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
综合
百科
VIP
热门
动态
论文
精华
Riemannian-Geometric Fingerprints of Generative Models
Arxiv
0+阅读 · 10月28日
When Intelligence Fails: An Empirical Study on Why LLMs Struggle with Password Cracking
Arxiv
0+阅读 · 10月26日
Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning
Arxiv
0+阅读 · 10月27日
AQORA: A Fast Learned Adaptive Query Optimizer with Stage-Level Feedback for Spark SQL
Arxiv
0+阅读 · 10月27日
Aircraft Collision Avoidance Systems: Technological Challenges and Solutions on the Path to Regulatory Acceptance
Arxiv
0+阅读 · 10月23日
Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence
Arxiv
0+阅读 · 10月23日
Spark Transformer: Reactivating Sparsity in FFN and Attention
Arxiv
0+阅读 · 10月23日
Serverless GPU Architecture for Enterprise HR Analytics: A Production-Scale BDaaS Implementation
Arxiv
0+阅读 · 10月22日
Comparative analysis of large data processing in Apache Spark using Java, Python and Scala
Arxiv
0+阅读 · 10月21日
The Spark Effect: On Engineering Creative Diversity in Multi-Agent AI Systems
Arxiv
0+阅读 · 10月17日
Balancing Fairness and Performance in Multi-User Spark Workloads with Dynamic Scheduling (extended version)
Arxiv
0+阅读 · 10月17日
AQORA: A Learned Adaptive Query Optimizer for Spark SQL
Arxiv
0+阅读 · 10月12日
U-Turn: Enhancing Incorrectness Analysis by Reversing Direction
Arxiv
0+阅读 · 10月10日
Trajectory Prediction Meets Large Language Models: A Survey
Arxiv
0+阅读 · 10月7日
Reward Models are Metrics in a Trench Coat
Arxiv
0+阅读 · 10月3日
参考链接
父主题
大数据处理
数据批处理框架
子主题
Databricks
Shark
Spark SQL
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top