数据科学是关于量化和理解人类行为,社会科学的圣杯。在下面的章节中,我们将探索一个多方面范式的广泛理论、技术、数据和应用。我们还将回顾为大数据和数据科学开发的新技术,比如使用Dean和Ghemawat(2008)在谷歌和25开发的MapReduce范式,并在雅虎的开源项目Hadoop中实现的分布式计算。26当数据变得超大时,将算法移到数据上比将算法移到数据上要好。正如大数据颠倒了数据库范式一样,大数据也在改变人类行为研究中推理的本质。归根结底,数据科学是社会科学家利用计算机科学的一种思维方式。

https://srdas.github.io/MLBook/

成为VIP会员查看完整内容
65

相关内容

【经典书】数据结构与算法,770页pdf
专知会员服务
143+阅读 · 2021年4月15日
【经典书】计算理论导论,482页pdf
专知会员服务
86+阅读 · 2021年4月10日
【干货书】机器学习Primer,122页pdf
专知会员服务
109+阅读 · 2020年10月5日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
七本书籍带你打下机器学习和数据科学的数学基础
独家 | 一文读懂优化算法
数据派THU
8+阅读 · 2017年9月15日
Arxiv
0+阅读 · 2021年5月26日
Arxiv
13+阅读 · 2021年5月3日
Arxiv
22+阅读 · 2018年2月14日
VIP会员
相关主题
相关VIP内容
【经典书】数据结构与算法,770页pdf
专知会员服务
143+阅读 · 2021年4月15日
【经典书】计算理论导论,482页pdf
专知会员服务
86+阅读 · 2021年4月10日
【干货书】机器学习Primer,122页pdf
专知会员服务
109+阅读 · 2020年10月5日
相关论文
Arxiv
0+阅读 · 2021年5月26日
Arxiv
13+阅读 · 2021年5月3日
Arxiv
22+阅读 · 2018年2月14日
微信扫码咨询专知VIP会员