当前位置:首页>正文

SPARK高级数据分析 (美)里扎(Sandy Ryza) 等 著 kindle pdf 115盘 snb chm 下载 免费 mobi

免费下载书籍地址:PDF下载地址

精美图片

SPARK高级数据分析 (美)里扎(Sandy Ryza) 等 著书籍详细信息

  • ISBN:9787564159108
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2015-09
  • 页数:260
  • 价格:35.80
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分

寄语:

新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!

内容简介:

网络数据量迅速增大的时代,亟需能高效迅捷分析处理数据的工具,Spark应运而生。本书由Spark开发者及核心成员打造,带领读者快速掌握用Spark收集、计算、简化保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。

书籍目录:

Foreword

Preface

1.Analyzing Big Data

The Challenges of Data Saence

Introduang Apache Spark

About This Book

2.Introduction to Data Analysis with Scala and Spark

Scala for Data Scientists

The Spark Programming Model

Record Linkage

Getting Started: The Spark Shell and Spark Context

Bringing Data from the Cluster to the Client

Shipping Code from the Client to the Cluster

Structuring Data with Tuples and Case Classes

Aggregations

Creating Histograms

Summary Statistics for Continuous Variables

Creating Reusable Code for Computing Summary Statistics

Simple Variable Selection and Scoring

Where to Go from Here

3.Recommending Music and the Audioscrobbler Data Set

Data Set

The Alternating Least Squares Recommender Algorithm

Preparing the Data

Building a First Model

Spot Checking Recommendations

Evaluating Recommendation Quality

Computing AUC

Hyperparameter Selection

Making Recommendations

Where to Go from Here

4.Predicting Forest Cover with Deasion Trees

Fast Forward to Regression

Vectors and Features

Training Examples

Decision Trees and Forests

Covtype Data Set

Preparing the Data

A First Decision Tree

Deasion Tree Hyperparameters

Tuning Decision Trees

Categorical Features Revisited

Random Decision Forests

Making Predictions

Where to Go from Here

5.Anomaly Detection in Network Traffic with K—means Clustering

Anomaly Detection

K—means Clustering

Network Intrusion

KDD Cup 1999 Data Set

A First Take on Clustering

Choosing k

Visualization in R

Feature Normalization

Categorical Variables —

Using Labels with Entropy

Clustering in Action

Where to Go from Here

6.Understanding Wikipedia with Latent Semantic Analysis

The Term—Document Matrix

Getting the Data

Parsing and Preparing the Data

Lemmatization

Computing the TF—IDFs

Singular Value Decomposition

Finding Important Concepts

Querying and Scoring with the Low—Dimensional Representation

Term—Term Relevance

Document—Document Relevance

Term—Document Relevance

Multiple—Term Queries

Where to Go from Here

7.Analyzing Co—occurrence Networks with GraphX

The MEDLINE Citation Index: A Network Analysis

Getting the Data

Parsing XML Documents with Scala's XML Library

Analyzing the MeSH Major Topics and Their Co—occurrences

Constructing a Co—occurrence Network with GraphX

Understanding the Structure of Networks

Connected Components

Degree Distribution

Filtering Out Noisy Edges

Processing Edge Triplets

Analyzing the Filtered Graph

Small—World Networks

Cliques and Clustering Coefficients

Computing Average Path Length with Pregel

Where to Go from Here

8.Geospatial and Temporal Data Analysjs on the New York City Taxi Trip Data

Getting the Data

Working with Temporal and Geospatial Data in Spark

Temporal Data with Joda Time and NScala Time

Geospatial Data with the Esri Geometry API and Spray

Exploring the Esri Geometry API

Intro to GeolSON

Preparing the New York City Taxi Trip Data

Handling Invalid Records at Scale

Geospatial Analysis

Sessionization in Spark

Building Sessions: Secondary Sorts in Spark

Where to Go from Here

9.Estimating Financial Risk through Monte Carlo Simulation

Terminology

Methods for Calculating VaR

Variance—Covariance

Historical Simulation

Monte Carlo Simulation

Our Model

Getting the Data

Preprocessing

Determining the Factor Weights

Sampling

The Multivariate Normal Distribution

Running the Trials

Visualizing the Distribution of Returns

Evaluating Our Results

Where to Go from Here

10.Analyzing Genomics Data and the BDG Project

Decoupling Storage from Modeling

Ingesting Genomics Data with the ADAM CLI

Parquet Format and Columnar Storage

Predicting Tranion Factor Binding Sites from ENCODE Data

Querying Genotypes from the 1000 Genomes Project

Where to Go from Here

11.Analyzing Neuroimaging Data with PySpark and Thunder

Overview of PySpark

PySpark Internals

Overview and Installation of the Thunder Library

Loading Data with Thunder

Thunder Core Data Types

Categorizing Neuron Types with Thunder

Where to Go from Here

A.Deeper into Spark

B.Upcoming MLlib Pipelines API

Index

作者介绍:

Sandy Ryza,是Cloudera的不错数据科学家,也是Apache Spark项目的活跃贡献者。

出版社信息:

暂无出版社相关信息,正在全力查找中!

书籍摘录:

暂无相关书籍摘录,正在全力查找中!

在线阅读/听书/购买/PDF下载地址:

在线阅读地址:SPARK高级数据分析 (美)里扎(Sandy Ryza) 等 著在线阅读

在线听书地址:SPARK高级数据分析 (美)里扎(Sandy Ryza) 等 著在线收听

在线购买地址:SPARK高级数据分析 (美)里扎(Sandy Ryza) 等 著在线购买

原文赏析:

暂无原文赏析,正在全力查找中!

其它内容:

暂无其它内容!

书籍真实打分

故事情节:7分

人物塑造:5分

主题深度:5分

文字风格:5分

语言运用:9分

文笔流畅:3分

思想传递:5分

知识深度:8分

知识广度:8分

实用性:5分

章节划分:9分

结构布局:6分

新颖与独特:3分

情感共鸣:4分

引人入胜:6分

现实相关:8分

沉浸感:7分

事实准确性:7分

文化贡献:3分

网站评分

书籍多样性:7分

书籍信息完全性:5分

网站更新速度:5分

使用便利性:5分

书籍清晰度:7分

书籍格式兼容性:5分

是否包含广告:9分

加载速度:4分

安全性:3分

稳定性:3分

搜索功能:4分

下载便捷性:6分

下载点评

  • 值得下载(398+)
  • 目录完整(574+)
  • 超值(639+)
  • 格式多(595+)
  • 盗版少(619+)
  • 在线转格式(508+)
  • 不亏(547+)

下载评价

网友 常***翠:哈哈哈哈哈哈

网友 宫***玉:我说完了。

网友 曹***雯:为什么许多书都找不到?

网友 冷***洁:不错,用着很方便

网友 冯***丽:卡的不行啊

网友 宓***莉:不仅速度快,而且内容无盗版痕迹。

网友 养***秋:我是新来的考古学家

网友 步***青:。。。。。好

网友 薛***玉:就是我想要的!!!

版权声明

1本文:SPARK高级数据分析 (美)里扎(Sandy Ryza) 等 著转载请注明出处。
2本站内容除签约编辑原创以外,部分来源网络由互联网用户自发投稿仅供学习参考。
3文章观点仅代表原作者本人不代表本站立场,并不完全代表本站赞同其观点和对其真实性负责。
4文章版权归原作者所有,部分转载文章仅为传播更多信息服务用户,如信息标记有误请联系管理员。
5本站一律禁止以任何方式发布或转载任何违法违规的相关信息,如发现本站上有涉嫌侵权/违规及任何不妥的内容,请第一时间联系我们申诉反馈,经核实立即修正或删除。


本站仅提供信息存储空间服务,部分内容不拥有所有权,不承担相关法律责任。

相关文章:

  • 致无尽岁月 kindle pdf 115盘 snb chm 下载 免费 mobi
  • HOUSE THAT GEORGE BUILT, THE(ISBN=9780812970180) 英文原版 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 交流变频调速器选用手册 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 燃气压力容器焊工/职业技能岗位鉴定试题库 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 孩子18岁前,父亲要做的50件事 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 彩虹兔欢唱童谣 第一辑 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 【正版】剑桥国际英语教程(附光盘入门级学生包第5版共3册) 外研社 剑桥国际英语教材 初级英语培训教材 英语自学 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 套装2册 住宅物语+有温度的家 一兜糖适合国人的装修设计灵感家庭装修案例详解室内设计师谈单参考书全屋定制 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 闯关东前传 kindle pdf 115盘 snb chm 下载 免费 mobi
  • 大师的色彩(国外建筑大师力作书系) kindle pdf 115盘 snb chm 下载 免费 mobi