1、封面介绍2、出版时间2020年11月3、推荐理由本书适合初级和中级软件工程师阅读,未接触过流计算领域的Java开发者也可以从本书中获益。针对初学者,本书提供Windows环境搭建的演示,使不具备Linux系统操作经验的读者也可以快速学习Apache Flink。本书从Apache Flink的缘起开始,由浅入深,理论结合实践,全方位地介绍Apach...

1、封面介绍2、出版时间2020年6月3、推荐理由适读人群 :数据库系统工程师、开发工程师、运维工程师、存储工程师及其他相关从业人员本书从数据库开发者角度,对现代数据库技术进行了全景式解读,完全不拘泥于任何一款数据库系统,也不偏袒任何一种数据库的类型或特性。这本书只会讨论现代数据库必不可少的那些东西,例如存储格式、索引数据结构、数据一致性等,以及相关的...

1、封面介绍2、出版时间2010年5月3、推荐理由《数据库系统实现(第2版)》内容深入且全面,技术实用且先进,叙述深入浅出,是一本难得的高层次的教材,适合作为高等院校计算机专业研究生的教材或本科生的教学参考书,也适合作为从事相关研究或开发工作的专业技术人员的高级参考资料。《数据库系统实现(第2版)》是斯坦福大学计算机科学专业数据库系列课程第二门课的教科...

1、封面介绍2、出版时间2014年5月3、推荐理由《分布式数据库系统原理(第3版)》主要介绍分布式数据库管理系统的基本概念、基本理论和设计问题,涵盖了分布式数据库系统的设计、实现和管理等方面的诸多专题。全书由两大部分组成,第一部分包括第1~14章,以关系数据库为主,讲述了分布式数据管理的基础原理,内容包括分布式数据库设计,分布式查询的分解与优化,事务管...

1、封面介绍2、出版时间2017年12月3、推荐理由本书是数据库领域的经典畅销著作,被世界多所大学选为教材,同时被广大技术人员和管理人员视为必读书。本书作者曾在工业界致力于数据库系统的设计,后进入学术界精耕于教学,深谙专业人士和非专业人士在使用和学习数据库时的痛点。因此,本书采用这两类读者都易于接受和理解的方式,全面介绍数据库设计、实现和管理的基本理论...

1、封面介绍2、出版时间2016年5月3、推荐理由本书是数据库领域的经典著作,内容系统、全面、实用,被世界多所大学选为数据库相关课程的教材。中文版分为基础篇和进阶篇,分别对应原书~五部分和第六~九部分。本书为基础篇,主要内容包括:数据库系统与数据库设计的基础知识;关系模型与语言;数据库分析与设计的主要技术;数据库设计方法学;以及现代数据库管理相关专题,...

1、封面介绍2、出版时间2012年4月3、推荐理由数据库系统方面的经典教材,被国外许多知名大学采用。决战大数据时代!IT技术人员不得不读!数据库领域的殿堂级作品,夯实数据库理论基础,增强数据库技术内功的必备之选,对深入理解数据库,深入研究数据库,深入操作数据库都具有极强的指导作用!《数据库系统概念(原书第6版)》是经典的数据库系统教科书《Databas...

科德十二定律,又称黄金十二定律,是计算机数据库中的一条定律,目的是数据库关系化。关系模型的奠基人埃德加·科德具体地给出了全关系系统应遵循的基本准则,如下所示:准则0一个关系型的数据库必须能完全通过它的关系能力来管理数据库。准则1 信息准则关系数据库的所有信息都应该在逻辑一级上用表中的值这一种方法显式的表示。准则2 保证访问准则依靠表名、主码和列名的组合...

简介埃德加·弗兰克·科德(英语:Edgar Frank Codd, 1923年8月23日-2003年4月18日),小名泰德·科德(Ted Codd),生于英国英格兰多塞特郡的波特兰,计算机科学家。他为关系型数据库理论做出了奠基性的贡献。他在IBM工作期间,首创了关系模型理论。他一生中为计算机科学做出了很多有价值的贡献,而关系模型作为一个在数据库管理方面...

Ted Codd于1923年出生在英格兰多塞特郡波特兰市的一个大家庭中。他曾经就读于牛津大学,主修数学和化学专业,第二次世界大战期间曾在英国皇家空军服役。第二次世界大战后,Codd动身前往纽约并成为IBM的一名编程员。Codd所做的第一个项目是帮助构建一个称为可选顺序电子计算器(Selective Sequence Electronic Calcula...

Flink用DataStream表示无界数据集,用DataSet表示有界数据集,前者用于流处理应用程序,后者用于批处理应用程序。从操作形式上看,DataStream 和 DataSet 与集合 Collection 有些相似,但两者有着本质的区别:(1)DataStream 和 DataSet 是不可变的数据集合,因此不可以像操作集合那样增加或者删除 ...

随着时代的发展,企业对数据实时处理的需求愈来愈大,所以就出现了storm/spark流框架。这两者有着自己的计算模式:storm属于真正的流式处理,低延迟(ms级延迟),高吞吐,且每条数据都会触发计算。spark属于批处理转化为流处理即将流式数据根据时间切分成小批次进行计算,对比与storm而言延迟会高于0.5s(s级延迟),但是性能上的消耗低于sto...

1、Spark Streaming1.1 Spark概述Spark是UC Berkeley AMP Lab开源的类似于MapReduce的通用的并行计算框架,同时兼顾分布式的并行计算模型和基于内存计算的特点。Spark优于MapReduce的最大的好处是作业计算的中间结果不需要再像MapReduce一样刷写到hdfs等外部存储,而是保存在内存中,因此不...

Spark注重建立良好的生态系统,它不仅支持多种外部文件存储系统,提供了多种多样的集群运行模式。Spark部署在单台机器上时,既可以用本地(Local)模式运行,也可以使用伪分布式模式来运行;当Spark以分布式集群部署的时候,可以根据自己集群的实际情况选择Standalone模式(Spark自带的模式)、Spark on YARN模式或者Spark ...

pandas 中 inplace 参数在很多函数中都会有,它的作用是:是否在原对象基础上进行修改inplace = True:不创建新的对象,直接对原始对象进行修改;inplace = False:对数据进行修改,创建并返回新的对象承载其修改结果。默认是False,即创建新的对象进行修改,原对象不变,和深复制和浅复制有些类似。

北京国际大数据交易所(简称:北数所),由具有优质数据资源的市属国企对现有交易所进行重组更名。北数所的成立意味着政府将加快建设金融、医疗、交通等公共数据专区,凡是被政府部门、公共事业单位所掌握,且有市场商业需求的高价值敏感数据,均应通过交易所进行数据使用权的交易。数据交易课题由来已久,然而不同于土地、劳动力、资本等生产要素,数据有成本极低、再生性强、难以...

2021年3月31日,在北京市人民政府的大力推动下,北京市经济和信息化局会同市金融局、市商务局、市委网信办等部门,组织北京金控集团牵头发起成立北京国际大数据交易有限公司(下称北京国际大数据交易所或北数所)。定位与发展规划北数所是国内首家基于“数据可用不可见,用途可控可计量”新型交易范式的数据交易所,定位于打造国内领先的数据交易基础设施和国际重要的数据跨...

为推动数据要素市场化配置和数字经济高质量发展,助力推进首都“两区”建设,3月31日,北京市经济和信息化局会同北京市金融局、商务局、网信办等部门,组织北京金控集团牵头发起成立北京国际大数据交易有限公司(下称北京国际大数据交易所或北数所)并在京举办发布会。发布会上,北京国际大数据交易所成立,北京数据交易系统上线。这是国内首家基于“数据可用不可见,用途可控可...