为什么不使用JavaScript分析数据呢?你可借助新的库和数据处理技术来采集、清洗、处理、存储和呈现Web应用数据。JavaScript语言管道和以数据为中心的Web应用将极大地提升你的工作效率。
《JavaScript数据整理》将JavaScript作为数据分析的核心,呈现大量紧贴实用的方法,指导你创建基于JavaScript的数据处理管道,处理常见数据和异常数据,并掌握一些有效的故障排除策略。此外,你可实现交互式可视化,将应用部署到生产环境中。每章的内容都极具价值,为你的可重用数据整理工具包添加新利器。
主要内容:
建立数据管道 采集、存储和检索 处理异常数据集 清洗和准备原始数据 使用D3实现交互式可视化
读者对象: 《JavaScript数据整理(大数据应用与技术丛书)》面向中级JavaScript开发人员,不要求读者具有数据分析经验。 Ashley Davis是一位企业家,也是一位软件开发人员和技术图书作者。Ashley用JavaScript语言创建了用于数据转换、分析和呈现的Data-Forge和Data-Forge Notebook软件。
Ashley Davis,既是一位软件开发人员,也是一名企业家。此外,他还会编写一些技术图书。他拥有超过20年的软件开发经验,从编写代码到管理团队无不涉猎,甚至还有自主创业的经历。他曾任职于多家公司,行业和规模跨度都非常之大,从小型的初创公司到大型跨国公司,都曾留下他的足迹。与此同时,他还经常编写和发布一些开源代码,以此来回馈社区用户。 需要特别说明的是,Ashley创建了JavaScript数据整理工具包Data-Forge。在此基础上,他构建了Data-Forge Notebook。这是一个记事本样式的桌面应用程序,用于在Windows、macOS和Linux 平台上使用JavaScript进行数据转换、分析和可视化。此外,Ashley还是一个嗅觉敏锐的系统交易者,使用C++和JavaScript开发了很多量化交易应用程序。 如果想要了解本书的新更新、开源库等,请关注Ashley的推特账号,也可以在Facebook上关注The Data Wrangler,或者通过http://www.the-data-wrangler.com注册电子邮件以获取近更新。 如果想要详细了解Ashley的背景资料,请访问他的个人主页(http://www.codecapers.com.au),或者访问他的Linkedin个人档案(https://www.linkedin.com/in/ashleydavis75).
“这本分步指南全面透彻地讲解如何使用JavaScript来管理数据。”
——Ethan Rivett (Powerley公司)
“你还认为需要掌握R和Python技能才能执行数据分析吗?本书将颠覆你的思维方式,其实,使用JavaScript就足以完成数据分析工作!”
——Ubaldo Pescatore (Datalogic公司)
“这本精品书籍详述JavaScript数据分析中的数据整理过程、涉及的工具以及需要关注的各种问题和事项。”
——Alex Basile (Bloomberg公司)
“本书示例精辟,是全栈JavaScript开发人员的良师益友。”
——Sai Kota (LendingClub公司)
第1章 快速入门:建立数据处理流程1.1 为什么要进行数据整理1.2 数据整理指的是什么1.3 为什么要写一本关于JavaScript数据整理的书1.4 可以通过本书获取哪些知识1.5 为什么要使用JavaScript进行数据整理1.6 JavaScript是否适用于数据分析1.7 在JavaScript生态系统中畅游1.8 组装你的工具包1.9 建立数据处理流程1.9.1 设置阶段1.9.2 数据整理过程1.9.3 计划1.9.4 采集、存储和检索1.9.5 探索性编码1.9.6 清洗和准备1.9.7 分析1.9.8 可视化1.9.9 转入生产环境小结第2章 Node.js快速入门2.1 开启工具包2.2 构建一个简单的报告系统2.3 获取代码和数据2.3.1 查看代码2.3.2 下载代码2.3.3 安装Nodejs2.3.4 安装依存项2.3.5 运行Nodejs代码2.3.6 运行Web应用程序2.3.7 获取数据2.3.8 获取第2章 对应的代码2.4 安装Nodejs2.5 使用Node.js2.5.1 创建一个Node.js项目2.5.2 创建一个命令行应用程序2.5.3 创建一个代码库2.5.4 创建一个简单的Web服务器2.6 异步编码2.6.1 加载单个文件2.6.2 加载多个文件2.6.3 错误处理2.6.4 使用Promise进行异步编码2.6.5 在Promise中封装异步操作2.6.6 使用async和await进行异步编码小结第3章 采集、存储和检索3.1 构建你的工具包3.2 获取代码和数据3.3 核心数据表示3.3.1 地震网站3.3.2 涉及的数据格式3.3.3 强大功能和灵活性3.4 导入数据3.4.1 从文本文件加载数据3.4.2 从RESTAPI加载数据3.4.3 解析JSON文本数据3.4.4 解析CSV文本数据3.4.5 从数据库导入数据3.4.6 从MongoDB导入数据3.4.7 从MySQL导入数据3.5 导出数据3.5.1 你需要有可供导出的数据3.5.2 将数据导出到文本文件3.5.3 将数据导出到JSON文本文件3.5.4 将数据导出到CSV文本文件3.5.5 将数据导出到数据库3.5.6 将数据导出到MongoDB3.5.7 将数据导出到MySQL3.6 构建完整的数据转换3.7 扩展流程小结第4章 处理不常见的数据4.1 获取代码和数据4.2 从文本文件导入自定义数据4.3 通过网页爬取导入数据4.3.1 识别要爬取的数据4.3.2 使用cheerio进行网页爬取4.4 使用二进制数据4.4.1 解包自定义二进制文件4.4.2 填充自定义二进制文件4.4.3 将JSON替换为BSON4.4.4 将JSON转换为BSON4.4.5 反序列化BSON文件小结第5章 探索性编码5.1 扩展工具包5.2 分析交通事故5.3 获取代码和数据5.4 迭代和反馈环5.5 了解数据的第一个步骤5.6 使用缩减后的数据样本5.7 使用Excel进行原型设计5.8 使用Nodejs进行探索性编码5.8.1 使用Nodemon5.8.2 对你的数据进行探索5.8.3 使用Data-Forge5.8.4 计算趋势列5.8.5 输出新的CSV文件5.9 在浏览器中进行探索性编码5.10 将所有内容整合到一起小结……第6章 清洗和准备第7章 处理大型数据文件第8章 处理大量数据第9章 实用数据分析第10章 基于浏览器的可视化第11章 服务器端可视化第12章 实时数据第13章 使用D3实现高级可视化第14章 转入生产环境附录
我们生活在一个信息爆炸的大数据时代,各种来源、各种形式的数据源源不断地涌现,任何人想要凭借一己之力就将各种数据整理得井井有条并完成相应的分析,可谓是难于上青天。而本书可以为你提供这方面的指导,教会你如何使用JavaScript整理数据。 数据整理是数据分析过程中最重要的环节,在大数据分析过程中也是如此。在小数据时代,数据整理包括数据清洗、数据转换、归类编码和数字编码等过程。其中,数据清洗处于最重要的位置,是指检查数据一致性、处理无效值和缺失值等操作。在大数据时代,这些工作被弱化了,在有些大数据的算法和应用中,基本不再进行数据清洗了,因为大数据的多样化使得其数据具有一定的不精确性,但数据转换和编码过程还是必不可少的。 本书的内容非常宽泛,其中涵盖了大量的工具、技术和设计模式,对于使用JavaScript进行高效数据处理来说,这些都是不可或缺的。本书是一本非常实用的操作指南,可以帮助你构建并管理自己的数据整理工具包。学习完本书后,你不仅能够了解如何应用各相关技能,还可以亲自构建一个切实可行的数据处理流程,囊括从数据采集一直到数据可视化的所有数据整理阶段。 本书不仅包含严谨的理论介绍,还提供了丰富的示例,其中的所有代码都是可以实际运行的,你可以在相应环境中检查并验证其运行结果。另外,本书还配备了很多插图,生动形象,可谓是图文并茂,使你在学习过程中不会感到枯燥乏味。 本书主要面向希望提升数据整理技能的中级JavaScript开发人员。要求读者对JavaScript开发平台有比较丰富的使用经验,对基本的语法以及如何使用JavaScript匿名函数有一定的了解,如果对Nodejs和异步编码有基本的了解,那么会对学习本书有非常大的帮助。当然,如果你对上述方面有所欠缺,也不必担心,书中都有详细介绍。