本書(shū)以技術(shù)應(yīng)用能力培養(yǎng)為目標(biāo),以真實(shí)的集散控制系統(tǒng)設(shè)備為載體,以6個(gè)學(xué)習(xí)情境組織教學(xué)內(nèi)容,采用任務(wù)驅(qū)動(dòng)的教學(xué)方式,重點(diǎn)介紹了浙大中控JX-300X集散控制系統(tǒng)的基本結(jié)構(gòu)、基本功能、軟硬件組態(tài)、流程圖繪制、監(jiān)控維護(hù)和工程應(yīng)用等知識(shí),同時(shí)介紹了霍尼韋爾TDC-3000、TPS/PKS系統(tǒng)、橫河CENTUM-CS系統(tǒng)、艾默生
本書(shū)共7個(gè)項(xiàng)目,全面介紹了大數(shù)據(jù)技術(shù)概述、大數(shù)據(jù)平臺(tái)部署與操作、數(shù)據(jù)庫(kù)配置維護(hù)、數(shù)據(jù)采集與處理、Hive數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用、SparkSQL數(shù)據(jù)分析、Zeppelin數(shù)據(jù)可視化等內(nèi)容。每個(gè)項(xiàng)目圍繞一個(gè)核心知識(shí)點(diǎn)展開(kāi),通過(guò)具體的任務(wù)描述、知識(shí)課堂和實(shí)踐操作引導(dǎo)學(xué)生逐步深入學(xué)習(xí)。本書(shū)具有較強(qiáng)的實(shí)用性和可操作性,語(yǔ)言精練,通俗易懂
本書(shū)主要介紹了如何確保企業(yè)所依賴(lài)的數(shù)據(jù)的質(zhì)量。書(shū)中詳細(xì)闡述了自動(dòng)化數(shù)據(jù)質(zhì)量監(jiān)控的重要性,并提供了實(shí)用的方法,幫助企業(yè)高效地覆蓋所有數(shù)據(jù)表,主動(dòng)發(fā)現(xiàn)數(shù)據(jù)問(wèn)題,并立即解決。作者們解釋了如何構(gòu)建無(wú)監(jiān)督機(jī)器學(xué)習(xí)模型來(lái)檢測(cè)數(shù)據(jù)問(wèn)題,以及如何實(shí)施通知機(jī)制以減少警報(bào)疲勞,并迅速分類(lèi)和解決這些問(wèn)題。此外,本書(shū)還探討了如何將自動(dòng)化數(shù)據(jù)質(zhì)
本書(shū)主要講解了Hadoop大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)與實(shí)戰(zhàn)的相關(guān)內(nèi)容,全書(shū)共11章,其中第1章為初識(shí)Hadoop,第2章為Hadoop集群的搭建,第3章為分布式協(xié)調(diào)框架ZooKeeper,第4章為分布式文件系統(tǒng)HDFS,第5章分布式計(jì)算框架MapReduce,第6章為YARN框架與HA模式,第7章為數(shù)據(jù)倉(cāng)庫(kù)Hive,第8章為分布式
本書(shū)屬于數(shù)據(jù)挖掘領(lǐng)域的著作,從數(shù)據(jù)挖掘基本知識(shí)入手,簡(jiǎn)要闡述了數(shù)據(jù)預(yù)處理技術(shù),在此基礎(chǔ)上深入研究了關(guān)聯(lián)規(guī)則、聚類(lèi)分析、分類(lèi)規(guī)則、時(shí)間序列挖掘等數(shù)據(jù)挖掘等核心技術(shù);此外,本書(shū)還關(guān)注了復(fù)雜類(lèi)型數(shù)據(jù)的挖掘,最后分析了數(shù)據(jù)挖掘技術(shù)在金融、教育、醫(yī)療等關(guān)鍵行業(yè)中的實(shí)際應(yīng)用。
本書(shū)屬于大數(shù)據(jù)分析領(lǐng)域的學(xué)術(shù)專(zhuān)著,由理論基礎(chǔ)、數(shù)據(jù)處理技術(shù)、算法應(yīng)用、模型創(chuàng)新及案例分析等部分組成。全書(shū)以大數(shù)據(jù)技術(shù)的發(fā)展趨勢(shì)、處理算法與應(yīng)用模型為研究對(duì)象。深入分析了大數(shù)據(jù)環(huán)境下的數(shù)據(jù)采集、存儲(chǔ)、處理及挖掘技術(shù),提出了針對(duì)海量數(shù)據(jù)處理的優(yōu)化算法和模型。特別關(guān)注了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)在大數(shù)據(jù)分析中的應(yīng)用,探討了它們?cè)诓煌?/p>
本書(shū)是一本面向數(shù)據(jù)分析初學(xué)者、進(jìn)階從業(yè)者及管理者的實(shí)用指南。本書(shū)通過(guò)系統(tǒng)化的學(xué)習(xí)路徑和豐富的案例,全面介紹了DeepSeek這款A(yù)I工具在數(shù)據(jù)分析中的應(yīng)用。書(shū)中從數(shù)據(jù)分析的基礎(chǔ)概念入手,詳細(xì)講解了數(shù)據(jù)分析的目的、流程和常用工具,強(qiáng)調(diào)了數(shù)據(jù)分析在企業(yè)決策中的重要性。通過(guò)實(shí)際案例分析,展示了DeepSeek如何通過(guò)自
本書(shū)主要介紹數(shù)據(jù)科學(xué)中數(shù)據(jù)準(zhǔn)備階段常用的數(shù)據(jù)處理方法。全書(shū)內(nèi)容分為五個(gè)部分:數(shù)據(jù)準(zhǔn)備概覽、數(shù)據(jù)清理、數(shù)據(jù)變換、數(shù)據(jù)歸約和案例分析。本書(shū)注重方法的原理及其應(yīng)用,在方法原理引介部分強(qiáng)調(diào)重要的統(tǒng)計(jì)學(xué)思想,在方法應(yīng)用部分強(qiáng)化數(shù)據(jù)思維和數(shù)據(jù)處理規(guī)范。
本書(shū)以Python為基礎(chǔ),深入講解HDFS分布式文件系統(tǒng)和PySpark3編程。全書(shū)共9章,內(nèi)容包括Docker環(huán)境下Hadoop與Spark的配置、HDFS操作技巧、RDD編程方法、SparkSQL應(yīng)用、Spark架構(gòu)及運(yùn)行機(jī)制、PandasonSpark使用及SparkML編程實(shí)踐。本書(shū)通過(guò)實(shí)際操作案例,幫助讀者掌
內(nèi)容簡(jiǎn)介這是一本指導(dǎo)各類(lèi)型組織科學(xué)構(gòu)建數(shù)據(jù)體系,并通過(guò)對(duì)數(shù)據(jù)體系的管理和運(yùn)營(yíng)讓數(shù)據(jù)實(shí)現(xiàn)價(jià)值轉(zhuǎn)化的實(shí)戰(zhàn)性著作,是作者在數(shù)字化領(lǐng)域近20年工作經(jīng)驗(yàn)的總結(jié)。本書(shū)深度剖析了數(shù)字化時(shí)代數(shù)據(jù)體系建設(shè)的關(guān)鍵要素與實(shí)施路徑,系統(tǒng)而全面地介紹了數(shù)據(jù)體系建設(shè)的方法論、框架與實(shí)戰(zhàn)案例。從全面認(rèn)識(shí)數(shù)據(jù)與數(shù)據(jù)要素的價(jià)值出發(fā),逐步深入探討了數(shù)據(jù)管