清華大學(xué)建筑學(xué)院建筑節(jié)能研究中心 錢明楊 燕達(dá)
空調(diào)設(shè)備及系統(tǒng)運(yùn)行節(jié)能國家重點(diǎn)實(shí)驗(yàn)室 劉華
摘 要:空調(diào)人行為是建筑能耗的重要影響因素,本文以住宅用多聯(lián)機(jī)系統(tǒng)的室內(nèi)機(jī)為研究對(duì)象,從某空調(diào)大數(shù)據(jù)監(jiān)控平臺(tái)獲取了499套多聯(lián)機(jī)系統(tǒng)運(yùn)行數(shù)據(jù),通過大數(shù)據(jù)分析方法進(jìn)行住宅用空調(diào)人行為現(xiàn)狀的研究。本文使用的數(shù)據(jù)挖掘分析方法主要包括統(tǒng)計(jì)分析方法和聚類分析方法。通過分析獲取了實(shí)際的住宅空調(diào)使用時(shí)長、用戶空調(diào)設(shè)定參數(shù)和室內(nèi)環(huán)境的實(shí)際分布情況以及典型的用戶使用模式,并提出了對(duì)于多聯(lián)機(jī)設(shè)計(jì)與運(yùn)行的建議。
關(guān)鍵詞:多聯(lián)機(jī);人行為;大數(shù)據(jù)分析;居住建筑
0 引 言
空調(diào)人行為是建筑能耗的重要印象因素,不同用戶的行為有巨大的差異性[1]。由于其巨大的差異性,使用傳統(tǒng)的測(cè)試方法無法全面地獲取不同用戶的空調(diào)人行為,而大規(guī)模調(diào)研問卷的調(diào)研結(jié)果與實(shí)際的空調(diào)人行為存在一定差距,并且調(diào)研結(jié)果的準(zhǔn)確性受到問卷的設(shè)計(jì)和調(diào)研用戶分布的影響[2]。另一方面,隨著智能家居和數(shù)據(jù)傳輸存儲(chǔ)技術(shù)的發(fā)展,大規(guī)模的建筑空調(diào)系統(tǒng)數(shù)據(jù)的獲取變得更加容易[3]。數(shù)據(jù)挖掘分析方法可以很好地用于大規(guī)模的建筑空調(diào)系統(tǒng)大數(shù)據(jù)的研究 [4],所以數(shù)據(jù)挖掘分析方法是可以用于空調(diào)人行為現(xiàn)狀的研究。
數(shù)據(jù)挖掘分析方法已經(jīng)應(yīng)用于建筑科學(xué)領(lǐng)域的各個(gè)領(lǐng)域。Hou, Z.等人應(yīng)用數(shù)據(jù)挖掘方法發(fā)現(xiàn)空調(diào)系統(tǒng)中傳感器的異常情況[5]。Kusiak,A. 等人通過數(shù)據(jù)挖掘方法提出了制冷量模型來預(yù)測(cè)制冷量和出風(fēng)溫度[6]。Kim, H.等人使用數(shù)據(jù)可視化的方法進(jìn)行了建筑性能設(shè)計(jì) [7] 。Yu, Z.等人利用關(guān)聯(lián)規(guī)則方法挖掘出建筑空調(diào)運(yùn)行中的故障 [8] 。Noussan 等人利用2.9百萬戶住宅能耗數(shù)據(jù)進(jìn)行行業(yè)對(duì)標(biāo) [9] 。數(shù)據(jù)分析方法在建筑人行為領(lǐng)域也有廣泛的應(yīng)用,Duarte, C.等人利用數(shù)據(jù)挖掘方法獲取了辦公建筑中的典型人行為模式[10] 。 D’Oca, S.等人提出了一套數(shù)據(jù)挖掘框架用于挖掘16個(gè)辦公室的人行為 [11] 。An, J.等人利用數(shù)據(jù)聚類方法獲取了一個(gè)住宅小區(qū)里的空調(diào)人行為 [12] 。但是,已有的研究中,僅分析了同一地區(qū)的建筑人行為,不同全面地獲取建筑人行為實(shí)際情況。所以獲取能覆蓋更多地區(qū)的空調(diào)系統(tǒng)數(shù)據(jù)非常重要。
多聯(lián)機(jī)系統(tǒng)通常是一個(gè)室外機(jī)與多個(gè)室內(nèi)機(jī)通過管路連接的制冷空調(diào)系統(tǒng)。多聯(lián)機(jī)系統(tǒng)的運(yùn)行數(shù)據(jù)可以用于獲取實(shí)際空調(diào)用戶人行為,而且由于多聯(lián)機(jī)系統(tǒng)的運(yùn)行模式復(fù)雜,所以空調(diào)人行為對(duì)多聯(lián)機(jī)能耗影響非常大[13]。
本文將以住宅用多聯(lián)機(jī)系統(tǒng)的室內(nèi)機(jī)為研究對(duì)象,從某空調(diào)大數(shù)據(jù)監(jiān)控平臺(tái)獲取了499套多聯(lián)機(jī)系統(tǒng)運(yùn)行數(shù)據(jù),通過大數(shù)據(jù)分析方法進(jìn)行住宅用空調(diào)人行為現(xiàn)狀的研究。本文使用的數(shù)據(jù)挖掘分析方法主要包括統(tǒng)計(jì)分析方法和聚類分析方法。通過分析獲取了實(shí)際的住宅空調(diào)使用時(shí)長、用戶空調(diào)設(shè)定參數(shù)和室內(nèi)環(huán)境的實(shí)際分布情況以及典型的用戶使用模式,并提出了對(duì)于多聯(lián)機(jī)設(shè)計(jì)與運(yùn)行的建議。下文第一部分將介紹數(shù)據(jù)集和技術(shù)路線,第二部分對(duì)數(shù)據(jù)挖掘結(jié)果進(jìn)行分析,第三部分討論了數(shù)據(jù)挖掘結(jié)果的潛在工程應(yīng)用,最后一部分給出了結(jié)論與建議。
1 數(shù)據(jù)集與技術(shù)路線
1.1 數(shù)據(jù)集介紹
本文從某空調(diào)大數(shù)據(jù)監(jiān)測(cè)平臺(tái)獲取了499套多聯(lián)機(jī)系統(tǒng)運(yùn)行數(shù)據(jù),覆蓋了中國五大氣候區(qū),五大氣候區(qū)的樣本比例如圖 1所示(其中144套多聯(lián)機(jī)系統(tǒng)位置未知,沒有畫在圖中),其中樣本主要分布在夏熱冬冷地區(qū)。
圖 1 不同氣候區(qū)的樣本比例
數(shù)據(jù)集中所有的多聯(lián)機(jī)系統(tǒng)均安裝在居住建筑中,每個(gè)多聯(lián)機(jī)系統(tǒng)運(yùn)行數(shù)據(jù)都可以代表一個(gè)住戶的空調(diào)使用人行為。不同多聯(lián)機(jī)系統(tǒng)的室內(nèi)機(jī)個(gè)數(shù)從2到31個(gè)不等,每戶基本上都是一個(gè)房間一個(gè)室內(nèi)機(jī)。不同個(gè)數(shù)室內(nèi)機(jī)的系統(tǒng)樣本分布情況如圖 2所示。其中室內(nèi)機(jī)個(gè)數(shù)4個(gè)的多聯(lián)機(jī)系統(tǒng)占比最多。
圖 2 不同個(gè)數(shù)的室內(nèi)機(jī)系統(tǒng)的樣本數(shù)量分布情況
數(shù)據(jù)集中包含了室內(nèi)機(jī)的用戶設(shè)定參數(shù)以及室內(nèi)環(huán)境參數(shù),具體參數(shù)的名稱及范圍如表 1所示。每個(gè)室內(nèi)機(jī)均包含表中的9個(gè)參數(shù)。
表 1 數(shù)據(jù)集的具體參數(shù)表
本文研究的數(shù)據(jù)集中每個(gè)室內(nèi)機(jī)的數(shù)據(jù)監(jiān)測(cè)時(shí)間從2016年6月到9月和從2016年11月到2017年11月。由于監(jiān)測(cè)時(shí)間完全覆蓋了多聯(lián)機(jī)系統(tǒng)的制冷季,本文主要針對(duì)多聯(lián)機(jī)的制冷工況進(jìn)行分析。
1.2 技術(shù)路線
本文的研究技術(shù)路線如圖 3所示,首先,對(duì)大規(guī)模的數(shù)據(jù)集進(jìn)行預(yù)處理,預(yù)處理包括有效樣本的篩選、數(shù)據(jù)清洗和數(shù)據(jù)整理。然后,本文使用了大數(shù)據(jù)分析方法包括統(tǒng)計(jì)分析和聚類分析方法,獲取了多聯(lián)機(jī)使用行為的分布和多聯(lián)機(jī)使用典型模式。最后基于數(shù)據(jù)挖掘結(jié)果對(duì)多聯(lián)機(jī)系統(tǒng)的設(shè)計(jì)與運(yùn)行提出工程建議。
圖 3 技術(shù)路線圖
數(shù)據(jù)預(yù)處理的方法主要包括樣本篩選、數(shù)據(jù)清洗和數(shù)據(jù)整理。首先將數(shù)據(jù)集的制冷模式樣本進(jìn)行篩選,其次將數(shù)據(jù)為“NULL”的值清洗掉,最后將數(shù)據(jù)根據(jù)時(shí)間的順序整理成每小時(shí)的標(biāo)準(zhǔn)數(shù)據(jù)集。
為了全面獲取不同用戶的空調(diào)使用行為分布情況,本文提出了空調(diào)使用行為指標(biāo),如表 2所示,并針對(duì)不同指標(biāo)進(jìn)行運(yùn)行累積時(shí)間的統(tǒng)計(jì),例如,統(tǒng)計(jì)室內(nèi)設(shè)定溫度為26℃的數(shù)據(jù)記錄,計(jì)算出該工況的累積小時(shí)數(shù)占總運(yùn)行累積小時(shí)數(shù)的比例。計(jì)算完所有的設(shè)定溫度的累積小時(shí)數(shù)比例,可以獲取完整的分布情況。為了能獲取單個(gè)用戶的使用行為,本文認(rèn)為一個(gè)室內(nèi)機(jī)代表單個(gè)用戶的空調(diào)人行為,最后還對(duì)不同月份的數(shù)據(jù)情況進(jìn)行了討論。
表 2 空調(diào)使用行為指標(biāo)表
為了獲得多聯(lián)機(jī)的典型使用行為,本文使用聚類分析方法。聚類分析方法就是將數(shù)據(jù)樣本進(jìn)行分類,獲得不同聚類的類間距離大,類內(nèi)距離小。K-means聚類方法是常用的聚類分析方法之一[14]。K-means聚類方法是通過迭代計(jì)算將N個(gè)輸入的向量數(shù)據(jù)分組到C個(gè)聚類中,最初確定C個(gè)聚類的權(quán)重,并且對(duì)于不同聚類的數(shù)據(jù)計(jì)算到聚類中心的距離,計(jì)算公式如公式(1)所示:
其中x = (x1, x2… xn),y = (y1, y2…, yn)是兩列n維的向量;通常情況下聚類為歐式距離,取p =2。
DBI指數(shù)(Davies–Bouldin index)是用于衡量聚類效果優(yōu)劣的指標(biāo),可以幫助確定聚類的個(gè)數(shù),DBI指數(shù)越低說明聚類的效果越好。DBI指數(shù)如公式(2)所示:
其中Si代表聚類內(nèi)部的分散程度;Mi, j代表聚類i與其他聚類之間的分散程度;N代表聚類的個(gè)數(shù)。
2 大數(shù)據(jù)分析結(jié)果
2.1 多聯(lián)機(jī)使用行為的分布
通過數(shù)據(jù)的預(yù)處理,從數(shù)據(jù)集中篩選出了480套多聯(lián)機(jī)系統(tǒng)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘工作,其中包含了2064個(gè)室內(nèi)機(jī)。多聯(lián)機(jī)室內(nèi)機(jī)的空調(diào)使用時(shí)長的分布如圖 4所示,多聯(lián)機(jī)室內(nèi)機(jī)的制冷時(shí)長最大值是2486小時(shí),所有室內(nèi)機(jī)的空調(diào)使用時(shí)長平均值為183小時(shí)。
圖 4 多聯(lián)機(jī)室內(nèi)機(jī)空調(diào)使用時(shí)長分布
不同月份的空調(diào)使用時(shí)長的四分位圖如圖 5所示,可知不同住戶的使用時(shí)長有巨大的差異性,并且其中8月的制冷時(shí)間最長。
圖 5 不同月份的空調(diào)使用時(shí)長四分位圖
室內(nèi)機(jī)設(shè)定溫度的分布如圖 6所示,設(shè)定溫度分布呈現(xiàn)雙峰分布,分別在25℃和16℃兩處達(dá)到峰值。室內(nèi)機(jī)設(shè)定風(fēng)檔的分布如圖 7所示,低風(fēng)檔與高風(fēng)檔占了運(yùn)行總時(shí)間的80%。掃風(fēng)模式的開關(guān)狀態(tài)情況如圖 8所示,有58%的運(yùn)行總時(shí)間室內(nèi)機(jī)開啟了上下掃風(fēng),而左右掃風(fēng)模式僅開啟4%的運(yùn)行總時(shí)間。
圖 6 設(shè)定溫度的分布情況
圖 7 室內(nèi)機(jī)風(fēng)檔分布
圖 8 上下掃風(fēng)與左右掃風(fēng)狀態(tài)分布
多聯(lián)機(jī)室內(nèi)機(jī)運(yùn)行時(shí)的不同環(huán)境溫度的分布如圖 9所示,室內(nèi)環(huán)境溫度分布為單峰分布,在室內(nèi)環(huán)境溫度26℃的時(shí)候達(dá)到峰值。
圖 9 室內(nèi)機(jī)運(yùn)行時(shí)的室內(nèi)環(huán)境溫度分布情況
2.2 多聯(lián)機(jī)典型空調(diào)使用模式
通常情況下單個(gè)多聯(lián)機(jī)系統(tǒng)包括了一個(gè)室外機(jī)和多個(gè)室內(nèi)機(jī)。對(duì)多聯(lián)機(jī)系統(tǒng)的運(yùn)行優(yōu)化最為重要的是什么時(shí)間開啟了多少個(gè)室內(nèi)機(jī),即為多聯(lián)機(jī)的空調(diào)使用模式。本文定義了逐時(shí)的同時(shí)使用系數(shù)來代表一天的空調(diào)使用模式。每個(gè)小時(shí)內(nèi)運(yùn)行的室內(nèi)機(jī)數(shù)量除以所有室內(nèi)機(jī)的數(shù)量定義為同時(shí)使用系數(shù),圖 10是逐時(shí)的空調(diào)使用模式的例子,通過樣本篩選,最后將13,836天的逐時(shí)空調(diào)使用模式用于聚類分析。
圖 10 例子:4臺(tái)室內(nèi)機(jī)的多聯(lián)機(jī)系統(tǒng)的逐時(shí)使用模式
通過試算,獲取了不同聚類數(shù)量對(duì)應(yīng)的DBI指數(shù),如圖 11所示,聚類數(shù)量為5個(gè)時(shí)的DBI指數(shù)最小,對(duì)應(yīng)的聚類效果最好。
圖 11 不同聚類數(shù)量對(duì)應(yīng)的DBI指數(shù)
通過K-means聚類算法獲取了5種典型多聯(lián)機(jī)空調(diào)使用模式,如圖 12所示,右側(cè)為5種典型多聯(lián)機(jī)空調(diào)使用模式的聚類中心,左側(cè)是5個(gè)聚類數(shù)據(jù)集的部分樣本,其中不同顏色對(duì)應(yīng)了不同的同時(shí)使用系數(shù):黑色代表100%、黃色代表50%、白色代表0%。
圖 12 聚類結(jié)果圖
5種典型多聯(lián)機(jī)使用模式的聚類數(shù)據(jù)集的樣本數(shù)量比例如圖 13所示。聚類4代表了高同時(shí)使用系數(shù)的使用模式,樣本量?jī)H占所有樣本的5%,在其中僅有36天是全天24小時(shí)同時(shí)使用系數(shù)是100%,即全時(shí)間全空間使用空調(diào),這36天僅占所有樣本的0.26%。由此可見,中國住宅建筑的住戶往往不會(huì)全時(shí)間全空間使用空調(diào)。
圖 13 不同聚類的樣本數(shù)量比例
3 大數(shù)據(jù)分析的潛在工程應(yīng)用討論
大數(shù)據(jù)分析方法可以全面地獲取大規(guī)模實(shí)際空調(diào)使用行為現(xiàn)狀,包括了空調(diào)使用時(shí)長、用戶設(shè)定參數(shù)和室內(nèi)環(huán)境情況以及典型多聯(lián)機(jī)使用模式,可以有效地幫助多聯(lián)機(jī)系統(tǒng)的設(shè)計(jì)與運(yùn)行。
首先,大數(shù)據(jù)分析結(jié)果表明多聯(lián)機(jī)的室內(nèi)機(jī)空調(diào)使用行為存在巨大的差異性,并且在8月的空調(diào)使用時(shí)長普遍高于其他月份,所以在多聯(lián)機(jī)系統(tǒng)的設(shè)計(jì)階段需要對(duì)8月運(yùn)行工況更加關(guān)注。
其次,多聯(lián)機(jī)室內(nèi)機(jī)的設(shè)定參數(shù)分布可以幫助產(chǎn)品開發(fā)者理解用戶的實(shí)際需求。例如用戶的設(shè)定溫度在25~26℃達(dá)到峰值,說明大部分用戶需求的室內(nèi)環(huán)境溫度設(shè)定值為25~26℃。而對(duì)應(yīng)的設(shè)定溫度16℃達(dá)到峰值,證明該部分用戶制冷空調(diào)需求高,需要提高空調(diào)系統(tǒng)的制冷能力。而對(duì)于掃風(fēng)模式,上下掃風(fēng)模式開啟時(shí)間遠(yuǎn)遠(yuǎn)高于左右掃風(fēng)模式,可見上下掃風(fēng)模式更有利于提高住戶的熱舒適性。
然后,室內(nèi)環(huán)境溫度分布可以反映住戶的熱舒適溫度的分布情況,室內(nèi)環(huán)境溫度26℃達(dá)到峰值代表了26℃可以滿足大部分用戶的熱舒適需求。
最后,聚類分析的結(jié)果表明中國住宅建筑的住戶往往不會(huì)全時(shí)間全空間使用空調(diào),對(duì)于在大多數(shù)情況下一個(gè)住戶中的所有房間空調(diào)的同時(shí)使用系數(shù)是低于0.5的,會(huì)導(dǎo)致多聯(lián)機(jī)系統(tǒng)長時(shí)間處于部分負(fù)荷工況,這可以幫助新型多聯(lián)機(jī)系統(tǒng)的開發(fā)研究。典型的多聯(lián)機(jī)使用模式可以幫助多聯(lián)機(jī)系統(tǒng)調(diào)整運(yùn)行用更少的能耗獲取更優(yōu)的用戶熱舒適。
4 結(jié)論
本文以住宅用多聯(lián)機(jī)系統(tǒng)的室內(nèi)機(jī)為研究對(duì)象,從某空調(diào)大數(shù)據(jù)監(jiān)控平臺(tái)獲取了499套多聯(lián)機(jī)系統(tǒng)運(yùn)行數(shù)據(jù),通過大數(shù)據(jù)分析方法進(jìn)行住宅用空調(diào)人行為現(xiàn)狀的研究,獲取了以下主要結(jié)論:
(1)多聯(lián)機(jī)系統(tǒng)的空調(diào)使用行為存在巨大的差異性,全年的多聯(lián)機(jī)室內(nèi)機(jī)的制冷時(shí)長最大值是2486小時(shí),所有室內(nèi)機(jī)的空調(diào)使用時(shí)長平均值為183小時(shí)。并且對(duì)于不同月份的分析中發(fā)現(xiàn),8月的空調(diào)使用時(shí)長最長。
(2)多聯(lián)機(jī)系統(tǒng)室內(nèi)機(jī)設(shè)定溫度是雙峰分布,分別在25℃和16℃達(dá)到峰值。而室內(nèi)機(jī)掃風(fēng)模式情況,有58%的運(yùn)行總時(shí)間室內(nèi)機(jī)開啟了上下掃風(fēng),而左右掃風(fēng)模式僅開啟4%的運(yùn)行總時(shí)間。
(3)實(shí)際室內(nèi)環(huán)境溫度分布是單峰分布,在26℃達(dá)到峰值,這說明26℃可以滿足大部分居住建筑的用戶熱舒適需求。
(4)典型多聯(lián)機(jī)使用模式分析結(jié)果表明中國住宅建筑的住戶往往不會(huì)全時(shí)間全空間使用空調(diào),并且導(dǎo)致多聯(lián)機(jī)系統(tǒng)長時(shí)間處于低負(fù)荷率運(yùn)行,這需要多聯(lián)機(jī)系統(tǒng)的設(shè)計(jì)和運(yùn)行時(shí)更加關(guān)注低負(fù)荷運(yùn)行工況。
參考文獻(xiàn)
[1] Yan, D., Hong, T., Dong, B., Mahdavi, A., D’Oca, S., Gaetani, I., & Feng, X. (2017). IEA EBC Annex 66: Definition and simulation of occupant behavior in buildings. Energy and Buildings, 156, 258–270.
[2] Feng, X., Yan, D., Wang, C., & Sun, H. (2016). A preliminary research on the derivation of typical occupant behavior based on large-scale questionnaire surveys. Energy and Buildings, 117, 332–340.
[3] Fan, C., Xiao, F., Li, Z., & Wang, J. (2018). Unsupervised data analytics in mining big building operational data for energy efficiency enhancement: a review. Energy and Buildings, 159, 296–308.
[4] 陳煥新,劉江巖,胡云鵬,李冠男.大數(shù)據(jù)在空調(diào)領(lǐng)域的應(yīng)用[J].制冷學(xué)報(bào),2015,36(04):16–22.
[5] Hou, Z., Lian, Z., Yao, Y., & Yuan, X. (2006). Data mining based sensor fault diagnosis and validation for building air conditioning system. Energy Conversion and Management, 47(15–16), 2479–2490.
[6] Kusiak, A., & Li, M. (2010). Cooling output optimization of an air handling unit. Applied Energy, 87(3), 901–909.
[7] Kim, H., Stumpf, A., & Kim, W. (2011). Analysis of an energy efficient building design through data mining approach. Automation in construction, 20(1), 37–43.
[8] Yu, Z. J., Haghighat, F., Fung, B. C., & Zhou, L. (2012). A novel methodology for knowledge discovery through mining associations between building operational data. Energy and Buildings, 47, 430–440.
[9] Noussan, M., & Nastasi, B. (2018). Data analysis of heating systems for buildings—A tool for energy planning, policies and systems simulation. Energies, 11(1), 233.
[10] Duarte, C., Van Den Wymelenberg, K., & Rieger, C. (2013). Revealing occupancy patterns in an office building through the use of occupancy sensor data. Energy and Buildings, 67, 587–595.
[11] D’Oca, S., & Hong, T. (2015). Occupancy schedules learning process through a data mining framework. Energy and Buildings, 88, 395–408.
[12] An, J., Yan, D., & Hong, T. (2018). Clustering and statistical analyses of air-conditioning intensity and use patterns in residential buildings. Energy and Buildings, 174, 214–227.
[13] Yu, X., Yan, D., Sun, K., Hong, T., & Zhu, D. (2016). Comparative study of the cooling energy performance of variable refrigerant flow systems and variable air volume systems in office buildings. Applied energy, 183, 725–736.
[14] Meesrikamolkul W, Niennattrakul V, Ratanamahatana C A. Shape-based clustering for time series data[C]//Pacific-Asia Conference on Knowledge Discovery and Data Mining. Springer, Berlin, Heidelberg, 2012:530–541.
[15] Davies, D. L., & Bouldin, D. W. (1979). A cluster separation measure. IEEE transactions on pattern analysis and machine intelligence, (2), 224–227.
備注:本文收錄于《建筑環(huán)境與能源》2019年5月刊總第21期。
版權(quán)歸論文作者所有,任何形式轉(zhuǎn)載請(qǐng)聯(lián)系作者。