馬 柯1,賈為征2,劉國峰2,韓立鵬2
(北京首鋼自動化信息技術(shù)有限公司京唐運行事業(yè)部,河北 唐山 063200)
摘要:收集了冷軋產(chǎn)線立式加熱爐帶鋼溫度控制下的數(shù)據(jù)集,該數(shù)據(jù)集包含有帶鋼溫度、厚度、寬度、運行速度、帶鋼長度、功率。通過python語言搭建機器學(xué)習(xí)模型,對數(shù)據(jù)集進(jìn)行學(xué)習(xí)、建模,通過影響因素來預(yù)判帶鋼實際溫度,并通過均方根誤差來判定模型的精度。
關(guān)鍵詞: 帶鋼溫度;均方根誤差;機器學(xué)習(xí);LightGBM算法
0 引言
退火爐加熱模型計算中,對于帶鋼進(jìn)入爐區(qū)溫度的預(yù)判及其重要,精度高的預(yù)判能夠提供一個更精準(zhǔn)的加熱策略,來滿足生產(chǎn)工藝需求,從而減少熱瓢曲現(xiàn)象的發(fā)生[1]。目前產(chǎn)線應(yīng)用較多的加熱模型,依靠實時的測量值和帶鋼的物性實時地計算/預(yù)測帶鋼在各段出口的溫度,使用了基于物理熱交換(對流換熱,輻射換熱)的數(shù)學(xué)模型。本文針對鍍鋅產(chǎn)線立式加熱爐,我們收集了大量數(shù)據(jù)集[2],采用python及其機器學(xué)習(xí)生態(tài)系統(tǒng),對數(shù)據(jù)集分析,建模,來完成帶鋼在加熱區(qū)域出口溫度實際值的預(yù)判[3]。通過均方根誤差計算,來驗證模型的好壞。
1 數(shù)據(jù)集
數(shù)據(jù)集為鍍鋅產(chǎn)線立式加熱爐,輻射管加熱段,利用帶鋼溫度控制模式下數(shù)據(jù),產(chǎn)線運行速度不為0。帶鋼厚度在0.5~1.5 mm之間,帶鋼速度為1~130 m/min的爐區(qū)加熱數(shù)據(jù),另外包含帶鋼長度、帶鋼溫度、功率實際值。數(shù)據(jù)集是13 249×9的一個二維數(shù)組,部分?jǐn)?shù)據(jù)見表1。表中:number為序列號,Thick為帶鋼厚度,Width為寬度,Length為長度,Spd_mea速度測量值,ST_mea加熱段出口處帶鋼溫度測量值, PoAvg_mea加熱段平均功率值,TTsAvg_mea加熱段區(qū)域溫度測量值,ST_est熱模型計算出的加熱段出口段溫度,ST加熱段入口處帶鋼溫度測量值。
表1 數(shù)據(jù)集示例
|
number |
Thick/ mm |
Width/mm |
Length/mm |
Spd_mea/(m·min-1) |
ST_mea/℃ |
TTsAvg_mea/℃ |
PoAvg_mea/% |
ST_est/℃ |
ST/℃ |
|
1 |
0.575 |
1224 |
3549 |
130 |
790 |
839 |
63 |
794 |
190 |
|
2 |
0.575 |
1224 |
3539 |
130 |
790 |
839 |
63 |
794 |
190 |
|
3 |
0.575 |
1224 |
3527 |
130 |
790 |
839 |
63 |
794 |
189 |
|
4 |
0.575 |
1224 |
3516 |
130 |
790 |
839 |
63 |
794 |
190 |
|
5 |
0.575 |
1224 |
3516 |
130 |
790 |
839 |
63 |
794 |
189 |
2 目標(biāo)和評估指標(biāo)
目標(biāo)是利用測試集中可用的信息,來預(yù)測帶鋼經(jīng)過輻射管加熱段后的實際溫度。評估指標(biāo)為,利用均方根誤差(root mean squared error, RMSE)來評價模型的好壞[4]。其數(shù)學(xué)公式為

當(dāng)均方根誤差越小時,表示數(shù)據(jù)的擬合效果越好,測試值越接近實際值。
3 分析數(shù)據(jù)
為了對數(shù)據(jù)集每一個字段進(jìn)行觀察,采用繪制箱式圖的方式來得到數(shù)據(jù)字段的分布。采用Python語言,利用數(shù)據(jù)可視化相關(guān)庫完成,導(dǎo)入matplotlib、seaborn、numpy、pandas,進(jìn)行繪制,輸出結(jié)果如圖1所示。通過圖1能夠直觀了解到每個字段的分布情況。
圖1 特征值箱式圖
繪制各個數(shù)值特征之間的相關(guān)矩陣熱圖[5],來理解目標(biāo)變量如何受數(shù)值特征影響,繪制 ST_mea 與 ["Thick", "Width", "Length", "Spd_mea", "PoAvg_mea", "TTsAvg_mea","ST","ST_est","ST_mea"]之間的相關(guān)矩陣熱圖,如圖2所示。通過特征值之間相關(guān)矩陣熱圖,能夠得到特征值對帶鋼溫度影響程度,影響程度從大到小依次為PoAvg_mea、Spd_mea、ST、 TTsAvg_mea、Thick、Length、Width。另外,Spd_mea和Thick、Length、Width有很強的相關(guān)性[6],ST_est為加熱模型計算出的實際溫度,不用于建模,可用于對比擬合精度。
圖2 特征值相關(guān)矩陣熱圖
4 模型的建立與求解
首先,準(zhǔn)備好數(shù)據(jù),訓(xùn)練集數(shù)據(jù)為data_train,X_train包含了PoAvg_mea、Spd_mea、ST、 TTsAvg_mea、Thick、Length、Width這幾個特征,Y_train為ST_mea。測試集數(shù)據(jù)為data_test, X_test包含了測試集數(shù)據(jù)PoAvg_mea、Spd_mea、ST、 TTsAvg_mea、Thick、Length、Width,y_test為測試集數(shù)據(jù)ST_mea。部分代碼如下:

定義評價函數(shù),實現(xiàn)均方根誤差的計算,引用Numpy庫,pandas庫、 calendar庫完成計算,部分代碼如下:
為了訓(xùn)練出高精度的模型,引入LightGBM算法,LightGBM是微軟開發(fā)的boosting集成模型,LightGBM作為常見的強大Python機器學(xué)習(xí)工具庫,具有以下優(yōu)點:更快的訓(xùn)練效率,低內(nèi)存使用,更高的準(zhǔn)確率,支持并行化學(xué)習(xí),可處理大規(guī)模數(shù)據(jù),支持直接使用 category 特征。面對工業(yè)級海量的數(shù)據(jù),普通的 GBDT 算法無法滿足需求。 LightGBM解決能夠解決大數(shù)據(jù)量級下的 GBDT 訓(xùn)練問題,以便工業(yè)實踐中能支撐大數(shù)據(jù)量并保證效率[7]。
引入機器學(xué)習(xí)lightgbm庫,對數(shù)據(jù)集進(jìn)行擬合訓(xùn)練,利用訓(xùn)練結(jié)果進(jìn)行測試集計算,將結(jié)果利用均方根計算誤差[8],代碼如下:

通過對數(shù)據(jù)集X_train, y_train經(jīng)過LightGBM模型的訓(xùn)練,得到的計算模型去求解X_test值[9],最終得到y(tǒng)_pred就是通過模型計算出的測試集帶鋼在出口時的實際溫度。通過均方根誤差計算,誤差為0.007787,同樣我們對熱模型求出的溫度實際值和溫度測量值進(jìn)行均方根誤差計算,得到的結(jié)果時0.013 096。輸出結(jié)果見表2。
表2 誤差統(tǒng)計表
|
模型 |
RMSLE |
|
hot-mod |
0.013 096 |
|
LightGBM |
0.007 787 |
5 結(jié)語
利用Python機器學(xué)習(xí)進(jìn)行建模得到的結(jié)果,精度在這種情況下大于熱模型的計算結(jié)果。在進(jìn)行爐子建模過程中,可以將機器學(xué)習(xí)模型納入計算過程中,結(jié)合熱模型,以及PID算法,能夠?qū)崟r對模型計算結(jié)果進(jìn)行調(diào)節(jié),以達(dá)到理想的精度[10]。
參考文獻(xiàn)
[1] 路佳佳.基于集成特征選擇和隨機森林的古代玻璃分類模型[J/OL].硅酸鹽學(xué)報:1-6[2023-03-15].https://doi.org/10.14062/j.issn.0454-5648.20220790.
[2] 劉玉敏,趙哲耘.基于特征選擇與SVM的質(zhì)量異常模式識別[J/OL].統(tǒng)計與決策,2018(10):47-51[2023-03-15].https://doi.org/10.13546/j.cnki.tjyjc.2018.10.010.
[3] 徐小青,郝曉東,周石光,等.熱鍍鋅退火過程中的溫度控制策略[J].鋼鐵研究學(xué)報,2016,28(1):44.
[4]楊枕,任偉超,李洋龍,等.連續(xù)退火爐二級管溫模型優(yōu)化[J].冶金自動化,2018,42(4):40.
[5] 揣雪雨. 基于LightGBM算法的個人信用評估模型研究[D]. 鄭州:鄭州大學(xué),2020.
[6]郭英,陳壘.連續(xù)退火爐帶鋼溫度數(shù)學(xué)模型開發(fā)及應(yīng)用[J].冶金能源,2021,40(06):28.
[7] 邢長征,徐佳玉.LightGBM混合模型在乳腺癌診斷中的應(yīng)用[J/OL].計算機工程與應(yīng)用:1-10[2023-03-15].
[8] 張笑宇,沈超,藺琛皓等.面向機器學(xué)習(xí)模型安全的測試與修復(fù)[J/OL].電子學(xué)報,2022(12):2884
[9] 周書蔚,楊冰,王超等.機器學(xué)習(xí)法預(yù)測不同應(yīng)力比6005A-T6鋁合金疲勞裂紋擴展速率[J/OL].中國有色金屬學(xué)報:1-17[2023-03-15].
[10] 李贊. 異構(gòu)數(shù)據(jù)集下通信高效的聯(lián)邦學(xué)習(xí)算法研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2022.
