關(guān)于工業(yè)數(shù)據(jù)采集的那些事兒
隨著工業(yè)互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)越來越成為了推動企業(yè)數(shù)字化轉(zhuǎn)型的重要引擎,數(shù)據(jù)采集則成為了一直困擾制造業(yè)工廠的首要痛點。由于自動化設(shè)備品牌類型繁多,廠家和數(shù)據(jù)接口各異,國外廠家本地支持有限,不同采購年代。即便產(chǎn)量停機數(shù)據(jù)自動采集了,也不等于整個制造過程數(shù)據(jù)都獲得了,只要還有其他人工參與環(huán)節(jié),這些數(shù)據(jù)就不完整。
一、工業(yè)數(shù)據(jù)采集類型
工業(yè)數(shù)據(jù)主要來源于機器設(shè)備數(shù)據(jù)、工業(yè)信息化數(shù)據(jù)和產(chǎn)業(yè)鏈相關(guān)數(shù)據(jù)。從數(shù)據(jù)類型上看,不僅要涵蓋基礎(chǔ)數(shù)據(jù),還將逐步包括半結(jié)構(gòu)化的客戶行為數(shù)據(jù),設(shè)備和傳感器采集的周期性數(shù)據(jù),網(wǎng)絡(luò)爬蟲獲取的互聯(lián)網(wǎng)數(shù)據(jù),以及未來越來越多有潛在意義的各類數(shù)據(jù)。主要包括以下幾種:
1、海量的Key-Value數(shù)據(jù)
在傳感器技術(shù)飛速發(fā)展的今天,包括光電、熱敏、氣敏、力敏、磁敏、聲敏、濕敏等不同類型的工業(yè)傳感器在工廠得到普遍應(yīng)用,而且很多時候機器設(shè)備的數(shù)據(jù)大概要到MS的精度才能分析海量的工業(yè)數(shù)據(jù),因此每條數(shù)據(jù)的特點為內(nèi)容很少,頻率卻極高
2、文檔數(shù)據(jù)
包括工程圖紙、仿真數(shù)據(jù)、設(shè)計的CAD圖紙等及大量傳統(tǒng)工程文檔。
3、信息化數(shù)據(jù)
由工業(yè)信息系統(tǒng)產(chǎn)生的數(shù)據(jù),一般是通過數(shù)據(jù)庫形式存儲的,這部分數(shù)據(jù)是最好采集的。
4、接口數(shù)據(jù)
由已經(jīng)建成的工業(yè)自動化或信息系統(tǒng)提供的接口類型的數(shù)據(jù),包括txt格式、JSON格式、XML格式等。
5、圖像數(shù)據(jù)
包括工業(yè)現(xiàn)場各類圖像設(shè)備拍攝的圖片(例如,巡檢人員用手持設(shè)備拍攝的設(shè)備、環(huán)境信息圖片)。
6、音頻數(shù)據(jù)
包括語音及聲音信息(例如,操作人員的通話、設(shè)備運轉(zhuǎn)的音量等)。
7、視頻數(shù)據(jù)
工業(yè)現(xiàn)場會有大量的視頻監(jiān)控設(shè)備,這些設(shè)備會產(chǎn)生大量的視頻數(shù)據(jù)。
8、其他數(shù)據(jù)
例如遙感遙測信息、三維高程信息等等。
二、工業(yè)數(shù)據(jù)采集類型
我們一直在提數(shù)據(jù)采集是當前制造業(yè)數(shù)字化轉(zhuǎn)型路上的一大絆腳石,那其難點到底在哪幾個方面,今天我們就詳細解析一下。
1、數(shù)據(jù)量大
數(shù)據(jù)量不同,數(shù)采所需的技術(shù)難度也不盡相同,然而完成初步數(shù)據(jù)獲取只是第一步,采集之后還需要對數(shù)據(jù)進行一些列的處理,因為必須考慮數(shù)據(jù)的規(guī)范與清洗,大量的工業(yè)數(shù)據(jù)是“臟”數(shù)據(jù),直接存儲無法用于分析,在存儲之前,必須進行處理,這從技術(shù)上又提高了難度。
2、工業(yè)數(shù)據(jù)協(xié)議不標準
在工業(yè)領(lǐng)域,會出現(xiàn)ModBus、OPC、CAN、ControlNet、DeviceNet、Profibus、Zigbee等各類型的工業(yè)協(xié)議,而且各個自動化設(shè)備生產(chǎn)及集成商還會自己開發(fā)各種私有的工業(yè)協(xié)議,導致在工業(yè)協(xié)議的互聯(lián)互通上,出現(xiàn)了極大地難度。許多企業(yè)在面臨數(shù)據(jù)化轉(zhuǎn)型的過程中遇到的最大問題就是因眾多協(xié)議而造成的信息孤島,而定制化數(shù)采產(chǎn)品的不菲投入讓很多企業(yè)望而卻步!
3、對原有系統(tǒng)的采集難度
在工業(yè)企業(yè)實施大數(shù)據(jù)項目時,數(shù)據(jù)采集往往不是針對傳感器或者PLC,而是采集已經(jīng)完成布署的自動化系統(tǒng)上位機數(shù)據(jù)。這些自動化系統(tǒng)在部署時廠商水平參差不齊,大部分系統(tǒng)是沒有數(shù)據(jù)接口的,文檔也大量缺失,大量的現(xiàn)場系統(tǒng)沒有點表等基礎(chǔ)設(shè)置數(shù)據(jù),使得對于這部分數(shù)據(jù)采集的難度極大。
4、視頻傳輸所需寬帶量巨大
隨著云計算技術(shù)的普及運用,大數(shù)據(jù)需要大量的計算資源和存儲資源,因此工業(yè)數(shù)據(jù)逐步遷移到公有云已經(jīng)是大勢所趨了。但是,一個工業(yè)企業(yè)可能會有幾十路視頻,成規(guī)模的企業(yè)會有上百路視頻,這么大量的視頻文件如何通過互聯(lián)網(wǎng)順暢到傳輸?shù)皆贫?,是開發(fā)人員需要面臨的巨大挑戰(zhàn)。
(來源:知乎)