心鑒智控羅曉忠接受澎湃科技專訪:所有創(chuàng)新要以提高企業(yè)效率為目的
內(nèi)容來源:澎湃新聞
·如何判斷某項技術(shù)是否需要投入?羅曉忠的標準是“接地氣”。他表示,“一定要結(jié)合公司的實際情況,不要‘為了創(chuàng)新而創(chuàng)新’。我們所有的創(chuàng)新都要圍繞一個目的,那就是提升企業(yè)的效率。”
·羅曉忠認為,大模型之所以有這么高的能力,是因為它擁有大量高質(zhì)量的數(shù)據(jù)和新型的訓練方法,因此在大算力的支持下,涌現(xiàn)出了令人驚艷的能力。但在自己的行業(yè)領(lǐng)域,羅曉忠直接表示:“我們需要的是基于基礎(chǔ)大模型之上的行業(yè)大模型?!?/u>
心鑒智控創(chuàng)始人兼CEO羅曉忠向澎湃科技介紹,公司的第一個產(chǎn)品用了兩年時間才正式落地,在這兩年期間公司沒有任何營收,只有不斷地研發(fā)投入。
“我最喜歡辛棄疾的‘醉里挑燈看劍’,很小的時候我也有當大俠的夢想,希望自己武功高強、除暴安良等。雖然這是小時候的夢想,但它也指引了我人生的一些選擇?!?/span>
心鑒智控創(chuàng)始人兼CEO羅曉忠喜歡讀詩并感悟美好,用他自己的話來說,是一個“文縐縐”的人。五年前創(chuàng)業(yè)時,他和聯(lián)合創(chuàng)始人為公司取名“心鑒智控”用的是《詩經(jīng)》中的“我心匪鑒”,寓意“用心做鑒別”。
羅曉忠于密歇根大學博士畢業(yè),創(chuàng)業(yè)前在美國微軟總部任首席軟件架構(gòu)師,擁有大數(shù)據(jù)、人工智能技術(shù)及企業(yè)級軟件的開發(fā)經(jīng)驗及團隊管理經(jīng)驗。2018年,羅曉忠創(chuàng)立心鑒智控,專注工業(yè)場景下透明、反光、高速運動物品的AI視覺檢測,主要應用場景包括醫(yī)藥外包裝(鋁塑泡罩,輸液袋,軟膏及三期等)、導光板,瓶蓋瓶身等的瑕疵檢測。
在日前舉辦的華映資本2023年會間隙,羅曉忠接受了澎湃科技專訪,談及自己選擇創(chuàng)業(yè),他覺得仍然和年少時的夢想相關(guān),只不過更加practical(重視實踐),“希望能做一些切實把人的雙眼從生產(chǎn)線中解放出來的事。因為人的眼睛要去看風景、看美好的東西,而不是去做瑕疵檢測?!?023年初,心鑒智控連續(xù)完成了A+和A++兩輪融資,融資總額近億元。
微軟工作18年后辭職下工廠2018年,在加入微軟18年后,羅曉忠選擇辭職回國創(chuàng)業(yè)?!拔沂冀K都有‘在這個世界上創(chuàng)造一些東西’的想法,而不是僅僅做一顆大廠螺絲釘。最小的孩子上大學后,沒有了對家庭的顧慮,我的太太也很支持我,所以正式投身創(chuàng)業(yè)?!?/span>
從工程師轉(zhuǎn)化成創(chuàng)業(yè)者,羅曉忠覺得最大的改變是“真是更加深入地理解了‘以客戶為中心’到底意味著什么?!闭劦阶约涸?jīng)因為理論和實際脫節(jié)吃的虧,羅曉忠笑著回憶道,“我們公司有很多海歸員工,大多是軟件和AI(人工智能)的人員,對工業(yè)實操欠缺經(jīng)驗,做出過不少失敗的產(chǎn)品。后來我們就要求所有人必須到工廠去,看到實際的工況才不會閉門造車。”
心鑒智控剛成立不久,曾經(jīng)為一家知名品牌做過一個瓶蓋檢測的項目。酒瓶蓋的檢測看似簡單,卻因團隊不了解生產(chǎn)線上的實際情況而最終流產(chǎn)。
“我們沒有想到,客戶的同一條生產(chǎn)線上只要更換模具,就可以生產(chǎn)十幾款大小規(guī)格不同的酒瓶蓋,甚至包括印刷都完全不同,但當時我們的模型迭代速度沒有那么快,滿足不了客戶的要求,”羅曉忠表示,“從那之后,我們在跟客戶溝通和交流的過程之中,信息的收集會更加全面,讓項目最后成功的幾率更大?!?/span>
創(chuàng)業(yè)后,羅曉忠很多情況下需要為公司親自做戰(zhàn)略決策,這直接影響到公司的生和死,他也感到作為創(chuàng)業(yè)者肩上沉甸甸的責任。羅曉忠介紹,一個產(chǎn)品面臨失敗了要如何及時止損,以及一些技術(shù)路徑上面是否需要投入,這都是讓自己壓力很大的決策。
如何判斷某項技術(shù)是否需要投入?羅曉忠的標準是“接地氣”。他表示,“一定要結(jié)合公司的實際情況,不要‘為了創(chuàng)新而創(chuàng)新’。我們所有的創(chuàng)新都要圍繞一個目的,那就是提升企業(yè)的效率?!?/span>
“我們創(chuàng)業(yè)早期還保留著工程師的習慣,想把事情做得比較完美,但實際上短期之內(nèi)你不需要那么完美,卻一定要把它盡快落地用出去,讓產(chǎn)品在實踐的過程中不斷迭代才是最重要的?!绷_曉忠表示。
第一個產(chǎn)品歷經(jīng)兩年才落地機器學習需要海量的數(shù)據(jù)做支撐,高質(zhì)量的數(shù)據(jù)越多,最后的人工智能模型效果就會越好。對人工智能創(chuàng)業(yè)公司而言,一家初創(chuàng)公司,還沒有積累足夠多的行業(yè)數(shù)據(jù)時,是發(fā)展最為艱難的時期。
羅曉忠向澎湃科技介紹,公司的第一個產(chǎn)品用了兩年時間才正式落地,在這兩年期間公司沒有任何營收,只有不斷地研發(fā)投入。產(chǎn)品真正落地之前的測試之中,團隊不管在硬件、軟件、還是模型上,都經(jīng)歷了一系列的問題,在工程化層面,團隊跟客戶也做了很多協(xié)同。
軟件層面的問題主要體現(xiàn)在速度上。如果軟件處理的速度是20毫秒,但生產(chǎn)節(jié)拍是18毫秒,那軟件就會因為來不及處理而導致系統(tǒng)崩潰。為了提高自己軟件的速度,羅曉忠推翻了自己原本用Python語言編寫的應用,重新打造了公司基于C++語言的軟件框架?!癙ython是一種解釋性的語言,它運行的速度很慢,一到高速產(chǎn)線就崩潰了。C++是一個多線程的語言,一個線程里可以有很多進程并行,它的運行速度比Python快很多。”
還有一個難點是公司的模型和客戶的產(chǎn)線系統(tǒng)需要匹配。羅曉忠介紹,藥片生產(chǎn)和包裝的速度很快,心鑒智控的系統(tǒng)在流水線上的A點識別出某一板藥品有瑕疵之后,它已經(jīng)位移到B點了生產(chǎn)線上的設(shè)備才能把瑕疵品剔出,因此模型和系統(tǒng)需要通過軟件和PLC(Programmablelogiccontroller,可編程邏輯控制器,專門用于工業(yè)環(huán)境的一種數(shù)字運算操作電子系統(tǒng))控制實現(xiàn)精準地協(xié)調(diào)和同步,這也花費了團隊很多時間和精力進行調(diào)試。
除了軟件方面之外,在流水線上的硬件也出現(xiàn)過各種各樣的問題,需要仔細排查并解決。團隊曾經(jīng)發(fā)現(xiàn)有的工業(yè)相機里沒有緩存,也有的相機會反復提交同一張。工人操作時可能把線碰松了導致數(shù)據(jù)傳輸不穩(wěn)或是相機掉線。還有的便宜導線本身就數(shù)據(jù)傳輸不穩(wěn),需要更換。
在心鑒智控將產(chǎn)品工程化的過程中,也與藥廠就藥品瑕疵的定義達成了共識。現(xiàn)在的行業(yè)標準中,鋁塑泡罩藥片有8種不同的瑕疵,膠囊有21種不同的瑕疵,就是心鑒智控在產(chǎn)業(yè)實踐中最早制訂出來的藥品瑕疵標準。隨著行業(yè)數(shù)據(jù)的積累和客戶的增加,現(xiàn)在,心鑒智控在醫(yī)藥產(chǎn)品、白玻、高速產(chǎn)線上物品的綜合檢測領(lǐng)域能力已經(jīng)位于行業(yè)第一梯隊。
打造自己的“行業(yè)大模型”羅曉忠介紹,心鑒智控在高透光、高反光的場景中,有自己獨到的光學成像技術(shù),可提供高質(zhì)量的初始圖像。另外,自己的人工智能模型也是另一個核心競爭力。
公司的人工智能模型中,采集數(shù)據(jù)有兩個技術(shù)模塊:一個是數(shù)據(jù)的素材系統(tǒng),能夠?qū)ιa(chǎn)線上的數(shù)據(jù)進行采集壓縮,并將數(shù)據(jù)在邊緣側(cè)上傳到云端,在云端解壓打開后,做半自動機器標注和人工的標注;另一個是數(shù)據(jù)的重復利用系統(tǒng),模塊在云端有自己的自動學習平臺,能夠把標注好的數(shù)據(jù)進行模型的訓練迭代和優(yōu)化,這就將數(shù)據(jù)和生產(chǎn)線部署的邊緣側(cè)模型進行了高效率的再利用。
心鑒智控成立至今,已經(jīng)在視覺檢測的業(yè)務(wù)中積累了大量高質(zhì)量的數(shù)據(jù),并在2022年下半年訓練出了自己在工業(yè)檢測領(lǐng)域的通用模型。同年11月,ChatGPT橫空出世。經(jīng)研究之后,羅曉忠認為,大模型之所以有這么高的能力,是因為它擁有大量高質(zhì)量的數(shù)據(jù)和新型的訓練方法,因此在大算力的支持下,涌現(xiàn)出了令人驚艷的能力。但在自己的行業(yè)領(lǐng)域,羅曉忠直接表示:“我們需要的是基于基礎(chǔ)大模型之上的行業(yè)大模型?!?/span>
“瑕疵檢測的容錯率非常低,有一點點差錯都不行,語言類的模型達不到這個水平,所以ChatGPT有時候會一本正經(jīng)地滿口胡話;另外,瑕疵品的數(shù)據(jù)是ChatGPT背后的訓練數(shù)據(jù)庫里沒有的,所以大模型不會根本性替代我們公司現(xiàn)有的技術(shù)底座,”羅曉忠說,“但借鑒大模型多模態(tài)的訓練方式,結(jié)合公司已有的行業(yè)數(shù)據(jù),我們可以更好地打造自己的行業(yè)大模型?!?/span>