摘要:近年來,中國經(jīng)濟的增長一定程度帶來文檔數(shù)據(jù)與信息量的增長,中國政府、企業(yè)對經(jīng)濟活動中產(chǎn)生的文檔進行電子化存儲、數(shù)據(jù)提取、分析挖掘具有巨大需求。2020年中國智能文字識別服務市場規(guī)模為30億元,2023年市場規(guī)模約為89.8億元,增長率遠超全球市場總增速。
一、定義及分類
智能文字識別是指相比傳統(tǒng)簡單文字識別,智能文字識別技術(shù)融合智能圖像處理、光學字符識別、深度學習、自然語言處理等技術(shù),可在多語言、多版式、曲面、褶皺、背景干擾等復雜場景下進行文字信息的識別分析與理解,能夠獲得較高的識別性能并具備認知與理解能力。
智能文字識別(OCR)通??梢愿鶕?jù)其功能和應用領(lǐng)域進行分類。智能文字識別按應用領(lǐng)域可以分為印刷體文字識別、手寫文字識別、混合文字識別;按技術(shù)可以分為光學字符識別、深度學習文本識別、傳統(tǒng)特征提取文本識別;按輸出結(jié)果可以分為文本檢測、文本識別;按部署環(huán)境可以分為離線文字識別、在線文字識別;按語言和腳本可以分為拉丁字母文字識別、非拉丁字母文字識別。
二、行業(yè)政策
1、主管部門及監(jiān)管體制
智能文字識別行業(yè)屬于軟件和信息技術(shù)服務業(yè),行業(yè)的行政主管部門主要是工信部以及各行政區(qū)劃設立的通信管理局。智能文字識別行業(yè)涉及商業(yè)大數(shù)據(jù)業(yè)務,因此相關(guān)企業(yè)需受征信行業(yè)主管部門中國人民銀行監(jiān)管。行業(yè)的內(nèi)部管理機構(gòu)是中國軟件行業(yè)協(xié)會,軟件產(chǎn)品登記的業(yè)務主管部門是工信部,軟件著作權(quán)登記的業(yè)務主管部門是國家版權(quán)局中國版權(quán)保護中心。
2、相關(guān)政策
智能文字識別行業(yè)屬于軟件和信息技術(shù)服務業(yè),具體到AI及大數(shù)據(jù)軟件領(lǐng)域,軟件和信息技術(shù)服務業(yè)既是國家戰(zhàn)略性新興產(chǎn)業(yè)的重要組成部分,也是關(guān)系國民經(jīng)濟和社會發(fā)展全局的先導性產(chǎn)業(yè),具有技術(shù)更新快、應用領(lǐng)域廣、滲透能力強等突出特點,對經(jīng)濟社會發(fā)展發(fā)揮重要支撐和引領(lǐng)作用。“十三五”以來,圍繞制造強國和網(wǎng)絡強國建設目標,中國通過發(fā)布實施一系列的政策、法律法規(guī)為軟件產(chǎn)業(yè)實現(xiàn)快速發(fā)展創(chuàng)造了良好的環(huán)境。
三、發(fā)展歷程
文字識別OCR發(fā)展歷程OCR技術(shù)自20世紀70年代誕生以來,經(jīng)歷了早期階段、發(fā)展階段、數(shù)字化時代三個發(fā)展階段,行業(yè)經(jīng)歷了從早期的基礎(chǔ)技術(shù)探索到現(xiàn)代深度學習方法的演進,從單一語言的識別到多語言多樣性的支持,不斷推動著OCR技術(shù)的發(fā)展和應用。
四、行業(yè)壁壘
1、技術(shù)與人才壁壘
智能文字識別行業(yè)具備技術(shù)密集的特點,智能文字識別技術(shù)涉及OCR、NLP、圖像處理、深度學習等尖端技術(shù)的融合,需要底層算法構(gòu)建、模型訓練、測試和部署等多個技術(shù)環(huán)節(jié)的配合。
全球人工智能的技術(shù)和產(chǎn)品呈現(xiàn)日新月異的發(fā)展態(tài)勢,例如如何在資源受限的移動端設備上設計兼顧性能和效率的輕量OCR模型,如何通過語義及知識的深度挖掘提升OCR性能,均是行業(yè)的研究熱點與難點。同時,市場需求也在不斷變化,促使智能文字識別廠商根據(jù)下游客戶的不同需求,開發(fā)標準化程度不同、形態(tài)不同的產(chǎn)品,提升識別的準確率、速度、穩(wěn)定性,才能夠在激烈的市場競爭中立于不敗之地。智能文字識別技術(shù)在實際應用場景上的商業(yè)化落地,需要長時間的技術(shù)積累與持續(xù)的研發(fā)投入,也需要大量的優(yōu)秀研發(fā)人員進行底層算法與應用模型的研究,新進入此領(lǐng)域的科技公司的技術(shù)追趕難度較大,同時也難以在短期內(nèi)培養(yǎng)出尖端的研發(fā)人才團隊。
2、客戶資源壁壘
智能文字識別行業(yè)按銷售模式可以分為C端業(yè)務與B端業(yè)務,而智能文字識別B端服務不同細分市場的競爭格局有所差異,B端業(yè)務可分為B端基礎(chǔ)技術(shù)服務、B端標準化服務、B端場景化解決方案三種形態(tài),技術(shù)的附加值、服務的復雜程度依次增高。
對于B端服務細分市場,智能文字識別行業(yè)的頭部企業(yè)通過多元化的B端產(chǎn)品線布局,在多個下游行業(yè)樹立了多家標桿企業(yè)客戶,其落地案例通常會形成較大行業(yè)影響,影響此行業(yè)內(nèi)眾多企業(yè)的供應商選擇。另外,大型企業(yè)客戶通常對于場景化解決方案需求更高,此類項目落地周期相對較長,更換成本較高。因此對于新廠商而言,形成較高客戶資源壁壘。
對于C端APP細分市場,先行進入市場的智能文字識別APP,利用先發(fā)優(yōu)勢,已積累大量用戶,形成了品牌效應。用戶在產(chǎn)品內(nèi)積累越來越多個人文檔資產(chǎn),遷移成本較高,使產(chǎn)品擁有較高用戶粘性,這對本行業(yè)的新進企業(yè)形成了較高的用戶壁壘,同時已樹立的品牌效應也進一步加強用戶壁壘。
3、銷售能力壁壘
由于不同行業(yè)客戶對于智能文字識別技術(shù)的需求與應用場景不同,智能文字識別服務提供商對于各行業(yè)場景的深度理解、研發(fā)出可在行業(yè)場景中落地的應用產(chǎn)品是其能否在本行業(yè)立足的關(guān)鍵因素之一。如為保險行業(yè)客戶研發(fā)出智能核保、理賠流程的智能文字識別解決方案;為政府客戶研發(fā)出智能證件審核的智能文字識別解決方案;為物流業(yè)客戶研發(fā)出運單信息自動錄入的智能文字識別解決方案。
因此,一家成功的智能文字識別企業(yè)不僅需要尖端研發(fā)人才,也同時需要可鏈接行業(yè)客戶需求和內(nèi)部研發(fā)團隊的銷售團隊,銷售團隊對客戶所在行業(yè)的真實業(yè)務場景、業(yè)務邏輯、產(chǎn)業(yè)鏈上下游等有充分的理解,以客戶的痛點、需求為核心,充分調(diào)動公司內(nèi)部如研發(fā)、實施、售后服務等各類資源,以實現(xiàn)行業(yè)解決方案的落地。而行業(yè)的深度理解需要依靠大量案例的經(jīng)驗積累,這對本行業(yè)的新進企業(yè)形成了較高的銷售能力壁壘。
4、數(shù)據(jù)資源壁壘
融合了深度學習、NLP等人工智能技術(shù)的智能文字識別,其算法的設計和優(yōu)化需要由海量的高質(zhì)量場景數(shù)據(jù)驅(qū)動,需要在各行業(yè)各類大數(shù)據(jù)應用場景積累的海量數(shù)據(jù)對智能文字識別算法模型進行訓練。所以相比市場新進廠商而言,進入智能文字識別領(lǐng)域較久、落地案例更為豐富的廠商在各類場景、各類行業(yè)數(shù)據(jù)的累積上優(yōu)勢明顯,其智能文字識別算法模型更為成熟,識別準確率、識別速度也更為出色。這對本行業(yè)的新進企業(yè)形成了較高的數(shù)據(jù)壁壘。
五、產(chǎn)業(yè)鏈
1、行業(yè)產(chǎn)業(yè)鏈分析
智能文字識別行業(yè)的產(chǎn)業(yè)鏈上游涉及到圖像采集、圖像預處理、特征提取、識別算法、語言模型等多個關(guān)鍵技術(shù)和環(huán)節(jié),這些技術(shù)共同構(gòu)成了OCR系統(tǒng)的基礎(chǔ),為文字識別提供了堅實的技術(shù)支持。智能文字識別行業(yè)位于產(chǎn)業(yè)鏈中游,主要代表企業(yè)有百度云、騰訊云、阿里云、Google Cloud、ABBYY、合合信息等。
智能文字識別行業(yè)的產(chǎn)業(yè)鏈下游涉及到各種應用場景和產(chǎn)品服務,包括應用軟件開發(fā)、文檔管理和數(shù)字化服務、電子商務和金融服務、智能設備和物聯(lián)網(wǎng)應用、人工智能應用開發(fā)等方面,這些應用場景和產(chǎn)品服務為OCR技術(shù)的商業(yè)化應用提供了廣闊的空間和機遇。
2、行業(yè)領(lǐng)先企業(yè)分析
合合信息是一家人工智能及大數(shù)據(jù)科技企業(yè),基于自主研發(fā)的領(lǐng)先的智能文字識別及商業(yè)大數(shù)據(jù)核心技術(shù),為全球C端用戶和多元行業(yè)B端客戶提供數(shù)字化、智能化的產(chǎn)品及服務。2022年合合信息實現(xiàn)營業(yè)收入98846.18萬元,實現(xiàn)凈利潤28371.77萬元;2023年一季度合合信息實現(xiàn)營業(yè)收入26602.31萬元,實現(xiàn)凈利潤7969.02萬元。
合合信息智能文字識別技術(shù)融合了智能圖像處理、復雜場景文字識別、NLP等AI技術(shù),相比傳統(tǒng)簡單文字識別,具備更多認知與理解能力,可適應多語言、多版式、多樣式等復雜場景,并可應用到多個商業(yè)化場景中并形成落地的產(chǎn)品或服務,例如票據(jù)分類、證照票據(jù)結(jié)構(gòu)化、合同關(guān)鍵信息抽取、智能審核等。合合信息智能文字識別業(yè)務包含掃描全能王、名片全能王C端APP收入以及B端服務收入。企業(yè)招股書數(shù)據(jù)顯示,2022年合合信息智能文字識別服務業(yè)務收入為72489.24萬元,其中:B端服務收入為7120.43萬元,C端APP(掃描全能王和名片全能王)服務收入為65368.81萬元。
六、行業(yè)現(xiàn)狀
相比傳統(tǒng)簡單文字識別,智能文字識別技術(shù)融合圖像處理、OCR、深度學習、NLP等AI技術(shù),具備更多認知與理解能力,可適應多語言、多版式、多樣式等復雜場景,識別準確率大大提升,同時可基于理解能力進一步開發(fā)文檔解析、分類、對比、審核等功能,是個人文檔資產(chǎn)管理與企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵。
從下游行業(yè)應用來看,金融、物流運輸?shù)氖袌鲆?guī)模是占比最高的兩個細分行業(yè),且增速也最快,主要由于金融、物流運輸企業(yè)在業(yè)務流程方面的基礎(chǔ)信息化建設程度、投入意愿相對其他行業(yè)來說相對較高,在證照、單據(jù)、表格等文檔的智能錄入、分類、比對、審核方面進行降本增效具有較大需求,為智能文字識別技術(shù)的商業(yè)化快速落地帶來基礎(chǔ)。據(jù)統(tǒng)計,2020年全球智能文字識別服務市場規(guī)模達75億美元,2023年全球智能文字識別服務市場規(guī)模約為123.2億美元。
近年來,中國經(jīng)濟的高速增長一定程度帶來文檔數(shù)據(jù)與信息量的增長,中國政府、企業(yè)對經(jīng)濟活動中產(chǎn)生的文檔進行電子化存儲、數(shù)據(jù)提取、分析挖掘具有巨大需求。2020年中國智能文字識別服務市場規(guī)模為30億元,2023年市場規(guī)模接約為89.8億元,增長率遠超全球市場總增速。
七、發(fā)展因素
1、有利因素
(1)人工智能列入中國“新基建”范圍,政策利好加速產(chǎn)業(yè)新生態(tài)的構(gòu)建
人工智能對社會與經(jīng)濟的影響日益凸顯,各國政府先后出臺人工智能發(fā)展相關(guān)政策,推動產(chǎn)業(yè)發(fā)展,將其上升到國家戰(zhàn)略高度。中國中央及各地政府近年來先后發(fā)布了多條人工智能利好政策。智能文字識別作為人工智能應用中商業(yè)推廣落地較快的領(lǐng)域,正成為人工智能新基建落地應用的“領(lǐng)頭雁”,已成為人工智能新基建對外提供的重要智能化服務能力之一。人工智能融入實體經(jīng)濟的過程,也將為智能文字識別產(chǎn)業(yè)生態(tài)引入豐富的人才、技術(shù)、場景等要素。
(2)深度學習、NLP賦能下,智能文字識別技術(shù)不斷提升
當前深度學習技術(shù)不斷發(fā)展,加速了智能文字識別技術(shù)性能提升,為復雜場景的文字識別應用提供先決條件。文字識別應用范圍從簡單的印刷體數(shù)字、字母符號識別,逐步演進到自然場景下多形態(tài)文本檢測與識別、手寫體文本檢測與識別等復雜情形。同時,深度學習的出現(xiàn),使NLP技術(shù)在閱讀理解、機器翻譯、問答系統(tǒng)等領(lǐng)域取得了一定成功,大幅提升智能文字識別的技術(shù)水平。
(3)企業(yè)及政府的數(shù)字化轉(zhuǎn)型需求不斷提升
在第四次工業(yè)革命背景下,人工智能、大數(shù)據(jù)與云計算、5G等新一代信息技術(shù)的快速發(fā)展與融合,使得數(shù)字化基礎(chǔ)設施和產(chǎn)業(yè)生態(tài)已經(jīng)成為了社會的“新基建”,其中人工智能是推動數(shù)字化轉(zhuǎn)型與創(chuàng)新的原動力,將成為引領(lǐng)第四次工業(yè)革命的核心驅(qū)動力。企業(yè)及政府數(shù)字化轉(zhuǎn)型意在實現(xiàn)運營自動化、管理網(wǎng)絡化、決策智能化,有利于加快業(yè)務流程重組,有效地降本增效。中國企業(yè)信息化與IT投入近些年不斷提升,且相比發(fā)達國家仍有較大上升空間。智能文字識別技術(shù)可幫助企業(yè)與政府實現(xiàn)文檔存量數(shù)字化、增量電子化,隨著企業(yè)與政府數(shù)字化、信息化與智能化需求的不斷提高,預計將持續(xù)推動智能文字識別服務行業(yè)發(fā)展。
(4)個人用戶對文檔資產(chǎn)管理愈發(fā)受到重視
互聯(lián)網(wǎng)、智能手機的高速發(fā)展,使消費者習慣于利用智能終端進行數(shù)據(jù)處理。同時,在互聯(lián)網(wǎng)時代下信息爆炸式的增長,且通常個人數(shù)據(jù)資產(chǎn)都較為珍貴,如合同、名片、發(fā)票、筆記等,使得消費者對個人資產(chǎn)管理數(shù)字化意識和需求不斷增強。由于紙質(zhì)文檔不易保存,難以對信息進行快速的查詢、分類、分享,因此用戶更傾向于將個人文檔通過掃描、拍照等方式數(shù)字化,在本地或者云端進行有效的存儲、分類等,以便隨時隨地在手機、電腦等多終端進行同步、查詢、管理及分享,滿足個人的辦公、求職、學習等不同場景的需求。個人用戶對文檔資產(chǎn)管理持續(xù)存在的需求將不斷推動智能文字識別服務行業(yè)發(fā)展。
2、不利因素
智能文字識別憑借著較高的實際應用價值,一直以來都是人工智能領(lǐng)域的研究熱點,2014年以來,隨著深度學習技術(shù)在智能文字識別的廣泛應用,中國智能文字識別技術(shù)取得了飛躍性發(fā)展。同時,中國智能文字識別行業(yè)在發(fā)展過程中面臨著不同行業(yè)及不同規(guī)模客戶差異化需求、技術(shù)挑戰(zhàn)、數(shù)據(jù)質(zhì)量和數(shù)量問題、數(shù)據(jù)隱私和安全問題、市場競爭和行業(yè)標準、人才短缺和技術(shù)壁壘、應用場景限制等多個方面的不利因素,需要克服這些困難,才能實現(xiàn)行業(yè)的持續(xù)健康發(fā)展。
八、競爭格局
近年來,物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)的快速發(fā)展推動數(shù)據(jù)量爆發(fā)式增長,智能文字識別作為文檔數(shù)據(jù)管理的關(guān)鍵技術(shù),擁有較大發(fā)展前景。目前中國已經(jīng)將人工智能上升到國家戰(zhàn)略層面,政府明確提出要加快發(fā)展人工智能產(chǎn)業(yè),推動數(shù)字經(jīng)濟高質(zhì)量發(fā)展。與此同時,人工智能在全球也遍地開發(fā),技術(shù)和產(chǎn)品日新月異,促使智能文字識別廠商根據(jù)下游客戶的不同需求,開發(fā)標準化程度不同、形態(tài)不同的產(chǎn)品,提升識別的準確率、速度、穩(wěn)定性,才能夠在激烈的市場競爭中立于不敗之地。目前,智能文字識別領(lǐng)域的主要競爭企業(yè)有百度云、騰訊云、阿里云、Google Cloud、ABBYY、合合信息等。
九、發(fā)展趨勢
智能文字識別(OCR)作為計算機視覺領(lǐng)域的重要分支,OCR典型應用是通過圖像文字識別實現(xiàn)信息錄入。同時,由于文字和符號包含豐富的語義信息,基于OCR提取文字信息繼而進行分析,能夠幫助機器更好地理解圖像。
借助人工智能技術(shù),近年來智能文字識別(OCR)性能的不斷提升為產(chǎn)業(yè)數(shù)字化催生出更復雜的OCR應用場景提供了堅實支撐。同時,覆蓋手機、電子產(chǎn)品以及云服務在內(nèi)的更加多樣化的服務載體,進一步加快了OCR的普及,持續(xù)向社會生產(chǎn)生活的更多領(lǐng)域滲透。未來,智能文字識別(OCR)技術(shù)發(fā)展將會更加智能化、高效化和個性化。隨著技術(shù)的不斷進步和應用領(lǐng)域的不斷拓展,文字識別技術(shù)將會在更多的領(lǐng)域得到應用,并且將會更好地滿足用戶的需求和偏好,市場前景一片光明。
智研咨詢倡導尊重與保護知識產(chǎn)權(quán),對有明確來源的內(nèi)容注明出處。如發(fā)現(xiàn)本站文章存在版權(quán)、稿酬或其它問題,煩請聯(lián)系我們,我們將及時與您溝通處理。聯(lián)系方式:[email protected]、010-60343812。