文本檢測和識別技術處于一個學科交叉點,其技術演進不斷受益于計算機視覺處理和自然語言處理兩個領域的技術進步。 它既需要使用視覺處理技術來提取圖像中文字區域的圖像特征向量,又需要借助自然語言處理技術來解碼圖像特征向量為文字結果。 從公開論文中可以看到,起源于圖像分類、檢測、語義分割等視覺處理任務的各個基礎網絡(backbone network),紛紛被征用來提取圖像中文字區域的特征向量。