計算機視覺技術方法與應用發展迅速。計算機視覺研究如何讓計算機可以像人類一樣去理解圖片、視頻等多媒體資源內容。例如用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等,并進一步處理成更適合人眼觀察或進行儀器檢測的圖像。近些年在海量的圖像數據集、機器學習(深度學習)方法以及性能日益提升的計算機支持下,計算機視覺領域的技術與應用均得到迅速發展,
國內外眾多知名機構在計算機視覺不同方向均有涉及,國內更是涌現出一批相關的明星創業團隊。除了耳熟能詳的Google、微軟、Facebook 等工業界科技巨頭有所涉及之外,一些著名高校也設有專門的實驗室,如斯坦福、麻省理工以及伯克利等。國內則涌現出一批以依圖、商湯、曠視、云從以及格靈深瞳等為首的創業公司,技術團隊核心成員大多擁有前述工業界及學術界知名機構的研究經驗。
兩大挑戰賽與三大頂級會議引關注,揭示計算機視覺研究熱點與技術進展。兩大挑戰賽分別基于ImageNet 和MS COCO 數據集。ImageNet 數據集主要由斯坦福大學李飛飛教授團隊牽頭創建,比賽重在評測算法識別圖像中顯著物體的能力,MS COCO 數據集主要由微軟贊助,大賽更傾向于評測復雜場景中識別各類物體的能力。三大頂級會議分別為ICCV、CVPR、ECCV,近些年來接受的論文開始更多涉及到計算機視覺在工業界的創新應用,逐漸成為領域內前沿理論和技術的聚集地。