李飛飛博士的團隊建立了一個名為 ImageNet 的資料集,在 2012 年的 ImageNet 挑戰賽中,奪冠團隊開發的 AlexNet 模型首次擊敗人類在圖像分類任務中的表現,這標誌著深度學習革命的開始,此後許多模型都以它為基礎和基準。
資料、計算、以及神經網路三者的發展引領了 AI 領域中的深度學習革命。未來 AI 的發展將持續受到腦科學和人類認知的啓發。
李飛飛博士分享了三個階段:
1. Building Al to See What Humans See
李飛飛教授提到跟人類一樣,視覺智能(Objective Recognition)是 AI 能自我學習的關鍵,但心理學家認為,要充分理解視覺場景,還必須考慮物體之間的關係。
李飛飛博士的團隊建立了一個名為視覺基因組的資料集(Action Genome),其中包含 10 萬張圖片,380 萬個物體,230 萬個關係,