當介面消失?AI Agent 引領的零介面時代(Zero UI)
你是否曾留意,自己是如何與 Siri 或 Alexa 互動的?或許是在開車時用語音導向,又或者是在烹飪時讓智慧音箱播放音樂。這些不經意的互動,正悄然改變我們與科技的關係。隨著 AI Agent 的日益普及,我們與技術的互動方式正經歷一場深刻的變革。
未來,Web 和 Mobile 應用是否還需要我們熟悉的按鈕、選單和視窗?Zero UI 的趨勢正引領我們走向一個無介面的未來,這不僅僅是技術的革新,更是對使用者體驗的重新定義。正如 John Maeda 在《簡約法則》中所強調的,設計的重點在於簡約,而這正是 Zero UI 的核心原則之一:將使用者與設備或系統的顯性互動減至最少,甚至完全消除,創造無縫、直觀且自動化的體驗。
Zero UI 與多模態體驗的崛起
大型語言模型(LLM)的突破性進展,使 AI 能夠理解和回應人類的自然語言,為語音互動奠定了堅實的基礎。擴增實境(AR)、混合實境(MR)和延展實境(XR)等技術以及新的硬體裝置(如:XREAL ONE、Apple Vision Pro)模糊了虛擬與現實的界限,創造了更沉浸式的體驗。
更重要的是,我們開始探索聲音、觸覺、嗅覺、動作和眼動等新的互動模態。例如,透過觸覺回饋,我們可以感受到虛擬物體的質感;透過眼動追蹤,系統可以理解我們的關注點。這些技術的融合,正推動我們走向多模態互動的時代。
在 ACM CHI 等頂級人機介面論壇上,我們已經可以看到多模態互動和 Zero UI 是熱門的研究主題。例如,有研究探索如何利用眼動和語音結合來控制智慧家居設備;也有研究關注如何透過手勢和觸覺回饋來增強虛擬實境的沉浸感。
現有的技術已經展現了無縫使用者體驗的潛力。例如,Apple Vision Pro 的手勢操控,讓使用者無需實體控制器就能自然地與虛擬內容互動;What3Words 的語音導向系統,則透過簡單的三個詞彙就能精確定位,擺脫了傳統地址的複雜性。
為何 Zero UI 是不可避免的未來?
Zero UI 的終極目標是實現「所思即所得」的境界,讓人類與技術的互動變得像與人交談一樣自然。使用者不再需要學習複雜的操作手冊,只需透過自然的語言、手勢或甚至是意念,就能與技術進行無縫的互動。
滑鼠、鍵盤、實體按鈕等傳統介面,在過去幾十年中扮演了重要的角色,短期內我們可能仍需要透過一些過渡型的 UI 讓它們可以操作。
我認為過渡的關鍵是因為,目前的 AI Agent 正處於從「Utility-based agent」(基於效用的 Agent)向「Future type」(未來型)演進的階段。Utility-based agents 雖然能評估情境並選擇最佳結果,但由於環境的複雜性和 AI 模型本身的不確定性(non-deterministic),它們的回應有時可能不夠穩定或準確。
這意味著我們需要更長的時間來完善 AI Agent 的技術,使其更加可靠和可預測。因此,這個過渡期可能會比我們想像的更長。但趨勢是明確的:介面將逐漸淡化,直至消失。
擁抱過渡期,邁向 Zero UI
要從現有的 UI 過渡到 Zero UI,設計師和工程師需要共同努力,在過渡期內做好準備。
UI/UX 設計師的挑戰與機會
設計師需要從傳統的 UI/UX 設計轉向多模態體驗設計。這意味著要關注使用者在不同情境下的需求,設計更自然、更直觀的互動方式。在這個過程中,設計師可以善用 AI 工具,例如使用 AI 生成設計稿、進行使用者研究等,以更高效地迭代設計方案。極簡主義(Minimalism)在此變得尤為重要,設計師需要避免設計過度複雜的互動模式,回歸使用者最基本的需求。
正如 UX Future is Zero Interface - AI instead of Figma 中提到的,雖然 Figma 不是設計零介面的最佳工具,但設計師需要開始思考如何使用其他方法來進行實驗和原型設計。更重要的是,設計師可以扮演類似監製或導演的角色,利用 AI 工具快速迭代設計,並更專注於使用者在終端體驗上的需求,而不是單純地關注設計工作是否「做完」。
更多閱讀:UI/UX in the age of Generative AI - by Andrew Gao。
前端工程師的新定位
在零介面時代,前端工程師不再只是介面建立者,而是體驗整合者,需善用新技術與工具(如 bolt.new),減少排版時間,專注於使用者體驗和系統整合,與 AI 專家、感測器技術人員等跨領域專家合作,理解 AI Agent 的運作、感測器資料和後端架構,以整合各元件。
工程師需關注 AI Agent 發展,學習與其溝通協作,並處理其非確定性行為,例如提供多種回應選項或更精確的控制。他們也需拓展技能邊界,理解後端、資料庫、雲端、AI 等領域,成為更全面的體驗工程師。
AI 搜尋、Deep Research 與終端體驗
隨著 Zero UI 的發展,資訊的獲取和處理變得尤為重要。AI 搜尋引擎的出現,正改變我們搜尋資訊的方式。傳統搜尋引擎依賴關鍵字對應,而 AI 搜尋引擎則利用機器學習和自然語言處理來理解使用者查詢的上下文,提供更相關的結果。
更進一步,Gemini Advanced 的 Deep Research 功能,作為一個強大的 AI 代理,展現了在主題研究方面的巨大潛力。其 1 million token context 意味著它能一次性處理大量資訊,進行更深入的研究。這對於 Zero UI 時代的資訊獲取和處理至關重要,使用者可以透過更自然的方式提出問題,並獲得更全面、更深入的答案。
Deep Research 的出現,也讓我們看到了「協同智能」(co-intelligence)的未來。它並非要取代人類研究者,而是與人類協同工作,在知識推理和資訊處理方面發揮優勢,而人類則在推理、理性思考、批判性思維和抽象思維等方面貢獻力量,也解決了網際網路上資訊品質參差不齊的問題,讓使用者更容易獲得高品質的資訊,避免「brain rot」。
結語:設計師與工程師的下一步
在追求技術簡化和人性化的過程中,應如何平衡人類體驗的本質與技術的無縫整合?
Zero UI 不僅僅是一種設計趨勢,更是未來不可避免的發展方向,我們要關注終端體驗的需求,而不是設計工作是否「做完」。它將深刻地改變我們與技術的關係,設計師和工程師需要積極擁抱這一趨勢,不斷學習新的技術和方法,才能在這場變革中找到自己的價值。
"Design is about the technology that disappears." - John Maeda
在 Zero UI 的時代,設計將更加回歸其本質,為人類創造更美好的體驗。而 AI 搜尋和 Deep Research 等技術的發展,則為 Zero UI 的實現提供了強大的支持,讓我們得以更自然、更有效地與資訊互動,並共同迎接通用人工智慧的新時代。